## AI 进展 本周AI 进展主要聚集与小模型方面的进展报告,包括:MiniCPM-V 4.5 系列 Nvidia 推出Nemotron-Nano-9B-v2、InternVL3.5 多模态大模型。| 理科生网!{alertInfo}
![]() |
9月1 日 全球人工智能动态总结报告 |
## 小模型进展方面
MiniCPM 系列小模型推出: MiniCPM-V 4.5 系列中最新、最强大的模型。总参数量 8B。 视觉能力上超越了 GPT-4o-latest、Gemini-2.0 Pro 以及 Qwen2.5-VL 72B,成为开源社区中性能最强的端侧多模态模型。
MiniCPM-o 进一步支持端到端的语音输入输出。自2024年2月以来,我们以实现高性能和高效部署为目标,发布了7个版本的模型。
Github:https://github.com/OpenBMB/MiniCPM-V
## Nvidia 推出Nemotron-Nano-9B-v2
Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2:旨在作为推理和非推理任务的统一模型。它通过首先生成推理轨迹,然后得出最终响应来响应用户的查询和任务。该模型的推理能力可以通过系统提示进行控制。
WebSite: https://build.nvidia.com/nvidia/nvidia-nemotron-nano-9b-v2/modelcard
## Step-Audio 2 mini 多模态大型语言模型
Step-Audio 2 mini 是一种端到端多模态大型语言模型,专为行业强度的音频理解和语音对话而设计。 高级语音和音频理解:通过理解和推理语义信息、副语言和非语音信息,在 ASR 和音频理解方面表现出色。 智能语音对话:实现自然、智能的交互,适合各种对话场景和副语言信息。
## OpenAI 星际之门计划进展
最新计划:在印度建立一座大型数据中心,这一举动可能会成为其 “星际之门”(Stargate)品牌 AI 基础设施在亚洲发展的重要里程碑。根据知情人士透露,OpenAI 正在寻求当地合作伙伴,并计划建造一座至少容纳1千兆瓦电力的数据中心。目前具体的选址和建设时间尚未确定,但业内人士认为,这一项目将在不久的将来得到进一步的明确。
## 人工智能生成合成内容标识办法
2025年3月14日联合发布了《人工智能生成合成内容标识办法》(以下简称《办法》),并于2025年9月1日正式实施。《办法》的核心目标是促进人工智能的健康发展,规范合成内容的标识,保护公民及法人等的合法权益,维护社会公共利益。
## xAI 诉讼前员工 Xuechen Li 偷窃代码
埃隆·马斯克旗下的AI初创公司 xAI 已在美国加州联邦法院对一名前工程师 Xuechen Li 提起诉讼,指控其窃取公司核心商业机密,并在离职后加入竞争对手 OpenAI。
xAI在诉讼中称,Xuechen Li于去年加入公司,并深度参与了 Grok 聊天机器人的训练与开发工作。今年7月,Li在接受OpenAI录用后,出售了其持有的价值700万美元(约合4990万元人民币)的xAI公司股票。
## Anthropic Claude Opus4.1和 Opus4模型降智
Anthropic 公司发布了一份事件报告,确认其最新的 Claude Opus4.1和 Opus4模型在8月25日至28日之间的确遭遇了 “降智” 现象。
造成这一情况的原因是由于推理堆栈的更新引起的。虽然更新的初衷是为了提升模型的效率和吞吐量,但显然这次的改动并未达到预期效果。
Claude Opus4.1和 Opus4模型降智 |
## 谷歌Gemini渐近ChatGPT
谷歌的 Gemini 依然落后于 ChatGPT,但在网络和移动应用领域,谷歌的产品正在逐步缩小差距,而中国公司在移动领域则占据主导地位。
前50名 AI 原生网络产品 |
谷歌的 Gemini 家族首次在网络榜单上占据四个席位,现时 Gemini 的月访问量约为 ChatGPT 的12%。在移动领域,Gemini 的月活跃用户几乎达到了 ChatGPT 的一半。Gemini 在 Android 系统上的用户基础尤其强大,约90% 的用户来自 Android,而 ChatGPT 则为60%。
版权声明:感谢您的阅读,资源整理自网络,如果您发现任何侵权行为,请联系 理科生网 管理人员,管理员将及时删除侵权内容。否则均为 理科生网 原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!{alertInfo}Ahmedabad