##AI消息 OpenAI 开源GPT-oss-120b和GPT-oss-20b、谷歌DeepMind 发布世界模型 Genie3、 Anthropic发布Claude Opus4.1、GPT-5模型的详细说明信息疑似泄露、微软宣布 windows 11 支持gpt-oss-20b、 大模型首轮比赛结果Grok4领先、 小红书开源大语言模型 dots vlm1、GPT-5 周五凌晨1点发布 www.lksr.net{alertInfo}
{getToc} $title={文章目录}
## GPT-5 周五凌晨1点发布
OpenAI 在社交平台 X 上宣布,将于北京时间周五凌晨1点举行一场备受期待的直播活动。许多科技爱好者纷纷猜测,这将是新一代强大 AI 模型 GPT-5的首秀。就在周二,该公司刚刚宣布发布 GPT-OSS,一款可在笔记本电脑上运行的免费开放权重模型,展现了其在开源领域的探索。而 GPT-5的到来,将进一步巩固 OpenAI 在前沿 AI 技术领域的领先地位。
## OpenAI 开源GPT-oss-120b和GPT-oss-20b
##谷歌DeepMind 发布世界模型 Genie3
谷歌DeepMind正式发布了其最新一代世界模型 Genie3,这一突破性AI技术以其强大的实时交互能力和多样化的环境生成能力,标志着AI模拟技术迈向新高度。Genie3作为一款通用世界模型,能够以24帧每秒的速度生成720P分辨率的交互式3D环境,较前代Genie2(360P,10-20秒一致性)实现了显著飞跃。谷歌DeepMind官方介绍,Genie3通过自回归方式逐帧生成虚拟世界,最长可维持 数分钟的环境一致性,视觉记忆时长高达 一分钟。Genie3的发布被DeepMind视为迈向 人工通用智能(AGI) 的重要一步。
Website:https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/
## Anthropic发布Claude Opus4.1
Anthropic正式发布其旗舰模型Claude Opus4的升级版——Claude Opus4.1。Claude Opus4.1的最大亮点在于其惊人的编程性能提升。在SWE-bench Verified编程评测中,其表现高达74.5%,这一成绩显示了其在处理复杂代码问题上的强大实力。Claude Opus4.1现已面向所有付费用户开放,价格维持与Opus4相同。
WebSite:https://www.anthropic.com/news/claude-opus-4-1
## GPT-5模型的详细说明信息疑似泄露
一份疑似GPT-5模型的详细说明信息在 GitHub Models平台上意外曝光,这份泄漏文件详细描述了 GPT-5的核心能力、新特性以及多个版本,GPT-5 被描述为 OpenAI 迄今为止“最先进的大语言模型”。其核心亮点在于推理能力、代码质量和用户体验上的重大飞跃,OpenAI 官方尚未对此做出回应。
##微软宣布 windows 11 支持gpt-oss-20b
Windows 11 将本地支持 OpenAI 开源模型 gpt-oss-20b,用户无需依赖云端,即可直接在本地电脑上调用强大的 AI 功能和各类热门开源模型。gpt-oss-20b 是一款轻量且高效的模型,尤其擅长执行代码、调用外部工具等任务。作为 OpenAI 的“最小”开源模型,gpt-oss-20b 仅支持文本处理,无法生成图像或音频。微软表示未来计划将该模型引入 macOS 等更多平台。
## 大模型首轮比赛结果Grok4领先
谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事首轮结果出炉,首日对决中,Grok4以超凡的战术表现和快速反应获得了最高评价, DeepSeek R1不敌 o4-mini,Kimi K2,马斯克对此次比赛的成功表现淡定回应:“我们并没有特别训练,这只是一个副产品。”,经过首轮较量,Grok4与 Gemini2.5Pro、OpenAI 的 o4-mini 和 o3晋级半决赛。
## 小红书开源大语言模型 dots vlm1
小红书 Hi Lab 近日发布并开源了其首个自研多模态大模型 dots.vlm1。该模型基于12亿参数的 NaViT 视觉编码器和 DeepSeek V3大语言模型,从零开始完全训练,其卓越性能在多模态视觉理解与推理能力上已接近当前领先的闭源模型
## 腾讯开源WeKnora
腾讯开源文档理解与检索工具WeKnora,WeKnora的核心优势在于其多模态文档解析能力。该工具能够从PDF、Word、图片等多种格式文档中提取结构化内容,通过先进的语义处理技术将来自不同来源的信息整合成统一的语义视图。
WebSite:https://github.com/Tencent/WeKnora
## 星火代码画布”功能上线
讯飞开放平台宣布上线一项名为“星火代码画布”的创新功能,过简单的语音指令、草图、链接或一段文字描述,即可快速生成交互网页。用户可以通过访问星火网页版,点击左侧栏的【代码生成】,向星火描述自己的想法,即可快速实现脑海中的小工具、小游戏或可视化网页。
## 美国正式启动名为"ATOM计划"
本周一,美国正式启动名为"ATOM计划"的新战略,旨在重夺开源AI领域的全球领导地位,根据Hugging Face数据显示,阿里巴巴"通义千问"(Qwen)系列因性能强大且完全免费,正成为全球开发者的首选工具,更令美国担忧的是,Artificial Analysis统计显示,全球性能最强的15个AI大模型中,仅有5个开源模型——而这5个均由中国AI企业开发,ATOM计划建立一个总部位于美国的非营利性AI实验室,专注开发真正开放、供全球开发者自由使用和改进的AI模型。核心配置包括超过10,000块最先进GPU芯片,为大规模AI模型训练提供算力支撑。
## Midjourney 宣布推出全新的高清视频模式
Midjourney 宣布向其 Pro 和 Mega 订阅计划用户推出全新的高清视频模式。这一新功能旨在为需要最高质量影像输出的专业人士提供更优质的创作工具,HD视频模式的生成成本约为默认标清(SD)视频输出的3.2倍,但其像素分辨率提升了约4倍。这一升级显著提高了视频的清晰度和细节表现,满足专业用户在广告、影视制作和创意内容生产等场景中的高标准需求。
## AMD 与高通硬件正式支持 OpenAI 推出的 gpt-oss 系列开放推理模型
AMD 与高通联合宣布,旗下硬件正式支持 OpenAI 推出的 gpt-oss 系列开放推理模型,标志着边缘计算和 AI 的结合迈出了重要一步。OpenAI 新发布的 gpt-oss 系列包括两个模型:参数较少的 gpt-oss-20b 和更复杂的 gpt-oss-120b。前者可以在配备16GB 内存的设备上流畅运行,而后者则能在单个80GB 显卡上高效执行。
## MiniMax推出新一代语音生成模型Speech2.5
MiniMax推出新一代语音生成模型Speech2.5,再次夺得榜单首位,今年5月发布的Speech02相比,Speech2.5在多语种表现力上取得了飞跃性进步,尤其在中文方面继续保持全球最强水平,同时英文及其他多语种的表现也得到了全面提升。
## Xbox Copilot集成到Windows11的游戏栏
微软正在将其Xbox Copilot集成到Windows11的游戏栏中,旨在为玩家提供一个更加智能和便捷的游戏体验。目前,Xbox Insiders成员已可以开始测试这一新功能的预览版。
## 通义千问团队推出Qwen3-4B系列小模型
通义千问团队推出全新Qwen3-4B系列模型,新发布的模型最大特色在于实现了性能与体积的平衡优化。Qwen3-4B-Instruct-2507已经超越了闭源小型模型GPT-4.1-nano的表现水平,同时接近同厂牌大规模模型Qwen3-30B-A3B(非推理版本)的能力。
## Grok2 即将开源
8月6日通过社交媒体透露,马斯克人工智能公司 xAI 即将开源其新款 AI 模型 Grok2。马斯克表示:“现在是时候开源 Grok2了。”
WebSite:https://x.com/elonmusk/status/1952988026617119075
版权声明:感谢您的阅读,资源整理自网络,如果您发现任何侵权行为,请联系 理科生网 管理人员,管理员将及时删除侵权内容。否则均为 理科生网 原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!{alertInfo}