ZoyaPatel

最新 AI 进展消息 | 8月18 日 全球人工智能动态简报 !| 理科生网

SohaniSharma

##  8月18 日 全球人工智能动态简报 !Anthropic的命令行编程工具Claude Code昨晚推出重要功能更新、甲骨文(Oracle)与谷歌云(Google Cloud)再度加深合作、为什么 LLM 无法真正构建软件、GPT 5 发布会的反思www.lksr.net {alertInfo}

本文由人工编写审核,非AI生成内容,请放心观看!

{getToc} $title={文章目录}

## Anthropic的命令行编程工具Claude Code昨晚推出重要功能更新

Anthropic的命令行编程工具Claude Code昨晚推出重要功能更新,专门针对编程初学者推出了个性化沟通风格设置,让AI编程助手变得更加智能和人性化。用户现在可以通过/output-style命令自定义Claude的交流方式,系统内置了两种专业的沟通风格,分别针对不同学习需求进行优化。解释型风格专注于深度教学,Claude会详细阐述自己的推理过程,包括架构设计决策、技术方案的权衡取舍,并在编程过程中主动传授行业最佳实践。这种模式特别适合希望深入理解代码背后原理的开发者,能够帮助用户建立扎实的编程基础和良好的代码习惯。学习型风格则采用更加互动的教学方式,Claude会在对话中适时暂停,引导用户亲自完成部分编程任务

## 甲骨文(Oracle)与谷歌云(Google Cloud)再度加深合作

甲骨文(Oracle)与谷歌云(Google Cloud)再度加深合作,宣布将为客户提供更为强大的 AI 服务,甲骨文将利用其云基础设施(OCI)为客户带来谷歌的先进 AI 模型,其中初期版本为 Gemini 2.5。

## 为什么 LLM 无法真正构建软件

开源代码编辑器 Zed 的开发团队发布了一篇引人关注的博文,题为《为什么 LLM 无法真正构建软件》。这篇文章由 Conrad Irwin 撰写,迅速引发了技术圈的热烈讨论,尤其是在 Hacker News 上,众多开发者纷纷发表看法,聚焦于 AI 辅助编程的本质。

## GPT 5 发布会的反思

GPT 5 发布会的反思:他们对用户的需求了解得远远不够。许多用户对之前的 GPT-4o 模型表现出极大的依赖与喜爱,尤其是一些核心用户在该模型被突然淘汰后感到十分不满。为了应对用户的强烈反应,OpenAI 决定恢复 GPT-4o 模型的使用权限,仅对付费用户开放。

OpenAI

## “兴智杯” 全国人工智能创新应用大赛

第二届 “兴智杯” 全国人工智能创新应用大赛如火如荼地进行中,这一赛事不仅以超200万元的奖金池吸引了众多目光,更是成为了国内规模最大、参赛主体最丰富的 AI 赛事之一。由工业和信息化部、科学技术部等多个机构共同主办,这场比赛面向全社会开放,欢迎各类企事业单位、高校团队以及个人开发者的参与。

## OpenAI表达想法购买的Chrome 

OpenAI 的首席执行官山姆・奥特曼近日在接受媒体采访时,透露了公司多项发展计划,并对收购谷歌的 Chrome 浏览器表示了兴趣。奥特曼明确表示:“如果 Chrome 真的要出售,我们应该考虑。” 

## OpenAI 对其 ChatGPT 网页应用进行了重大的更新

OpenAI 对其 ChatGPT 网页应用进行了重大的更新,尤其是在语音模式方面。新增加的 “语音速度” 选项,让用户能够更灵活地调节 ChatGPT 的语音说话速度。用户可以通过一个滑块选择速度,范围从0.5倍速到2.0倍速,满足不同用户的需求。

## 阿里巴巴自然语言处理团队宣布推出WebWatcher

阿里巴巴自然语言处理团队宣布推出WebWatcher,这是一个开源的多模态深度研究智能体,旨在突破现有闭源系统和开源Agent在多模态深度研究领域的局限性。WebWatcher通过整合网页浏览、图像搜索、代码解释器和内部OCR等多种工具,能够像人类研究员一样处理复杂的多模态任务,展现出强大的视觉理解、逻辑推理、知识调用、工具调度和自我验证能力。

仓库地址:https://github.com/Alibaba-NLP/WebAgent

## AI技术重新定义催收行业

一家名为Salient的初创公司正在用AI技术重新定义催收行业。这家仅有 16 名员工的公司凭借多语言AI催收代理技术,在不到 18 个月的时间里创造了 1400 万美元的年收入,展现出惊人的增长速度和市场潜力。Salient开发的AI催收代理具备强大的多渠道沟通能力,可以通过语音通话、短信和网页等多种方式与客户进行交互。更值得关注的是,该系统能够基于借款人的历史互动记录自动调整沟通策略和话术,实现个性化的催收服务。

## OpenAI 万亿美元投入AI 

OpenAI首席执行官萨姆·奥特曼近日发表了一项雄心勃勃的声明,表示希望在未来投入数万亿美元用于开发和运行人工智能服务所需的基础设施建设。在接受记者采访时,奥特曼明确表示:"你应该预计OpenAI在不远的未来投入数万亿美元用于数据中心建设。"

## 调查Meta的生成式AI产品

美国参议员乔什·霍利(Josh Hawley,共和党-密苏里州)表示,他将调查Meta的生成式AI产品是否存在剥削、欺骗或伤害儿童的行为。此前泄露的内部文件显示,该公司的聊天机器人被允许与儿童进行"浪漫"和"感性"对话。

## Qwen 3 调用量增加

根据全球知名AI模型聚合平台OpenRouter的最新数据,从2025年7月21日至8月11日,阿里云通义千问团队研发的Qwen3模型在API调用量上实现了显著增长,使用量飙升15.4%,展现出强劲的市场竞争力。与此同时,Anthropic的Claude模型使用量下降了18.9%,Google的Gemini模型则下降了6.8%。

Qwen3 openrouter LLM Ranking

## 一款名为UnMarker的新工具

一款名为UnMarker的新工具声称能够在短短5分钟内破解市场上几乎所有AI图像水印,其中包括谷歌备受推崇的HiDDeN水印技术已被完全攻破,就连被认为更加安全的SynthID水印系统也面临79%的高攻击成功率。UnMarker的核心优势在于无需精确定位水印位置,而是直接对图像的频谱信息进行修改,通过有效扰乱水印信号来实现去除效果。这种通用性设计使得UnMarker能够适应多种不同类型的水印系统,实验数据显示其去除成功率在57%至100%之间波动。

项目地址https://github.com/andrekassis/ai-watermark

## 百度发布全端通用智能体GenFlow2.0

在百度AI Day开放日上,百度发布全端通用智能体GenFlow2.0,,GenFlow2.0展现出强大的并行处理能力,支持超100个专家智能体同时协作,能够在3分钟内并行完成超5项复杂任务。该产品的生成速度超越主流同类型产品10倍,GenFlow2.0目前已在百度文库Web端和APP端正式上线,采用开放策略,所有用户均可直接使用,无需排队等待或申请邀请码。

## 萨姆・奥尔特曼(Sam Altman) 公司上市后继续担任 CEO 持保留态度

OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)在接受媒体采访时透露,他对在公司上市后继续担任 CEO 持保留态度。尽管 OpenAI 正在推进数万亿美元级的计算基础设施投资计划,奥尔特曼表示自己并不确定是否适合这一角色。他特别提到,上市企业的领导者需要具备应对复杂投资者关系和监管环境的能力,而这正是他所缺乏的。他表示:“我相信公司最终会走向上市,但不确定自己是否适合执掌上市后的 OpenAI。”

## OpenAI 的 ChatGPT 移动应用收入

根据应用情报提供商 Appfigures 的最新分析,自2023年5月推出以来,OpenAI 的 ChatGPT 移动应用在全球消费者支出中已经达到了惊人的20亿美元。这一收入数字是其竞争对手 Claude、Copilot 和 Grok 等的移动端终身消费总和的30倍。

## 中国 AI 公有云服务市场份额,2024:全面向生成式 AI 演进

 IDC 最新发布的《中国 AI 公有云服务市场份额,2024:全面向生成式 AI 演进》报告,2024年中国 AI 公有云服务市场规模预计将达到195.9亿元人民币,较2023年增长55.3%。这一增长主要得益于生成式 AI 应用的不断扩展以及机器学习需求的显著上升,推动了云服务市场的快速发展。

## 腾讯推出AudioGenie进军音频生成领域

腾讯推出AudioGenie进军音频生成领域,AudioGenie支持视频、文本和图像等多种模态输入,能够生成音效、语音、音乐以及混合音频输出。无论是为影视作品生成沉浸式背景音乐、为虚拟人物配音,还是为游戏场景添加逼真的环境音效,AudioGenie都能轻松胜任。

## AI健康管家AQ同步推出AI拍照打假

AI 打假、阿里巴巴旗下的AI健康管家AQ同步推出AI拍照打假、AI电话验真、24小时滚动辟谣等系列创新功能。用户仅需在AQ App输入"打假"指令,即可通过拍照识别身边医药保健品广告真伪,利用AI通话实时验证健康谣言,获取全天候更新的辟谣资讯,并依托平台联合的30万真人执业医师团队及300余位由中科院院士领衔的AI名医分身,实现24小时在线问诊。

## 电商平台出现一种新型恶意退款行为

电商平台出现一种新型恶意退款行为:部分买家利用人工智能工具伪造商品损坏图片,申请“仅退款”,导致商家遭受货款和运费的双重损失。这一现象引起广泛关注,揭示了AI技术被滥用所带来的新挑战。商家们在社交平台吐槽,买家利用AI将完好无损的商品,如衣物、杯子或玩具,通过“伪毁损”处理,使其在图片上呈现出碎裂或有瑕疵的状态。这些伪造的图片逼真,让商家难辨真伪。

## 字节Seed发布全新多模态智能体框架

字节Seed发布全新多模态智能体框架——**M3-Agent**。M3-Agent的亮点在于,它不仅能够处理实时的视觉和听觉输入,以构建和更新其长期记忆,还发展了语义记忆,能够随着时间的推移积累知识。为了评估多模态智能体中的记忆有效性和基于记忆的推理,来自字节Seed、浙江大学和上海交通大学的研究团队还开发了一个新的长视频问答基准:**M3-Bench**,同样开源。通过强化学习训练的M3-Agent在多个基准测试中表现均显著优于基线模型(包括基于商业模型如Gemini-1.5-Pro和GPT-4o的智能体)。

文章地址https://www.qbitai.com/2025/08/322954.html

## AMD CEO苏姿丰,公开“怼”起了扎克伯格

就在AI人才争夺战打得最激烈的当口,她明确表态不会像Meta的扎克伯格那样动辄开出1亿美元年薪挖人。她的核心观点很直白——钱很重要,但不是最重要的。这位带领AMD从濒临破产到市值千亿的传奇CEO,还特别强调了一点:不应该让员工觉得自己只是机器上的一个齿轮。钱很重要,但坦率地说,在吸引人才方面,它不一定是最重要的。她希望吸引的是那些渴望在技术领域做出重要贡献、能够推动公司未来发展蓝图的人才。

文章地址https://www.qbitai.com/2025/08/322932.html

## AI性能的提升,一半靠模型,一半靠提示词

马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。他们让DALL-E 2和DALL-E 3来了一场PK,1,893名「选手」在10次尝试中,用随机分配三种模型之一复现目标图像。令人惊讶的是,DALL-E 3图像相似度显著优于DALL-E 2。其中,模型升级本身仅贡献了51%的性能,剩余的49%全靠受试者优化的提示词。

文章地址https://www.36kr.com/p/3428131017330310

版权声明:感谢您的阅读,资源整理自网络,如果您发现任何侵权行为,请联系 理科生网 管理人员,管理员将及时删除侵权内容。否则均为 理科生网 原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!{alertInfo}

Ahmedabad
Kolkata
Hyderabad
后一页 Bangalore 前一页

Random Manga

Ads

نموذج الاتصال