[AI 简讯] 最新全球人工智能行业动态简报

一、OpenAI 发布 Deep Research API 新模型 O3 deep research

OpenAI 发布 Deep Research API 新模型，o3 deep research ，专为高阶分析和深度信息合成设计，支持开发者通过API实现自动化的网页搜索、数据分析、代码执行等功能，为企业、研究人员和开发者提供了强大的工具。

二、ElevenLabs正式发布最新语音设计工具Voice Design v3

AI语音技术领域的领军企业ElevenLabs正式发布其最新语音设计工具Voice Design v3，为内容创作者和开发者带来了前所未有的语音生成体验，Voice Design v3进一步增强了对语音角色的个性化和韵律控制能力。用户可以精确调整语音的语气、语速、语调变化、年龄和性别，打造出符合特定场景或品牌形象的声音表现。

三、谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具

谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问，并对该功能进行了一系列改进。在此之前，谷歌曾悄然暂停了该工具的推出，以便进一步优化用户体验。用户可以通过提出复杂的问题来快速找到所需的照片。尽管该功能具有很大的潜力，但在本月初，谷歌照片团队的一位成员在社交媒体平台 X 上表示，当前的工具在延迟、质量和用户体验方面仍未达到理想状态。

四、小米正式推出其首款小米AI眼镜

6月26日，小米正式推出其首款小米AI眼镜。这款集时尚设计与尖端科技于一身的智能眼镜，以轻量化设计、强大的AI功能和多场景应用为亮点，迅速成为市场关注的焦点。，小米AI眼镜不仅具备第一人称拍摄、语音助手和开放式耳机功能，还通过创新的电致变色技术为用户带来个性化体验，定价从1999元起，目前已在中国市场正式开售。

五、YouTube 宣布将推出两项新的人工智能（AI）功能

YouTube 宣布将推出两项新的人工智能（AI）功能，旨在提升用户的观看体验。其中一项功能类似于 AI 概览，将出现在搜索结果中，而另一项则是对话式 AI 工具的扩展访问。这些新功能的推出，将为用户提供更加智能化的内容搜索和互动方式。这一功能仅对美国的 YouTube Premium 会员开放。

六、谷歌开源 Gemma 3n 多模态模型

Gemma3n提供 E2B 和 E4B 两个版本，只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理，支持140种文本语言和35种语言的多模态理解，在LMArena评测中得分超过1300，成为首个达到此基准的100亿参数以下模型。

七、Google 近期宣布，将在7月7日让其全新的 AI 助手 Gemini 成为用户手机的智能助理，随着 Gemini 的到来，Android 用户将迎来一个更加智能、便捷且注重隐私的手机助手时代。

版权声明：
感谢您的阅读，除非文中已经注明来源网站，否则均为理科生网原创内容，转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接，感谢！{alertInfo}

Ahmedabad

[AI 简讯] 最新全球人工智能行业动态简报 — 2025.6.27

Random Manga

Ads

Anthropic 炸裂收入，今天你还认为AI 存在泡沫吗？

نموذج الاتصال