ZoyaPatel

[AI 简讯] 最新全球人工智能行业动态简报 — 2025.6.27

SohaniSharma

 一、OpenAI 发布 Deep Research API 新模型 O3 deep research

OpenAI 发布 Deep Research API 新模型,o3 deep research ,专为高阶分析和深度信息合成设计,支持开发者通过API实现自动化的网页搜索、数据分析、代码执行等功能,为企业、研究人员和开发者提供了强大的工具。



二、ElevenLabs正式发布最新语音设计工具Voice Design v3

AI语音技术领域的领军企业ElevenLabs正式发布其最新语音设计工具Voice Design v3,为内容创作者和开发者带来了前所未有的语音生成体验,Voice Design v3进一步增强了对语音角色的个性化和韵律控制能力。用户可以精确调整语音的语气、语速、语调变化、年龄和性别,打造出符合特定场景或品牌形象的声音表现。

三、谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具

谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问,并对该功能进行了一系列改进。在此之前,谷歌曾悄然暂停了该工具的推出,以便进一步优化用户体验。用户可以通过提出复杂的问题来快速找到所需的照片。尽管该功能具有很大的潜力,但在本月初,谷歌照片团队的一位成员在社交媒体平台 X 上表示,当前的工具在延迟、质量和用户体验方面仍未达到理想状态。

四、小米正式推出其首款小米AI眼镜

6月26日,小米正式推出其首款小米AI眼镜。这款集时尚设计与尖端科技于一身的智能眼镜,以轻量化设计、强大的AI功能和多场景应用为亮点,迅速成为市场关注的焦点。,小米AI眼镜不仅具备第一人称拍摄、语音助手和开放式耳机功能,还通过创新的电致变色技术为用户带来个性化体验,定价从1999元起,目前已在中国市场正式开售。

五、YouTube 宣布将推出两项新的人工智能(AI)功能

YouTube 宣布将推出两项新的人工智能(AI)功能,旨在提升用户的观看体验。其中一项功能类似于 AI 概览,将出现在搜索结果中,而另一项则是对话式 AI 工具的扩展访问。这些新功能的推出,将为用户提供更加智能化的内容搜索和互动方式。这一功能仅对美国的 YouTube Premium 会员开放。

六、谷歌开源 Gemma 3n 多模态模型

Gemma3n提供 E2B 和 E4B 两个版本,只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解,在LMArena评测中得分超过1300,成为首个达到此基准的100亿参数以下模型。

七、Google 近期宣布,将在7月7日让其全新的 AI 助手 Gemini 成为用户手机的智能助理,随着 Gemini 的到来,Android 用户将迎来一个更加智能、便捷且注重隐私的手机助手时代。


版权声明:
感谢您的阅读,除非文中已经注明来源网站,否则均为理科生网原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!
{alertInfo}
Ahmedabad
Kolkata
Hyderabad
后一页 Bangalore 前一页

Random Manga

Ads

نموذج الاتصال