ZoyaPatel

最新 AI 进展消息 | 8月19 日 全球人工智能动态简报 !| 理科生网

SohaniSharma

## 8月19 日 全球人工智能动态简报 !英伟达发布了一个只有9B大小的NVIDIA Nemotron Nano 2模型阿里推出Qwen-Image-Edit、理想汽车今日正式发布MindGPT3.1、小红书AIGC发布DynamicFace的可控人脸生成技术。www.lksr.net{alertInfo}

本文由人工编写审核,非AI生成内容,请放心观看!

{getToc} $title={文章目录}

## 英伟达发布9B大小的NVIDIA Nemotron Nano 2模型

英伟达发布了一个只有9B大小的NVIDIA Nemotron Nano 2模型。对标的是业界标杆,千问的Qwen3-8B,但这个模型是一个完全不同的混合架构。用英伟达的说法,这是一款革命性的Mamba-Transformer混合架构语言型。Nemotron-Nano-9B-v2的强大,源于其创新的Nemotron-H架构。用闪电般快速的**Mamba-2层,替换了传统Transformer架构中绝大多数的自注意力层。


项目地址:https://research.nvidia.com/labs/adlr/NVIDIA-Nemotron-Nano-2/

## 阿里推出Qwen-Image-Edit

这是其此前8月5日推出的图像生成基础模型Qwen-Image的图像编辑版本。用户可以通过Qwen-Image-Edit在图中添加指示牌,指定指示牌中上的文本为“Welcome to Penguin Beach”。下面右图不仅准确生成了用户所需要素,指示牌下还生成了自然的倒影。Qwen-Image-Edit基于其20B的Qwen-Image模型进⼀步训练,将Qwen-Image的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。


开源地址:https://huggingface.co/Qwen/Qwen-Image-Edit

## 理想汽车今日正式发布MindGPT3.1

MindGPT3.1的核心亮点是将智能体能力深度融入大模型架构中,支持"边想边搜"功能,能够在推理过程中同步调用各类工具,为用户提供更加快速、全面、准确的结果。这种设计让AI助手具备了更强的实时处理和多任务协调能力。

## Vercel  v0正式推出 iOS 版

Vercel 宣布其备受关注的 AI 驱动开发工具 v0正式推出 iOS 版,为移动开发者带来了全新的构建体验。现已正式开放候补名单注册。以“Anything. Anyone. Anywhere.”为 slogan,官网注册通道现已开启,欢迎开发者抢先体验。

地址:https://v0.app/ios

## Grammarly 升级AI新功能

Grammarly 近日推出了一系列专为学生和教育工作者设计的 AI 写作助手。这些新工具旨在帮助学生更好地应对写作挑战,包括评估论文质量、生成引用和检查抄袭等功能。

## 小红书AIGC发布DynamicFace的可控人脸生成技术

小红书AIGC团队近日正式发布了名为DynamicFace的可控人脸生成技术。DynamicFace强调"可控性",这意味着用户能够对人脸生成过程进行精确控制,而非完全依赖算法自动生成。这种可控性设计能够更好地满足用户的个性化需求,提供更加精准的创作体验。

项目地址:https://dynamic-face.github.io/

## Meta对其AI聊天机器人制定了令人震惊的行为准则

路透社记者杰夫·霍洛维茨近日披露的一份超过200页的内部文件显示,Meta对其AI聊天机器人制定了令人震惊的行为准则。这份已获得Meta法律、工程和公共政策团队批准的政策文件,文件中最令人不安的条款包括允许AI与18岁以下用户进行"浪漫或性感对话",甚至包括"用能证明其吸引力的词语描述儿童"。

## ChatGPT Go 订阅计划

OpenAI 宣布推出新的 ChatGPT Go 订阅计划,该计划目前仅在部分地区上线,例如印度。用户现在可以以大约每月5美元(399印度卢比)的价格体验到最新的 GPT-5模型。ChatGPT Go 计划的推出似乎是 OpenAI 为了扩大其用户基础而采取的策略,特别是针对那些希望从免费版中获得更多功能的用户


## ARM 最近成功引进了亚马逊 AI 芯片主管

芯片架构授权公司 ARM 最近成功引进了亚马逊 AI 芯片主管拉米・辛诺(Rami Sinno),此举旨在加速公司自研完整芯片的进程。辛诺在亚马逊曾负责开发名为 “Trainium” 和 “Inferentia” 的 AI 芯片,这些芯片专为支持大型 AI 应用程序而设计。

## Gemini正式推出URL Context功能

这一创新工具允许开发者直接在API中嵌入网页链接,极大地简化了内容获取流程,同时也为内容提供商和开发者开启了全新的商业可能性。Gemini API的URL Context功能允许开发者在提示中直接提供网页链接,模型能够自动访问并解析网页内容,涵盖标准网页、PDF文件、图片等多种格式。这一功能省去了传统需要通过额外脚本(如Python的requests库)抓取网页内容的步骤,极大提升了开发效率。

地址:https://ai.google.dev/gemini-api/docs/url-context?hl=zh-cn


## 苹果Xcode即将原生集成Claude

苹果正准备为Xcode开发环境引入Anthropic的Claude AI助手,为开发者提供更多AI编程选择。苹果的动作有点慢,其实各大厂商已经在努力的推荐的编程IDE 内嵌入 编程助手了,Xcode 动作说实话有点慢了!

## ElevenLabs宣布了两项重大更新

AI语音技术领域的先锋企业ElevenLabs近日宣布了两项重大更新:全新的视频到音乐生成流程以及专为学生设计的AI学生包。这两项创新不仅进一步巩固了ElevenLabs在AI音频领域的领先地位,还为内容创作者和学生群体提供了更高效、更经济的创作工具。

## 腾讯大模型训练库WeChat-YATT

腾讯近日发布了基于Megatron-Core和SGLang/vLLM研发的大模型训练库WeChat-YATT(Yet Another Transformer Trainer),内部项目代号为gCore。这一训练库专注于强化学习和多模态模型训练,致力于为开发者提供易扩展、简洁、高效、可靠的大模型训练解决方案。WeChat-YATT通过定制化的并行计算策略,能够有效处理大尺寸模型、长序列输入和大数据集等复杂场景,成功解决了微信内部多个实际业务场景的关键痛点问题,显著提升了大模型训练效率。

项目地址:https://github.com/Tencent/Wechat-YATT

## AI 技术简化动漫制作流程

中国香港中文大学和腾讯 PCG 的研究团队推出的 ToonComposer,将这一过程大大简化,利用生成式 AI 技术,ToonComposer** 的 “生成后补间” 技术,可以让用户只需提供一张草图和一帧彩色图像,便能生成完整的卡通视频,节省高达70% 的人工工作时间,让创作者可以将更多精力投入到创作本身。 

地址:https://lg-li.github.io/project/tooncomposer/

## 苹果iPhone 17已进入大规模量产阶段

记者从产业链人士处获悉,苹果iPhone 17已进入大规模量产阶段。记者注意到,富士康作为苹果iPhone的主要代工生产商,其郑州厂区正开展旺季招工。

## SpaceX 用不着缴税

SpaceX 是埃隆·马斯克的火箭和卫星互联网公司,在它成立的二十多年里,获得了数十亿美元的联邦合同。但据《纽约时报》查看的公司内部文件显示,SpaceX 自2002年成立以来,几乎没有缴纳过联邦所得税,而且它私下告诉投资者,可能永远都用不着缴税。

## 山姆承认 GPT-5这事儿,我们搞砸了

为了推广GPT-5,OpenAI一声招呼都不打就直接把其他型号给一刀切了,然后在用户的一片吐槽声中又把GPT-4o给加了回来。对此,奥特曼在最近的一次记者晚宴上也干脆利落地承认:没错,GPT-5这事儿,我们搞砸了。上一个这么公开承认搞砸模型发布的还是小扎,于是开始启动疯狂招人模式。

## 脉脉发布AI人才报告

根据脉脉发布的相关岗位数统计,2025年7月,脉脉上人工智能新发岗位量相较2024年1月暴涨29倍,有超过1000家人工智能企业在脉脉上招聘人才,相关在招岗位数量超过7.2万个,除了技术岗位之外,设计、销售、人事、财务、行政、运营、市场等多个非技术岗位也在热招。人工智能相关岗位的平均月薪普遍在4.7万至7.8万元之间,部分人工智能实习生的日薪达4000元。

## 山姆奥特曼认为美国可能低估了中国在人工智能

OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)最新警告称,美国可能低估了中国在人工智能(AI)方面取得进展的复杂性和严重性,并表示仅靠出口管制可能不是可靠的解决方案。

版权声明:感谢您的阅读,资源整理自网络,如果您发现任何侵权行为,请联系 理科生网 管理人员,管理员将及时删除侵权内容。否则均为 理科生网 原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!{alertInfo}

Ahmedabad
Kolkata
Hyderabad
后一页 Bangalore 前一页

Random Manga

Ads

نموذج الاتصال