图像生成升级:支持用自然语言生成更高质量、更细致的图像,适用于创意设计和内容制作,表现优于部分竞品。反思模式(Reflection Mode):能在长任务中理解上下文并进行“反思”,输出更连贯,适合项目规划和多步骤分析。多语言支持:新增中文、日文、韩文显示,尤其在 Python 图表中优化亚洲用户体验。文档导出功能:一键生成 PDF、Word、PPT 文件,便于快速分享和汇报,提升工作效率。这次升级标志着 MiniMax Agent 向“全能 AI 生产力平台”迈出了坚实一步,从多模态能力、文档导出到本地化体验,彰显出以用户为中心的设计理念与拓展全球化的野心。
通过支持创建项目,添加PDF上下文,组织聊天方式,用户可以创建无限个项目,每个项目最多支持 20 个文件,但受速率限制。项目是智能工作区,可将与长期工作相关的所有内容集中管理。您可以分组聊天、上传参考文件并添加自定义说明,以便 ChatGPT 记住重要内容并保持主题一致。凭借记忆功能、上下文和灵活的工具,项目非常适合写作、研究、规划等重复且不断变化的工作。目前可供全球 ChatGPT Plus、Pro 和 Team 用户使用。
V-JEPA 2 是 Meta 最先进的“世界模型”AI,它基于视频数据进行广泛训练,使机器人和 AI 代理能够像人类一样理解、预测和规划物理世界中的动作。核心能力包括:第一理解现实世界场景:通过将视频抽象为有意义的嵌入的编码器来学习视频中的语义特征和对象动态 。第二预测未来状态:预测模块使用当前嵌入(甚至假设动作)来预测接下来发生的事情 - 就像预测球的轨迹一样 。第三规划/零样本控制:*通过在其学习的世界模型中模拟动作结果,它可以*在无需额外训练的情况下规划和执行物理任务,从而有效地使机器人能够操纵看不见的物体或在陌生的环境中导航 。第四视频问答:支持链接到语言模型,以解释、回答查询或从因果关系、物理和行动意图的角度描述视频序列。
AMD 与 OpenAI 联合发布强大 AI 芯片:推理性能提升35倍
AMD 与 OpenAI 推出了最新的 Instinct MI400和 MI350系列 AI 芯片,MI350系列显著提升了 AI 计算性能,MI400系列则面向下一代旗舰 AI 计算需求。此外,ROCm7平台进一步推动了 AI 开发者的效率。
谷歌最新、最先进的文本转图像生成模型 Imagen 4 已正式集成到 Gemini AI 平台,标志着 Gemini 图像生成能力获得重大升级 。此次集成于 2025 年谷歌 I/O 大会前后宣布,所有 Gemini 用户均可使用,包括免费版和高级订阅版用户。
Kalshi 雇佣使用谷歌的文本转视频生成器 Veo 3 制作广告。数百万观看NBA总决赛的观众面前播放了一则由AI生成的荒诞广告——而制作成本仅为2000美元。广告内容为,有一位身穿美国国旗的赤裸上身的老先生、一位漂浮在装满鸡蛋的充气泳池中的农民、一个喝着一壶啤酒的外星人,以及一位身穿闪亮粉色运动服驾驶赞博尼冰车的女士。
马克·扎克伯格亲自出马抢 AI 天才!
扎克伯格正通过冷邮件、WhatsApp 一对一私聊,从 Google、DeepMind、OpenAI 等巨头猎取顶尖 AI 人才。他向这些研究者承诺:极高的自主权、Meta 庞大的产品平台支持、海量基础设施投资,以及高达八位数甚至九位数的“天价”薪酬包!
超过 80% 的财富 500 强企业拥有 51 个以上生成式 AI 项目提案。但仅 18% 的企业成功将 20 个以上模型投入生产。多数项目从构想到上线需耗时 6 至 18 个月。企业面临严重的“执行力差距”,导致投资回报延迟、内部信心下降、利益相关者不满。
英国正在通过与 NVIDIA 等公司合作解决技能差距
英国正在通过与 NVIDIA 等公司合作解决技能差距等问题,巩固其作为欧洲人工智能强国的地位。
英国政府与 NVIDIA 签署备忘录(MoU),联合推动全国 AI 人才培养,涵盖从中学、大学到在职人员和公务员,计划未来 5 年大力提升 AI 能力。NVIDIA 大力支持英国政府的国家技能推动计划,并计划在英国建立一个专门的 AI 技术中心。英国土壤。该中心承诺提供人工智能、数据科学以及日益重要的加速计算领域的实践培训。
据英国广播公司报道,英国教师已获准使用人工智能来帮助他们完成属于其职责范围的低级任务。
英国教育部 (DfE) 的指导意见称,英格兰的学校教师可以使用人工智能,但它只能用于“低风险”任务,例如给父母写信和批改家庭作业。
纽约州立法者周四通过了一项法案,旨在防止OpenAI、谷歌和Anthropic的前沿AI模型导致灾难场景,包括造成超过100人死亡或受伤,或超过10亿美元的损失。
由 Eliza McNitt 编剧、导演,与 Darren Aronofsky 创立的 Primordial Soup 工作室合作,与 Google DeepMind 联手制作。影片于2025年6月13日在 Tribeca 电影节全球首映,讲述一位母亲面对心脏有缺陷婴儿诞生时的宇宙式母爱与救赎。将实景拍摄与 DeepMind 的视频生成模型 Veo 融合,实现更具想象力的视觉表达。
该工具的初始版本将被称为“V1 视频模型”,并将在 Midjourney 完成一些收尾工作后正式发布。
目前,该视频模型无法通过 Midjourney 网站甚至 Discord 访问。查看示例视频的唯一途径是通过视频评级小组。
卫报调查发现近 7,000 起已证实的作弊案件
数千的大学生英国《卫报》的一项调查显示,近年来,许多研究人员被发现滥用 ChatGPT 和其他人工智能工具,而传统形式的抄袭行为则明显减少。关于学术诚信违规行为的调查发现,2023-24学年,利用人工智能工具作弊的案例已证实近7000起,相当于每1000名学生中就有5.1起。这一数字高于2022-23学年的每1000名学生中1.6起。
版权声明:Ahmedabad
感谢您的阅读,除非文中已经注明来源网站,否则均为理科生网原创内容,转载时请务必以超链接(而非纯文本链接)标注来源于理科生网及本文完整链接,感谢!{alertInfo}