当前位置: 首页 > news >正文

2026年6月24日Google DeepMind集成计算机使用能力到Gemini 3.5 Flash,简化开发提升任务可靠性

2026年6月24日,Google DeepMind团队宣布将计算机使用能力原生集成到Gemini 3.5 Flash模型,让开发者能通过单一模型构建AI Agent,此能力通过相关平台向开发者开放。

集成优势显著

此前计算机使用能力需额外调用独立模型,如今集成到3.5 Flash,简化开发者体验。一个Agent进行多步骤任务时,可在同一模型上下文使用多种工具,无需切换模型和传递上下文,改善了任务可靠性和延迟。

架构决策关键

这种“多工具合一”架构反映Google DeepMind对AI Agent发展方向的判断,认为其可靠性瓶颈在于多工具间的上下文切换和信息损失。统一模型架构可降低复杂任务失败概率。

应用场景广泛

Google为计算机使用定义三个核心场景,包括长时间自动化任务、持续性软件测试和跨应用知识工作。这些场景需在多上下文保持连续工作流。

安全多层防御

Google采用多层防御策略,有针对性对抗训练、企业安全护栏和间接提示注入检测。加上沙箱隔离等构成完整安全边界,但也承认在开放环境管理风险挑战大。

评测风格转变

发布时未强调标准benchmark排名,可能因标准化评测无法反映现实任务复杂性,Google用定性表述暗示对此的自觉。

编辑观点:Google此举是AI Agent领域的重要创新,简化开发且拓展应用场景,虽安全有挑战,但未来有望推动AI在更多领域落地。

http://www.gsyq.cn/news/1590042.html

相关文章:

  • 深度剖析Mos:Swift构建的macOS鼠标滚动平滑引擎架构揭秘
  • AppGen:基于Groq LPU的确定性AI应用编译范式
  • Python图像处理三驾马车:Pillow、OpenCV与NumPy实战指南
  • XUnity自动翻译器终极指南:5分钟实现Unity游戏无障碍本地化
  • 任意矩阵的Moore-Penrose伪逆
  • GPT-4参数量真相:为何1.8万亿说法不成立
  • TurtleBot3搭载RealSense D435i硬件集成全指南
  • 三步搞定downkyi视频旋转:告别竖屏视频方向混乱的终极解决方案
  • C语言实现RSA算法:从大数运算到安全工程的深度实践
  • 从Daugavet性质到超限推广:Banach空间几何的深度探索
  • 迅雷影音播放器深度评测:编解码能力、硬件加速与功能解析
  • PCL2启动器性能优化指南:5个关键技巧让Minecraft流畅运行
  • MTKClient终极指南:5步掌握联发科设备底层控制的完整解决方案
  • Viewer.js图像查看器:如何为现代Web应用构建专业级图片浏览体验?
  • OpenAI替代方案实战指南:5大可落地AI API选型与迁移路径
  • 神奇技巧:从Word文档中“挖矿“文献引用,拯救你的学术论文
  • 医疗AI幻觉防控:三层工程化防御体系实战
  • IntelliJ IDEA Windows安装失败真相大起底:Registry权限劫持、UAC虚拟化、企业组策略封锁——3大隐藏拦截器曝光
  • YOLOv8 AI自瞄终极指南:三步打造你的FPS游戏智能瞄准助手
  • 免费开源虚拟桌面伴侣:5分钟打造你的专属二次元伙伴
  • 抖音无水印视频批量下载终极指南:从技术原理到高效实践
  • 言语理解靠语感够吗?公考新手该怎么练阅读和选项判断
  • 如何1分钟搞定iPhone USB网络共享:Windows驱动快速安装完整指南
  • Bebas Neue字体完整指南:免费开源标题字体的终极解决方案
  • SPT-AKI存档编辑器:你的塔科夫离线版终极管理解决方案
  • 基于PwnDoc的渗透测试审计管理平台实战:提升团队协作与项目质量
  • 对不起,我们跑路了……我被中转站坑了3次,直到我做了这个工具
  • 怎样强制调整任意窗口大小:WindowResizer免费工具终极指南
  • 一文讲透|2026年最值得用的专业AI论文网站
  • Z-Image中文轻量文生图模型:4060 Ti本地3秒出图实战指南