当前位置: 首页 > news >正文

Gemini 3.5 Flash 发布公告 越级、提速,Google 正式转向智能体竞争

模型概览多模态、超长上下文、全入口覆盖Gemini 3.5 Flash 是一款原生支持 文本、图像、音频、视频 输入的多模态模型拥有 100 万 token 的上下文窗口输出上限为 64K token。目前它已全面进入 Google 多个核心入口包括Gemini AppGemini APIGoogle AI StudioSearch AI ModeGoogle Antigrav性能基准测试Flash 越级但 Pro 仍有保留地在多项基准测试中Gemini 3.5 Flash 直接超越了上一代旗舰 Gemini 3.1 Pro尤其是在智能体编程、真实世界智能体任务和多模态理解上表现突出。智能体编程能力Terminal-Bench 2.1Flash 得分 76.2%超过 3.1 Pro 的 70.3%。真实世界智能体任务GDPval-AA EloFlash 获得 1656 分3.1 Pro 只有 1314 分差距拉到 342 分已逼近 GPT-5.4 的 1674 分。规模化工具使用MCP AtlasFlash 为 83.6%高于 3.1 Pro 的 78.2%。多模态理解MMMU-ProFlash 以 84% 的成绩登顶压过 Claude Opus 4.7 和 GPT-5.5。独立评测机构 Artificial Analysis 的综合智能指数Flash 为 55 分距离 Claude Opus 4.757 分只差 2 分但使用成本仅为后者的三分之一。不过Flash 并非在所有指标上都超越上一代 Pro。在极限推理和长上下文任务中Pro 仍有优势Humanity‘s Last ExamFlash 为 40.2%低于 3.1 Pro 的 44.4%。ARC-AGI-2Flash 为 72.1%低于 3.1 Pro 的 77.1%。长上下文 MRCR v2128k 平均Flash 为 77.3%低于 3.1 Pro 的 84.9%。Flash 在代理、编码、多模态及多数专业任务上完成了对上一代 Pro 的越级但在极限推理和部分长上下文任务上Pro 仍保持优势。这也符合 Google 的产品分层策略。速度与成本生成速度是 Gemini 3.5 Flash 的另一项硬指标。它每秒可输出近 290 个 token是其他前沿模型的 4 倍。Ars Technica 在现场报道中评价“这个速度让生成式 AI 终于显得合理了”。对于开发者而言在做 AI Agent 时延迟不再拖后腿。长链任务、多步骤调用、实时交互等此前受限于推理速度的场景现在 Flash 提供了新的可能。定价方面Gemini 3.5 Flash 的标准付费档为每 100 万 tokens 输入 1.50 美元输出 9.00 美元批处理价格则降至输入 0.75 美元、输出 4.50 美元。相比 Gemini 3.1 Pro 的标准档输入 2.00 美元、输出 12.00 美元Flash 保持了更低的使用门槛。这意味着在一些 Agent 和 Coding 任务中开发者可以重新评估模型选择——不一定所有任务都要上 Pro也不一定所有复杂工作流都要用最贵模型。一个足够强、足够快、足够稳定的 Flash反而可能成为默认选择。这就是所谓的 “单位智能成本”竞争。当 AI 进入真实业务场景真正决定落地速度的往往是三件事性能、延迟、成本。Flash 正在打这个位置。Gemini Omni视频生成领域的「Nano Banana」Gemini Omni 是 Google 在视频生成领域的“Nano Banana”。和单纯追求画面真实度的视频模型不同Google 给 Omni 的定位是 “从任意输入创造任意内容”文本、图片、音频、视频都可以作为输入模型先理解素材之间的关系再生成或编辑新的视频内容。Omni 把 Gemini 的推理能力与 Google 既有的生成式媒体模型结合起来不只是让画面动起来而是尝试理解场景中的物理关系、运动逻辑和空间变化。用户只需要输入一句提示Omni 就能把抽象科学概念转化成直观的视频表达。更重要的是它支持对已有视频进行自然语言编辑比如更换风格、加入元素、调整氛围甚至把普通画面改造成更具戏剧感的电影场景。第一款 Omni 家族模型 Gemini Omni Flash 已开始进入 Gemini App、Google Flow 和 YouTube Shorts 等产品。这意味着 Google 不只是发布了一个视频模型而是要把视频生成和编辑能力嵌入到自己的内容创作与分发。未来展望官方确认Gemini 3.5 Pro 正在内部测试预计下月发布。Flash 已经能打上一代 Pro那么这一代 Pro 能不能冲顶大模型榜单将是接下来的最大看点。Gemini 3.5 Flash 的发布标志着 Google 从模型竞争正式转向 Agent 竞争。更快、更便宜、更稳定的智能体基础设施正在成为新的生态制高点。ALL IN ONE 通用智能AGI服务行业领先的AI服务供应商探索智能边界发现无限可能
http://www.gsyq.cn/news/1383099.html

相关文章:

  • 资源受限下基于AoI感知与DRL的智能波束预测框架
  • 2026质感瓷砖选购全解析:核心判断维度+高端品牌信息,避坑选购有参考 - 寻茫精选
  • YOLOv8垃圾分类识别检测系统(项目源码+YOLO数据集+模型权重+UI界面+python+深度学习+环境配置)
  • 5步掌握大麦网抢票神器:告别黄牛票的Python自动化方案
  • YOLOv8道路坑洼识别检测系统(项目源码+YOLO数据集+模型权重+UI界面+python+深度学习+环境配置)
  • FModel终极指南:5步掌握虚幻引擎游戏资源提取的完整解决方案
  • PHP远程命令执行漏洞(RCE)原理与实战防御指南
  • HiveWE:魔兽争霸III地图编辑器的现代化革新
  • 低成本高精度激光测距:基于CCD三角法的DIY方案与Arduino集成
  • USBCopyer终极指南:Windows平台U盘文件自动备份与管理神器
  • 国产数据中台的下半场:为什么ETL不再是ETL,数据开发正在被重新定义
  • 吃透Docker!从原理、安装、核心命令到镜像制作、网络实战(保姆级入门教程)
  • 5分钟掌握SPT-AKI存档编辑器:离线塔科夫终极修改工具完整指南
  • 艾尔登法环帧率优化完全指南:从卡顿到丝滑的终极解决方案
  • AI算法工程师必知的深度学习优化技巧:这4个方法让你的模型更高效
  • 新手教程使用Python和OpenAI兼容SDK五分钟接入Taotoken
  • go slice在函数间的传递模式
  • 5分钟快速上手:Highlighter浏览器扩展终极指南 - 免费网页高亮工具
  • 美国海运专线VS空运:哪种跨境物流更适合你的生意? - 恒盛通物流
  • Hermes agent的tools是怎么落地应用的系列
  • 终极抖音下载器完整指南:免费开源工具让你轻松批量下载无水印视频
  • TuxGuitar完整指南:5大核心功能解锁专业吉他谱创作新境界
  • 跨行零基础也能月薪 10k,学会破局方能逆风翻盘
  • AI写代码翻车现场:被MonkeyCode坑惨的3个瞬间
  • 电子电路工程师工作全解析:从原理图到量产的硬核全过程
  • 【2026 收藏版】大模型进阶必备:图 RAG(Graph RAG)原理 + 三种实现 + 电商实战,小白也能看懂
  • 5个步骤快速上手ParsecVDisplay:Windows虚拟显示器的终极指南
  • 告别‘盲测’:用Playwright录屏和截图,让你的Allure报告会‘说话’
  • 1990-2025年 省市区县三级土地利用面积土地覆盖面积数据 CSV+SHP
  • C++ STL源码阅读(持续更新)