当前位置: 首页 > news >正文

谷歌Gemini 3.5 Flash表现不佳、成本高且“智力不够”,3.5 Pro能否力挽狂澜?

谷歌Gemini 3.5 Flash遭冷遇距离谷歌的Gemini 3.5 Flash发布已超一周。皮查伊在发布会上称其性能比3.1 Pro强是Agent时代的底座。然而网上评价除速度快外全是缺点输出错误多、啰嗦token消耗量爆炸。谷歌Antigravity负责人瓦伦·莫汉5月25日发帖称已增设Gemini 3.5 Flash (Low) 模型优化资源消耗。据内部测试处理简单任务时该模型比Gemini 3.5 Flash (Medium) 约减少45%的token生成量在软件工程任务上表现优于上一代旗舰模型Gemini 3 Flash (High)。但网友并不买账瓦伦评论区被冷嘲热讽攻占。3.5 Flash成本高、表现差网上对Gemini 3.5 Flash评价一致快但不够好。皮查伊强调模型便宜可现实相反。官方定价虽比Claude Opus 4.7低但完成任务的实际成本高。Artificial Analysis测试显示Gemini 3.5 Flash完成全部任务总成本是Gemini 3 Flash的5.5倍比Gemini 3.1 Pro高出75%甚至比GPT - 5.5 medium还贵。原因在于完成任务的轮次多Flash模型平均每个任务需49轮对话而GPT - 5.5或Opus 4.7约20轮。此外Flash输出啰嗦复杂任务token消耗爆炸还有用户触发使用限制。谷歌还修改了AI Pro订阅额度规则引发用户不满。性能不均衡“智力不够”Benchmark显示Gemini 3.5 Flash在部分榜单表现不错但在综合推理榜上表现难看低于Gemini 3.1 Pro、Claude Opus 4.7和GPT - 5.5等。其记忆方面也有问题虽宣传有最高1M token上下文但测试成绩不佳。Artificial Analysis测试中Flash编程指数得分低于Gemini 3.1 Pro和GPT - 5.5。污染谷歌产品体验谷歌I/O 2026上皮查伊宣布Gemini是全产品宇宙连接层Gemini 3.5 Flash嵌入多数产品。外媒称“Gemini无法避开”其糟糕体验污染了谷歌产品。如AI Overview和AI Mode出现“disregard/ignore/stop”故障多个单词被误判为指令谷歌回应称是AI Overviews自身问题正在修复。3.5 Pro成关键目前Gemini 3.5 Pro还在内部测试官方期待6月推出。谷歌产品负责人称3.5 Pro像项目经理Flash像执行团队。若3.5 Pro表现好谷歌或能挽回局面若表现不佳谷歌在AI领域可能全面溃败。谷歌硬件表现亮眼谷歌2026年Q1财报显示公司收入增长其中谷歌Cloud收入同比增长63%。皮查伊称Cloud增长是“强劲需求”结果即TPU硬件和数据中心卖得好。基于谷歌模型的AI解决方案增长近800%Gemini Enterprise付费月活用户环比增长40%API使用的AI token增长。Cloud的backlog本季度翻番公司预计24个月内完成50%。Anthropic等大客户租用或采购谷歌TPU资源。谷歌还宣布了第八代TPUTPU 8t针对训练目标是goodput超97%TPU 8i针对推理有384MB板载SRAM用更多CPU主机。微软预测2028年将有13亿个Agent投入运行这或是谷歌分设TPU 8t和8i的原因。但Anthropic能用TPU造出好模型谷歌却只拿出Gemini 3.5 Flash。
http://www.gsyq.cn/news/1405915.html

相关文章:

  • CANN/cannbot-skills Catlass算子开发
  • 终极视频下载解决方案:一键保存微信视频号、抖音、小红书等平台资源
  • YOLO v11蚊子自动检测项目
  • InsForge A/B测试:功能发布与数据驱动决策的终极指南
  • 基于TypeScript构建AI代理网关:统一LLM调用、智能缓存与监控
  • 如何快速掌握Figma中文插件:从安装到精通的完整实战指南
  • 【仅限Q2发放】ChatGPT入职加速包:含23个预审Prompt模板、7类日志审计规则、4套SLA承诺书范本
  • 从零到上线仅47分钟,ChatGPT生成员工手册全流程,深度解析Prompt工程×HR SOP融合逻辑
  • ChatGPT服务协议暗藏风险?3步自动化审查法,10分钟揪出霸王条款(附可落地的Prompt清单)
  • NativeScript 9.0.19 发布:新增 iOS 启动事件延迟选项,多项功能修复与性能优化
  • OHIF医学影像查看器:重新定义数字医疗时代的影像诊断体验
  • ESP32 Arduino核心库终极指南:从零开始打造智能物联网项目
  • Kubernetes存储类:动态管理持久化存储
  • 伽马校正(Gamma Correction):一个隐藏在像素背后的“千年误会“
  • FXAA:游戏画面里的“魔法橡皮擦“——一个让锯齿消失的小魔术师
  • 发送电子邮件
  • LiteIDE完整指南:如何让Go开发效率提升300%?
  • 昇腾大模型推理“一键跑通”指南——cann-recipes-infer实战与优化全解析
  • Java 生产环境 RocketMQ 架构与部署指南
  • 如何快速掌握未来荧黑字体:面向设计师与开发者的完整指南
  • 大疆无人机固件下载终极指南:如何用DankDroneDownloader重获固件控制权
  • RFID防碰撞协议优化:位窗技术如何实现节能与提速
  • Sparse4D 运行笔记
  • 雾计算架构下医疗物联网数据全链路隐私保护框架设计与实践
  • 【无标题】趣味评测公众号小程序双端管理系统
  • 3步搞定B站视频下载:从新手到高手的完整指南 [特殊字符]
  • 美国3A认证办理哪家好?2026美国3A认证办理推荐:美国3A认证办理公司推荐指南 - 栗子测评
  • 2026年全波段水质检测仪技术实力深度解析:从数据精准性、生产厂家、知名品牌与非标定制能力对比 - 品牌推荐大师1
  • 基于Groq与Streamlit构建本地语音AI助手:从原理到实践
  • 终极指南:Qwen3-VL-30B-A3B-Instruct的8大核心增强功能全解析