当前位置: 首页 > news >正文

2026 年字节 AI 多线作战:世界模型、Coding、视频模型、豆包商业化谁能突围?

2026 年字节 AI 四大命题

2026 年,字节 AI 有四个重要命题:加大对世界模型训练的投入,年底前模型性能达到现阶段世界模型全球 SOTA(最佳)Google Genie 3 的水平;视频模型继续保持领先地位,探索“动态生成”等新方向;进一步打好 Coding 的地基,做好 Coding 的 Dogfooding(数据回流、评测,形成飞轮),提升 Agent 能力;豆包强化商业化能力,重点场景是“办公”。

字节的未竟之地:世界模型

如今,字节的 AI 矩阵中,有 Seed 2.0 让字节进入中国大模型第一梯队,Seedance 2.0 做到世界 SOTA 水平,应用侧豆包也断层式领先。2026 年春节过后,豆包 DAU 达到 2 亿。但在一众模型中,唯独少了大模型研究下一阶段的关键——世界模型。

字节是入场世界模型赛道较晚的玩家。2024 年,周畅扛起世界模型研究大旗,但当时内部认为世界模型路线和商业化场景不明确,更重要的是打好视频模型的仗。直到 2025 年,字节才成立研究组探索世界模型中的 VLA 路线,带队人是李航和王文千。

2026 年,吴永辉为世界模型设立目标:年底前至少发布一版世界模型,性能对标 Google 在 2025 年 8 月发布的 Genie 3。但目前追赶速度不够,截至 2026 年初,字节世界模型综合性能距全球 SOTA 存在 10% 的差距。

世界模型下游是具身智能市场和游戏娱乐场景,人形机器人是字节会入局的方向。而且世界模型路线存在诸多非共识。一名 AI 投资人分析,“赌,以字节的人才密度和资金投入,大概率能赢;不赌,则一定会输。”

2026 年以来,字节针对世界模型训练做了不少调整。春节后,Seed 新设立世界模型研究组,负责人为范浩奇,汇报给周畅;原来李航和王文千的两个 VLA 研究组合并,统一向周畅汇报。原来的研究组探索 VLA 路线,目标是具身智能;范浩奇的新队伍走 3D 仿真路线,主打娱乐和游戏场景。

世界模型在资金投入上是多个模型方向中最高的,数据预算也很高。2026 年,字节批给世界模型训练数据的预算达数千万元,投入是其它厂商的 3 - 4 倍。

Coding:追求更极致的数据工程

Coding 能力是基础,决定 Agent 效果上限,这是业界共识。字节对 Coding 投入一直很高,仅次于今年的世界模型。比如内部会定向采购数据,研究海外顶尖 Coding 模型的训练数据 demo。

但在外界,字节 Coding 业务存在感不强。2025 年发布的 Doubao - Seed - Code 和 AI 编程工具 Trae,效果和声量不及智谱的 GLM 5 和月之暗面的 K2。一名知情者评价,“字节 Coding 效果难以取得突破的原因在于缺少数据回流。”

由于模型能力有限,字节相关业务不愿使用 Seed - Code,AI Coding 应用 Trae 最早接入的也是其他模型,导致字节 Coding 模型缺少真实应用场景的反馈。

2026 年以来,业务方加大对 Seed 模型的支持力度,多个应用部门被强制要求使用 Seed 模型。不过,Seed 在人才招聘上速度稍有放缓,现在主要开放招聘口子给来自 DeepSeek 以及海外大厂的 AI 人才。

Seedance 如何保持 SOTA 地位

2026 年字节的另一个重点是维持 Seedance 在全球视频生成领域的 SOTA 地位。某视频生成初创企业创始人评价,“Seedance 2.0 的胜利,是数据的胜利。”庞大的训练数据量和超 2000 人的评测团队,造就了 Seedance 2.0 的亮眼效果。

但持续“走量”的训练方式有隐忧,视频生成领域存在“Anti - Scaling Law”现象,训练后期数据“走量”收益降低。两名数据侧知情人士表示,Seedance 在预训练上已达天花板,接下来要清洗训练数据,进行更精细的后训练。

“动态生成”能力是 2026 年 Seedance 团队关注的新方向。所谓“动态生成”即互动视频,用户可输入指令调整视频内容和剧情。在这一赛道上,Vivix AI 估值达 13.2 亿美金。周畅看好动态生成的落地前景,一名接近 Seed 人士表示,“互动视频可以做成小游戏,也可以做互动剧集,同时也能和世界模型的探索接轨。”

加速豆包的商业化和出海

36 氪曾报道,豆包预计 6 月下旬上线付费内容,还计划与抖音电商打通,完善付费场景。2026 年 5 月初,豆包在 App Store 更新付费订阅方案,月订阅价格在免费到 500 元不等。6 月 3 日,豆包宣布将推出“豆包专业版”,提供专业服务。

春节后,豆包 DAU 突破 2 亿。一名知情者认为,高 DAU 带来推理成本和运维压力,豆包推进商业化有降增速和自我造血的双重目的。PPT 生成是豆包建立用户付费心智的核心切入点,豆包希望加强 PPT 生成功能,面向高净值行业白领收费,还计划推出企业版,但内部仍在讨论结合方式。

海外模型商业模式给了豆包启发,面向办公场景收费在海外已得到验证。Anthropic 的 Claude Code 上线后 ARR 增长可观,让 Anthropic 反超 OpenAI 的 ARR。现在,豆包要把用户心智从“通用入口”转变为“办公助手”。

不过,豆包进入的市场已开始拥挤,企业 AI 工具市场被不少供应商占领,豆包获客成本更高。出海也是豆包今年的重要命题,豆包海外版应用 Dola 2025 年底 DAU 突破千万,2026 年目标是年底达到 3000 万 DAU。Dola 面向小语种市场,避开欧美与“AI 御三家”对抗,2025 年下半年以来频频登上印尼、马来西亚、墨西哥等国家应用商店下载榜。

加入字节一年来,吴永辉的命题是带领 Seed 一边修 Bug,一边做 SOTA 模型。2026 年,字节在 AI 各战场目标都是做赢家。如今,Seed 2.0、Seedance 2.0 成果初显,积累的经验和人才将复用到新一轮战争中。

http://www.gsyq.cn/news/1463511.html

相关文章:

  • Kimi k2.6 LeetCode 3003. 执行操作后的最大分割数量 Go实现
  • 告别重复造轮子:用快马一键生成gptimage2安卓版高效开发模板
  • AI注销不是删除,而是智能遗忘:解析联邦学习+差分隐私双引擎注销架构(附开源POC代码)
  • Kimi k2.6 LeetCode 2972. 统计移除递增子数组的数目 II Python3实现
  • SWAT模型实战踩坑记:.sol文件为空、气象数据缺失?手把手教你诊断与修复
  • 新手福音:用快马平台生成练习项目,轻松理解github协作开发
  • 如何快速构建你的专属离线英语发音库:11万单词MP3音频一键下载指南
  • ContextMenuForWindows11开源项目:彻底解放你的右键菜单生产力
  • 别再乱改my.cnf了!MySQL 8.0+Docker大小写敏感问题的根治方案
  • 2026年近期潍坊行业知名的智能热水龙头生产商怎么选择?专业解析与推荐 - 2026年企业资讯
  • iFakeLocation终极指南:三步完成iOS虚拟定位的完整方案
  • 昌平区如何选购靠谱的近视防控眼镜? - mypinpai
  • 2026微信小程序商城平台深度解析:全链路选型与技术能力实测
  • 告别烂三角!用CGAL的isotropic_remeshing函数一键优化你的3D网格模型
  • hw八股准备
  • 如何用AI视觉技术彻底革新你的象棋学习体验:Vin象棋完整指南
  • 2026年新发布:青岛船员刷题软件机构如何选?这份指南请收好 - 2026年企业资讯
  • 2026年6月有实力的北京丙烷配送公司怎么选推荐榜,工业丙烷/高纯丙烷/焊割丙烷配送公司选择指南 - 海棠依旧大
  • 实战指南:基于快马平台生成RESTful API自动化测试脚本,保障接口质量
  • 2026无锡管道疏通避坑指南:选对专业、靠谱、口碑好公司的硬核逻辑!对维度对比。 - 极速版本
  • 从爱因斯坦求和到深度学习:揭秘张量运算中的‘黑话’(δij与erst符号保姆级解读)
  • OBS LocalVocal终极指南:3步实现本地AI语音识别字幕
  • Bobst 0704151202 NFC25-24T05-15控制器模块
  • 粉底液代加工多少钱,有哪些推荐厂商 - mypinpai
  • 中小企业转型:低成本、零服务器架构接入大模型的商业路径评估
  • 2026年6月评价高的无锡居民搬家公司哪家*榜:五大专业公司选择指南 - 海棠依旧大
  • AiFei 框架在机器人开发领域和边缘计算中的机遇
  • 探讨钢筋混凝土管定制生产的技巧 - mypinpai
  • 2026年现阶段,广东不锈钢圆球销售厂家综合实力深度解析 - 2026年企业资讯
  • 增长黑客实战:数据埋点设计、用户留存模型与转化率分析实践