当前位置: 首页 > news >正文

梁文锋立即决定融资74亿。Claude Mythos一发布!!

4月中旬的AI圈被一条融资传闻搅得心神不宁,三天后The Information拿出的爆料把这锅沸水直接掀翻——Claude Mythos,正是逼得梁文锋拍板融资的那根导火索。

Anthropic今年4月发布Claude Mythos第一个预览。它对标的不再是语言模型的“聪明”,而是直接用海量算力和数据堆出的强能力跨阶。梁文锋看完,内部只传出一句话:“不储备弹药根本没法打下去了。” DeepSeek的融资传闻几乎同步传出,时间对得一笔不差。

最终落定的数字是74亿美元。梁文锋自己掏了200亿人民币,约合30亿美元,占到总盘子五分之二。这个一度被投资人反复拒绝的实验室,创始人用个人支票把三年不融资的纪录亲手打破。

融资宣布后的第一个动作指向了人。DeepSeek全员约300人,本周四罕见发了一份公开声明:所有部门招人“至少翻倍”。Harness团队负责人崔添翼今年3月刚从Jane Street跳过来,他的日程已经切换到每天面试模式。这个部门负责把模型转化为自主AI智能体,是梁文锋眼下最着急吃下来的能力。</p>

但真正让DeepSeek在过去一年半里“憋着不发新模型”的,是人手不足之外另一个更重的代价。华为的昇腾芯片。</p>

华为去年才发现DeepSeek在私下用自家芯片做试验,随后两家开始直接合作。梁文锋一直相信华为芯片几年内就能追上英伟达,DeepSeek应该第一个把适配做完。可这话说得轻巧——整套训练和部署系统原本长在英伟达CUDA上,工程师只能一层层重写底层软件,才能在昇腾上把模型跑起来。</p>

代价是一段扎眼的空窗期:15个月,DeepSeek没有发布任何一个新一代模型。同一时期,其他顶级实验室两三个月就更新一轮。去年下半年Anthropic的Claude Code搅动编程工具市场时,DeepSeek根本连出牌的动作都没有。</p>

梁文锋并不掩饰他对这些“短期产品”的态度。路演时他直接告诉投资人,编程工具和聊天机器人一样,都是AI进化途中的临时产物,重注押上去只会让团队偏离AGI。他把AGI定义为机器在理解、推理、学习、规划和适应上全部达到人类水平,这才是他唯一的目标。</p>

“AI不应该被少数人控制。”梁文锋对身边人说这话时,没打算把它当成一句口号。融资完成后DeepSeek做了两件外界看得到的事:把所有模型底层代码继续完全公开,把轻量版价格打到大模型实验室里最低的那一档。

V4模型的表现让这套策略的冲击感变得具体。5月,V4在Vercel AI Gateway上的token用量份额从不到1%一口气冲到17%,一个月内成为平台第三大模型,前面只剩Anthropic和Google。轻量版V4 Flash的价格比Anthropic模型便宜20到50倍。6月,涨势没停。</p>

此刻回头看2023年,梁文锋确实试着找过钱。他跟投资人讲,DeepSeek只做深度研究和科学探索,没有商业化路线图,没有产品时间表。对面的人一个个打了退堂鼓。最后他自己掏钱养了这个实验室,一养就是三年。</p>

现在他成了这家公司最大一笔钱的主人,员工持股计划同步落地,按实际估值分配股份。战略依然没变:继续开源,保持低价,只做AGI。</p>

当梁文锋赌上200亿和全部开源路线,他赌的究竟是“芯片能追上”,还是“这条路最终只能这么走”?

http://www.gsyq.cn/news/1612375.html

相关文章:

  • 基于深度学习的钢材焊接缺陷检测系统(YOLOv8+YOLO数据集+UI界面+Python项目+模型)
  • AWS开源Blocks框架:AI智能体负责写后端代码,Amplify要凉?
  • 客服外包公司排名,哪家口碑更靠谱
  • 华硕笔记本终极轻量控制工具:G-Helper完整指南
  • Linux内核开发入门:从C语言到内核模块的实践路径
  • 告别JMeter:基于Prometheus与Grafana的轻量级性能压测平台实战
  • C++实战:从原理到代码实现RSA非对称加密与安全传输
  • 从传统后端到阿里大模型:小白程序员必备的Agent与RAG进阶指南(收藏学习)
  • 【电赛/毕设高端局】DMA数据全是0?STM32H7/F7 Cache一致性灾难、DWT纳秒测速与 CMSIS-DSP 极限榨汁指南
  • ModelFS:如何利用可编程缓存技术加速LLM推理启动?完整解析
  • 【机器人】缓冲的不确定性感知沃罗诺伊单元多机器人碰撞规避【含Matlab源码 15672期】
  • 【Springboot毕设全套源码+文档】基于springboot+spark的买菜推荐系统设计与实现(丰富项目+远程调试+讲解+定制)
  • 2026手机抠图软件合集:免费无水印App与轻量工具实操指南
  • Go项目配置安全实战:使用RSA非对称加密保护敏感信息
  • 基于深度学习的骨折检测系统(YOLOv8+YOLO数据集+UI界面+Python项目+模型)
  • 【Springboot毕设全套源码+文档】基于Java+springboot汽车维修保养服务信息系统的设计与实现(丰富项目+远程调试+讲解+定制)
  • Java 多线程并发
  • 黄金目前仍有下调压力
  • 原神玩家数据查询:3分钟掌握账号完整信息的终极工具
  • MySQL数据库零基础入门:从环境搭建到CRUD实战完整指南
  • 单身证明公证书需要什么材料?单身证明公证书在哪里办?
  • N_m3u8DL-RE技术深度解析:现代流媒体下载架构实现
  • 冷轧薄板用校平机:为什么这类材料对矫平精度要求最高?
  • 别再踩坑了!用Python控制Agilent 34401A万用表,这个SYSTEM:REMOTE命令必须发
  • 保姆级教程:在Ubuntu 22.04上搞定USRP B200/B210与GNURadio 3.10的连接测试
  • 专业流媒体下载方案:N_m3u8DL-RE实现DASH/HLS/MSS内容高效保存
  • AgentScope 2.0
  • 别再手动移位了!用Verilog实现PRBS7并行输出(附10比特并行源码)
  • 50元玩客云刷Armbian变身家庭服务器:保姆级TTL刷机避坑指南(附固件包)
  • 为AI Agent构建可靠邮件中枢:从协议原理到自动化实战