当前位置: 首页 > news >正文

阿里云峰会大切换:云计算三十年首换用户,全栈重做能否驱动飞轮?

【阿里云峰会现场信息量惊人】5月20号在杭州举办的阿里云峰会场馆外早已排起长队。原本以为只是例行发布会进去后却发现展区密度远超预期。AI原生应用全家桶、合作伙伴展台还有超节点服务器实体一路看下来信息量巨大。【发布众多产品指向大切换】芯片、模型、平台、官网一上午发布的内容让人目不暇接。其中千问云官网格外引人注目。阿里云成立17年首次在主站之外为一个产品单独做官网首页仅一行代码是给Agent读的。芯片层平头哥推出新AI芯片真武M890搭配互联芯片ICN Switch装进磐久AL128超节点服务器。128张卡拼成计算机已上线百炼运行着Qwen、DeepSeek、Kimi的模型服务路线图显示V900、J900将一年一代持续推出。模型层千问发布旗舰模型Qwen3.7 - Max在各榜单中位居国产第一。现场展示的实战案例中模型在全新芯片上35个小时从零写出生产级kernel性能比官方版本高10倍且全程无人干预。平台层百炼推理服务全面升级上下文缓存、弹性调度、机密推理等功能完善六家头部模型公司的产品全部接入。众多产品发布实则指向一次大切换。刘伟光称人类员工与Agent已形成混合工作网络未来自己可能接受Agent做manager李飞飞认为云基础设施从资源调度转向任务调度千问云将所有模型服务封装Agent一条指令就能学会全站能力自主调用开发者无需写集成代码。【云计算换用户挑战巨大】云计算行业三十年来首次换用户从开发者变成了Agent。这与以往计算范式切换不同以前是换使用云的人群这次是换使用云的是否为人。云计算三十年里有三个默认设置一直未变。一是活可预估电商网站双11流量峰值、SaaS应用使用情况都可通过历史数据计算但Agent的活无规律无法画出曲线调配资源。二是用户是人控制台、API文档、权限体系都是为人设计而Agent需要可编程接口、结构化能力描述和机器能读懂的反馈权限管理也面临挑战。三是程序长期跑传统云上程序部署后长期运行而Agent任务短命生命周期可能仅几秒传统云的资源分配等方式不适用。李飞飞总结了六个核心挑战这些都是传统云计算未遇到的新问题。因此阿里云此次要从芯片到操作系统等每一层都按新假设“重做”。【满足Agent需求全栈打造基础设施】从Agent需求角度看首先需要算力。真武M890芯片性能强大搭配互联芯片ICN Switch通信时延极低。平头哥的全自研软件栈SAIL将在6月上线并开源且真武芯片已累计出货56万片服务400多家客户、20多个行业。其次需要运行环境。阿里云为Agent打造的沙箱百毫秒级启动一分钟可拉起两万个且采用硬件级隔离保证任务间隔离。龙蜥操作系统在内核级别做了Agent Task OS调整资源调度逻辑。再者需要身份。阿里云推出Agent ID服务为Agent提供独立身份认证、权限边界和行为审计配套的Agent Ops可全链路追踪Agent生命周期。还需要记忆。阿里云将Agent记忆分为短期、长期和知识记忆三层分别采用不同存储方式调用自家数据库等产品线。安全也必不可少。阿里云的机密推理技术C - MASK可保证数据加密只有用户能接触核心数据。最后模型要让Agent变聪明。Qwen3.7 - Max展示了自主完成复杂工程任务的能力大模型从对齐人类偏好转向对齐任务目标。【全栈重做价值凸显】阿里云全栈重做的成果已在MiniMax的MaxCloud产品上应用。阿里财报显示AI模型及应用服务的ARR已超80亿年底有望突破300亿消息公布后阿里股价涨了8%。Token驱动的MaaS收入正取代ECS成为阿里云最大产品线计费单位从“台”变为“Token”增长逻辑改变。Agent越多Token消耗越大收入越高平台就能投入更多资金迭代芯片和模型形成良性循环。大会现场六家头部模型公司产品接入百炼阿里云成为多模型、多模态的统一入口对模型公司和企业都有好处生态逐渐聚拢。阿里云是全栈打通五层的云厂商全栈能力在Agent时代价值放大因为Agent工作负载穿透各层全栈可实现端到端优化。钱在跟进生态在聚拢全栈能力发挥作用阿里云全栈重做值得期待。那么阿里云这次全栈重做能否成功未来又将如何发展呢
http://www.gsyq.cn/news/1335271.html

相关文章:

  • 别再只用SSH了!深入对比新华三设备Telnet的三种认证模式(None/Password/AAA)及适用场景
  • 别再手动挖洞了!用Leaflet + GeoJSON一键搞定复杂行政区地图遮罩(含飞地处理)
  • 从Sobel到Roberts:在Unity中实现屏幕后处理描边的性能与效果对比
  • C++零基础到工程实战(5.2.1):指针和引用理论到实战
  • Linux驱动开发避坑:为什么你的GPIO申请总失败?从devm_gpio_request_one源码看设备资源管理
  • 初创团队如何利用Taotoken的Token Plan套餐有效控制AI开发成本
  • 异步复位、异步复位-同步释放
  • 告别WSL网络隔离:用桥接模式让Ubuntu 22.04和Windows 11共享同一个局域网IP段
  • 2026年靠谱阳台晾衣架TOP5品牌技术实力深度剖析:电动衣架/落地晾衣架/遥控晾衣机/遥控晾衣架/隐藏式晾衣架/选择指南 - 优质品牌商家
  • 实验二:防火墙路由通信与安全访问实验
  • 【养龙虾指南:把 AI 养成“一次构建、永久运行“的自我进化系统】
  • 量化感知训练中的权重震荡:成因、影响与抑制策略
  • 5分钟终极指南:Adobe-GenP通用激活工具快速上手
  • 嵌入式储能监控系统开发实战:从核心板选型到算法部署
  • GEFFEN格芬智能云控分布式电源管理系统GF-SPMS8
  • 别再到处找教程了!用Docker Compose一键部署RuoYi-Cloud微服务全家桶(含Nacos 2.x + Sentinel)
  • 论文查重,重复率太高怎么办?
  • 华为ENSP模拟器实战:手把手教你配置LACP链路聚合,实现带宽翻倍与链路备份
  • 2026年腾讯云OpenClaw/Hermes Agent配置Token Plan保姆式教学
  • 好用的合同管理系统怎么选?8个真实选型标准
  • 别再只改POI版本了!解决EasyExcel报错,你可能还漏了xmlbeans这个关键依赖
  • 从Hi-Fi耳机到5G基站:聊聊FIR和IIR滤波器那些意想不到的应用场景
  • 别再只用串口了!手把手教你用STM32CubeMX配置LIN总线(基于TJA1020收发器)
  • 把OpenWrt路由器变成轻量Web服务器:手把手教你配置NGINX并挂载外部存储
  • 合宙ESP32 S3接SD卡模块总失败?可能是HSPI和VSPI的坑(附完整引脚配置)
  • DistroAV:基于NDI技术的OBS Studio网络音视频传输解决方案
  • c语言之时间格式化之转换为yyyy-MM-dd‘T‘HH:mm:ss.SSSZ 例如“2026-12-17T17:26:40.979+0700”
  • Qt QAction的隐藏玩法:除了菜单,还能用在工具栏、快捷键和右键菜单?
  • 避坑指南:Docker Buildx多架构构建时,如何正确配置BuildKit和insecure-registry推送
  • STM32CubeMX安装后,HAL库到底怎么选?在线安装慢、离线包找不到的终极解决指南