当前位置: 首页 > news >正文

清程极智AI全链路基础设施方案,构建国产自主Token高效流通生态

近日在中科创星硬科技媒体行——清程极智专场活动中清程极智团队与到场媒体深入交流系统介绍了以赤兔推理引擎、AI Ping评测路由平台、八卦炉智能软件栈为核心的全链路Token解决方案。活动现场清程极智围绕大模型推理降本、国产算力生态适配、Token服务质量与性价比三大行业关键痛点集中展示多项核心技术突破与规模化落地成果以技术创新推动中国AI产业从“能用”迈向好用、省钱、自主可控的新阶段。清程极智成立于2023年12月核心团队来自清华大学计算机系高性能计算所已完成天使轮、PreA、PreA三轮融资获得中科创星、中金资本、考拉基金、联想创投、中关村科学城公司等多家国资与明星投资机构加持是国内专注AI基础设施AI Infra的标杆企业致力于打造一站式全链路Token解决方案。当前全球 AI 产业已进入规模化落地的关键阶段Token 成为 AI 时代的 “水电煤”是大模型服务与智能应用的核心生产要素。数据显示2024 年初至 2026 年 3 月中国 Token 日均调用量激增约1400 倍规模突破140 万亿。伴随 Agent 智能体、多模态应用快速普及Token 正从交互用量转向生产用量直接推动产业对推理效率、部署成本、服务稳定性的要求持续攀升。在 Token 需求爆发的同时国产算力与国产模型迎来高速发展但二者之间的推理环节却长期依赖海外引擎难以充分释放国产硬件性能而 Token 服务市场也面临乱、贵、慢、选型难等突出问题供需错位、成本高企、体验不一成为制约 AI 技术普惠化、规模化落地的核心瓶颈。针对大模型部署成本高、国产算力适配不足的痛点清程极智推出赤兔推理引擎。作为完全自主研发的国产推理引擎赤兔打破海外技术垄断构建“国产算力国产引擎国产模型”全国产化闭环针对昇腾、海光、沐曦、摩尔线程等国产芯片的硬件特性深度优化实现标量向量计算、数据表达、硬件调度、卡间互联的全维度适配解决国产算力“能用不好用”的难题。在性能与成本上赤兔推理引擎实现突破性提升通过软件方案在不具备FP4/FP8硬件能力的算力设备上支持FP4/FP8低位宽量化使用FP8量化可降低50%算力门槛FP4量化可降低75%算力门槛部署DeepSeek‑V3满血版模型时仅需1台8卡910B服务器即可替代传统4台8卡机硬件成本从600万元降至150万元。目前赤兔已在券商、能源央企等场景落地应用某能源央企实现3500员工全国产化算力稳定使用算力效率提升近40%相关案例荣获2025人工智能应用大赛铜奖。面对Token服务市场服务商林立、指标混乱、选型成本高的行业乱象清程极智打造AI Ping一站式大模型服务评测与API智能路由平台成为国内首个集“信息汇总、客观评测、智能路由”于一体的Token服务枢纽。平台已接入30余家主流服务商、600余个大模型服务覆盖文本、图片、视频等全场景通过7×24小时多地域分布式监测实时输出延迟、吞吐、可靠性、价格等核心指标数据真实可核验依托智能路由算法以统一API接口为用户自动匹配最优服务商实现成本降低超37%、吞吐提升超90%、延迟降低超20%让开发者“一键调用、省心省钱”专注业务创新。此外清程极智还推出八卦炉智能软件栈面向大模型训练、微调场景提供高效Token生产与智能调度能力与赤兔推理引擎、AI Ping平台形成协同覆盖AI“训练‑推理‑应用”全流程构建完整的AI基础设施生态。清程极智相关负责人表示公司将持续深耕AI基础设施领域坚持核心技术自主可控不断迭代赤兔推理引擎对国产芯片的适配能力完善AI Ping评测与路由服务联动国产算力、国产模型、行业应用等产业链伙伴打造高效、普惠、安全的国产AI基础设施体系响应国家“人工智能”行动以技术创新推动中国AI产业高质量发展。
http://www.gsyq.cn/news/1403594.html

相关文章:

  • 项目管理的三种常见模式
  • 外资品牌进入中国开店,选址顾问的核心价值是什么?五大行能力横向对比
  • 企微客户秒删?48小时黄金期这样做留存率翻倍
  • 如何彻底解锁PS3隐藏功能:webMAN MOD完整使用指南
  • 国家中小学智慧教育平台电子课本下载工具:一键获取官方教材的智能解决方案
  • pot-desktop跨平台翻译工具终极指南:从零开始快速精通多语言工作流
  • DRAM地址映射优化:破解高速光通信交织器行列访问瓶颈
  • MagiskOnWSALocal 终极指南:3步让Windows安卓子系统拥有完整Root权限
  • 跨平台资源下载利器:一键捕获微信视频号、抖音、小红书等热门内容
  • maven管理的项目把jar安装到本地仓库
  • Equalizer APO完全指南:Windows音频系统均衡器终极配置教程
  • 【RT-DETR实战】082、实例分割(Instance Segmentation)扩展:从检测框到像素级掩码的实战踩坑
  • nodejs服务中异步调用taotoken多模型api的最佳实践
  • Minecraft游戏世界的多面棱镜:PrismLauncher如何重塑你的游戏体验
  • 【限时开放】ChatGPT音乐理论黄金提示词库(v3.2):涵盖21种调式转换、13类终止式判别、9种复调织体识别——今日下载即赠MIDI验证工具包
  • 如何实现AI到PSD的无损矢量图层转换:设计师工作流优化终极指南
  • 在哪里买商标最放心?结合风控、效率、费用测评主流平台,一文看懂优质商标交易渠道怎么选 - 资讯纵览
  • 英语学习笔记一
  • Java 篇-项目实战-AI 天机学堂(从0到1)-day3
  • UWB室内定位精度提升:双分支MLP模型融合测距与RSSI的工程实践
  • 非金属耐磨齿轮注塑加工方案,赋能机器人行星关节模组提质升级
  • 神经形态计算与人形机器人融合:基于STDP的脉冲神经网络实现视觉注意学习
  • 脉冲神经网络:从生物启发的计算模型到高效能AI的未来
  • 广东东莞专业的自动包装机圆角冲刀厂家推荐 - 变量人生001
  • 6.Java多线程详解:Thread类、线程属性与start()方法深度解析
  • 呼伦贝尔黄金回收实测报告:亲测6家平台,福昌夏验货数据全公开 - 黄金上门回收
  • 个体化步态预测与多模块协同:地面康复机器人NaTUre-gaits系统深度解析
  • ChatGPT影评写作必须绕开的6大豆瓣算法雷区,第4条让82%新手账号触发“疑似营销”限流
  • 解锁诗人级输出:ChatGPT诗歌生成的7个被99%用户忽略的温度/Top-p/stop参数组合策略(附实测对比数据)
  • 差分非相干外差雷达:高灵敏度位移测量的硬件简化方案