当前位置: 首页 > news >正文

算力大爆炸:GPU凭什么统治了AI时代?

说实话,到现在我还记得第一次接触GPU的感受。

那时候是2012年, 我购置了一张二手显卡, 心里期望玩游戏能够更流畅些。谁能料想到十年之后, 这物品竟然变成了全球最匮乏的资料, 就连黄牛都着手炒作显卡了, 你会相信这件事吗?

为什么GPU比CPU更适合算力任务?

好多人会发问, CPU难道不就是处理器, 为何AI训练非得要用GPU。

这个问题其实挺有意思的。

中央处理器宛如一位无所不能的超级学霸, 对各类知识皆能涉猎, 然而在同一时刻仅能够处理为数不多的几件事情。图形处理器恰似一位体育教师, 尽管思维的敏捷程度略逊一筹, 不过却可以在同一时间带领几百号人员进行体操活动。

你瞧, 一块平常的CPU大约有8个至16个核心, 然而一块GPU呢, 却有几千个, 就拿的A100来说, 它拥有6912个CUDA核心, 当然, 我们不提及品牌名, 仅仅讲述这个数量级。

当进行AI训练之际, 你所面对的情形是, 存在海量的矩阵运算, 并且, 其中一个模型或许有着上亿个参数, 要是利用CPU逐个进行运算, 那将会算到遥遥无期, 然而, GPU却能众多一起上, 几千个核心同时开展工作, 其效率直接远超几十倍。

在2018年期间, 对GPT - 1进行训练, 动用了8颗GPU。直至2020年GPT - 3出现, 其数量一下子飙升到上万颗。到了2024年, 传闻中的GPT - 4, 据说使用数量达到了25000颗。这样的增长速率, 相较于房价而言更为迅猛。

显存到底有多重要?

你可能听说过“显存不够”这个词。

比如这么说: 称作显存的存储空间, 就如同你日常使用的办公桌, 桌面的面积越大, 那么你可以平铺开来放置的资料数量就会越多, 要是显存的容量过小, 模型便无法完整存放只得是频繁地从硬盘之中调取数据, 如此一来速度就会急剧下降到仿佛脚踝处那般缓慢。

目前处于主流地位的AI模型, 其参数动不动就达到几百亿。仅仅是7B的那种模型, 也就是有着70亿参数的, 大约要14GB的显存才可以使其运行起来。而70B的模型呢, 起码得有140GB。单单一张显卡根本无法容纳这么多, 必须得让几块显卡并联才行。

所以, 你瞧那些从事AI行业 的公司, 为啥动不动就在抢购显卡 , 并非是由于他们热衷于玩游戏 ,实则是真真切切地缺乏显卡, 无法满足需求。

在2025年的时候, 存在着这样一个数据, 全球GPU的出货量预计将会达到2.5亿块, 其中, 用于数据中心的高性能GPU这一部分, 大概占据了3%到5%的比例。尽管这个比例看起来比较小,然而其价值却在整个市场中占据了40%还多。

算力为什么成了硬通货?

我存在一位友人, 于杭州开展AI创业相关事宜。他向我讲述过那么一档子话: “现今进行融资操作时, 投资人首先提及的那句话并非询问商业模式怎样, 而是询问‘你手上持有多少张卡’。“。

听起来荒诞,但这就是现实。

在2024年时的全球AI算力市场, 其金额差不多估计是有着500亿美元之数。而到了2027年, 经预计其能够达到1500亿。这样的增长曲线状况, 相较于火箭而言还要显得更加陡峭, 呈现在更高的陡度特征上。

为什么这么贵?因为制造难度太大了。

在一块顶级GPU的芯片之上, 集成了数量超越800亿个的晶体管。制造工艺历经从7纳米至5纳米, 而后又到3纳米的变化。每一步骤皆是在耗费资金。一座具备先进制程的晶圆厂, 其所需要的投资额超过200亿美元。

据说, 台积电2025年有关3纳米的产能, 其中70%可都是被一家公司给包揽了。而这般的垄断程度, 相较于石油而言, 那可是还要更为夸张的。

算力缺口有多大?

别以为只有大公司在抢。中小企业也在抢。

在2025年, 依据IDC所给出的数据表明, 这全球范围约多达60%的企业, 它们已然或者正处于部署AI应用的进程当中。然而, 在这些企业里面那些占据80%比例的中小企业, 实际上能够获取到的算力情况是, 其数量还达不到自身需求的30%。

这般情形究竟意味着什么呢? 意味着绝大多数的公司都在借助算力延长自己的持续存在时期, 并非是实现自身的进步与扩展。

有的小型团队, 为了运行一个模型而守候, 需要等待三天时间。大型企业情况? 经过三分钟便能够得出结果。这样的差距可不是一点点。

能效比是个大问题

GPU好归好,但真是电老虎。

一块具备高端性能的GPU, 其功耗能够达到700瓦, 一个数据中心若安置上几万块这样的GPU, 那么每小时所消耗的电量可达几十万度。在2024年时, 全球数据中心的用电总量, 已经在全球总用电量中占据了2%到3%的比例, 而且这个比例还处于持续上涨的态势。

国际能源署预测, 到二零二六年, 人工智能训练所消耗的电量, 有可能会增长至原来的三倍, 这个数据相当惊人。

因此当下众人都着手开展“绿色算力”方面的工作, 像液冷技术这类, 它能够使散热效率提高超过百分之三十, 并且还能够减少百分之五十的能耗, 然而其成本也是高昂的, 改造一套液冷系统, 起步就是几百万。

未来的算力会怎么走?

我猜,未来两三年会有几个方向。

一方面是, 能够像提供水电那般, 依据需求来供应的算力云化, 你并非要自己去购置显卡, 而是可以选择租赁。

其一为芯片呈现出多样化的特质, 其二是除了GPU之外, 还存在着诸如TPU、DPU、NPU此类各种各样的专用芯片, 其三是在2025年的时候, 针对全球范围内的AI芯片市场而言,非GPU的份额大概有可能会处于15%左右的水平之上, 其四是到了2030年的时候, 该项份额大概有可能会攀升至30%。

其三是国产替代, 尽管当下仍存在差距, 然而国产GPU在推理场景已然可以投入使用, 举例而言, 在2025年时, 某些国产芯片已然能够使百亿参数模型运行成功, 虽说训练方面尚不可行, 但是推理方面并无问题。

最后说句实话。

算力这东西,不是万能的,但没有算力是万万不能的。

眼前映入你视线之中的每一款人工智能应用, 每一回展开产生的智能对话, 其背后皆是一列列发出嗡嗡声响的显卡正在竭尽全力地从事劳作。它们既不进行休息, 也不发出言语, 单纯只是静悄悄地持续运算着, 运算着, 将数字转化成为令人惊叹的奇迹。

你和我, 此刻正伫立在这个算力呈现极大规模爆发式增长的门口之处。有的人察觉到了其中的恐惧之感, 有的人则发现了蕴含的机会所在。

你呢?

http://www.gsyq.cn/news/1428676.html

相关文章:

  • 3分钟搞定!Axure RP中文语言包终极汉化指南
  • 跨设备游戏串流终极方案:Sunshine自托管游戏流媒体服务器完全指南
  • DLSS Swapper终极指南:3步解锁游戏性能的免费神器
  • 3PEAK思瑞浦 TP5552-VR MSOP8 精密运放
  • 基于模块化插件架构的LCU API客户端:League Akari的技术实现与性能优化
  • Keil编译环境输出完整文件路径的配置方法
  • Ubuntu 22.04 LTS + AMD显卡:从驱动到Demo,一步步搭建你的OpenCL异构计算实验平台
  • 基于树莓派Pico W与WS2812B的斐波那契时钟制作全解析
  • 四川盛世钢联国际贸易有限公司|四川H型钢供应价格|四川H型钢批发报价|四川H型钢价格大全 - 四川盛世钢联营销中心
  • Ubuntu 22.04 Gnome扩展安装与避坑指南:从浏览器插件安装到常用扩展推荐(附Dock优化技巧)
  • 树莓派复古游戏主机DIY:旧闹钟外壳改造与散热方案实战
  • 网盘限速终结者:LinkSwift直链下载助手完全指南
  • 2026年五大GEO工具生死对决,搜极星凭什么让品牌不再“人间蒸发“?
  • 2026年上海超声波焊接机厂家深度评测:江浙沪采购必看的5大选型参考 - 企业名录优选推荐
  • 离散制造企业仓库系统与智能物流服务商选型实测 - 奔跑123
  • FreeCAD建模效率翻倍:巧用外部几何与基准平面,让开孔永远自动居中
  • TrafficMonitor插件终极指南:9款实用插件让你的桌面监控更强大
  • AMD Ryzen终极调试指南:5分钟掌握SMU Debug Tool核心功能
  • DeepSeek-R1-Distill-Qwen-1.5B量化压缩:提升推理速度的终极方案
  • 【紧急预警】Gemini最新财报中隐藏的3项非经常性损益陷阱,92%财务人尚未察觉!
  • 大牌包包出手攻略!2026佛山五家合规奢包回收门店对比 - 奢侈品回收测评
  • 烟台沙发翻新维修换皮哪家好?2026本地靠谱商家推荐 - 天堂海洋
  • Pix2Text:开源Python工具,轻松实现图像到Markdown的智能转换
  • HLS Downloader:如何在浏览器中安全高效地下载HLS流媒体视频
  • github仓库合并
  • 2026 全自动金相切割机厂家推荐,高性价比设备生产厂家盘点 - 商业新知
  • CANN/ops-blas文档编写Agent
  • CompressO:当数字生活遇上“空间焦虑“,这款免费神器如何帮你找回存储自由?
  • 2025-2026年武汉家装市场观察:本土实力企业盘点与业主选企参考 - 商业新知
  • 【AI工具终极使用指南大全】:仅限内部流传的「AI就绪度评估矩阵」——含12维评分卡+自动诊断脚本