报告
华福证券:算力专题研究二:从训练到推理:算力芯片需求的华丽转身
admin2024-08-25 14:31
64人已围观
下载完整内容
简介投资要点:推理算力:算力芯片行业的第二重驱动力我们在此前外发报告《如何测算文本大模型AI训练端算力需求?》中,对未来三年AI训练卡需求持乐观态度。我们认为,推理
投资要点:
推理算力:算力芯片行业的第二重驱动力
我们在此前外发报告《如何测算文本大模型AI训练端算力需求?》中,对未来三年AI训练卡需求持乐观态度。我们认为,推理侧算力对训练侧算力需求的承接不意味着训练需求的趋缓,而是为算力芯片行业贡献第二重驱动力。当前推理算力市场已然兴起,24年AI推理需求成为焦点。据Wind转引英伟达FY24Q4业绩会纪要,公司2024财年数据中心有40%的收入来自推理业务。如何量化推理算力需求?与训练算力相比,推理侧是否具备更大的发展潜力?我们整理出AI推理侧算力供给需求公式,并分类讨论公式中的核心参数变化趋势,以此给出我们的判断。
ScalingLaws&长文本趋势:推理需求的核心驱动力
根据OpenAI《ScalingLawsforNeuralLanguageModels》,并结合我们对于推理算力的理解,我们拆解出云端AI推理算力需求≈2×模型参数量×数据规模×峰值倍数。由ScalingLaws驱动的参数量爆发是训练&推理算力需求共同的影响因素;而对于推理需求,更为复杂的是对数据规模的量化。我们将数据规模(tokens)拆解为一段时间内用户对于大模型的访问量与单次访问产生的数据规模(tokens)的乘积,其中,单次访问产生的数据规模(tokens)可以进一步拆解为单次提问的问题与答案所包含的token数总和乘以单次访问提出的问题数。通过层层拆解,我们发现单次问答所包含的token数是模型中的重要影响因素,其或多或少会受到大模型上下文窗口(ContextWindow)的限制。而随着上下文窗口瓶颈的快速突破,长文本趋势成为主流,有望驱动推理算力需求再上新台阶。
结论:
我们首先根据前述逻辑测算得到AI大模型推理所需要的计算量,随后通过单GPU算力供给能力、算力利用率等数值的假设,逐步倒推得到GPU需求数量。若以英伟达当代&前代GPU卡供给各占50%计算,我们认为2024-2026年OpenAI云端AI推理GPU合计需求量为148/559/1341万张。
建议关注
算力芯片:寒武纪海光信息龙芯中科
服务器产业链:工业富联沪电股份深南电路胜宏科技
风险提示
AI需求不及预期风险、ScalingLaw失效风险、长文本趋势发展不及预期风险、GPU技术升级不及预期的风险、测算模型假设存在偏差风险。









微信公众号
下载完整内容
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著