报告
华金证券:传媒行业快报:国产MoE模型优势显著,AI垂类应用迎增长
admin2024-05-10 22:30 20人已围观 下载完整内容
简介投资要点事件:近日,幻方量化旗下AI公司深度求索(DeepSeek)发布全新第二代MoE大模型DeepSeek-V2。模型拥有2360亿参数,中文综合能力(Al
投资要点
事件:近日,幻方量化旗下AI公司深度求索(DeepSeek)发布全新第二代MoE大模型DeepSeek-V2。模型拥有2360亿参数,中文综合能力(AlignBench)超过GPT-4,与GPT-4-Turbo,文心4.0等闭源模型表现相近;英文综合能力(MT-Bench)与LLaMA3-70B表现相近,超过MoE开源模型Mixtral8x22B。
数据库及算法革新有望改善大模型计算成本。模型基于8.1Ttoken组成的高质量、多源预训练语料库。该语料库与前代相比增加中文数据比重以及数据质量。结构优势:DeepSeek-V2对现存模型框架进行创新提出MLA架构,大幅减少计算量和推理显存;自研Sparse结构DeepSeekMoE进一步降低计算量,两者结合最终使每token成本大幅降低。价格优势:DeepSeek-V2API定价,每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo近百分之一。
大模型发展路径多元化,正向推动生态建立。MoE模型(专家混合)由多个子模型(即专家)组成,每个子模型为一个局部模型,处理输入空间特定子集。MoE使用门控网络基于数据适配特定模型降低不同类型样本之间干扰。Transforer特点:主要用于处理序列到序列(Seq2Seq)任务,缺乏循环结构,使得训练AI大模型需要大量算力及时间。以GPT为例,其Transformer解码器训练过程中每天约消耗超50万度电力,训练成本以万亿美元为单位计数。搭载MoE架构的可持续新模型逐渐成为趋势。通过改变模型底层架构,调整为耗能低且训练和推理效果好的模型架构进行大模型开发。
国内AI产品部分细分领域增速显著呈现新趋势。根据AI产品榜统计,国内增速榜top5中AI搜索占据两席,360AI搜索与秘塔AI。360AI搜索4月增速为1303.09%,其核心为AI搜索功能,回答时会提供参考资料、思维导读、以及相关延展阅读;同时支持PDF文档分析、音视频分析以及网页AI整理。据头豹预计,到2027年,国内AI搜索引擎市场规模将达到329.35亿元人民币。预计市场规模复合年增长率(CAGR)将达到约32.93%。
投资建议:MoE模型更新或将引领大模型新趋势,AI产品发展有望丰富其垂类领域整体生态。建议关注相关标的:昆仑万维、捷成股份、视觉中国、中广天择、中信出版、万兴科技、因赛集团、蓝色光标、元隆雅图、天娱数科、汤姆猫、中原传媒等。
风险提示:政策不确定性、AI技术发展不及预期、AI应用接受度不及预期等。
- 微信公众号
下载完整内容
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们
标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著