报告
民生证券:传媒行业事件点评:谷歌发布Gemini,把握AI多模态应用投资机遇
admin2023-12-10 17:30
81人已围观
下载完整内容
简介事件12月6日谷歌发布多模态大模型Gemini。Gemini原生地支持多模态,使用图像、音频、视频和文字等数据进行预训练,其能够无缝地理解和推理各种输入,远远优
事件
12月6日谷歌发布多模态大模型Gemini。Gemini原生地支持多模态,使用图像、音频、视频和文字等数据进行预训练,其能够无缝地理解和推理各种输入,远远优于现有多模态模型,在各种领域都具有强大的理解和推理能力。
Gemini支持32k上下文长度,先发版本包括Ultra、Pro和Nano三种规格
1)Ultra是最强大的规格,适用于高度复杂的任务;2)Pro具有增强性能和大规模部署能力,适用于多任务;3)Nano适用于特定任务及移动设备。
Gemini多模态理解推理能力极强,测试结果或超越GPT-4
Gemini具有强大的多模态信息理解推理能力,其可以同时识别和理解文本、图像、音频等,擅长解释数学和物理等复杂学科的推理。在MMLU上,GeminiUltra是第一个在57个学科上实现超过90%的人类专家水平得分的模型。据官方文档案例,1)如图2所示,Gemini能够理解学生杂乱的笔迹,理解关于滑雪者滑下斜坡的物理问题,识别出学生在解决问题时出错的具体推理步骤,并给出解决问题的正确方法。2)如图4所示,Gemini能够识别图像中显示的特定植物,并提供相关信息。尽管有错别字,Gemini仍能理解用户的问题。3)如图5所示,Gemini能够识别图像中的形状,理解它们的属性,并推理它们之间的关系,从而预测下一个物体。
专用TPU训练,TPUv5e推理性能提升2.5倍,成本降低50%
谷歌使用大量的TPU资源对Gemini进行训练,包括TPUv4和TPUv5e。规模最小的GeminiNano的参数分别为18亿(Nano-1)和32.5亿(Nano-2)。TPUv5e是谷歌专为提升大中型模型的训练、推理性能以及成本效益所设计,并且其内部张量处理单元的最新版本。与TPUv4相比,TPUv5e的大型语言模型提供的训练性能提高了2倍、推理性能提高了2.5倍。而TPUv5e的成本却不到TPUv4一半,使企业能够以更低的成本,训练和部署更大、更复杂的AI模型。
投资建议:我们认为AI技术突破或超市场预期。Gemini原生支持多模态,具有强大的理解和推理能力,TPUv5e实现成本降低与更强的训练能力。模型能力的提升与多模态的发展有望推动AI应用端的使用场景与内容创新,建议重点关注:1)有相关多模态产品布局且产品有望近期上线的公司;2)核心业务的应用场景有望受益的公司。建议关注昆仑万维、易点天下、浙文互联、紫天科技、汤姆猫、盛天网络、中文在线、南方传媒、世纪天鸿、元隆雅图、视觉中国、奥飞娱乐、蓝色光标、掌趣科技、中国电影、北京文化、新媒股份。
风险提示:AI技术发展不及预期、行业竞争加剧等。






微信公众号
下载完整内容
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著