报告
国海证券:计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来
admin2024-05-16 22:30
73人已围观
下载完整内容
简介事件:2024年5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,其中o代表的是omni,即“全能”,GPT-4o可以实时对音频、视觉和
事件:
2024年5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,其中o代表的是omni,即“全能”,GPT-4o可以实时对音频、视觉和文本进行推理,相较于GPT-4Trubo速度更快、价格更便宜。
2024年5月15日,2024年谷歌I/O大会正式召开,会上谷歌将搜索业务做了最彻底的AI改造,更新升级了Gemini1.5Pro版本,推出
Gemini1.5Flash轻量化小模型、生成视频模型Veo、AI智能体ProjectAstra,并展示了与GPT-4o相似的语音视觉交互功能GeminiLive。
投资要点:
GPT持续迭代,GPT-4o推动人机交互再上新台阶
OpenAI持续升级GPT版本,2023年3月发布GPT-4在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023年11月发布GPT-4Turbo,支持125万tokens的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o带来各种能力升级:
①多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。
②情绪感知:GPT-4o能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。
③毫秒级响应:GPT-4o对音频输入的响应时间可以快到232毫秒,平均为320毫秒,这与人类在对话中的响应时间相近,此前GPT-4的语音响应约5.4秒。
④性能&成本优势:在传统基准测试中,GPT-4o在文本、推理和编码智能方面,达到了GPT-4Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比GPT-4Turbo,GPT-4o推理速度提升2倍的同时,价格降低50%。
打造全新GPT语音助手且免费开放,合作苹果&微软加速端侧落地OpenAI通过GPT-4o打造的语音版ChatGPT助手,当前已在ChatGPT中开放使用,同时模型API同步放出。GPT语音助手主要功能包括与用户跨音频、视频进行交流,例如,让GPT-4o进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI将会在ChatGPTPlus中推出新版语音模式GPT-4o的alpha版。
OpenAI与苹果合作,加速ChatGPT在端侧落地。OpenAI宣布推出一款适用于macOS的桌面级应用,使用键盘快捷键就可向ChatGPT提问。用户可通过电脑与ChatGPT语音对话,GPT-4o的新音频和视频功能后续将推出。据《每日经济新闻》援引彭博社5月10日报道,苹果被曝正与OpenAI敲定一项协议,今年将后者的部分技术引入iPhone。借此苹果将能提供由ChatGPT支持的“聊天机器人”,作为iOS18中人工智能功能的一部分。
谷歌发布ProjectAstra、Veo等,多模态技术奇点加速到来2024年5月15日凌晨,GoogleI/O开发者大会上发布了通用AI智
能体ProjectAstra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型Veo,谷歌声称,Veo能够根据文本、图像创建超过60秒的高质量1080P视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。
我们认为,OpenAI、谷歌等新品的推出,体现出多模态大模型技术的持续升级,GPT-4o的发布将革新人机交互模式,推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。
行业评级及投资策略:GPT-4o、Gemini新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值、AI应用的创新突破以及AI算力需求的持续增长可期,维持对计算机行业“推荐”评级。
相关个股:
(1)大模型:科大讯飞、三六零、拓尔思、云从科技;
(2)AI应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科
技、彩讯股份、佳发教育、鸥玛软件、拓维信息;
(3)AI终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;
(4)AI算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。
风险提示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。









微信公众号
下载完整内容
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们

点击排行

标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著