报告

上海证券:互联网传媒行业周报:字节、阿里推出图生视频AI生成器,谷歌上线多模态AI模型Gemini1.0

admin2023-12-12 11:30 103人已围观 下载完整内容

简介11月27日和28日,字节和阿里相继发布了图生视频项目相关论文,阿里推出了AnimateAnyone,新加坡国立大学和字节跳动则联合推出了MagicAnimat

11月27日和28日,字节和阿里相继发布了图生视频项目相关论文,阿里推出了AnimateAnyone,新加坡国立大学和字节跳动则联合推出了MagicAnimate。AnimateAnyone由阿里巴巴智能计算研究院开发,通过优化的扩散模型让静态任务生成动态视频,创作者只需提供静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路)即可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。MagicAnimate是新加坡国立大学和字节跳动联合推出的“人体图像动画生成器”,能够把指定的人物图片按照既定动作序列生成视频。在TikTok舞蹈数据集上,MagicAnimate生成的视频的真实度比最强基线提高了超过38%,用户只需三步即可使用:1)上传一张静态人物照片;2)上传想要生成的动作demo视频;3)调整参数,点击“Animate”。字节和阿里的两个图生视频均通过扩散模型创造时间连贯的人像动画,训练数据大多相同。

12月5日,南洋理工大学联合清华和商汤提出的GaussianEditor算法成功解决了3D编辑领域长时间和低可控性的问题,通过采用高斯溅射表示,引入高斯语义追踪和层次化高斯溅射,实现了精确可控的编辑,并提供局部修复算法。GaussianEditor有三大特点:1)Gaussian语义追踪:在训练过程中持续识别需要编辑的高斯点,确保只有目标区域被编辑。2)层次化GaussianSplatting(HGS):通过在不同训练阶段形成的高斯点之间建立层次结构,有效管理GS场景的流动性,并模拟隐式表示中神经网络的缓冲功能。3)3D场景的增加和删除算法:通过设计3D场景的增删算法,高效地从场景中移除或添加特定对象。GaussianEditor在视觉质量、量化指标、可控性和生成速度等方面超越了之前的工作,为未来虚拟现实和游戏开发提供了有力的工具。

12月6日,谷歌首席执行官SundarPichai和DeepMind负责人DemisHassabis共同在官网宣布Gemini1.0正式上线。功能方面,Gemini是一款新型的强大多模态人工智能模型,1)可归纳、理解、操作、组合不同类型的信息,2)处理文本、图像、视频和音频,3)可完成复杂的数学、物理等科学领域任务,并能理解和生成各种编程语言的高质量代码。扩展性方面,Gemini1.0设计了三个不同功能和尺寸版本:1)GeminiNano是端侧设备上最高效的模型,可以在没有连接外部服务器的情况下执行高效的AI处理任务,支持总结文本、智能回复等功能。2)GeminiPro是运行在谷歌数据中心,适用于各种任务的最佳模型,为AI聊天机器人Bard提供支持,能够快速响应并理解复杂查询,目前为170多个国家和地区提供英语服务,应用于搜索、广告、Chrome和DuetAI等更多谷歌产品。3)GeminiUltra是规模最大且功能最强大的模型,专用于高度复杂的任务。

根据我们“大模型+小模型+应用&内容”的研究框架,我们认为多模态大模型是未来发展趋势:相较于文字和图片,视频在信息表达、画面丰富性及动态性方面有更大优势,视频可以结合文本、图像、声音及视觉效果,在单一媒体中融合多种信息形式。我们认为通过文本描述或其他简单操作,AI视频工具即可生成较高质量和完成度视频内容,这降低了视频创作门槛,让创作者能够精准用视频进行内容展现,有望广泛赋能各细分行业的内容生产降本增效和创意输出,进而开拓出更广阔的应用场景。目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。

投资建议

基于我们“大模型+小模型+应用及内容”的研究框架,我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。

AI行情分化趋势下,建议重点关注基本面优异的【游戏】及【出版】板块:

1、建议关注AI+游戏,如【盛天网络】、【姚记科技】、【神州泰岳】、【三七互娱】、【完美世界】、【吉比特】;建议关注AI+出版,推荐【皖新传媒】。

2、建议关注行业垂类大模型,如【创业黑马】、【昆仑万维】。

3、建议关注短剧标的,如【三人行】、【中文在线】、【引力传媒】、【因赛集团】。

4、建议关注【汇纳科技】、【浙文互联】、【世纪恒通】。

风险提示

政策边际优化的程度不及预期、疫情致企业经营情况不及预期、AI推进进度不及预期、AIGC商业模式或落地场景效果不及预期、内容监管趋严。

  • 微信公众号

下载完整内容

文章评论


评论0

    站点信息

    • 微信公众号:扫描二维码,关注我们