报告

申港证券:计算机行业研究周报:从技术路线谈AI视频的未来发展

admin2023-12-19 09:32 73人已围观 下载完整内容

简介本周我们从技术路线来对近期爆火的AI视频进行展望。自Pika爆火出圈后,越来越多的AI视频软件接踵而至,Pika的测评也出现了明显的口碑分化,市场主流观点认为视

本周我们从技术路线来对近期爆火的AI视频进行展望。

自Pika爆火出圈后,越来越多的AI视频软件接踵而至,Pika的测评也出现了明显的口碑分化,市场主流观点认为视频生成领域也迎来了GPT时刻。

从AI视频的技术迭代的路线看,我们认为:

从参与玩家的类型来看,整体是科技大厂居多,并没有出现如文生图模型一样的的现象,背后的原因在于文生视频的门槛较高。

从训练数据层来看,AI视频训练数据集的呈现跨模态的形式,以Runway的视频生成模型Gen-2为例,训练数据包括2.4亿张图片、640万个视频剪辑片段以及数亿个学习示例。

从形式来看,目前大多数模型厂商在文生视频上以闭源路线居多,其原因在于文生视频对算力及模型的工程化能力都很高。

文生视频模型背后其实有两条技术路线:一条是从文本或图像生成中得到广泛的应用,基于Transformer架构的技术路线,而另一条则是基于我们在之前的周报中有所提及的扩散模型,两条技术交替,目前扩散模型占据主流。

Google发布的Transformer架构已经在许多不同领域取得了较大的成功,但实际上包括最近的Pika在内,视频生成的主导范式依然是扩散模型。其原因在于Transformer中的注意力机制的内存需求会随输入序列长度而二次方增长,在处理视频这样的高维信号时,这样的增长模式会让计算成本成倍增加。

我们认为两种技术路线的融合可能会推动视频生成技术的发展,并对AI行业的争格局产生影响。斯坦福大学AI科学家李飞飞团队与谷歌合作,推出了视频生成模型W.A.L.T,该模型成功地将Transformer架构整合到了隐视频扩散模型中,隐扩散模型(LDM)可在源自自动编码器的更低维隐空间中运行,从而降低计算需求。

尽管通用大模型正以飞快的速度发展和迭代,但我们认为在文生视频领域距离GPT时刻的来临仍需一定的时间,预计明年二季度会出现下一个出圈的AI视频应用。

目前AI视频有两个较大的门槛,一是算力的掣肘,视频领域对算力需求更高;另一方面是竞争环境的激烈,当前头部科技巨头基本都已入局,只是产品尚未全面公测。

从W.A.L.T模型的例子来看,我们不能忽视算法的演进对AI视频领域的影响,同时也需注意轻量化的视频制作产品最终面向的是非专业人群,这也意味着能否以差异化优势吸引用户也是成功的关键。

建议重点关注:视觉算法领先的虹软科技、当虹科技、格灵深瞳,大模型侧的科大讯飞,应用侧的金山办公、万兴科技、福昕软件等。

市场回顾:

本周申万计算机指数跌幅较大,下跌1.48%,在申万一级行业中排名24/31。

本周申万计算机行业指数前十大权重股整体除德赛西威、海康威视、金山办公外均为下跌,其中大华股份、中科曙光、浪潮信息回调幅度较大。

本周计算机板块涨幅前十大个股:苏州科达、云鼎科技、恒银科技、方直科技、丝路视觉、赛为智能、御银股份、维海德、软通动力及汉王科技。

申万计算机行业指数当前滚动市盈率为63.54,近五年分位值67.72%。

风险提示:政策落地不及预期风险、技术落地不及预期、宏观经济波动风险等。

  • 微信公众号

下载完整内容

文章评论


评论0

    站点信息

    • 微信公众号:扫描二维码,关注我们