(资料图片)
国盛证券研报提出,Runway 6月对Gen-2开放公测,基于用户提供的文字提示,Gen-2生成视频。国盛证券认为,在文生视频领域,Gen-2已经是佼佼者。Gen-2展现了AIGC能在相当程度上运用所训练的数据,“理解”用户文本提示中的动作,使图片的每帧画面之间能以较为有逻辑性的方式连接起来。
另外值得注意的是,Runway于6月获得了谷歌参投的1亿美元投资,估值达到15亿美元,这意味着巨头的重视。如果将“文生图”“大语言模型用自然语言回复用户的自然语言提问”视作AIGC爆发的前两波高潮,
国盛证券认为,当前AIGC应用尚处于第三波高潮——文生视频的前夜,它是多模态赛道的一大圣杯。看好后续AIGC多模态应用“狂飙”对算力需求的拉动,建议关注:光通信、算力设备、云算力、液冷、边缘算力承载平台五大方向。
事件:近日,多款多模态工具发布AIGC上的重大更新。
Runway Gen-2:文生视频开放公测:Runway 6月对Gen-2开放公测,基于用户提供的文字提示,Gen-2生成视频。此次公测向所有用户免费提供100秒的时长,单个视频约4秒。Gen-2的训练数据包括2.4亿张图片、640万个视频剪辑片段以及数亿个学习示例。尽管在专业人士看来,Gen-2存在较为模糊、颗粒感较重、光线穿透差、帧率不稳定、人物不自然、动物/人物动作诡异等问题,我们认为,在文生视频领域,Gen-2已经是佼佼者。Gen-2展现了AIGC能在相当程度上运用所训练的数据,“理解”用户文本提示中的动作,使图片的每帧画面之间能以较为有逻辑性的方式连接起来。我们注意到,其他声称具备文生视频能力的公司,如Meta Make-A-Video和Phenaki,尚未将此功能开放公测,仅在官网放置了论文入口和部分示例。另外值得注意的是,Runway于6月获得了谷歌参投的1亿美元投资,估值达到15亿美元,这意味着巨头的重视。如果将“文生图”“大语言模型用自然语言回复用户的自然语言提问”视作AIGC爆发的前两波高潮,我们认为,当前AIGC应用尚处于第三波高潮——文生视频的前夜,它是多模态赛道的一大圣杯。
Photoshop(Beta):生成式填充画面。Adobe 5月发布的Photoshop(Beta)新增创意填充(Generative Fill)功能,该功能由Adobe FireflyAI提供。基于文本提示,Photoshop(Beta)可以创造性地扩充用户提供的图片,新增内容致力于与用户文本提示的内容和风格对齐。
Midjourney:生成式放大与缩小画面。文生图应用Midjourney发布Zoom Out功能,用户可以将文字生成的图片放大或缩小,这里指的并不是简单的尺寸上的缩放,而是放大图像的画布,使其扩展到其原始边界之外,而无需更改原始图像的内容,新展开的画布将使用提示和原始图像的指导填充。使用这一思路,借助Runway图片生成视频功能,用户可以实现将某一张图片作为关键帧,将它作为视频的核心场景,实现类似于调整焦距的功能,十分生动。
AIGC技术更新,影视创作、游戏制作等领域降本增效进一步深化。上述AIGC应用显然利好影视创作、游戏制作等领域,能极大提高提高生产效率、降低内容的生产成本。并且,我们认为,它们对生产力的提升,并非是通过取代人工的方式,而是辅助人工。
投资建议:我们看好后续AIGC多模态应用“狂飙”对算力需求的拉动,建议关注:1)光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁;2)算力设备:中兴通讯、紫光股份、锐捷网络、菲菱科思、恒为科技、工业富联、寒武纪、震有科技;3)云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据;4)液冷:英维克、申菱环境、高澜股份、佳力图;5)边缘算力承载平台:美格智能、广和通、移远通信、初灵信息、龙宇股份、网宿科技、佳讯飞鸿。
风险提示:伦理风险:人工智能与人交互过程中,可能出现伦理风险;市场竞争风险:开源大模型的发展一日千里,对商业公司而言,是机遇也是挑战;技术发展与商业落地进度不及预期风险。
关键词:
责任编辑:Rex_28