Sora概念连涨一周,英伟达市值一夜涨2万亿,2024人工智能如何布局?
钛媒体《一周资本市场观察》主理人雨朦特邀易观分析研究合伙人陈晨,《钛度热评》主编车铭德,对上周A股市场进行了复盘,探讨了文生视频模型Sora的优势、其对AI行业产生的影响、我国在AI视频领域的研发与布局等话题。
继文本模型ChatGPT、图像模型Dall-E大放异彩后,OpenAI继续祭出大杀器——文生视频模型Sora,Sora到底是什么?相比同类型产品如Runway和Pika,Sora有哪些优势?
易观分析研究合伙人陈晨介绍,Sora是基于大量高质量视频和图像数据的训练,从而构建的一个功能非常强大的文生视频大模型。在2023年12月25日播出的《一周资本市场观察》直播节目中,陈晨也曾谈及视频生成可能会成为2024年市场更加关注的一个方向,其技术也可能会出现重大突破。
相比之前已经存在的同类型产品,Sora的优势主要有以下几点:
1、 生成的视频时间更长。其他类型产品生成的视频一般仅有几秒钟,但Sora生成的视频长度可以达到一分钟,这基本等于大部分短视频的时长。
2、 从生成效果来看,Sora在视频一致性、复杂动作的连续性,对于物理世界的理解上已经很接近我们对AI生成世界的想象了。
此外,针对最近大家在讨论的为什么Sora出自OpenAI而不是别家公司这一问题,陈晨认为,正是因为OpenAI研发出了ChatGPT与Dall-E这类功能强大的语言/图像大模型,建立在自身技术范式、高质量数据的基础上加以对技术路线的融合,才研发出了如今令人惊艳的Sora。
尽管Sora显示出了远超同行的能力,但它并没有选择像Pika、Runway一样,开放给大众使用,而是采取了Google、Meta类似的保守策略,先官宣,然后慢慢内测,等待一个合适的时机,再向大众开放。Sora这么做的原因有哪些?目前,文生视频模型还存在哪些问题?
陈晨认为,Sora没有一开始就开放给大家试用,可能是由于以下两点原因:
1、 考虑到文生视频技术是否会被滥用以及由此引发的安全性问题,OpenAI也许还需要进行一系列的安全性测试与优化调整。
2、 出于商业策略的考量。之前GPT在逐步开放之前也经过了4-6个月的内测,这可能都是由于OpenAI需要对模型实际运行的成本问题做前期评估。目前ChatGPT的运营成本已经非常高了,如果再加上Sora,成本恐怕会提升一个量级,所以OpenAI需要在产品开放前制定好相应的商业化路线。
谈及文生视频模型目前存在的问题,陈晨表示主要有以下几点:
1、 生成的视频在逻辑性与一致性上仍然有一些问题,比如视频中会凭空出现一些物体,物体的运动不符合客观规律等,这也是目前视频生成主要的技术难点之一。
2、 内容制作者对已经生成的视频还是希望能够做进一步调整的,人为的操作空间到底有多少,目前在交互性和反馈上还需要进一步优化。
自ChatGPT引爆起,国内科技大厂、创业企业、科研院所等纷纷入局AI大模型。目前我国有哪些企业已开始布局AI视频领域的相关研发?
陈晨表示,目前国内很多企业都在相继布局视频大模型,主要分为三类,第一类是传统大厂,比如字节跳动在视频领域布局已久,不久前刚发布了高清文生视频模型MagicVideo-V2。此外像阿里云、腾讯、百度、讯飞等,除了在通用技术上继续向多模态大模型发力之外,也在面向行业开发一些应用于垂直领域的大模型。第二类是专门做视觉分析的厂商,比如海康威视等,已经开始投入到视频大模型的研发中。第三类包括了一些专注内容开发、创意营销的厂商,比如昆仑万维、万兴科技等也研发了自己的视频大模型。
Sora大模型的推出,除了让人们看到AI大模型的无限可能,也在一定范围引发了“Sora是否会替代影视制作从业人员”的讨论和担忧,您如何看待该问题?还有哪些行业会受到Sora的影响出现颠覆性的改革?
陈晨坦言,自从ChatGPT出现的那一天开始,就一直存在对这类话题的讨论。虽然Sora相比其他同类型的视频大模型已经有了很大的突破,但它仍然是不完美的,从目前公开出来的视频看,逻辑性与一致性上仍然存在一些问题。而且影视行业涵盖了一整套工业化的内容制作体系,拥有非常多的细分场景和分工,是很难被一个模型彻底取代的。不过,陈晨表示,视频大模型势必会降低视频创作领域的门槛,起到明显的赋能提效作用。它会成为一个强力的辅助工具,日后那些具有创意且能够掌握AI工具能力的行业从业者,才是真正具有核心竞争力的群体。
除了影视行业之外,游戏开发、广告、营销、在线教育等领域的从业人员,可能都会因为视频生成技术而受到一些挑战,这也取决于个体会以什么样的态度和方式来拥抱技术的变革。
对于Sora所带来的影响,360集团创始人、董事长周鸿祎稍早前在微博发文表示,Sora意味着AGI实现将从10年缩短到两三年。您是否认同该观点,原因为何?
陈晨表示,视频大模型在技术上的突破必定加速了AGI的进程,但AGI的关键还在于是否能自发地处理无限多的任务,以及是否具备与人类一致的认知架构。此外最近针对Sora其实也出现了一些不同的声音,有一部分专家并不认为Sora是真正可以通往AGI的道路,不过现在相对独立的技术路线,在未来未必不会出现相互融合的情况,创造出真正智能且灵活可控的AGI模型。
据报道,微软计划设计一款新的网卡芯片,以替代英伟达相关产品。除了微软,一家名为Groq的美国AI公司一夜“爆火”,其自研的LPU芯片在处理大模型时的速度远超英伟达GPU。AI芯片竞争加剧,英伟达的行业龙头地位持续被挑战,后续芯片市场格局将会发生怎样的变化?
陈晨指出,今年视频大模型的热潮势必会加大对于智能算力的需求,未来也会有更多的行业客户提出定制化需求,相应地也要面对大模型的运行与维护成本上升、能耗负担等问题。整体格局上,之后的一段时间芯片短缺的问题依然会存在,英伟达的霸主地位也还会持续,但将会遭遇持续挑战,一方面大厂的芯片自研速度加快,以及一些初创企业也开始推出半通用或专用型的芯片来取代GPU,更多的替代品将会出现。在我国,国资委近期也强调了要加快建设智算中心,对于我国芯片大厂在这方面的需求也会进一步提升。
另一方面,英伟达自身也在加快布局,计划增加更多的产品种类,推出多款面向AI计算的产品,从而增加客户的可选项,降低购买芯片的难度。
文章转载至公众号:易观分析,作者:苏筱芮,大数跨境经授权转载。