随着数字化浪潮的推进,人工智能(AI)技术的飞速发展正在深刻改变着我们的生活方式。一年前,OpenAI推出的ChatGPT在全球范围内引起了广泛关注和讨论,以其独特的生成式对话能力而声名鹊起。
作为科技界的佼佼者,OpenAI再次凭借其领先的技术实力,引领了新一轮的技术革新。近日,该公司宣布推出其首个文本到视频生成的AI模型——Sora。
近日,一位名为“AI疯人院”的博主利用AI技术生成《西游记》动画短片,向观众展示了传统文化与现代科技的完美融合,呈现出了一种全新的视听体验,让多数网友叹为观止,在网络上掀起一番热潮。
视频博主冯先生在接受媒体采访时透露,这段视频如果是传统人工制作大概需要半年的时间,而自己在AI的帮助下仅耗时一周便完成制作。
随着短视频生成模型Sora的问世,许多目前看似遥不可及的事情在未来都有可能实现。
可生成一分钟的逼真视频
Sora可以根据用户的文本提示创建最长60秒的逼真视频,视频分辨率高达1080P,为用户提供极佳的视觉效果,不仅可以生成细致的背景、多角度的镜头运动等,还能够提供多种类型的角色,以满足创作者多样化的需求。
同时也接受现有视频扩展或填补缺失的帧,使得视频内容更加完整和连贯。相较于传统的视频制作方式,Sora的出现极大地提高了视频的制作效率。
理解物体在物理世界中的存在方式
该公司还指出,该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。
目前官方已经公布了48条由Sora生成并且没有进行任何编辑的视频。其中,一只长着独角的毛绒小怪兽,面朝一支正在燃烧的蜡烛,成为了焦点。这只小怪兽的表情生动逼真,与文字指示的“惊奇和好奇”情感完美契合。
此外,视频中的细节处理得很细致,怪兽身上的绒毛清晰可见,蜡烛火焰的光线也逼真地呈现在画面中。
长时间连贯和物体一致性
Sora模型通过其强大的生成能力,有效地模拟了短距离和长距离依赖关系,确保了视频在时间维度上的连贯性。例如,Sora模型可以在被遮挡或离开画面时仍然保持对人、动物和物体的追踪和生成,确保了它们在视频中的一致性。
此外,Sora还可以在单个样本中生成同一角色的多个镜头,并保持他们的外观和特征一致。
强大模拟与互动能力
Sora模型不仅能够模拟复杂的数字环境,还能够模拟人工操作。
以Minecraft游戏为例,Sora模型可以控制玩家的行为,实现与游戏环境的实时互动,为观众带来更加沉浸式和交互式的视频体验。
“世界模型”Sora广阔前景
Sora模型的发布无疑为视频创作领域带来了巨大的变革和机遇。这一创新技术不仅简化了视频制作流程,还为创作者们提供了更广阔的想象空间。
在影视制作领域,Sora模型能够为导演们提供丰富的素材和新颖的灵感来源,帮助创作者迅速构建出精彩的视觉效果;其次,在广告领域,Sora模型可以精准捕捉广告核心需求,呈现出不同风格的广告风格;在教育领域,Sora模型为学生们带来了全新的学习体验,帮助学生更好地理解和掌握知识。
而在社交媒体上,Sora模型则可以为用户们提供更多创意、趣味以及个性化的短视频内容。OpenAI悄然杀进TikTok。在TikTok认证帐号上更新了不少全新生成的视频,再加上洗脑的配乐,疯狂吸粉。仅4天,就收获了10万粉丝、50万点赞——并且还是在无拍摄、无宣传的情况下。
“Sora风”不仅在各界疯狂刷屏,更惊动了科技界的重量级人物。马斯克、周鸿祎、贾扬清等一众科技大佬纷纷下场参与讨论,发表自己的见解。
马斯克在社交平台X上的各网友评论区活跃蹦跶,留下“人类愿赌服输(gg humans)”等话语,引发了网友们的热议和猜测。
360集团创始人周鸿祎更是表示,Sora的推出将大大缩短AGI的实现时间,从原本的10年缩短至一两年。这意味着我们将更快地迎来一个充满智慧和创造力的新时代。
结语
Sora模型为创作领域带来的巨大潜力和机遇,同时也面临着一些局限性。随着技术的不断发展和完善,我们有理由相信在未来克服这些局限性,为创作者和观众带来更多惊喜。