OpenAI 最新的生成人工智能产品 Sora 可以根据文本提示生成长达一分钟的极其逼真的视频。OpenAI 首席执行官Sam Altman周四在 X 上宣布了该模型的创建。
Sora 尚未向公众开放。目前,OpenAI 仅向红队成员(受雇寻找问题的个人)授予访问权限,他们将评估与模型发布相关的潜在风险,以及数量有限的“视觉艺术家、设计师和电影制作人,以获取有关如何解决问题的反馈”。推进该模型对创意专业人士最有帮助,”根据一篇博客文章。
该帖子展示了 Sora 生成的一些视频。为了进一步展示 Sora 的功能,Altman 邀请 X 上的用户提出建议,以便生成视频。他们的回应是,要求提供一段视频,其中包括“由祖母社交媒体影响者主持的自制面疙瘩烹饪教学课程,背景是在质朴的托斯卡纳乡村厨房里,配有电影灯光”,以及“ 半鸭半龙飞过美丽的日落,一只背上穿着冒险装备的仓鼠。” 许多X用户表达了他们对新技术的兴奋。
OpenAI 是开创性聊天机器人ChatGPT背后的公司。它还生产了流行的图像生成人工智能模型Dall-E。在 Sora 宣布之前,领先的文本到视频 AI 模型是由位于布鲁克林的Runway开发的。Runway 最先进的模型 Gen-2于 2023 年 3 月发布。它制作的视频断断续续、简短,而且常常是噩梦般的。一些用户惊叹于 Sora 视频的优越性,并注意到人工智能在不到一年的时间里取得的进步。Runway 首席执行官兼联合创始人Cristóbal Valenzuela在 X 上 发布了“game on”,以回应 OpenAI 的声明。
索拉在这些计划的关键时刻登陆。专家们担心人工智能生成的内容 可能会被用来错误地影响选举或在全世界范围内制造混乱。世界经济论坛的 2024 年全球风险报告将人工智能生成的错误信息和虚假信息列为 2024 年世界面临的最重大风险。除了与红队合作识别 Sora 可能带来的风险外,OpenAI 还在构建分类器,如果出现以下情况,可以向用户发出警报:根据 Sora 发布时发布的博客文章,该视频由 Sora 生成,并计划包含C2PA 元数据,即在包含 AI 生成内容的文件中添加不易察觉的内容,如果他们在产品中部署 Sora,则可以进行出处验证。
OpenAI 遵循一种被称为“迭代部署”的原则,即在人工智能模型与几年后的情况相比仍相对原始的情况下发布人工智能模型,以便让社会适应新技术。Sora 博客文章重申了这一原则,指出“我们相信,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。”
OpenAI 发布的技术报告没有披露 Sora 训练的数据,这种做法在人工智能行业中越来越普遍,因为越来越多的针对人工智能公司的诉讼指控他们在未经他人同意的情况下利用他人的数据训练模型。同意。视觉艺术家起诉人工智能公司,去年的演员罢工部分原因是担心人工智能可能取代演员和作家。OpenAI 也引起了一些争议:去年年底,《纽约时报》 起诉OpenAI 侵犯版权,一些人工智能研究人员批评该公司,声称该公司抄袭了公开发表的学术研究人员的工作成果,但没有给予适当的署名。
原文链接:https://time.com/6695938/sora-openai-video-generator-ai/’