OpenAI 再次以惊天动地的 AI 公告打破了互联网——一款名为 Sora 的AI 视频生成器,可以创建异常逼真的视频。已经发布的一些示例很难与真实的摄像机镜头区分开来。
Sora 是一种具有 Transformer 架构的扩散模型,这意味着它的神经网络功能与ChatGPT类似。OpenAI 对其官方发布日期守口如瓶,但表示希望向人们展示人工智能“即将到来”的前景。
以下是迄今为止我们对 Sora 的了解,以及为什么视频生成器可能还需要一段时间才能向公众推出。
索拉是什么?
Sora 是由 ChatGPT 创建者 OpenAI 开发的文本到视频 AI 模型。“文字转视频”是指Sora将文字提示转化为短视频片段。OpenAI 本周发布的批次确实令人惊叹。看看这段完全由人工智能生成的章鱼视频:
OpenAI 在本周发布的一篇博文中解释道:“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景,”该博文中还发布了更多视频。“该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。”
现在谁可以访问 Sora?
目前,安全研究人员正在对 Sora 进行测试,他们负责在向公众发布之前确保其安全可靠,并评估“关键风险”。
然而,OpenAI 表示,一小部分视觉艺术家、电影制作人和设计师也获得了 Sora 的访问权限。参与试验的艺术家或设计师的名字都没有被透露。
OpenAI 论坛上的一些知情账户似乎表明,在某个时候将会推出等待名单,这将是您获得它的第一个机会。不幸的是,没有迹象表明我们何时能够注册使用 Sora。
Sora 何时向公众开放?
遗憾的是,目前《Sora》还没有发布日期。过去 24 小时在互联网上疯传的所有内容都来自 OpenAI 发布的公告博客文章。有趣的是,OpenAI 似乎并没有给出任何关于何时普遍可用的模糊指示——甚至没有迹象表明它会在今年发布。对于如此重大的公告来说,这是相当不寻常的,并且可能表明距离公开发布还有很长的路要走——但话又说回来,OpenAI 确实承认它正在提前分享其研究成果。随着人工智能行业在过去两年的发展速度,真正的发布日期谁也说不准。
索拉有什么困难吗?
正如我们所报道的,OpenAI 尚未准备好向公众发布 Sora,因为它对视频生成技术经过充分的安全测试不满意。考虑到与制作如此逼真的视频相关的无数道德问题,这很好——更不用说在一年中有如此多的选举了。
“在 OpenAI 的产品中使用 Sora 之前,我们将采取几个重要的安全措施。”“我们正在与红队成员合作,他们是错误信息、仇恨内容和偏见等领域的领域专家,他们将对抗性地测试该模型” 。
OpenAI 还表示,它正在开发一种人工智能视频检测分类器,可以识别视频是否由 Sora 制作。
这似乎与 ChatGPT 推出后采取的步骤类似,之后这家 AI 公司推出了文本分类器。但后来因不可靠而被关闭。当我们测试它是否可以发现 ChatGPT 剽窃时,它甚至无法检测自己生成的内容。
索拉如何运作?
OpenAI 本周表示:“Sora 是一种扩散模型,它从看起来像静态噪声的视频开始生成视频,然后通过多个步骤消除噪声来逐渐改变视频。”
该技术的工作原理与为该公司的聊天机器人 ChatGPT 提供支持的GPT 语言模型系列类似。它们都使用“变压器”架构——一种接受输入并将其“转换”为输出的神经网络。他们还整合了DALLE-3的元素,例如重述系统。OpenAI 将 Sora 视频和图像作为数据单元(或“补丁”)提供。“通过统一我们表示数据的方式”OpenAI 天,“我们可以在比以前更广泛的视觉数据上训练扩散变压器,涵盖不同的持续时间、分辨率和纵横比。
原文链接;https://tech.co/news/what-is-sora