OpenAI 与 Sora 抢尽风头

跨语桥梁

2024-02-19

6388

【建站扶持计划】

免费7天，首月1元！ 16大主流媒体免费开户

立即查看>>

导读：就在我们认为Google 让 OpenAI 和微软在 Gemini 1.5 版本中起舞时，OpenAI 首席执行官 Sam Altman 的 Sora抢尽了风头——一款超酷的文本转视频工具，可以生成栩栩如生、超现实的视频片段，世界前所未见。

Khosla Ventures 合伙人 Nikunj Kothari 写道：“ OpenAI和谷歌之间每天都变得越来越明显的区别是，一家公司在谈论，而另一家公司在展示。”

在某种程度上，当 Altman 亲自向 X 上的用户寻求提示以围绕 Sora 引起热议时，Google 确实让 OpenAI 起舞了。 “我们想向您展示 Sora 的能力，请回复并附上您想看的视频的字幕，我们将开始制作一些！”奥特曼写道，要求用户不要隐瞒细节或困难。其余的都是历史了。

“必须出去，大约 45 分钟后就会有更多视频，”随着请求的浪潮不断涌出，奥特曼喊道。在他回来后，CRED 的 Kunal Shah 的请求成为了我们精心挑选的请求之一。

奥特曼并没有就此止步。他甚至对 Sora 背后的团队给予了当之无愧的赞扬，他说：“OpenAI 是我在一个地方见过的最有才华、最友善的一群人。”此外，他还表示，他们正在利用所有资源来解决最棘手、最有趣、最重要的问题，重点是构建 AGI。 “你也许应该考虑加入我们，”他补充道。

Sora 背后的团队由OpenAI 研究科学家Tim Brooks 、OpenAI 研究科学家William Peebles以及DALL·E 创始人兼 Videogen 负责人Aditya Ramesh领导。

所有这一切感觉就像 OpenAI 准备在未来几周内发布 GPT-5 时的权宜之计机制。 “它将更加智能、多式联运、速度更快，”奥特曼在迪拜举行的世界政府峰会上表示。在最近一集《Unconfuse Me with Bill Gates》中，他也强调了多模态作为GPT-5关键方面的重要性，它使其能够处理视频输入并生成新视频。

Sora 可能正是 GPT-5 所需要的。

视频生成中的 ChatGPT 时刻？

OpenAI 全新的超酷文本转视频工具可以创建长达 60 秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。许多人还称这是视频生成中的ChatGPT时刻。

Sora 不仅仅是 OpenAI 的视频生成模型，它还是AGI 的垫脚石。 OpenAI 正在教 Sora 理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要现实世界交互的问题。

索拉的工作原理

Sora 就像一个使用 Transformer 架构的法学硕士。 LLM 使用文本标记，而 Sora 使用视觉补丁。补丁作为一种高度可扩展且有效的表示形式，用于训练各种类型的视频和图像的生成模型。与 LLM 预测单词的方式类似，Sora 被训练为在给定输入噪声补丁的情况下预测原始的“干净”补丁。

Sora 具有多种功能，例如 DALL·E 图像动画、扩展生成的视频、视频到视频编辑和连接视频。然而，除了视频生成之外，Sora 的可能性是无限的。它可以模拟现实世界中人、动物和环境的某些方面。

此外，它还可以模拟数字世界，其中包括《我的世界》等流行游戏。它可以同时通过基本策略控制《我的世界》中的玩家，同时以高保真度渲染世界及其动态。

Sora 的推出紧接着 Google 最近推出了 Lumiere，这是一种文本到视频的扩散模型，旨在合成视频，产生逼真、多样化和连贯的运动。 Sora 在日语中翻译为“天空”。索拉肯定是一片布满星星的天空，而不仅仅是一个星座。这也给 RunwayML、Pika 和 Stable Video 等其他文本转视频生成器敲响了警钟。
原文链接：https://analyticsindiamag.com/openai-steals-the-spotlight-with-sora-%E2%9C%A8/

OpenAI

 0

 0

跨语桥梁

大家好

内容 4367

粉丝 5

关注

抖音直播又出牛人，董艳颖吊打董宇辉，登顶抖音带货榜第一

2024-10-16