0
0

OpenAI 与 Sora 抢尽风头

跨语桥梁
2024-02-19
6388
shoptop 【建站扶持计划】

免费7天,首月1元! 16大主流媒体免费开户

   立即查看>>

大数跨境 导读: 就在我们认为Google 让 OpenAI 和微软在 Gemini 1.5 版本中起舞时,OpenAI 首席执行官 Sam Altman 的 Sora抢尽了风头——一款超酷的文本转视频工具,可以生成栩栩如生、超现实的视频片段,世界前所未见。 

Khosla Ventures 合伙人 Nikunj Kothari 写道:“ OpenAI和谷歌之间每天都变得越来越明显的区别是,一家公司在谈论,而另一家公司在展示。”

在某种程度上,当 Altman 亲自向 X 上的用户寻求提示以围绕 Sora 引起热议时,Google 确实让 OpenAI 起舞了。 “我们想向您展示 Sora 的能力,请回复并附上您想看的视频的字幕,我们将开始制作一些!”奥特曼写道,要求用户不要隐瞒细节或困难。其余的都是历史了。 

“必须出去,大约 45 分钟后就会有更多视频,”随着请求的浪潮不断涌出,奥特曼喊道。在他回来后,CRED 的 Kunal Shah 的请求成为了我们精心挑选的请求之一。 

奥特曼并没有就此止步。他甚至对 Sora 背后的团队给予了当之无愧的赞扬,他说:“OpenAI 是我在一个地方见过的最有才华、最友善的一群人。”此外,他还表示,他们正在利用所有资源来解决最棘手、最有趣、最重要的问题,重点是构建 AGI。 “你也许应该考虑加入我们,”他补充道。 

Sora 背后的团队由OpenAI 研究科学家Tim Brooks 、OpenAI 研究科学家William Peebles以及DALL·E 创始人兼 Videogen 负责人Aditya Ramesh领导。

所有这一切感觉就像 OpenAI 准备在未来几周内发布 GPT-5 时的权宜之计机制。 “它将更加智能、多式联运、速度更快,”奥特曼在迪拜举行的世界政府峰会上表示。在最近一集《Unconfuse Me with Bill Gates》中,他也强调了多模态作为GPT-5关键方面的重要性,它使其能够处理视频输入并生成新视频。 

Sora 可能正是 GPT-5 所需要的。

视频生成中的 ChatGPT 时刻?

 
OpenAI 全新的超酷文本转视频工具可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。许多人还称这是视频生成中的ChatGPT时刻。 

Sora 不仅仅是 OpenAI 的视频生成模型,它还是AGI 的垫脚石。 OpenAI 正在教 Sora 理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要现实世界交互的问题。

索拉的工作原理 

Sora 就像一个使用 Transformer 架构的法学硕士。 LLM 使用文本标记,而 Sora 使用视觉补丁。补丁作为一种高度可扩展且有效的表示形式,用于训练各种类型的视频和图像的生成模型。与 LLM 预测单词的方式类似,Sora 被训练为在给定输入噪声补丁的情况下预测原始的“干净”补丁。

Sora 具有多种功能,例如 DALL·E 图像动画、扩展生成的视频、视频到视频编辑和连接视频。然而,除了视频生成之外,Sora 的可能性是无限的。它可以模拟现实世界中人、动物和环境的某些方面。 

此外,它还可以模拟数字世界,其中包括《我的世界》等流行游戏。它可以同时通过基本策略控制《我的世界》中的玩家,同时以高保真度渲染世界及其动态。

Sora 的推出紧接着 Google 最近推出了 Lumiere,这是一种文本到视频的扩散模型,旨在合成视频,产生逼真、多样化和连贯的运动。 Sora 在日语中翻译为“天空”。索拉肯定是一片布满星星的天空,而不仅仅是一个星座。这也给 RunwayML、Pika 和 Stable Video 等其他文本转视频生成器敲响了警钟。
原文链接:https://analyticsindiamag.com/openai-steals-the-spotlight-with-sora-%E2%9C%A8/

【版权声明】秉承互联网开放、包容的精神,大数跨境欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源大数跨境;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至 contact@10100.com,我们将第一时间核实、处理。
0
0
跨语桥梁
大家好
内容 4367
粉丝 5
关注
跨语桥梁 大家好
总阅读29675.4k
粉丝5
内容4.4k
主页
关注