0
0

META 顶级人工智能科学家表示,OPENAI 的视频生成人工智能“注定会失败”

跨语桥梁
2024-02-29
4909
shoptop 【建站扶持计划】

免费7天,首月1元! 16大主流媒体免费开户

立即查看>>

大数跨境 导读: 人工智能教父之一的严厉言论

像素不完美

OpenAI 用于生成视频的新 AI 模型 Sora 自上周发布以来已成为热门话题。但 Meta 首席人工智能科学家 Yann LeCun 并不认为大肆宣传的文本到视频模型就是这样。

LeCun 特别质疑 OpenAI 的说法,即其与 Sora 的合作最终将能够构建“物理世界的通用模拟器”。LeCun 认为,如果情况确实如此,那么它创建“世界模拟器”的方法就大错特错了。

他在X(前身为 Twitter)上发表的一篇文章中写道:“通过生成像素来模拟世界的行动是一种浪费,而且注定会失败,就像基本上被放弃的‘综合分析’的想法一样。”

一代复杂功能

LeCun 是所谓的人工智能教父之一,也许也是最直率、最直言不讳的一位。当另外两位教父 为他们所释放的东西而感叹时,LeCun继续他在 Meta 的工作,从不害怕批评他的竞争对手。

他在这里的评论指的是机器学习中生成模型和判别模型之间由来已久的争论。LeCun 认为,前一种方法“从解释性潜在变量”生成像素效率太低,并且无法充分处理 3D 空间中这些复杂预测所产生的不确定性。

用外行的话来说,他认为这些模型试图“推断”太多不相关的细节——有点像试图通过理解足球的每种材料如何发挥作用来计算足球的轨迹,而不是通过计算足球的轨迹。只关注质量和速度等东西。

“如果你的目的是真正生成视频,那没有什么问题,”他在回复帖子时说道。“但如果你的目的是了解世界是如何运作的,那就是一个失败的提议。”

另一种选择

LeCun 承认,总的来说,到目前为止,生成方法已经适用于像 ChatGPT 这样的大型语言模型,“因为文本是离散的,符号数量有限。” 但如果你要像索拉那样模拟世界,你要处理的不仅仅是几个角色。

为了与 OpenAI 的方法竞争,LeCun 一直在 Meta 开发自己的模型,称为视频联合嵌入预测架构 (V-JEPA),该模型于上周推出。

Meta 在博客文章中声称:“与尝试填充每个缺失像素的生成方法不同,V-JEPA 可以灵活地丢弃不可预测的信息,从而将训练和样本效率提高 1.5 到 6 倍。 ”

LeCun 的工作可能不像 OpenAI 的产品那样因其华丽的图像和文本生成而受到大肆宣传,但有趣的是,看到这样一位杰出的人工智能研究人员与 OpenAI 及其众多模仿者目前正在开发的相同旧方法有所不同。
原文链接;https://futurism.com/the-byte/openai-video-ai-doomed-meta-scientist

【版权声明】秉承互联网开放、包容的精神,大数跨境欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源大数跨境;同时,我们倡导尊重与保护知识产权,如发现本站文章存在版权问题,烦请将版权疑问、授权证明、版权证明、联系方式等,发邮件至 contact@10100.com,我们将第一时间核实、处理。
0
0
跨语桥梁
大家好
内容 4367
粉丝 5
关注
跨语桥梁 大家好
总阅读29397.0k
粉丝5
内容4.4k
主页
关注
大数跨境
跨境资源整合、信息共享平台
www.10100.com

公众号

公众号

大数活动

小程序
旗下产品 M123.com
M123