0
0

OpenAI的Sora给中国的人工智能梦想泼了“冷水”,文本到视频的进步引发了更多的反省

俏千金做外贸
2024-02-29
10297
shoptop 【建站扶持计划】

免订阅费,免费SEO与代建站,16大主流媒体免费开户

   立即查看>>

大数跨境
导读:Sora的推出迫使中国人工智能行业再次面临如何在美国制裁升级的情况下赶上最新技术的问题

中国曾设想通过其海量数据在人工智能竞赛中占据主导地位,但事实证明,高质量的训练数据至关重要
OpenAI最近推出的文本转视频模型Sora对中国与世界顶尖人工智能技术的差距发出了新的警告,引发了人们的疑问:为什么中国没有类似的产品,呼应了这种灵魂—— 2022 年ChatGPT推出后,我们开始寻找当地研究人员和投资者。
就在几年前,中国还设想利用该国大量的数据来开发面部识别等功能的成熟应用程序,最终主导全球人工智能竞赛。生成式人工智能(使用大型模型来生成文本、图像和视频等内容)的最新发展已经改变了计算方式,使中国再次显得落后。

Sora 于 2 月 16 日推出,将人工智能之战转移到视频生成领域,而此时中国正面临着更大的挑战,因为缺乏关键工具,例如领先人工智能芯片设计公司 Nvidia 开发的高级图形处理单元 (GPU) ,由于美国不断升级的出口限制。中国最好的人工智能公司在生成人工智能方面已经落后美国同行很多年,而在这个领域,北京自诩的互联网治理模式看起来像是一种负担。

中国互联网安全公司360安全科技创始人周鸿祎表示,Sora的推出就像“一桶冷水浇在中国头上”,该公司已加入中国推出自己的ChatGPT式大语言模型的竞赛。第一财经媒体周五报道。“这让很多人冷静下来,迫使我们看到与海外领导人的差距,”他补充道。
本周,北京方面下意识地对 Sora 作出回应,要求最值得信赖的国有企业在人工智能领域发挥带头作用。国务院国资委周一敦促中央企业“拥抱人工智能带来的深刻变化”。其中十家公司被指定为推广人工智能的冠军企业,但监管机构没有透露所选公司的名称。

纽约大学库朗数学科学研究所计算机科学助理教授谢赛宁否认自己参与了Sora的开发,并强调人才、数据和计算能力的重要性。在一篇被广泛报道的社交媒体帖子中,谢询问中国是否为Sora做好了准备,并表示中国应该确保该技术“不会被某些人或团体滥用作为牟取暴利和操纵的工具”。

Sora 的访问权限目前受到限制。与 OpenAI 早期的一些模型不同,它不是开源的,只有少数人可以试用该模型。

在中国大陆,国家网信办要求所有公开的大语言模型(LLM)必须向该机构注册。OpenAI 并未直接在大陆或香港提供其服务,谷歌也未在这些市场提供其 Gemini AI 产品。微软的Copilot采用OpenAI的GPT模型,已在香港上市。
由于大陆缺乏外国参与者,几家本土科技巨头在拥有 200 多名法学硕士的拥挤市场中争夺一席之地。中国搜索巨头百度、社交媒体巨头腾讯控股以及拥有《南华早报》的电子商务巨头阿里巴巴集团都推出了自己的法学硕士课程。然而,很少有人能够与 Sora 相媲美,部分原因是他们尚未使用新颖的扩散变压器 (DiT) 架构。

总部位于北京的TikTok所有者字节跳动表示,其用于辅助视频生成的内部视频运动控制工具 Boximator 仍处于起步阶段,尚未准备好大规模发布。“在图像质量、保真度和持续时间方面,它与领先的视频生成模型仍然存在很大差距。”
然而,一些业内人士认为,更紧迫的问题是获得 OpenAI 的模型,而不是与 Sora 相匹配。总部位于北京的中科金财表示,一旦文本转视频工具在微软的云计算平台 Azure 上可用(OpenAI 最大的支持者),它将成为首批申请 Sora API 订阅的公司之一。
不过,在美国,立法者已经在寻找限制中国获取美国人工智能云服务的方法。
与此同时,总部位于伦敦的独角兽Stability AI发布了其文本到图像模型Stable Diffusion 3,该模型也使用了DiT,因为随着Sora的流行,该架构可能会成为构建生成式AI的主流。一位不愿透露姓名的中国开发人员表示,中国人工智能工程师可能的路径是“首先解码 Sora,并用自己的数据对其进行训练,以生产出类似的产品”。

浙江省杭州市的人工智能企业家徐亮表示,不久之后中国就会推出类似的服务。“最快一两个月内,中国市场就会出现类似Sora的车型,下半年还会有大量车型出现,”他说。但徐指出,中国产品与Sora之间仍然存在不可忽视的差距。
天津师范大学人工智能和机器学习教授王书义表示,过去一年培养法学硕士的经验让中国大型科技公司在这一领域积累了专业知识并储备了资源。必要的硬件,使他们有能力在未来六个月内生产类似 Sora 的产品。

Sora 的推出引起了人们对其令人印象深刻的产量背后的秘密的猜测。纽约大学的 Xie 是 DiT 的两名开发者之一,他在推特上表示,“数据可能是 Sora 成功的最关键因素”。他估计 Sora 可能有大约 30 亿个参数。

“如果属实,这并不是一个不合理的模型尺寸,”他写道。“这可能表明训练 Sora 模型可能不需要像人们预期的那样多的 GPU——我预计未来迭代会非常快。”

Sora 推出前几个月,一组研究人员推出了 VBench,这是一个视频生成模型的基准测试工具,旨在评估 Runway 的 Gen-2 和 Pika 的性能。在16个维度中,Gen-2在成像质量和美学质量等方面表现突出,但在动态范围和外观风格方面较弱。Pika由斯坦福大学中国博士生郭文静联合创立,其在背景一致性和时间闪烁方面表现最好,但在成像质量方面需要改进。

由新加坡南洋理工大学和中国上海人工智能实验室的研究人员组成的 VBench 团队根据 OpenAI 提供的演示发现,与其他模型相比,Sora 在整体视频质量方面表现出色。关于模型如何将文本提示转换为视频的信息有限。
IDC中国新兴技术研究总监卢艳霞表示,百度、阿里巴巴和腾讯等科技巨头将率先在中国推出类似服务。她表示,受到华盛顿制裁的本土人工智能企业科大讯飞、商汤科技和海康威视也将参加角逐。

但分析师表示,中国仍然面临着一场艰苦的战斗,因为中国的科技市场在资本、硬件、数据甚至人员方面与世界的隔离越来越严重。

近年来,自从北京以遏制“资本非理性扩张”为名决定打压科技巨头以来,中国顶尖科技公司与微软、谷歌和英伟达等美国科技公司的市值差距显着拉大。

尽管中国一度被认为在数据量方面具有优势,但卢表示,中国现在面临着训练这些新模型所需的高质量数据的匮乏,这使得其获得先进芯片的机会有限而带来的挑战更加复杂。卢表示,人才的缺乏是另一个问题,因为中国人工智能领域最优秀、最聪明的人才往往会发现,为美国的领先企业工作更容易表现出色。
例如,在 OpenAI,具有中国教育背景的技术专业人士构成了一个关键群体。OpenAI 在 LinkedIn 上的 1,677 名关联会员中,有 23 人毕业于中国清华大学,清华大学在该初创公司员工中排名第九,超过了剑桥大学和耶鲁大学。

斯坦福大学、加州大学伯克利分校和麻省理工学院是 OpenAI 员工中排名前三的机构,分别拥有 88 名、80 名和 59 名员工,这些学校都在其 LinkedIn 个人资料中列出。

然而,即使拥有必要的人才,专家们仍质疑,在面临中美贸易紧张局势的现有限制的情况下,中国本土的生成人工智能能走多远。

平安证券在一份报告中警告称,美国持续的半导体出口限制“可能会加速国内人工智能芯片行业的成熟”,但“本土替代品可能达不到预期”。

华盛顿通过限制包括任何源自美国技术的相关产品,阻止中国公司获得世界上最先进的半导体工具。10月份,美国再次收紧了这些限制,阻止中国大陆获得英伟达为应对先前的限制而专门为中国客户设计的GPU。
技术研究和咨询集团 Omdia 高级计算首席分析师 Alexander Harrowell 指出,中国除了 GPU 之外还有其他选择来培训法学硕士。“你可以使用谷歌的 TPU [张量处理单元]、华为的 Ascend、AWS 的 Trainium,或者相当多的初创公司的产品之一,”他说。

但更换 GPU 是有代价的。“你离 GPU 路线越远,你在软件开发和系统管理方面花费的精力就越多,”Harrowell 说。

杭州企业家徐表示,还将有专门针对中国市场的机会。“随着Sora技术报告的发布,以及即将推出的开源视频模型,将为中国玩家提供学习的基础,”他说。他补充说,本地视频模型将更好地支持中文。

天津师范大学的王指出,Sora 的一个演示视频中有一个中国龙跳舞的场景,他发现这是对该活动的刻板描述。他说,中国众多的民族、民间传统、风俗习惯和地域多样性为本土视频模式提供了丰富的素材,可以更好地迎合本土用户。

王还对中美人工智能之间存在“不可逾越的鸿沟”的观点表示犹豫。

“每次美国同行推出新产品时,中国公司是否愿意效仿并进行抄袭,还是宁愿设定更大的目标来争取安全的通用人工智能?” 王问道。
原文链接;https://www.scmp.com/tech/big-tech/article/3253034/openais-sora-pours-cold-water-chinas-ai-dreams-text-video-advancements-prompt-more-soul-searching

【声明】该内容为作者个人观点,大数跨境仅提供信息存储空间服务,不代表大数跨境观点或立场。版权归原作者所有,未经允许不得转载。如发现本站文章存在版权问题,请联系:contact@10100.com
0
0
俏千金做外贸 俏千金做外贸
总阅读179.4k
粉丝0
内容29
主页
关注