“AI教母”李飞飞祛魅算力讨巧，DeepSeek算法和成本遇争议

华尔街科技眼

2025-02-07

导读：“AI教母”李飞飞祛魅算力讨巧，DeepSeek算法和成本遇争议

文/Leon

编辑/cc孙聪颖‍

DeepSeek的持续火爆，被广泛认为是中国AI大模型的“弯道超车”，其最大的意义是打破了物理算力至上的逻辑，用更低的成本训练出高性能AI大模型，对行业领头羊OpenAI产生巨大冲击。

自2025年1月末上线以来，基于DeepSeek V3模型的DeepSeek官方App下载量飙升，目前已经登顶全球140多个国家应用商店，日活突破2000万，在多个国家及地区取代ChatGPT成为最受欢迎的AI应用。

人红是非多。很快，DeepSeek的高效、低成本遭遇质疑，包括马斯克等科技大佬纷纷下场表态，认为DeepSeek不可能突破算力瓶颈。

‍‍‍‍DeepSeek的争议：创新还是取巧

训练大模型需要算力，算力则是通过英伟达AI显卡实现。以马斯克xAI的全球最大超级计算中心“Supercluster”为例，该集群由10万个液冷英伟达H100 GPU组成，价值超40亿美元。同样，OpenAI、Meta、亚马逊等企业的AI投入，也都以数亿美元起计算。

没有算力，开发不出高性能的大模型；算力需要英伟达高性能AI显卡，不仅奇货可居，还针对中国市场进行限制，只向中国市场销售低性能的阉割版本，比如特供版H800，性能明显低于通用版H100。因此，按照上述逻辑来说，DeepSeek这样同时具有高性能、低算力成本的大模型，是不应该出现的。

图：xAI旗下Supercluste超算中心

据了解，DeepSeek-V3模型仅使用了2048块H800的芯片、历经两个月，便实现了6710亿参数的训练成果。相比之下，Meta的Llama 3训练参数为4050亿，则需要16384块性能更强的H100芯片、耗时54天才能完成训练， DeepSeek的训练效率提升了11倍。

目前，对于DeepSeek算力争议众说纷纭，《华尔街科技眼》汇总了各方观点。

第一种观点，是DeepSeek隐瞒了其训练模型的真实算力，马斯克便是其中之一。据美媒报道，美国白宫和FBI正展开调查 DeepSeek是否透过新加坡作为中转站获得H100显卡。所谓的疑点来自英伟达财报，其2023 财年第三财季新加坡营收占比仅为9%；而在美国升级对华AI芯片出口管制之后，新加坡在英伟达2025 财年第三财季的营收占比提升至22%。

对此，英伟达方面简称公司遵循所有法律要求，表示新加坡是主要的交易中转站，英伟达是在此统计销售额，并不代表产品的实际最终使用地点。

第二种观点，是OpenAI主张的“数据蒸馏”观点。DeepSeek的大模型均为开源，在使用指南中也提及到数据蒸馏，但数据蒸馏在训练大模型中是常见的手段，关键争议在于DeepSeek是否使用了OpenAI的闭源数据。ChatGPT分为多个版本，只有GPT 2时期短暂开源，后续的 3.5/4.0等均不再开源。至截稿前，OpenAI方面未发布相关的调查结果。

DeepSeek与OpenAI大模型基准性能测试对比

第三种观点，即DeepSeek的创新实际上是思路上的改变，通过算法上的优化降低物理算力成本。此观点也获得了一些AI权威的认同。人工智能和机器学习领域的权威学者、曾任百度首席科学家的吴恩达认为，DeepSeek通过算法创新而非纯粹的算力，为AI领域带来了新的思路转变，包括专注效率而非规模的理念、降低AI应用的构建门槛等等，将对AI企业的商业决策产生深远影响。

吴恩达的观点很快得到了印证。最新消息称，“AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型，其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。

需要指出的是，S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.0 Flash Thinking Experimenta多模态模型，耗时26分钟完成训练。“不到50美元”的成本仅计算了云服务费用，不包括显卡、服务器等其他硬件费用。

李飞飞团队成功训练出成本不足 50 美元的人工智能模型，有力地打破了 DeepSeek R1 身上那层被过度神化的光环，让业界对其有了更为客观、理性的认知。

DeepSeek遭多个国家局部封禁

神秘面纱已经褪去，算力争议仍存在，随之而来的，便是以数据安全为由的各种调查以及针对性措施。据《路透社》2月6日报道称，韩国产业通商资源部一位官员表示，出于安全因素，该部门已暂时禁止员工访问DeepSeek。此前，韩国政府在4日发布通知，呼吁各个政府部门员工在工作中谨慎使用AI应用，包括ChatGPT及DeepSeek。目前，尚不明确上述部门是否同样禁用ChatGPT。

韩国并非首个在政府部门禁用DeepSeek的国家。据新加坡《联合早报》报道，2月5日，澳大利亚以“国家安全”为由，禁止在政府设备上使用DeepSeek。

据悉，澳大利亚内政部长托尼·伯克在一份声明中指出，根据澳大利亚情报机构的威胁评估，DeepSeek相关技术奖构成不可接受的风险，主要集中在用户使用DeepSeek时上传的信息可能“无法被妥善保护”、并可能会“让用户面临恶意软件的风险”。基于国家安全考量，将从政府系统中移除所有DeepSeek产品和相关服务。

不过，伯克也表示澳洲政府做出上述决定，是“基于风险评估，而非针对某个国家，旨在保护澳大利亚政府及其资产免受风险。”

美国方面，部分政府部门也在近日通过行政命令来禁止在官方设备上使用DeepSeek，包括美国国防部、国会、海军、NASA以及得克萨斯州政府。

与此同时，美国方面也在加紧制定相关政策，限制使用DeepSeek。据美媒报道，2月3日，美国国会提出新法案，寻求全面禁止包括DeepSeek在内的中国的先进AI模型，下载者将被判处20年监禁。当然，这只是一份提案，而且过于极端，即便是美媒都表示该法案不可能通过。

与上述国家不同，目前意大利实施全面封禁DeepSeek的政策。1月28日，意大利隐私监管机构 Garante要求DeepSeek提供关于个人数据使用问题的解释，包括“收集了哪些个人数据、收集来源、收集目的、基于什么法律依据，是否存储在中国等。”随后在1月30日，意大利区苹果AppStore和谷歌Play商店中的DeepSeek应用均被下架，无法下载。

作为欧盟成员国，意大利先于欧盟封禁DeepSeek是令人有些意外的。欧盟对中国跨国应用的态度一直相对温和，虽然Temu、TikTok等应用此前也被相关机构调查过，但并未采用一刀切的封禁措施。与之相对的，ChatGPT在意大利并未受到该监管组织的质疑。

在2月6日的中国外交部例行记者会上，有媒体就此事提问，外交部发言人郭嘉昆表示：“我想强调的是，中国政府高度重视并依法保护数据隐私和安全，从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法，同时中方也将坚定维护中国企业的合法权益。”

事实上，部分封禁并没有阻止DeepDeek在全球市场流行。To C市场方面，据Appfigures数据显示，DeepSeek App于1月26日首次登顶苹果App Store，并迅速攀升至140个国家及地区榜首，在发布的18天内实现1600万次下载，其中印度下载量位居榜首，达到15.6%。

To B市场，包括英伟达、亚马逊、微软等科技巨头纷纷接入DeepSeek平台，与西方国家政府的谨慎态度形成了鲜明对比。