AI大模型引发的三场革命
-
人机交互革命。从物理设备、软件编程、图形界面交互到今天的自然语言对话交互。
-
认知协作革命。什么叫认知协作革命?就是从问题到答案的最短路径实现了新的突破。
-
计算范式革命。即“以CPU为核心的计算体系”向“以GPU为核心的计算体系”的切换,这种切换首先从云计算、服务器开始,并逐步拓展到普通人使用的手机、电脑等等。未来计算的芯片、架构、存储、网络、通信、调度等,以及与之相关的协议和软件开发范式,都会迎来一次巨大的变革。
AI大模型正在驱动一切智能硬件,包括手机、PC、家电、汽车、眼镜、机器人、工程机械等。
假设今天我们在一个教室里,这个教室里安装了两、三个摄像头,会议结束后,我可以问一下摄像头:今天在座的各位谁听讲最认真?它会告诉我;谁老在看手机呢?它也会告诉我。
假设你家里面有5个房间,你养了3只猫,此时此刻你可以看看猫在干什么,你可以问它,它可以告诉你,也可以给你一张图片。
而这些并不是短时间内就可以实现的。
AI大模型正在重构一切软件系统。手机软件正在被AI大模型改造,钉钉有几十个、几百个功能组件;PC的Windows 、Office、Photoshop等已经被AI大模型改造;ERP、CRM、MES乃至于PLC的编码方式也正在被AI大模型改造。
GPT时刻重构核心竞争力
换而言之,今天新的技术对于企业最重要的价值在于会重新定义其产品、服务、解决方案的竞争力。在此,我提出三个非常重要的判断:
判断1:AI大模型是数字技术体系的竞争
如果说ChatGPT是美国数字创新森林里的一棵树上的一片叶子,那么Sora是另外一片叶子。
-
AI基础理论模型的突破。2017年谷歌发布了Transformer模型,成为这一轮大模型突破发展的基础。
-
“AI+GPU”算力新Wintel体系的崛起。“AI教父”Geoffrey Hinton的学生在2012年的ImageNet大规模视觉识别挑战赛(ILSVRC)上获得了冠军,重要的是他将模型的训练从CPU切换到了GPU,大幅提高模型训练效率的同时,降低了训练成本,引发了新的深度学习革命,此后GPU成为学术界、产业界训练AI模型的“标配”。
-
云计算大规模地推广和普及。大模型需要大算力,大算力需要新技术和低成本,云计算为大模型的训练创造了条件。云计算的发展为这些大模型大规模大算力创造了条件。
-
过去近20年互联网的发展为今天AI在数据、工具、人才、场景等方面奠定了基础。
-
美国开源社区的发展重构了AI商业化模式。因为开源开放生态很大程度上还决定了今天AI大模型的推广速度、广度和深度,也将深度影响今天AI大模型的商业模式。
7年前,我曾经去过全球最大的农业和工程机械公司约翰迪尔,它的总部位于一片玉米地后面的原始森林里,令人印象非常深刻。当时,约翰迪尔就在跟我们讲述如何将AI应用到农业生产中,并以“See and Spray”喷雾系统为例,解析了目标识别摄像头指导喷洒除草剂的概念:即在喷洒除草剂前,你首先要分清楚什么是草,什么是苗。
美国在7、8年前就已经出现了行业垂直大模型的应用,并且遥遥领先。今天,我们要思考的一个问题,就是行业垂直大模型,无论是在工程机械行业,还是在矿山行业的应用模型,它是一个8年前的模型,还是今天的基于AI的大模型,这是两个完全不同的物种。
关于AI大模型:有人说,AI大模型只会对话、生成文字图片,不能服务实体经济;有人说,只有行业垂直模型才有价值和意义;还有人说,中国在AI大模型领域与美国差距较大,但中国在垂直行业领域已经超过美国。
这些都是错误的,没有AI基础(通用)大模型支撑的行业垂直应用AI模型,要么是浑水摸鱼,要么是混淆视听。
今天,我们一定要重视通用人工智能,通用人工智能才是关键。这个关键是什么?好比人形机器人,不是因为它长得像人,而是因为它的大脑、它的智力水平更像人,才被称之为人形机器人。而决定其智力水平的一定是通用人工智能,之前的人工智能是没有意义的。
判断3:中国AI大模型面临“加拉帕戈斯隐忧”
中国AI大模型面临的最大挑战是“加拉帕戈斯隐忧”。何谓“加拉帕戈斯隐忧”?加拉帕戈斯是太平洋上的一个群岛,达尔文在一百多年前写的《物种起源》中提到,这个岛上有很多物种,每个物种都在这个封闭的环境中自我进化、自我迭代、自我演进,但它们一旦离开了这座岛,就会因为无法适应环境而死掉。
我们今天也经常在讲,产业在一个封闭的、碎片化的环境中形成的时候是没有竞争力的。企业所需要的是如何从项目公司进化到产品公司、从产品公司进化到平台公司的核心竞争力。无论是做AI大模型,还是做SaaS,还是做工业互联网,都需要理解一个基本问题,即公司是属于项目公司、产品公司还是平台公司。只有对此有一个清晰的定位,你才能真正理解什么叫做新质生产力,什么叫做先进的商业模式和技术解决方案。
AI大模型的典型应用场景
目前,AI大模型的商业化发展到了什么阶段?结论是AI大模型距离大规模商业化拐点的到来还需要一段时间。
如何判断AI大模型商业拐点、技术拐点的到来有两个标志:
1 . AI大模型的能力需要提高两个数量级;
2 . AI大模型的算力成本需要降低两个数量级。
当这两个条件同时满足时,才有可能真正地出现AI大模型的原生应用。
对于ToB/G场景而言,面临着碎片化场景微调需求以及更加稀缺的算法专家资源等挑战。
谈几个与AI大模型应用有关的例子:
01. 视频影视行业
2024年3月6日,时长达90分钟的电影《终结者2:审判日》上映,这是一部由50位AI电影艺术家利用Midjourney、Runway等多个AIGC工具创作而成;还有由Stable Diffusion、Topaz Photo AI等文生图及视频工具制作而成的AI版《沙丘2》,人们通过AI制作方式参与得更多。
大家有一个错觉,好像Sora只能生成一些图片、视频。对此,王坚院士关于Sora的经典言论对我非常有启发,他表示:“如果谈到Sora,只说它可能会影响短视频等行业,那我觉得是对它极大的羞辱,它的意义远超这种事情。”
因为从Sora的发布会中可以了解到,它未来的目标是“世界模型”,意为“在比特世界中还原原子运行轨道,用数字化的方式模拟物理世界的运行规律。”目前,Sora距离“世界模型”的目标还有很长的路要走,但它在这条道路上已经迈出了重要的步伐,这是其核心价值所在,它的意义远超过生成视频。
02. 软件行业
去年4月份ChatGPT-4发布的时候,机构研究表明,ChatGPT-4的软件编程能力,在中国相当于月薪3万元的软件工程师的水平,在美国相当于年薪18万美元的谷歌L3级软件工程师的水平。
前段时间,我看到美国的互联网上在讨论一件事情:某企业要招聘一个工程师来创建最小可行性产品(MVP),有两个人去面试,一个有4年编程经验,一个有19年编程经验。但是4年编程经验的工程师,他利用ChatGPT-4、Copilot、Bubble等工具,他的工作效率相当于19年编程经验工程师的5倍,而他的工作成本仅相当于19年编程经验工程师的1/20。
大家可能没有感觉,我前段时间去到了一家央企,了解到它每年软件外包的预算高达6亿元。2024年,这家央企要求将6亿元的预算压缩到3亿元。为什么要压缩预算呢?因为今天有了一个新的工具,ChatGPT-4或者说阿里的通义灵码,可以帮助公司去编写软件、生成代码,软件的开发效率会提高、开发成本会降低,就可以帮助公司将6亿元的预算压缩到3亿元。
03 . 芯片行业
2024年2月23日,英伟达市值涨了2770亿美元;英伟达的市值从1万亿美元到2万亿美元只用了9个月时间,这创造了华尔街历史上的两项记录。英伟达有一天的成交量突破1000亿美元,这是什么概念?一家公司一只股票一天的成交量几乎相当于整个A股市场5000家公司一天的成交量。
这主要归功于计算范式的变革,从CPU (通用计算芯片)到GPU/xPU(半专用计算芯片),再到ASIC(专用计算芯片),计算效率越来越高。我们可能没有去关注芯片,大家可以体会一下通用芯片与专用芯片的区别。
-
什么叫CPU?它好比一辆皮卡,既可以拉货,也可以拉人; -
什么叫GPU?它好比一辆小轿车,可以拉人,既可以走高速公路,也可以走农村一级公路; -
什么叫专用计算芯片?大家可能有注意到一个成立时间不长的AI芯片初创公司Groq,它开发出了一种新的 AI 专用计算芯片——LPU(Language Processing Unit),其推理速度相较于英伟达GPU 提高了7-8倍,成本却不到其十分之一。
所以,计算范式也正在发生变革。
04 . 无人驾驶行业
特斯拉的自动驾驶FSD V11版本有30万行代码,其技术路线是基于“海量标注+规则代码”,即将“红灯停绿灯行”等图像标注转化为规则代码给到自动驾驶系统。而FSD V12版本只有2000+行代码,其技术路线是基于“海量数据+BEV+Transformer”,即无需再将“红灯停绿灯行”给到自动驾驶系统,它可以通过图片、视频自行学习。
2023年9月2日,1200万人围观马斯克特斯拉自动驾驶,他试驾后讲的最重要的一句话是,“没有一行代码,让特斯拉在停车标志处停车”。AI大模型带来了自动驾驶研发模式的跃升:从规则代码输出的驾驶决策,到基于AI大模型生成的驾驶决策。
05 . 机器人行业
2023年7月28日,谷歌Deep Mind推出了一款新的机器人模型Robotics Transformer 2(RT-2),这是一个全新的视觉-语言-动作(VLA)模型。例如,对AI机器人说“捡起已灭绝的动物”,机械臂会在一堆塑料玩具中精准的选择恐龙,“灭绝的动物”很多,在此之前,机器人无法做到把“灭绝的动物”和“塑料恐龙玩具”联系在一起。
近期,很多人也关注到了OpenAI在今年2月投资了一家机器人公司Figure AI,获得投资的13天后,Figure AI公司就推出了OpenAI大模型加持的机器人产品——Figure 01,它基本可以完全理解人类的自然语言指令和意图并执行相应动作。通过Figure 公司公布的视频,我们能看到Figure 01已经具备很好的理解能力(什么是可以吃的东西)、分析能力(在桌子上找到可以被人类吃的东西)、规划调度能力(苹果和碟子的抓取手指动作的不同)和执行能力(将苹果拿给人类)。更重要的是,Figure 01模型的开发只用了12天。
机器人产业的核心竞争力正在被重构。浙江有一家机器人公司叫有鹿机器人,它的路面清洁机器人集成了通义千问开源模型,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,完成用户交办的任务。比如,物业经理说“一号楼门前有个可乐瓶,你过来扫一扫”,机器人就能找到这个位置、完成清扫任务。
可以看出,未来机器人产业的核心竞争力在于是否植入AI大模型。比如码垛机器人,过去工程师现场调试可能需要一周时间,而现在植入AI大模型后操作人员可能只需要几分钟的时间,打开知识库文件,通过语音/文字输入需求参数,一键下发指令后码垛机器人就可以开始执行任务。
06 . 智能终端行业
在今年1月的美国拉斯维加斯消费电子展上(CES)上,最重要的一个概念就是AI。尽管是消费电子展,但是可以看到PC、手机、汽车、家电、可穿戴设备等都在不断被AI化。
昨天在跟智库机构交流的时候,我说今天要思考一个问题,什么叫做AI大模型驱动的竞争力敏感行业?我们需要定义AI大模型竞争力的敏感行业:哪些产品和企业的竞争力在短期内会被AI大模型重构?哪些是长期?哪些永远不会被重构?
中国的手机、PC、汽车出货量的全球占比很高,而很多企业都在开发自己的AI大模型。在此,我有几个非常重要的判断:
判断4:模型上机并与云端协同,将成为智能终端大模型商业化的重要形态,AI开源大模型的重要性进一步凸显。
最近,联发科(MediaTek)携手阿里云已成功在天玑9300等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配,大模型在手机芯片上的探索从验证走向商业化落地。
07 . 科学行业
今天,AI已经成为芯片设计的“器”,AI与EDA的双向奔赴,推动着芯片设计开启下一场革命。英伟达用AI设计GPU,比传统EDA减少25%芯片面积,功耗更低。英伟达研究人员提出了PrefixRL——用深度强化学习优化并行前缀电路。英伟达Hopper架构H100就拥有13000个AI设计电路。EDA设计公司Synopsys和Cadence等公司积极拥抱AI设计。
2022年底,Deep Mind通过Alpha Fold2模型,预测了2.2亿种蛋白质结构,几乎覆盖DNA数据库中所有已知生物体的蛋白质,解决了长期困扰生物医学研究领域的难题,为加速生物医学研究打开了大门。生物医药公司通常会聘请博士处理专利分析的工作,但我们发现AI大模型工作10分钟相当于2个博士1周时间的专利分析成果。
斯坦福大学报告中指出:算力已成为科研的大型装置。2022年,美国科技公司创造了32个重要的机器学习模型,而学术界只产生了3个,这与2014年形成了明显的反转,当时大部分AI突破都来自高校;近70%拥有AI博士学位的人才最终进入私营公司就业,而20年前这个比例只有21%。今天在AI大模型的理论创新方面,美国的企业也已成为了主力军。
以上就是未来AI大模型可能给产业带来的影响。