2024年10月17日,非凡资本联合诸多合作伙伴在北京举行了“AIGC应用发展高峰论坛暨AIGC100年度评选”,此次盛会吸引了超过50位AI领域的演讲嘉宾和近千名AI相关从业者参与。
通过主题演讲、圆桌论坛、实践工作坊、互动展览、播客马拉松和晚宴派对等丰富多彩的活动形式,非凡资本为参与者打造了一个全面而深入的AI行业交流盛会。
峰会现场,DeepWisdom创始人兼CEO吴承霖带来了《多智能体引领代码生成的革新探索》的主题分享,为听众描绘了一个由多智能体技术驱动的软件开发新时代的蓝图。
推荐阅读:MetaGPT:Agent as a Service时代,赋能个体独特智能,引领自然语言编程革新
以下是他的演讲精华:
大模型和智能体让自然语言编程得到普及
无论是新一代的大模型,还是传统的NLP等AI技术产品,本质都是一种软件形式。从这个视角,我们会发现,软件开发市场正面临着许多困难。以下是全球软件开发的四大痛点:
1、编程难
编程语言的多样性和学习成本确实是初级开发者面临的主要挑战之一。开发者需要掌握多种编程语言,如Java、Python、C++等,每种语言都有其学习曲线和应用场景。同时,他们还要深入理解数据结构、算法等计算机科学的核心概念,以及在处理大数据时所需的分布式系统和数据库优化技术。
2、周期长
软件开发流程包括需求分析、设计、编码和测试,每个阶段都至关重要且耗时。需求分析阶段需与客户深入沟通,确保准确把握需求。设计阶段则制定详细的技术文档。编码阶段根据设计文档进行编程,是核心构建部分。最后,测试阶段确保软件质量和稳定性。整个过程需要大量时间和精力投入。
3、雇佣贵
全球程序员人数已经超过 2700 万人,根据最新数据表明,2024年全球人数预计达到2800 万人,总雇佣成本超过2.79 万亿美金(全球平均雇佣成本支出超过 $9.9万/人年)
4、门槛高
IT服务外包行业门槛较高,全球市场价值高达525亿美元,外包服务部分贡献尤为突出,达到665亿美元。而GitHub Copilot通过智能代码生成和自动化常规编程任务,显著降低了编程相关成本,最高可降低90%。
但是,随着大模型和智能体的普及,自然语言方案让曾经高门槛的编程开发也逐渐变得“平民化”。自然语言编程方案开始受到市场关注,多个相关产品获得显著融资和高估值。例如,由GitHub 前首席技术官创立的Poolside上个月获得由eBay (via eBay Ventures) 、Nvidia等知名企业投资的5亿美元种子轮融资,估值高达30亿美元。
此外,GitHub Copilot的用户也增长非常迅速,2023年10月付费订阅用户数达到100万,预计2024年收入将达到20亿美元,其中Copilot贡献超过40%的收入增长,显示了自然语言编程方案在提高开发效率和降低成本方面的潜力。
基于多智能体技术提升大模型效果
在深入研究多智能体技术如何提升大型语言模型(LLM)的效果之前,首先需要明确智能体的定义。传统观念中,智能体被定义为能够观察并影响周围环境的实体。然而,这一定义在现代技术发展的背景下显得不够全面,因为智能体的能力已经超越了基本的观察和作用能力,它们被期望在各个方面超越人类,例如自动驾驶汽车就不应重复人类的错误。
我们可以将其与人类大脑进行类比,大型模型类似于人类的认知能力,LLM提供了对世界的基本理解,包括语言、图像和声音的识别。但认知并不仅限于表征,LLM也无法通过训练获得数学推理能力。因此,智能体需要补充LLM未能覆盖的多个方面,尤其是完整的思考、决策、计划和记忆功能,并在特定环境中进行训练。
智能体可以被定义为LLM加上观察、思考、行动和记忆的能力。而多智能体系统则进一步包括智能体、环境、标准操作程序(SOP)、评审、路由、订阅和经济机制等多个要素。这种系统的设计旨在模拟和增强智能体在复杂环境中的交互和决策能力。
MetaGPT 是 DeepWisdom在 2023 年 6 月开源的全球首个由多智能体支持的自然语言编程框架,一经开源就受到大量关注,火爆全网。截止今年9月份,MetaGPT 在 GitHub 已经收获了 40K star,也多次获得 GitHub Trending 的第一名。此外,MetaGPT的Data Interpreter功能因其交互式代码生成能力而受到全网关注,甚至获得了机器学习领域著名专家Andrew Ng(吴恩达)的关注。
作为首家多智能体软件公司,MetaGPT通过自动化生成文档,能帮助开发者快速掌握并深化领域知识,优化需求分析、设计和代码编写等软件开发流程。在实际应用中,MetaGPT通过Python游戏生成、CRUD代码生成及简单数据分析任务的综合实验,表现出色,平均得分达到3.9,明显优于其他自动化工具。
MetaGPT之所以能吸引关注,源于其结合大语言模型与人类社会最佳实践,推动软件开发的自动化。现有的大语言模型在处理复杂任务时,如软件生成开发和项目级别的代码生成,常面临“幻觉”问题,即无法准确将自然语言转换为高质量的代码,并解决动态变化的问题。
而MetaGPT通过引入标准化操作程序(SOPs)和元编程,将软件开发流程中的角色智能体(如产品经理、架构师、项目经理、开发和测试工程师)结合到模型中,实现结构化协作。产品经理将模糊的需求转化为详细的结构化信息,架构师根据这些信息生成任务列表、API设计和技术架构,
最后,工程师利用这些设计文档生成有效代码,从而提升代码生成的准确性和效率。通过这种方式,MetaGPT推动了大语言模型在复杂任务中的应用,解决了自然语言到代码的对齐问题。
MetaGPT代表性案例
MetaGPT 是一个支持多智能体协作的框架,可应用于各种仿真场景。我们基于该框架创建了一个虚拟小镇,探索不同角色互动的技术潜力。此外,学术界也在研究大型语言模型如何驱动智能体在游戏中的决策与互动表现。为此,我们构建了一个狼人杀智能体团队,通过 6 到 8 个智能体的互动,验证了 MetaGPT 在策略决策中的应用能力。
智能体这一概念最早出现在强化学习中,并在游戏仿真中得到了进一步发展。例如,在 Minecraft 游戏中的“挖钻石”任务,智能体不仅需要自动升级工具,还要根据环境变化调整策略。这类研究展示了智能体在复杂任务中的潜力,并为多智能体协作提供了宝贵的经验。