2023年05月22日,多模态大模型研发开发商智子引擎完成了1000万元人民币天使轮融资。智子引擎CEO高一钊是人大博士生,师从卢志武,导师卢志武在“智子引擎”公司中担任顾问。此外,卢志武同时兼任软通动力首席AI科学家。
卢志武和高一钊从事多模态大模型始于2020年。在ChatGPT火起来之前,北京智源人工智能研究院曾率先开拓中国大模型研究,名为“悟道”,当时聚集了四支主要力量,分别由清华唐杰、清华刘知远、清华黄民烈与人大文继荣领头。人大文继荣主要带领人大高瓴人工智能学院的科学家们开拓多模态大模型方向,名为“文澜”,卢志武便在团队中担任模型主力军,他的学生高一钊也参与进来,完成了核心的研究工作。“悟道”之后,唐杰、刘知远与黄民烈均基于大模型技术成立了公司,而人大的入局,为智源大模型“四大金刚”的创业阵容拉开了完满的序幕。——卢志武团队也是国内最早研究多模态大模型、并取得杰出技术成果的团队。
智子引擎是一家多模态大模型研究和开发商,发布了第一款应用级多模态ChatGPT产品“元乘象 ChatImg”。“元乘象ChatImg”的参数量在百亿级别,主要使用了图文对数据和VQA数据作为训练集,同时进行图文匹配、图文检索、图像描述生成、文本描述生成等多种任务的训练。根据用户输入的图片或文字,“元乘象ChatImg”可以进行智能聊天、讲故事、写广告等。
2021年6月,卢志武所在的文澜团队又发布了“文澜 2.0”(BriVL-2)。
基于视觉-语言弱相关的假设,研究团队提出图文弱相关假设,设计了高效的跨模态对比学习策略,同时提出了基于DeepSpeed的分布式多模态训练框架,从而提高模型的表达能力和泛化能力。
基于6.5亿弱相关的图文数据集的预训练,文澜2.0拥有的模型容量达到50亿参数,是目前最大的中文通用图文预训练模型,可覆盖多个领域和场景,在多个图文检索和生成任务上都取得了优异的性能,比如图像检索、图像描述、视觉问答等。
期间,高一钊也深度参与了文澜1.0和2.0的图文预训练工作,主要负责数据处理、模型训练和评估等。
在ChatGPT的热浪下,卢志武和高一钊看到了多模态研究在大模型时代的新机遇,成立多模态大模型公司“智子引擎”。借鉴以往参与文澜模型研发的经验,“智子引擎”团队于今年的3月8日正式推出了自主研发的多模态对话大模型,并发布了第一款应用级多模态ChatGPT产品“元乘象ChatImg”。
“元乘象 ChatImg”的参数量在百亿级别,主要使用了图文对数据和 VQA 数据作为训练集,同时进行图文匹配、图文检索、图像描述生成、文本描述生成等多种任务的训练。
智子引擎团队表示,他们的核心发展战略是打造一个通用的多模态AI生成模型—元乘象,支持多模态输入、多模态输出。ChatImg只是其中一部分对话模型,团队成员已经在文生图、文生视频、多模态融合搜索等多个领域取得成果,后期将全部整合进元乘象。
智子引擎融资情况如下:

多模态大模型作为最前沿的AI技术,有着广泛的应用前景。如何将多模态大模型与产业相结合、与具体应用场景相结合,成为多方关注的重要课题。智子引擎团队在多模态大模型领域深耕多年,他们的技术始终站在世界前列。今天,智子引擎发布元乘象ChatImg2.0,同时联合软通动力、软通智慧、福建AI计算中心等多家企业共同迈出多模态AI大模型产业落地的第一步。
文章来源:【非凡产研】公众号
【声明】该内容为作者个人观点,大数跨境仅提供信息存储空间服务,不代表大数跨境观点或立场。版权归原作者所有,未经允许不得转载。如发现本站文章存在版权问题,请联系:
contact@10100.com