Snowflake和Databricks一直是数据库领域关注度非常高的两家公司,虽然同在一个地盘,但各有特色,竞争一直没有摆到台面上。而这一次的生成式AI浪潮,两家公司非常积极的通过收购布局,Snowflake完成了对Neeva(企业级AI搜索引擎)的收购,Databricks 13亿美金收购MosaicML(ML模型部署),并低调宣布对OmniML(模型压缩)的收购。两家一改一直以来表面和睦、暗里较劲的态势,选择同一天举办公司最重要的年会,亮明自家的生成式AI布局,野心藏不住了。Snowflake 2020年上市,目前市值579.2亿美金(2023.8.1),Databricks还未上市,根据上一轮融资,其估值已达到380亿美金。在生成式AI的加持下,Databricks的估值/未来上市市值能否追上Snowflake?Snowflake又能否更上一层楼?作为投资了Snowflake的基金Madrona的合伙人Vivek和投资人Sabrina分享了他们对两家公司在生成式AI领域扳手腕的看法,以下,Enjoy。上周对数据和人工智能领域从业者来说是重要的一周,两个最重要的参与者——Databricks和Snowflake——分别在旧金山和拉斯维加斯举办了他们的年度会议(Databricks的Data and AI Summit和Snowflake的Summit)。这两个巨头决定在同一周举办他们的重要活动,这大概率不是巧合。在过去十年中,Snowflake和Databricks一直是朋友也是对手,但这一周明显表明,它们现在是彼此的主要竞争对手,而新的战场就是人工智能。毫不奇怪的是,两个会议上的讨论和宣布大部分都围绕生成式人工智能。所传达的重要信息是,为了建立生成式人工智能战略,每家公司都必须从数据战略开始。不出所料,Databricks和Snowflake都为自己为什么可以在这一旅程中为客户提供最佳支持进行了论证。两家公司从价值链的不同部分开始,曾经甚至是战略合作伙伴关系,为何在这个人工智能的新时代演变为如此激烈的竞争对手呢?
Databricks成立于2013年,仅比Snowflake晚一年。与Benoit和Theirry是行业从业者不同,Databricks是由一群与学术界和开源社区有着深厚渊源的人士创立的。包括现任CEO Ali Ghodsi在内的七位创始人是UC Berkeley的AMPLab研究员,他们构思了Apache Spark,这是一个用于大规模数据处理的开源统一分析引擎。Spark已经发展成为最大且最常用的数据处理框架之一,在大规模数据工程、数据科学和机器学习方面起着重要作用。Databricks最初的目标是商业化Spark,推出了企业级的Spark版本,提供了大型组织所需的所有功能(治理、支持、托管等)。Databricks随后发展成为创新的“Lakehouse平台”,统一了数据、分析和人工智能。统一的Lakehouse概念将“集成、存储、处理、治理、共享、分析和人工智能”融合在一个平台上。在过去的十年中,Databricks已成为全球估值最高的私人公司之一,2021年估值达到380亿美元,并于近期实现了10亿美元的收入里程碑。他们为成千上万的企业客户和开源用户提供服务,并被视为最受瞩目的IPO之一。在所有这些增长中,他们越来越将自己定位为人工智能领域的领导者,并最近进行了重要的收购和产品发布,包括以13亿美元收购MosaicML(下文将更详细介绍),并开源了Dolly,这是一种以低于30美元的成本训练的指令调优LLM。