0
0
在微信中打开

Mistral AI最新模型Mistral Large 2,相比Llama3.1谁才是开源之王?

Mistral AI最新模型Mistral Large 2,相比Llama3.1谁才是开源之王? 302.AI
2024-07-29
528
【广告服务】

15年经验 全平台广告代投

   立即查看>>

导读:7月26日,法国AI初创公司Mistral AI发布了最新模型Mistral Large 2。与Mistral AI公司前代产品相比,Mistral Large 2 在代码生成、数学和推理方面的能力显著增强。

紧随Meta发布 Llama 3.1之后,7月26日,法国AI初创公司Mistral AI发布了最新模型Mistral Large 2。与Mistral AI公司前代产品相比,Mistral Large 2 在代码生成、数学和推理方面的能力显著增强。它还提供了更强大的多语言支持和高级函数调用功能。

Mistral Large 2 模型拥有1230亿参数,宣称性能媲美OpenAI和Meta的最新尖端模型,尤其在代码生成、数学和推理方面表现出色。Mistral AI在官方网站中还提到,Large 2 在MMLU基准测试中实现了84.0%的准确率。

Mistral Large 2基于之前Codestral 22B和Codestral Mamba的经验,进行了大量代码训练,支持Python、Java、C、C++、JavaScript和Bash等80多种语言。其代码生成能力远超Llama 3.1 70B,接近Llama 3.1 405B。

除此之外,Mistral Large 2 投入了大量精力来增强模型的推理能力,在推理能力上,特别关注减少模型产生“幻觉”,即生成看似合理但实际不准确或无关的信息。通过对模型细致的微调,使模型在响应时表现得更加谨慎和敏感,确保输出的信息既可靠又准确。

同时,Mistral Large 2 在遵循精确指令和处理长时间多轮对话方面表现尤为出色。下面展示了 MT-Bench、Wild Bench 和 Arena Hard 基准测试中的表现,Mistral Large 2 的表现仅次于GPT-4o和Claude-3.5-sonnet:

如今,很大一部分业务用例涉及处理多语言文档。 Mistral Large 2 在大量多语言数据上进行训练的。以下是 Mistral Large 2 在多语言 MMLU 基准上的性能结果,与之前的 Mistral Large、Llama 3.1 模型以及 Cohere 的 Command R+ 进行了比较。

讲了这么多,那是不是Mistral Large 2就能完胜最新的Llama3.1模型了呢?小编认为要对比过才知道,接下来小编就和大家一起对比Llama3.1和Mistral Large 2的数学推理能力,看看到底谁会更胜一筹。

首先找到302.AI的模型竞技场,勾选Mistral Large 2、Llama 3.1 70B和Llama 3.1 405B。无论是Mistral Large 2还是Llama 3.1系列,都有提到在多语言能力上有提升,第一题就先用中文提问:“9.9和9.11哪个大?”

没想到这个数学题十分有效,屡试不爽,可以看到三个模型都答错了,我们试一试将问题切换成英语再次提问:

没想到的是,两极反转,全部模型都回答正确了,看来三个模型在中文理解能力上还有提升的空间。接下来换一题目考考逻辑能力,继续是用中文提问,先来看下题目:

来看下回答:

没想到的是,居然只有Llama3.1 70B回答正确,正确答案就是甲偷吃了鱼!最后一个问题来自弱智吧:“生鱼片是死鱼片吗?”,在以上三个模型的基础上增加了GPT-4o和Claude-3.5-Sonnet两个模型,共五个模型,看下表现怎么样:

可以看到,Claude-3.5-Sonnet的回答最详细最完整的;其次是GPT-4o,基本能够解释清楚生鱼片和死鱼片之间的关系;Mistral Large 2的解释没有回答到重要的点上,只是名词解释了生鱼片和死鱼片各自的意思,而Llama3.1的表现稍微差点,只从字面上去回答。

从以上的测试内容可以看出,302.AI的模型竞技场不仅在操作界面设计上做到了简洁明了、直观易用,更重要的是其模型更新的速度十分快,用户不需要为了尝试不同的AI模型而注册多个账号,节省了用户大量的时间和精力。并且!通过302.AI模型竞技场用户可以快速、方便地在不同模型间进行直观比较,清晰地了解各个模型的优势和特点。

除了模型竞技场,302.AI的聊天机器人和API超市也更新了Mistral Large 2模型。302.AI的聊天机器人支持按需付费,且能够一键分享机器人,收到分享链接的用户无需登录注册即可使用。另外,还能手动设置单日额度及总额度,更好的帮助用户控制管理预算成本。

302.AI的API超市支持在线调试API,不同模型的API更新速度迅速,不需要电脑配置和复杂部署,即使是小白也能轻松使用。

Mistral Large 2的发布无疑为AI领域注入了新的活力,也为行业竞争格局带来了新的变数。对于目前AI领域的内卷情况来看,无论是Mistral Large 2还是Llama 3.1,都难以在这场没有终点的技术马拉松中独占鳌头,但是,正是这种激烈的竞争,推动着AI技术以惊人的速度向前发展。我们可以期待看到更多突破性的模型问世,推动整个行业向前发展。

 

文章来源:【302.AI】公众号
【声明】该内容为作者个人观点,大数跨境仅提供信息存储空间服务,不代表大数跨境观点或立场。版权归原作者所有,未经允许不得转载。如发现本站文章存在版权问题,请联系:contact@10100.com
海外广告投放

海外广告投放

大数自营,全平台投放

302.AI
分享更新更全面的AI资讯。
内容 105
粉丝 0
加入大数社群!和众多大卖交流
扫描右侧 二维码,添加微信后可免费领取跨境资料包
头图

营销推广专区

借助各大平台带来新流量,增强品牌曝光

广告图

Google广告

谷歌一级代理

广告图

Facebook营销

FB核心代理

广告图

TikTok ADS

快速开通高质量账户,支持全球投放

广告图

Bing广告开户

直连Microsoft Ads官方渠道

标签图片 推特广告标签图片 Criteo标签图片 Yandex标签图片 VK广告标签图片 拼趣
302.AI 分享更新更全面的AI资讯。
总阅读52.3k
粉丝0
内容105
加入卖家交流群
  • 平台社群
  • 城市社群
  • 品类社群
  • 推广营销社群
  • 其他跨境社群
企业会员