大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
今天是OpenAI连续12天直播发布会的第1天。关于OpenAI本次的宣传“噱头”详情,可以看我这篇文章:《》。
老规矩,先上干货。
Day 1 发布内容
今天发布内容共有两个:虽迟但到的满血版o1模型和一个名为ChatGPT Pro的新套餐,重点来了,这个新套餐的定价为200美元/月,折合人民币约1452元!
备注:文章后附完整版直播视频,感兴趣的小伙伴可以按需食用。
满血版o1意味着响应速度更快,推理能力更强,尤其是代码、数学和写作任务。另一个提升是完整版的o1模型现在支持解析图片了,而在这之前的o1-preview是一个纯文本模型,不支持图片输入。
除了满血版的o1模型,今日发布的另一项更新就是ChatGPT Pro。这个新套餐能够不限量使用当前ChatGPT中的所有模型,包括o1、o1-mini和GPT-4o,以及所有的高级功能,如高级语音模式(Advanced Voice Mode)。另外,该套餐还包括o1专业版(o1 pro mode)的使用权限。
ChatGPT Pro的定价则高达200美元/月。总结:除了贵,没毛病。
关于满血版o1
为什么强调这个新发布的o1模型才是满血版本(正式版)?
1. 推理能力
首先是其推理能力。虽然之前的o1-preview推理能力已经够强了,但毕竟只是预览版本,从当时的基准测试结果看和正式版的o1还是有差距的。
本次发布的满血版o1包括两个版本:o1和o1专业版(o1 pro mode)。o1专业版在o1的基础上拥有更强的推理能力,当然也意味着更长的思考时间。
附上o1-preview、o1和o1 pro mode在竞赛数学(AIME 2024)、竞赛代码(Codeforces)和博士级科学问题(GPQA Diamond)的基准测试表现。
可以看出,在所有测试中,o1 pro mode的表现都是最优的,尽管在后两项测试中o1表现和o1 pro mode相差无几。
下面这个测试结果是三个o1模型在4/4可靠性(4/4 reliability)的严格评估结果。与传统的模型评估方法(例如只要求模型在一次尝试中答对问题即可)不同,4/4可靠性要求模型在连续四次尝试中都必须给出正确答案,才能算作成功。这种测试方法更加苛刻,用来衡量模型在回答问题时的稳定性和一致性。
在4/4可靠性测评中,o1 pro mode的性能表现被彻底显现,可以看到,在每一个基准测试里,o1 pro mode都获得了75%以上的正确率,远远超出了o1和o1-preview。
2. 多模态能力
满血版o1模型增加了对图片输入的支持,在此之前,o1-preview和o1-mini均只支持文本输入和文本输出。
需要注意的是,满血版o1也仅支持对图片的支持,而非文档。我总结了当前满血版o1支持的图片格式类型如下,共5种。
.jpeg / .jpg / .webp / .png / .gif
这5种图片格式的使用场景和特点可以总结如下。
格式 | 适用场景 | 特点 |
---|---|---|
JPEG/JPG | 照片、色彩丰富的图像 | 有损压缩,文件体积小 |
PNG | 标志、透明背景、文字清晰的图像 | 无损压缩,支持透明背景 |
WebP | 网站优化、需要小体积高质量的图像 | 现代格式,有损或无损压缩 |
GIF | 动图、简单低色彩图像 | 支持动画和透明背景 |
3. 如何使用满血版o1?
满血版o1现已向所有的ChatGPT Plus和Team付费会员开放。之前的o1-preview模型已移除。OpenAI官方表示,ChatGPT Enterprise企业和Edu教育会员将于下周起开放满血版o1的使用权限。
现在ChatGPT可选模型列表已经变成了这样。
至于大家比较关心的满血版o1的使用数量限制,虽然在本次发布会上没有明确说明,但查询o1的使用说明页面可以得知,满血版o1的使用数量和之前的o1-preview一致,仍为每周50条,o1-mini则为每天50条。
而至于当前最强的o1专业版(o1 pro mode),则只有开通ChatGPT Pro会员的用户才有权限使用。
关于ChatGPT Pro
ChatGPT会员值不值得开?
结论:如果有需求,那肯定是超值。但仅限ChatGPT Plus(尤其是个人用户)。
今天新发布的这个最新套餐ChatGPT Pro听起来当然是非常不错,但对于一般的个人用户,真的用得了这么多的o1和高级语音模式吗?大多数情况下,ChatGPT Plus的高级模型使用数量都用不到上限,更别提无限制的ChatGPT Pro了。当然,不差钱的随意开,无脑冲Pro不会错。
喂饭级使用教程看下面的文章。
-
如何注册ChatGPT:《》。 -
如何开通ChatGPT会员:《》。
附一张最新的ChatGPT各个套餐的比较截图。
Day1 完整版直播视频结语
200美元/月的套餐都有了,2000美元的套餐还会远吗?对此,你怎么看?