0
0
在微信中打开

openai-day2:o1mini 通过微调可以超于o1的效果,熟悉的运用场景和结论:gpt3.5-16k微调后超过4.0

openai-day2:o1mini 通过微调可以超于o1的效果,熟悉的运用场景和结论:gpt3.5-16k微调后超过4.0 默拉智能AI系统
2024-12-07
311
导读:企业在选择模型的时候,一定要考虑价格和性能,选择最有竞争力和性价比的方案。当然有充足预算的企业除外,选最好最贵的模型就是对的!

公司老板,CTO,CAIO,公司财务总监,公司人事部门必看!

首选说说openai几个模型代和变种的区别:

GPT3.5-4k:openai最早发布的模型,2022年11月GPT3进来来的

GPT3.5-16k:openai最早发布的模型,2022年11月GPT3进来来的

GPT4.0-8k-32k:openai的最强模型,2023-3-14发布

GPT4o:变种有GPT4o-05-13.GPT4o-08-06,看代号知道是2024年5月13和8月6号发布的模型!

o1mini:o1mini和o1 preview 是同时发布的2024-9-13

o1(完整版):2024-12-06发布

早在GPT4 发布的时候,默拉智能在运用的时候发现,通过GPT3.5-16k通过微调,效果可以超越GPT4,由于GPT4的价格持续降低,以及GPT4o的发布,用3.5做底座微调已经没有性价比了,所以慢慢全部使用GPT4o作为基础模型微调了!(最有性价比的gpt4o变种模型是GPT4o-08-06)

为什么用上一代的版本微调?核心原因是算力的价格,3.5-16k太便宜了!GPT4太贵了!微调好比一个有经验的人事经理,选择最有价值的劳动力!

用GPT3.5-16k微调成gpt4的效果,就好比你请一个高中生,通过自己的训练,可以把他训练成本科生的水平!但是你只需要支付一个高中生的工资,就可以拥有一个本科劳动力!

o1mini 通过微调可以超于o1的效果!是一样的道理。(算力的价格差距太大)

为什么要微调,核心原因是o1mini 太便宜了,o1 满血版太贵了!当然有充足预算的企业除外,选最好最贵的模型就是对的!

所以在day2时候,openai发布会,就告诉大家利用o1mini可以训练某些方面的特长,让o1mini 达到o1满血版的效果!通过后期的微调和努力,让o1mini 性能提升!

为什么人工微调可以提升模型的能力?

人工智能是真的人工-智能,人工智能训练背后离不开高质量的标准数据,这些标准数据,都是南美廉价人工通过自己的眼睛,手和脑力完成的标注工作(背后的scale ai功不可没,其公司估值也飞涨)。

不同代差的模型,使用的标注数据的人群的学历,智力和工作时间是不同的!学历越高,标注时间越长的模型,性能肯定更强!

那么微调,其实就是通过使用者自己的标注数据训练,让原来60分的模型,在某些领域达到80分的水平。记住是使用者微调的某些领域达到80分,不是说整个模型跨越一个代差,全部达到80分!

为什么现在没人用gpt3.5做底座微调了?

因为gpt4o很便宜了,没有必要使用gpt3.5费时费力的去微调了。核心原因是4o微调更有性价比了!

为什么o1mini 微调正是时候?当然是因为价格呀,当一个硕士生通过微调可以达到一个博士生的效果,人事部门当然是选一个硕士生录取,而不是请一个博士生呀!openai-day2:o1mini 通过微调可以超于o1的效果,熟悉的运用场景和结论:gpt3.5-16k微调后超过4.0

day2原文:

John: 不可思议。谢谢你,Justin。现在我们将展示强化学习微调的工作原理,并且不抢任何人的风头,我们将通过 o1-mini 使其在该任务中超越 o1 的表现。这是我们昨天刚发布的 o1,之所以重要,是因为 o1-mini 是一个更小、更快、更便宜的模型。

Julie: 是的,借助 Justin 的数据集,我们将展示如何大大提升性能。o1-mini 在这个任务上的表现,当给出一份症状清单时,你将尝试预测哪个基因可能导致遗传疾病。

结论:企业在选择模型的时候,一定要考虑价格和性能,选择最有竞争力和性价比的方案。当然有充足预算的企业除外,选最好最贵的模型就是对的!

文章来源:【默拉智能】公众号
【声明】该内容为作者个人观点,大数跨境仅提供信息存储空间服务,不代表大数跨境观点或立场。版权归原作者所有,未经允许不得转载。如发现本站文章存在版权问题,请联系:contact@10100.com
默拉智能AI系统
默拉智能基于GPT4.0+midjourney+suno+pika runwayAI视频开发出来的AI-CMS系统!让你轻松驾驭最新Al。我们希望用AIGC助力整个行业,把人力资源从重复的劳动中解放出来,解放脑力,代替人类思考,让人类去做有更高附加值的创作,为企业真正的降本增效。
内容 88
粉丝 0
主页
关注
加入大数社群!和众多大卖交流
扫描右侧 二维码,添加微信后可免费领取跨境资料包
默拉智能AI系统 默拉智能基于GPT4.0+midjourney+suno+pika runwayAI视频开发出来的AI-CMS系统!让你轻松驾驭最新Al。我们希望用AIGC助力整个行业,把人力资源从重复的劳动中解放出来,解放脑力,代替人类思考,让人类去做有更高附加值的创作,为企业真正的降本增效。
总阅读267.4k
粉丝0
内容88
主页
关注
活动推荐 查看更多
加入卖家交流群
文章目录
为什么人工微调可以提升模型的能力?
企业会员