今天创建一个gpts,鸡娃专家-灿老师,上面是midjourney生成的头像!
1.训练素材搜集和整理:
训练的素材是7个关于灿老师鸡娃的经验教程的文档,每个文档3100+字,总字数24000+字。
文档结构比较乱,都是word文字。 第一步:内容制作(制作成execl的知识库导入gpt)
我们采用默拉智能助手的批量任务,把7份文档,2.4w字先做一次总结归纳,
这样的好处是可以减少训练的数据,减低训练成本,坏处是会丢掉一些案例或者一些语气词!
批量任务的提示词:请把下面几个文档的内容缩写成800字以内,不要改变原文的语气和中心思想!
7个文档,2.4w字按照要求,变成了6000字左右!
2.知识库导入大模型
批量处理后的文档,导入到私有化知识库的excel文档,下一步导入到私有化知识库!
ps:知识库导入是可以修复鲁迅和周树人的问题,所以通过鲁迅和周树人来判断3.5还是4.0 是非常不靠谱的,那么如何判断和区分3.5模型和4.0模型呢,可以关注我们之前文章:“企业应该如何选择AI,让AI提高企业的效率,CAIO必修课!”
3.创建模拟角色(GPTs)
最后一步,创建一个模型,然后输入角色定义-鸡娃专家灿老师,示例问题,链接到私有知识库,这样一个gpts就创建完成了。
理论上,一个gpts可以链接多个知识库,只要结构化的知识库,都可以通过这种方式去实现组合和训练!
零代码完成了一个小应用,只需要自然语言即可!
默拉智能的私有知识库推荐使用GPT 3.5(text-embedding-ada-002)前端用户驱动这个gpts可以选择gpt 3.5-16k,也可以选择gpt-4-1106-preview,其他模型,文心一言4.0也可以驱动这个gpts,但是效果可能没那么好!
如果觉得语气跟模拟对象不是很像,还可以通过模拟前置提示词进行微调! 作为提示词工程师,在做提示词的时候注意标点符号的作用。逗号,句号,引号,冒号,问号等等,标点符号用的好,可以让大模型输出更准确。
一句话概括就是:用标点符号把内容结构化!
最后一步,把这个gpts分享给你的用户,用户注册和充值默拉平台,你就可以获得推广佣金了。要想获得佣金,请分享前加入我们的分销商,在默拉智能助手-我的-分销商,只有分销商分享我们的小程序才能获取佣金(20-30%)!分销中心有专属的分享二维码!
最后把今天案例“鸡娃专家灿老师”的链接分享出来:https://ai.mygptlife.com/web/#/cosplay?id=732 (微信扫码登录和手机注册登录,支持国际手机验证码)