从三张图,看到大模型的演变:
3.5模型的运用:大家一直提的提示词和rag,是整个模型运用的核心组件!
2023年 GPT 3.5时代,要用好大模型,对于提示词,rag的知识库嵌入的依赖,达到了40%-60%
2024年 GPT 4.0,随着4.0不断降价,4.0成为主流模型,对于rag层的依赖不断减少,只需要少量的提示词和少量的rag,就可以达到很好的效果!
可以预见的趋势,大模型像一个黑洞,正在吞噬一切数据。
GPT5.0,LLM as service,模型即服务就可以实现!大模型正在以年为单位迭代!
LLM未来应用的思考:
是不是有了更强的模型5.0,其他模型(3.5,4.0)和架构(rag agents架构)就没有价值了?答案显然不是的。
原因如下:
-
更强的模型意味着更贵的价格,模型价格永远是决定因素,如果4.0 token不降到刚开始发布的四分之一甚至五分之一的价格,4.0的大规模普及也不会出现!
-
3.5+rag的架构,在很多场景,依然有效,GPT3.5+rag依然是价格便宜,效果稳定的有效!就好比有了高铁,动车和快车,甚至绿皮火车依然存在!
-
不是模型越先进,越好。不是每个企业都需要研究生和博士生,企业要选好模型,选好架构,做出最适合自己的方案选择!
-
未来LLM as service,模型即服务一定会实现,大家使用大模型会原来越容易。
-
agents是增加了工作流编排的rag