12月15日,OpenAI“超级对齐”团队发布了成立以来的首篇论文,开辟了对超级模型进行实证对齐的新研究方向。OpenAI认为,比人类聪明得多的人工智能(超级智能)可以在未来十年之内发展出来,然而如何正确的引导和控制超人的人工智能系统仍然没有得到很好的解决,解决AI的可控问题对于如何确保最先进的人工智能系统始终安全并造福人类至关重要。在最新的研究中,OpenAI实现了从弱模型监督强模型的任务,OpenAI使用GPT-2模型来激发GPT-4的大部分能力,使其达到接近GPT-3.5级别的性能。实现了“弱到强泛化”(Weak-to-stronggeneralization),即让小模型监督大模型,为“超级对齐”提供了切实可行的技术路线。预期OpenAI将在“超级对齐”研究中取得持续突破。来源:界面