6月28日,人工智能领域迎来了一个振奋人心的新闻:OpenAI在27日的新闻发布会上宣布,他们成功训练出了一个名为CriticGPT的新型AI模型。这个模型的诞生,标志着影视评论领域的一个新纪元,它不仅能够撰写评论,更能精准地指出其他AI生成内容中的不足之处。
CriticGPT的使命是辅助人类AI训练师,通过一种名为“从人类反馈中强化学习”的技术,来不断优化和提升GPT-4的输出质量。这种技术的核心在于,通过持续的学习和反馈,使AI模型在回答的准确性和深度上不断进步。
随着时间的推移,ChatGPT的准确性已经达到了一个新的高度,错误变得越来越难以察觉,这无疑给AI训练师的工作带来了新的挑战。OpenAI对此表示,这是RLHF技术固有的局限性之一——当AI模型的知识水平超越了提供反馈的人类时,如何协调和优化模型的回答,成为了一个亟待解决的问题。
CriticGPT在寻找ChatGPT回答中的错误时,展现出了其独特的“洞察力”。OpenAI强调,现实世界中的错误可能分散在答案的各个部分,这需要CriticGPT在未来的工作中进行更深入的分析和处理。“目前,我们的重点是能够在一个集中的地方指出错误,但我们也清楚,未来我们需要解决那些分散在不同地方的错误。”