来自加利福尼亚大学圣迭戈分校(UCSD)的认知科学家本杰明·伯根(Benjamin Bergen)和卡梅隆·琼斯(Cameron Jones)的最新研究结果表明,GPT-4已经通过了图灵测试。
在实验中,500名人类被邀请与四种AI语言模型进行5分钟的对话,其中包括GPT-4、GPT-3.5、ELIZA以及一个人类作为对照组。参与者需要在对话结束后判断对话对象是人还是机器。实验结果显示,GPT-4在54%的时间里被误认为是人类,这一比例超过了GPT-3.5的50%。
与此同时,ELIZA(一个预先编程了响应的系统,没有大型语言模型或神经网络架构)仅在22%的时间里被误认为是人类。
人类参与者的平均识别准确率为67%。
图灵测试是用来判断机器是否具有模拟人类思维能力的测试。对于通过图灵测试的机器来说,它必须能够与某人交谈并愚弄他们,让他们认为自己是人类。
GPT-4的表现表明,它已经达到了相当高的智能水平,能够在一定程度上模拟人类的思维和对话方式。
根据UCSD研究团队的实验结果,GPT-4已经通过了图灵测试,这是首次有系统在“交互式”双人图灵测试中,被实证通过测试。这一结果不仅证明了GPT-4的智能水平,也为人工智能领域的发展带来了新的可能性。