打开三级黄色片该论文介绍,心智理论对人类社交互动十分重要,是人类沟通交流和产生共鸣的关键。之前的研究表明,大语言模型这类人工智能可以解决复杂的认知任务,如多选决策。不过,人们一直不清楚大语言模型在被认为是人类独有能力的心智理论任务中的表现是否也能比肩人类。
在本项研究中,论文第一作者和共同通讯作者、德国汉堡-埃彭多夫大学医学中心 James W. A. Strachan与同事及合作者一起,选择能测试心理理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼。他们随后比较了1907人与两个热门大语言模型家族(GPT和LLaMA2模型)完成任务的能力。他们发现,GPT模型在识别间接要求、错误想法和误导的表现能达到有时甚至超越人类平均水平,而LLaMA2的表现逊于人类水平;在识别失礼方面,LLaMA2强于人类但GPT表现不佳。
论文作者提醒说,人工智能大语言模型在心智理论任务上的表现堪比人类不等于它们具有人类般的能力,也不意味着它们能掌握心智理论。
论文作者指出,LLaMA2的成功被证明是因为回答的偏见程度较低而不是因为真的对失礼敏感,而GPT看起来的失利其实是因为对坚持结论的超保守态度而不是因为推理错误。
网友评论更多
92 安顺b
欧盟拟加征反补贴税 多家车企发声反对💽💾
2025-06-19 07:23:38 推荐
187****9765 回复 184****2709 :部分养老FOF“扛不住了” “长不大”怪圈如何破解💿 来自毕节
187****8546 回复 184****6738 :股海导航 6月14日沪深股市公告与交易提示📀 来自铜仁
157****7838 :按最下面的历史版本📁📂 来自清镇
30 赤水506
房贷还款“先息后本”热度升温 存量房贷利率会否调整引发关注📃📄
2025-06-19 06:52:46 推荐
永久VIP :马斯克画出有史以来最牛“大饼”:机器人将带来巨额利润 市值可能达十个苹果📅 来自仁怀
158****2035 :中信证券:机器人有望进入发展快车道📆 来自凯里
158****4615 回复 666📇 :"黑天鹅"突袭,茅台飞天价格暴跌,真相来了!📈 来自都匀
96 兴义lr
飞天茅台散瓶批发参考价跌至2230元,单日跌近200元📉📊
2025-06-18 0-1:56:23 不推荐
福泉zl :火爆!这款游戏定价近2000元,炒至近3万元!产业化提速,人形机器人站上风口,潜力股名单抢先看📋
186****5233 回复 159****2603 :警惕!男子晒办公室自拍被间谍盯上📌