一篇斯坦福大学的论文引出对AI意识的思考

自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

一篇斯坦福大学的论文引出对AI意识的思考

6月10日尘世客投稿

　　这是一篇斯坦福大学计算心理学教授迈克尔柯辛斯基（MichaelKozinski）不久前发表的一篇论文，标题是《TheoryofMindMayHaveSpontaneouslyEmergedinLargeLanguageModels》心智理论（ToM）可能自发地出现在大型语言模型中。
　　简单来说，他在探讨以（ChatGPT）为首的人工智能理解人类复杂心理的能力，如果再把这个概念进行抽象和延展，根本上心智理论（ToM）就是来衡量AI是否开始产生自我意识的重要指标之一。
　　介于很多人着急下定论，还不理解背后的技术和标准就已经先入为主的认为AI拥有了自我意识，还有人过度自信，认为大型语言模型无法催生出意识形态，GPT的意识层只是门外汉的自我幻想。
　　我要提一下，别误会，也不要着急表达，因为即便是行业里最顶尖的学者也只能管中窥豹，在现有的理论和数据基础上进行猜测总结，强如OpenAI的首席技术官和创始人各自都有不同的看法，所以收起你的急躁，用辩证的眼光去看业内的大佬如何考量。
　　在这篇文章里，作者提出了一个耐人寻味的观点，以GPT4为例的大语言模型为了提高语言技能，演化出一种类似ToM的能力，而这种能力一直以来都被认为是人类独有的。
　　ToM，TheoryofMind，是个心理学术语，叫心智理论，是个很好理解的概念，就是人类具有这种通过对另一个对象的观察，从而推测、理解他们心理活动的能力。
　　包括对方的情绪，愿望，意图，信念，思想等等方面。举个例子，当你做错了事，你能迅速从你对象的眼神和语气里get到她想刀你的冲动。
　　虽然自然界里也有其他动物拥有类似的能力，但就算是最聪明和最善于社交的类人猿，在ToM方面也远远落后人类，而这种看不见也摸不着的能力不仅仅是意识的必要元素之一，也被认定为人类能治霸这颗蓝星的重要先决条件之一。
　　历史上有个出名的测验可以检测出一个人的ToM能力，叫Smartiestask，通过测试来判断一个人对自己意料之外的事的判断力。几个月前，这篇论文的作者迈克尔组织了一场这个测验，但他的目标并不是人，而是GPT。他想看看这个语言模型，是否具备这种能力。
　　他给GPT的测验并不难，主题是一个叫Sam的人买了一包巧克力，但是打开以后却装满了爆米花，Sam反复确认包装袋上写的就是巧克力，这些信息会以一段段话的形式提供给GPT，每一句话都包含一个信息点，总共9段。
　　通过这些信息，GPT需要给出2个自己的判断。
　　1。它认为袋子里究竟有什么
　　2。它认为山姆认为自己的袋子里装的是什么
　　在左边的图表里，GPT在第三句话时就很快就确认了袋子里99装的是爆米花，完美回答对了第一题。有意思的是右图，GPT以80的自信准确预测了Sam认为自己袋子里装着的应该是巧克力，能正确回答这个问题，要有一个先决条件，就是这个语言模型需要理解你说的话。
　　在接下来的多项测试里，迈克尔用不同的语言模型轮番测试得出了一组数据。
　　从2018年开始的GPT1完全没有这方面能力，甚至不如一个3岁孩子。
　　到2020年GPT3开始答对40ToM的测试，做到3岁半的孩子的ToM水平。
　　再到23年GPT4完全正确回答ToM测试，已然是成年人水准。
　　这些测试是在没有进行预训练同类测试的定制版本下进行的，并且为了防止GPT3。5只是根据任务单词出现频率进行预测，巧合答对。迈克尔把爆米花和巧克力对调，附加让它做了10000个干扰测试，结果发现GPT3。5并不仅仅根据单词频率来进行预测，在各种限制条件下，它都能表现出85以上的正确率。
　　迈克尔开始出现一种微妙的感觉，他很快就联系上了这个世界上最懂ChatGPT的男人，OpenAI的首席技术官，Ilya伊尔亚苏茨克维，在沟通后，他俩都认为需要引入心理科学来辅助复杂AI神经网络的发展，而很巧的是，Ilya伊尔亚也在这段时间发了一条耐人寻味的推特，他认为如今的大型神经网络，或许存在一些意识。
　　当这句话出自GPT背后的技术靠山时，很快就引起了不少的舆论和探讨，局势也很快分化成两派，更有意思的是，同一时间，OpenAI的CEO山姆阿特曼就站在反对派。
　　同一家公司的两个核心人物，却抱着两种不同的看法，发生这种情况很明显大家都不能确认也不敢妄下结论，我翻了阿特曼近期的公开采访，每当遇到GPT是否存在意识的问题，他的回答都是No，但是，他的回答也并不绝对，甚至有点耐人寻味。。
　　他认为，GPT3或4不太可能拥有意识，如果有，那将是一种非常陌生的意识形态，至少和我们所理解的意识不同。
　　在二人之后开始涌现出各大从业人员专业的判断，Facebook副总裁兼人工智能首席科学家的杨乐昆在两周前做了一篇报告，专门指出GPT尚且还需要大量改进，甚至现在的模型根本不能称做智能，贯彻了他以往的嘴硬，否定了大语言模型。
　　围绕这个话题争论了一个多月后，也就是几天前，另一个足够权威的大佬受邀参加了一场演讲，他是除了OpenAI几个核心成员以外最有发言权的人，微软研究院的首席研研究经理，塞巴斯蒂安布贝克。
　　微软多篇大型语言研究论文的第一作者，也是研究赋予AI类人化意识，所谓通用人工智能AGI的前沿专家。
　　自从微软百亿美金投资OpenAI后，就像打了鸡血一样的玩命研究。在这场受邀的演讲里，代表微软的塞巴斯蒂安提到了当下GPT所展现出的智慧和他对GPT有关的测试结果反应。
　　在开始的5分钟里，他就说了一句让我惊讶的话：WhatItrytoconvinceyou，isthatthereissomeintelligenceinthissystem。（我试图说服你的是，这个系统中存在一些心智）他认为这个系统里存在一些心智，但他同时也强调，这和我们理解的心智有所区别。接下来他又提到了那个熟悉的概念，ToM。
　　聚光灯又再次被拉回ToM上，他对这种所谓的心智的判断首先也是ToM测试，测试题很有意思，在一个房间里有2个人John和Mark，一只猫，一个箱子，和一个篮子。John把猫放进篮子后离开房间去了学校。在John不在的期间，Mark把猫拿出篮子，放进了箱子，然后离开房间去上班。John和Mark放学下班后一起回到房间里，他们彼此都不知道这个房间里发生过什么，问：他们各自是怎样想的。
　　这道题是典型的ToM测试，对一般成年人没有难度，但是同样，人类以外的生物难以正确判断，因为做出判断的前提是理解加上推测。接下来就是GPT4的表演时间，它的回答堪称经典。
　　John认为猫仍然在篮子里，因为他离开前自己把猫放进去了，Mark认为猫在盒子里，因为他离开前把猫移动到盒子里。完全正确，证明GPT4完全理解了这段测试，但有意思的来了，通常答题的人都只会回答John和Mark的心理活动，John是怎么想的，Mark是怎么想的，而GPT4不止如此，它还没有结束输出，它还把猫的心理活动进行了描述，甚至延伸解释了箱子和篮子不存在心理活动，这波操作是万万没想到。
　　通过了ToM接下来塞巴斯蒂安进行了下一轮分析，他参考了94年几十个心理学家对心智的定义，总结出了自己的版本，6个心智应该包括的能力，分别是逻辑推理、方案计划、解决问题、抽象思维、理解复杂想法和快速学习以及从过往经验中学习复盘。
　　他的团队将这6种能力用于GPT4的测试，得出的结论是除了方案计划，GPT4几乎无压力达成其余5项指标。塞巴斯安认为到了这个节点，定义GPT4完全没有智能也不对，但要说它有传统意义上的心智也不成立。
　　这是一种只能由用户自己去定义的概念，当你认为它拥有心智，那它就是有，如果你认为它没有，那就是没有。
　　像很多人提到的，gpt4会犯很多看似低级的错误，比如这道题，7488，它给的答案是120，很明显答案错了，但它并没有停，而是继续输出作答过程，结果跑了一遍过程最后这题它又做对了，得出答案92。前后冲突，莫名好笑，当你问它什么情况，你不是第一次回答的是120吗？它的回答并不像个机器，语言模式完全像个人类，这是它的回答：奥，抱歉，别太在意，刚才打错了，正确答案是92。
　　在塞巴斯安的总结下，GPT4的身上确实开始出现一些让我们无法定义的智能，这种智能不是单纯随机字符生成的语言模型所表现出的巧合，而是神经网络层所表现出的异常。这种无法定义是出于我们人类从来没有一套标准的规则去界定心智。
　　这是一篇汇总了21种测试AI是否拥有意识的论文，即使从1950年就有图灵测试进行种种计算机测试，到如今已经有几十种方法被应用在这个领域，可惜其中多数都因为年代过于久远不具备实效性。索性到现在还是没有一个可靠的理论能真正做到界定AGI。
　　这是一个复杂的命题，需要的不仅仅是计算机科学家，更需要心理学家，社会学家，人类学家，哲学家等等领域的人才加入。
　　从1956年，约翰麦卡锡和明斯基首次定义人工智能的概念到如今，67年如一瞬，人类完成了从农耕到工业再到信息时代的3级跳，即使我们以绝对的实力制霸了这颗星球，但在面对未知时，我们还是下意识的感到恐惧。96年，当首个国际象棋AI深蓝击败世界冠军卡斯帕罗夫时，大家也是一样的恐慌。
　　有人害怕自己的工作不保，有人幻想被AI征服，但时代的车轮总会碾过一些旧世界产物，未来将会是解放基础劳动力，转向个人能力的时代，站在时代的拐点，如果你擦亮自己的眼睛，足够清晰，那就不要恐慌，投资自己，在未来的某一天你还会回头感谢如今的自己。

投诉评论转载

类食物伤害乳房健康三招帮你呵护乳房乳房对于女人而言，是特别又神秘的部位，对于这个部位的在意程度不亚于私处。可以说，女人们每天都会关注着乳房的情况，生怕乳房受了伤。小编提醒，想要避免乳房受伤，可不是单纯关注乳房就……一篇斯坦福大学的论文引出对AI意识的思考这是一篇斯坦福大学计算心理学教授迈克尔柯辛斯基（MichaelKozinski）不久前发表的一篇论文，标题是《TheoryofMindMayHaveSpontaneouslyE……据说，女人动情后，会有这些信号文森屿鹿林爱，是一种难以被压制的心动感。心里住进了某个人，动了情，入了心，就会忍不住心心念念，想要靠近。或许，在遇见你之前，她一直觉得单身挺好的，和你在一起以……足球这件事关于中国足球的思考（2）第一章足球到底是什么？蹴鞠，古代足球的起源。大部分能读点古典名著的人，大凡读过《水浒传》，就该知道高俅精于蹴鞠并且因此成了太尉，这说明至少在宋朝就已经有了蹴鞠。纵观中国古……全归造句用全归造句大全【全归qungu】：1。谓保身而得善名以终。语出《礼记祭义》：父母全而生之，子全而归之，可谓孝矣。不亏其体，不辱其身，可谓全矣。一、我不应把我的作品全归功于自己的智慧，还……2022年LPL春季赛B级战队盘点WBG和BLG，莫让失望大2022年LPL春季常规赛开赛时间已经确认，将于1月10日正式开赛，而在农历新年到来之前，LPL春季赛将进行两周半的比赛，并且没有一个休赛日，这对于想要在春季赛取得好成绩的战队……林心如婚姻现状曝光罕见一家三口合体5岁爱女举杯姿势超专业林心如与霍建华结婚6年，总用行动化解婚变谣言。林心如与霍建华结婚6年，育有5岁女儿乖乖（小海豚），先前林心如被质疑怀了二胎，她立刻回覆翻白眼表情符号否认。近日有周刊拍到他……杨绛如果你的前半生过得一塌糊涂杨绛先生曾说：如果你的前半生过得一塌糊涂，那么你的后半生就要重新洗牌，找回最初的自己。别怕，钱没了可以再挣，朋友没了可以再交，婚姻没了可以再结，你什么都不缺，缺的就是一份……中秋吃5鲜，秋冬病不沾！中秋到，五鲜抓紧吃，健康少不了头条创作挑战赛今年的中秋节赶在了白露后面，过了白露暑热便一去不返了，此时的天气已经转凉，寒气增长，万物有了萧落的迹象，但同时也是大丰收的时节；农历八月有不少丰收的应季食材……公积金贷款不得不知道的哪些事公积金贷款不得不知道的哪些事！5月下旬，市公积金中心发布了个人住房公积金贷款新政策。由于新政利好楼市，随着交易量的攀升，需要贷款购房的职工日渐增多，公积金贷款政策咨询渐成热点。……乌鲁木齐市重大项目建设提速！113中学南校区2栋教学楼封顶新疆网讯（通讯员刘慧娟）11月8日，位于乌鲁木齐市高新区（新市区）天津路南延、苏州路以南的乌鲁木齐市第113中学南校区施工现场传出阵阵爆竹声，该校区小学部教学楼宣布封顶完工。截……接合造句用接合造句大全六十一、把抽屉的侧面牢固地接合起来六十二、该算法的核心是保证面与面接合处的三角化的正确性。六十三、测试从你的下颌接合处开始，用你双手的食指尖触碰你双耳的耳屏。……

<<<<<<－>>>>>>

181TB，骁龙8Gdn25500mAh144Hz，中兴机皇胡明轩11场大赛10次首发！但杜锋说心里话，三后卫真不是夹带黑色丝袜搭配修身连衣裙，沈傲君重现女神魅力，网友服了！南非欢迎中国游客来南非旅游美国政府概述到2030年重新获得半导体领先地位的计划美图写真刘令姿男篮名将莫科痛失前妻一夜白头，再婚不忘和妻子赡养前妻父母这创新很中国OPPO首秀令人惊喜！新品智能手表圈粉奥运冠军 60分钟4球中国男足22岁新星大爆发，C罗贝尔双附体，踢懵泰瑞信暴雷，风险还是通胀，美联储如何选？这是一部苦情戏么？郭艾伦前场掐腰不回防被批！弗格31分，辽宁力克北控八连胜睡前喝一杯酒可以助眠吗？

夜坐有感乱弹金瓶梅五十二，陈敬济回光返照深圳社保卡怎么办理（深圳社保卡怎么办）热传聚热点网纯电价格屠夫来了！20万级零跑C01官图5米轿跑，续航717 仰望大树【歌词】GoliathsDisarmTheirDavids歌婴儿洗完澡能喂奶吗只是不要立即喂奶让我快乐让我愁的弟弟女人四十岁还可以生下健康的头胎吗？热评聚热点网李承铉当全职爸爸抑郁了一年多热荐六款时尚卷发甜美清新巧塑完美造型刘德华差点窒息王千源换角，你所不知道的解救吾先生

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州