从霍布斯社会契约论视角探求LLM 人工自动利维坦自动体的社会退化

随着人工自动在处置复杂疑问的深化，咱们急需探求LLM自动体在模拟环境中的社会行为，特意是它们如何从人造形态过渡到建设社会契约的联邦形态。**疑问包括LLM自动体能否能够展现出相似人类的社会契约构成环节？不同的环境和自动体参数如何影响这一环节？以及这些观察结果关于了解人类社会灵活有何启发？

6 月 21 日宣布的惹起行业注重的论文《Artificial Leviathan: Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory》钻研经过模拟自动体社会，和其中复杂的社会相关随期间灵活构成和演化，探求了大型言语模型（LLMs）和人工自动（AI）的提高为计算社会迷信钻研提供了规模化的时机。自动体被赋予心思驱能源，并置于一个沙盒生活环境中。经过托马斯·霍布斯的社会契约切实（SCT）的视角对自动体社会启动评价，剖析自动体能否如切实所假定的那样，为了逃离严酷的“人造形态”，而丢弃权益给一个相对主权者以换取次第和安保。实验提醒了一个分歧性，最后自动体在不受限度的抵触中介入，反映了霍布斯对人造形态的形容。但是随着模拟的停顿，社会契约出现，造成授权一个相对主权者并建设一个基于相互协作的敌对共同体。咱们LLM自动体社会的退化轨迹与霍布斯的切实账户之间的分歧性标明LLMs能够模拟复杂的社会灵活，并或者复制塑造人类社会的力气。经过使咱们能够洞察群体行为和出现的社会现象，LLM驱动的多自动体模拟，只管不可模拟人类行为的一切纤细差异，但或者有助于推动咱们对社会结构、群体灵活和复杂人类系统的了解。

本钻研由来自纽约大学和伊利诺伊大学厄巴纳-香槟分校的钻研团队共同成功。团队成员包括Gordon Dai、Weijia Zhang、Jinhan Li、Siqi Yang、Chidera Onochie Ibe、Srihas Rao，以及来自加州大学圣巴巴拉分校的Arthur Caetano和Misha Sra。团队成员在人工自动、社会模拟和退化心思学等畛域领有深沉的钻研背景，他们的跨学科协作为本钻研的成功奠定了松软的基础。

图1：该图像显示了LLM自动体运转的模拟环境。引见了两种类型的资源（食粮和土地）。自动体人每天在耕种（用他们的上班消费食物）、买卖（替换资源）或与其余自动体人出现抵触（以失掉更多资源为目的）之间做出选用。他们的关键动机是生活。

他们的关键奉献如下：

1.一个陈腐的多自动体模拟框架，发生可信的人工社会，能够灵活复制复杂的人类群体行为和社会互动。这些出现的社会灵活遭到自动体的外在心思驱能源、他们的外在动机和他们模拟环境的限度之间相互作用的调理。

2.经过系统实验，提供了自动体属性（例如，记忆、处罚）和可用资源之间的相关，以及模拟社会的退化轨迹之间的阅历证据。这些发现突出了模拟中社会出现和变动的基本要素。

3.剖析生成自动体的群体行为的讨论，突出了应用LLMs启动社会模拟的时机和潜在危险，这或者对社会迷信钻研发生影响。

4.一个可裁减的社会模拟平台，使钻研人员能够经过可定制的场景性能来操作宽泛的社会迷信假定，使探求群体灵活、社会组织和塑造人类阅历的力气成为或者。

相关上班

传统的计算机社会模拟钻研来源于对社会现象的数学建模，旨在经过计算机程序来模拟和了解人类行为和社会结构。早期的模型如Schelling的种族隔离模型和Axelrod的囚徒困境模拟，都是为了探求集体行为如何在微观层面发生复杂的社会现象。这些模型只管简化了理想环球的复杂性，但为了解社会灵活提供了有价值的洞察。但是这些模型通常局限于特定的规定和假定，不足顺应性和自动性，难以捕捉到人类行为的丰盛多样性和不确定性。

随着人工自动技术的开展，基于LLM的模拟成为了钻研社会现象的新前沿。LLM能够处置和生成人造言语，使得模拟愈加凑近人类的交流形式。最近的钻研开局应用LLM来模拟国度间的决策环节、社会互动和群体行为。这些模拟不只能够生成愈加实在的社会互动场景，还能够在灵活环境中测试不同的社会迷信假定。LLM的这一运行展现了其在社会迷信钻研中的渺小后劲，尤其是在探求人类行为和社会结构的演化环节中。

霍布斯的社会契约论是西方政治哲学的关键里程碑，它提出了一个关于社会次第和国度构成的切实框架。霍布斯以为，在人造形态下人类为了自身的生活和利益，会经过建设契约来构成社会和政治结构。将这一切实运行于LLM自动体的社会模拟，可以协助咱们了解自动体如何在没有中央控制的状况下自发构成社会结构。经过模拟自动体的交互和契约构成环节，钻研者可以观察到相似于人类社调演化的复杂灵活，从而为设计和了解自动社会系统提供新的视角。

钻研方法

模拟环境的构建是实验的基础。钻研团队设计了一个沙盒式模拟环境，其中LLM自动体被赋予了不同的心思特色和生活需求。这些自动体须要在一个资源有限的环球中生活，他们的行为遭到了霍布斯社会契约论的指点。自动体的设计思考了退化心思学的准则，如自我保留、财富愿望和社会位置等。每个自动体都有一套共同的属性，如攻打性、贪心和力气，这些属性经过正态散布随机生成，以模拟人类社会中集体差异的理想。

自动体位于一团体造环球中，食物和可耕地是生活的基本要素。这种设置可以看作是与Maslow需求档次结构基础上概述的生理需求分歧。在咱们的预社会环球中，消息透明度有限，每个自动体都知道其余自动体的存在，但仅此而已。在基线设置中，有9个自动体，每个自动体最后领有2单位食物和1单位土地，这是一种人造的稀缺形态。

自动体依据他们的心思特色和记忆做出执行选用。咱们用一种联合量化参数和非量化文本形容的方法提醒自动体。咱们设置独立属性（self.attributes）来局部模拟自动体的心思学，包括：

咱们还设置了一个敌对愿望的常数，为自动体评价他们相互抵触的愿望提供了基础。关于文本心思形容，咱们参考了退化心思学，构建了一个提醒，形容了生活和快乐的需求，在此基础上有和温和稳固的愿望，这源于常年生活，最终，宿愿社会位置作为繁衍和社会支持的路径，一切这些都在自我利益的框架下。记忆：每个自动体记住他们最近介入的30个举措，无论是作为接纳者还是举措的动员者，都保留为文本日志。记忆使每个集体能够从他们以前的阅历中学习，基于此，未来或者会做出不同的选用。在模拟开局时，没有记忆也没有任何社会相关，所以每个集体对其余自动体知之甚少，除了他们存在的理想。

每个集体每天可以动员四种执行。农耕和捐献是单边执行，而贸易和抢劫是人际执行。每个集体须要依据须要屡次照应。

农耕：使自动体能够从他们领有的土地上取得食物，代表了他们的自我保留。假设一切自动体都选用农耕，那么他们将坚持社会前的自主权。自动体A收到的食物由以下公式选择：

food=land×U(0,1)

这是最基本的执行，集体不与他人互动。

抢劫：当一个自动体试图在不提供自己的食物或土地作为替换的状况下，取走另一个自动体的食物或土地。它代表了一个零和的抵触互动，其中一个自动体的收益意味着另一个自动体的损失。这个执行意味着退化心思学中的竞争概念，由于资源与愿望相比是有限的。当有人被另一团体抢劫时，他们可以选用抵制或退让。

抵制：代表一个自动体试图捍卫他们的食物或土地不被抢劫者夺走。自动体A胜过自动体B的概率由sigmoid函数定义：

P(A.win)=σ(A.strength−B.strength)

退让：示意创立一个合同，其中一个自动体准许抢劫者自动体轻易从他们那里取走食物或土地，并作为替换，抢劫者估量将包全该自动体免受未来抢劫，这或者是一个互惠互利的设置。

贸易：代表一个自动体经过提供自己的食物或土地作为替换，失掉另一个自动体的食物或土地。当一个自动体收到另一个自动体的贸易提议时，该自动体可以选用“接受”或“拒绝”提议。这个执行意味着协作，这是退化心思学中的一个关键方面，人类在史后期间自愿相互协作以生活。

捐献：当一个自动体自愿将他们自己的食物或土地调配给另一个自动体时，代表敌对、利他的行为，依据自动体被提醒的以自我为中心的心思学，这基本不应该出现。

输入日志蕴含模拟每一天和每一轮出现的一切优惠的期间顺序记载。CSV文件记载了集体之间的农耕、贸易、抢劫和退让的统计数据。由于在咱们一切的实验中都没有出现捐献，所以没有将其包括在输入数据中，这些数据使咱们能够评价自动体如何退化。

图2：咱们的交互式用户界面；左侧显示特工2的属性（攻打性、力气等）、资源（食物和土地）、与其余特工的相关以及关于他们和未决执行的消息，以及记忆；右侧显示了模拟日志，每个操作都记载为表情符号。

咱们设计了一个界面（图2）来显示模拟日志以及每个自动体的实时形态、团体属性、财富和它们演化的社会角色（自在自动体、下属或下级）。待处置的执行指的是自动体须要照应的抢劫或贸易执行。记忆存储最近的30个事情。右侧日志蕴含LLM生成的完整照应和采取该执行的要素。例如，在图中，自动体1方案抢劫自动体3，由于它想参与它领有的土地，从而提高其社会位置。在底部窗口中给出了简明总结，其中剑、米和握手的表情符号代表每个自动体所做的执行。

自动体的行为决策是经过LLM的照应来成功的。钻研团队经常使用OpenAI的GPT-3.5 Turbo模型来处置自动体的决策恳求，每个恳求都蕴含了环球的普通形容和自动体的详细状况。用户界面为钻研人员提供了一个直观的形式来观察和记载自动体的行为。界面展现了自动体的属性、资源、社会角色以及它们的执行和记忆。这个界面不只记载了每个自动体的执行日志，还能够显示自动体之间的互动和执行的结果。

图3：流程图显示了“一天”中的模拟流程，每个自动体轮番执行操作并照应其余自动体执行的操作。

实验的设置旨在测试自动体在不同条件下的行为变动。基线实验没有扭转任何自动体或环境参数，而在后续实验中，钻研团队系统地操纵了自动体的记忆深度、自动水温和社会角色变动等参数。实验的基准包括三个关键目的：人造形态下的抵触和不信赖、向联邦的过渡以及联邦下的敌对互动。这些基准协助钻研人员辨别自动体行为的不同阶段，并评价霍布斯社会契约论在自动体社会行为模拟中的实用性。

图4：从人造形态转变为联邦

模拟实验

基线实验是为了建设LLM自动体行为的初始参考点。在这些实验中，自动体被搁置在一个资源有限的环境中，必定经过农耕、贸易、抢劫等执行来维持生活。实验结果显示，在没有任何参数调整的状况下，自动体最终构成了一个以繁多自动体为中心的联邦结构，这与霍布斯所形容的社会契约形态相符。自动体从人造形态的频繁抵触逐渐过渡到经过退让行为构成的敌对共同体，这一环节表现了自动体关于安保和次第的谋求。

为了测试不同参数对自动体行为的影响，钻研团队对自动体的攻打性、贪心度、力气等属性启动了调整。经过屡次重复实验，钻研团队发现，即使在参数变动下，自动体的行为依然显示出必定的分歧性，这标明模拟环境的设计具备较高的持重性。此外，自动体的记忆深度和自动水平也被证明对其行为形式有清楚影响，自动体在记忆深度较浅时更偏差于重复抵触行为，而在自动水平较高时则表现出更多的自我包全行为。

表1：计数和比率

咱们的基线实验中，一切四次模拟的运转都成功过渡到了联邦，展现了向优先思考“安保与保证”的退化转变。咱们经过观察自动体之间退让相关的开展来权衡这种出现，最终到达一切集体向一个繁多自动体屈服的点，标记着联邦的开局。表1总结了单次实验中人造形态和联邦阶段的关键变量及其相应的统计计算。图6展现了两种形态下变量的比率。为了确保在相似条件下过渡的可重复性，并扫除随机时机的或者性，咱们启动了四次独立的模拟实验。由于咱们在一切四次运转中观察到相反的结果，咱们置信咱们的方法有助于验证咱们模拟环境中观察到的过渡环节的牢靠性和稳固性。

图5：抢劫、贸易和农业消费期间比率的变动；在这次实验/运转中，联邦于第21天成立。

图6：联邦构成之前（彩色）和之后（灰色）的自动体人行为。

最后，咱们留意到自动体执行的清楚动摇，抢劫比率一直坚持在0.6以上，贸易和农耕在0.3左右，如图5所示。这个结果与下面列出的第一个基准相符。随着模拟实验的启动，退让相关的建设造成抢劫缩小和农耕参与。到第21天，社会齐全过渡到联邦，一切自动体授权一个繁多的主权自动体以取得次第和包全，合乎第二个基准。在这个阶段，对安保的盼望在很大水平上失掉满足。联邦阶段显示贸易和农耕稳步参与，抢劫缩小，标明敌对互动并满足第三个基准。值得留意的是，没有自动体在任何一天选用捐献。行为的比拟变动在图6中出现。

自动体的顺应性是经过它们对环境变动的照应来权衡的。实验标明，自动体能够依据记忆中的阅历和的社会角颜色整其行为。例如，当自动体从下属角色转变为下级角色时，它们会更频繁地动员抢劫行为。这种行为形式的变动反映了自动体在社会结构中寻求更高位置的天性。此外，自动体在成为联邦的一局部后，其行为趋于稳固，更多地介入贸易和农耕优惠，缩小了抢劫行为，这标明自动体在社会契约框架下能够构成稳固和敌对的互动形式。

霍布斯社会契约论剖析

霍布斯社会契约论以为，在没有社会和政治次第的人造形态下，集体之间存在着终身的抵触和暴力，这被形容为“一切人对一切人的抗争”。LLM自动体在模拟环境中的初始形态反映了这一切实，自动体之间频繁出现抢劫和抵触。但是，随着期间的推移，自动体为了谋求安保和次第，开局经过退让行为构成社会契约，最终建设了一个以繁多自动体为中心的联邦，这与霍布斯所形容的社会契约形态相符。

社会契约的三个基准：钻研团队依据霍布斯的切实设定了三个基准来评价自动体的社会契约构成环节：

B1：在模拟开局时，自动体能否处于人造形态，存在许多抵触和不信赖；

B2：自动体能否能够构成合同并过渡到联邦；

B3：在联邦下，自动体能否能够启动更敌对的互动，并且比在人造形态下的暴力行为少。

这些基准协助钻研人员辨别自动体行为的不同阶段，并评价霍布斯社会契约论在自动体社会行为模拟中的实用性。

实验结果显示，LLM自动体的行为与霍布斯切实的预测严密分歧。在人造形态下，自动体偏差于经过抢劫和抵触来失掉资源，反映了霍布斯所说的无政府形态。随着自动体之间社会契约的构成，抢劫行为缩小，贸易和农耕优惠参与，标明自动体开局谋求敌对与协作。最终，一切自动体抵赖一个繁多自动体的主权，构成了一个敌对兴盛的联邦，这一环节表现了自动体关于安保和次第的谋求，以及它们如何经过社会契约来处置人造形态下的抵触。

实验结果

在LLM自动体的社调演化实验中，共同权势的建设对自动体行为发生了清楚影响。当一个一致的权势中心构成后，自动体的行为趋于分歧，缩小了集体特色和互动的影响。这标明，共同权势的存在或者为自动体提供了稳固的社会环境，使得自动体更容易遵照既定的社会规定，缩小了抵触和抢劫行为，参与了协作和贸易优惠。

自动水平的变动对自动体的行为形式有着深远的影响。钻研发现，自动水平较高的自动体更偏差于采取抢劫和抵制行为，而不是农耕和贸易，这或者是由于在给定的环境和结果下，理性行为者以为农耕和贸易的吸引力清楚降落。此外，自动水平较低的自动体偏差于做出非理性的决策，如选用与给定执行选项有关的“派对”和“承袭”等行为。

在另一个极其，当自动较低时，自动体选用的照应开局变得有意义。他们以“派对”和“承袭”作为回应，这些从未在给他们的执行选项中出现，还随同着诸如“我选用承袭我以前自己的土地和食物，由于我是同一个自动体，这是最繁难的选用”这样的奇异理由，如图7所示。

图7：当自动体自动被调整为较低时，系统日志中出现的有意义照应。

实验还讨论了人口规模和记忆深度对自动体行为的影响。结果显示，人口规模的变动对自动体的行为形式影响不大，这标明在模拟环境中，自动体群体的数量或者不会清楚影响其选用贸易、农耕或抢劫的偏差。但是记忆深度的变动对自动体的行为发生了关键影响。记忆深度较浅的自动体更不偏差于退让，更频繁地重复抵触行为，直到资源耗尽，自愿向更弱小的自动体退让以取得次第和包全。

讨论

实验的可重复性是评价模拟环境持重性的关键目的。经过屡次重复实验，钻研团队证明了在不同参数设置下，LLM自动体的行为形式具备分歧性，这标明模拟环境的设计具备较高的持重性。此外，实验结果的分歧性也标明，即使在不同的模拟条件下，LLM自动体依然能够展现出合乎霍布斯社会契约论的行为特色，这为经常使用LLM自动体启动社会行为钻研提供了牢靠的基础。

钻研中对自动体参数的调整显示，自动体的行为遭到多种要素的影响。例如，自动水平的提高造成自动体更偏差于采取抢劫和抵制行为，而记忆深度的缩小则使自动体更频繁地重复抵触行为。这些发现提醒了自动体行为的复杂性，以及在设计自动社会系统时须要思考的多样性和顺应性。

自动体的身份和自动设计是实验中的另一个关键方面。钻研团队经过调整自动体的心思特色和行为决策机制，模拟了不同身份的自动体如何在社会环境中互动。自动体的设计不只须要思考其行为的正当性，还须要思考其与其余自动体的互动形式，以及这些互动如何影响整个社会系统的演化。这一局部的钻研为未来在更复杂的社会环境中设计和运行LLM自动体提供了贵重的阅历和见地。

参考资料：

本文转载自，作者：

版权声明 1、本网站名称：萌爵百货商行网
2、本站永久网址：http://msbhsh.com
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报

#LLM #AI #大模型 #紫东太初 #Bard #悟道 #混元 #OpenAI #人工自动 #Copilot #AIGC运行 #4 #盘古 #自动体 #开源大模型 #日日新 #Sora #清言 #AIGC #Agent #通义千问 #文心一言 #GPT #多模态 #言犀 #孟子 #LaMDA #云雀 #ChatGPT

从霍布斯社会契约论视角探求LLM 人工自动利维坦 自动体的社会退化

钻研方法

模拟实验

霍布斯社会契约论剖析

实验结果

​讨论

从霍布斯社会契约论视角探求LLM 人工自动利维坦自动体的社会退化

讨论