八部九狸 LV
发表于 2025-4-9 16:51:40
旺晓通:深入浅出解读,轻松通晓技术
<hr/>你是否曾幻想过,身边有一个无所不能的智能伙伴,它不仅能陪你谈天说地,还能帮你解决各种难题,从制定旅行计划到完成复杂的工作任务?如今,随着大语言模型(LLMs)的兴起,这样的幻想正逐渐成为现实。大语言模型就像是给智能体注入了强大的“智慧引擎”,让它们在人工智能的世界里飞速发展。但这背后究竟隐藏着怎样的技术奥秘?它们又面临着哪些挑战呢?今天,就让我们一起深入探索大语言模型驱动的智能体的奇妙世界。
作者:张长旺,图源:旺知识
一、智能体:人工智能的“多面手”进化史
在人工智能的领域中,智能体是一类能够感知环境、做出决策并采取行动以实现特定目标的系统。它的概念可不是凭空出现的,其起源可以追溯到古代神话和早期的工程发明。像古希腊神话中的青铜巨人塔洛斯,它能自动守护岛屿,抵御外敌,这就是人类早期对智能、自主行为的一种想象。到了文艺复兴时期,达·芬奇设计的人形机器人则是将这种想象向现实迈进了一步。
随着时间的推移,智能体的发展逐渐从想象走向科学。早期的符号系统,比如纽厄尔和西蒙的通用问题解决器,试图通过逻辑步骤来模拟人类的问题解决过程,但它在面对复杂的现实环境时显得有些“力不从心” 。直到罗德尼·布鲁克斯在20世纪80年代提出的包容架构,智能体才迎来了重要的发展阶段。这种架构下的智能体能够在机器人领域实现基于行为的实时响应,不再依赖于对环境的详尽建模,展现出了更强的灵活性和可扩展性。
而大语言模型的出现,更是让智能体发生了翻天覆地的变化。以ChatGPT、DeepSeek、Claude等为代表的大语言模型,凭借其强大的语言理解、推理和生成能力,让智能体从执行简单任务的“小助手”,变成了能够处理复杂问题的“多面手”。它们可以理解自然语言,在各种领域进行推理,并根据不同的情境做出适应性的反应,就像给智能体装上了一个“智慧大脑”,使其在人工智能领域的应用更加广泛和深入。
二、智能体与人类大脑的异同:一场有趣的“较量”
大语言模型驱动的智能体虽然在功能上越来越强大,但和人类大脑相比,还是有着不少有趣的差异。
先从“硬件”层面来说,人类大脑是由生物神经元、神经递质等构成的,它的运行极其节能,只需要大约20瓦的能量,就能维持我们一生的学习、推理和决策。而且大脑的维护方式也很特别,需要睡眠、营养和休息来保证正常运转,知识的传递主要通过学习来实现,复制起来可不容易。相比之下,智能体依赖的是深度神经网络和基于梯度的优化算法,运行时需要强大的硬件支持,稳定的电源供应和良好的散热系统,不过好在它可以轻松地在全球的服务器上进行复制。但这也带来了一个问题,就是能耗较高,每块GPU的能耗可能达到数千瓦。
在意识和情感方面,人类大脑有着丰富的主观体验、情感和自我意识,这些因素在我们的推理、决策和社交互动中起着至关重要的作用。而智能体目前还缺乏真正的主观意识,它们所谓的“情感”,只是通过语言模仿出来的表面现象,在训练完成后也缺乏动态成长的能力。
从学习方式来看,人类的学习是持续一生的、在线的、互动的过程,并且会受到环境、文化和情感等多种因素的影响,能够快速地进行知识迁移。但智能体主要依赖离线的批量训练,虽然也有在线微调等技术,但和人类灵活的学习能力相比,还是有一定的差距。
在创造力方面,人类的创造力源于个人的丰富经历、情感洞察以及跨领域的联想,作品往往带有独特的情感深度和原创性。而智能体的创造力更多地来自于对训练数据的统计重组,缺乏像人类那样的深度和情感共鸣。
不过,通过这样的对比,我们可以更好地了解智能体的优势和不足,为进一步改进和发展智能体技术提供方向。就像一场有趣的“较量”,虽然目前智能体在某些方面还比不上人类大脑,但它的发展潜力巨大,未来的发展充满了无限可能。
三、智能体的模块化设计:构建智慧大厦的“基石”
为了让智能体更好地模拟人类的智能行为,研究者们从人类大脑的结构和功能中获得灵感,提出了一种模块化和受大脑启发的智能体框架。这个框架就像是构建智能体这座“智慧大厦”的基石,由多个关键模块组成,每个模块都有着独特的功能,它们相互协作,共同支撑起智能体的智能行为。
(一)感知模块:智能体的“感觉器官”
感知模块是智能体与外界环境交互的“感觉器官”,它负责将接收到的各种信息转化为有意义的表示。人类通过视觉、听觉、触觉等多种感官来感知世界,智能体也有类似的“感官”,只不过它是通过各种传感器来实现的,比如摄像头、麦克风等。
根据处理信息的方式和涉及的模态,感知模型可以分为单模态、跨模态和多模态模型。单模态模型就像一个专注于单一任务的“小专家”,只能处理一种类型的输入,比如文本、图像或音频。例如,BERT模型在处理文本时表现出色,它能够通过大规模的无监督预训练,捕捉到文本中的深层语义信息;而ResNet则是图像领域的“佼佼者”,能够有效地提取图像的特征。
跨模态模型则像是搭建了一座连接不同“感官”的桥梁,它能够在不同的模态之间建立联系并进行转换。比如CLIP模型,它通过对比学习的方法,实现了文本和图像表示的对齐,使得智能体能够进行零样本的跨模态检索和分类。就好像给智能体赋予了一种能力,让它看到一张图片时,能准确地用文字描述出来,或者根据一段文字描述找到对应的图片。
多模态模型则更加“全能”,它能够同时处理和整合多种模态的信息,就像人类一样,能够综合视觉、语言和听觉等多种信息来理解世界。像LLaVA模型,它通过端到端的训练,结合了图像和文本的信息,展现出了出色的多模态聊天能力。还有Video-ChatGPT,它将输入扩展到视频,能够捕捉视频中的时间动态和帧间一致性关系,实现对视频内容的流畅对话。
(二)认知模块:智能体的“智慧核心”
认知模块是智能体的“智慧核心”,它就像人类的大脑一样,负责学习、推理和决策等高级功能。这个模块包含多个重要的子模块,其中学习和推理是最为关键的部分。
智能体的学习过程和人类有些相似,但也有自己的特点。它可以通过多种方式进行学习,比如在大规模数据集上进行预训练,就像人类在成长过程中不断积累知识一样。然后,通过监督微调、强化学习等技术,智能体可以进一步优化自己的能力,适应不同的任务和环境。例如,通过监督微调,智能体可以学习特定领域的知识和逻辑推理能力;而强化学习则可以让智能体在与环境的交互中,根据奖励信号来调整自己的行为策略。
推理是智能体认知模块的另一项重要功能,它可以分为结构化推理和非结构化推理。结构化推理就像是按照明确的地图导航,有着清晰的步骤和逻辑依赖。比如ReAct通过将推理痕迹与任务特定行动相结合,以一种交替的方式解决问题;Tree of Thoughts则将复杂问题分解为中间步骤,通过广度优先或深度优先搜索来探索解决方案空间。非结构化推理则更像是凭借直觉探索,推理过程更加灵活,没有明确的中间步骤。例如,通过精心设计的提示,智能体可以利用语言模型的逻辑演绎能力来解决问题,像Chain-of-Thought prompting通过生成中间推理步骤来解决问题,展现了强大的推理能力。
(三)记忆模块:智能体的“信息宝库”
记忆模块是智能体存储和管理信息的“信息宝库”,对智能体的学习和决策起着至关重要的作用。它的设计灵感来源于人类的记忆系统,同样可以分为感觉记忆、短期记忆和长期记忆。
感觉记忆是信息进入智能体的“第一道关卡”,它就像一个短暂的信息缓冲区,能够快速捕捉和过滤环境中的感知信号。比如在RecAgent中,它利用基于大语言模型的感觉记忆模块对原始观察进行编码,同时过滤掉噪声和无关内容,就像我们的眼睛快速捕捉到重要信息,而忽略周围的干扰一样。
短期记忆则是智能体用于存储和处理与当前任务相关信息的临时“工作区”。它可以分为上下文记忆和工作记忆,上下文记忆就像我们在对话中记住之前说过的内容,帮助我们更好地理解和回应;工作记忆则像是我们在脑海中进行计算或思考时,暂时存放信息的地方。例如,MemGPT通过管理不同的存储层来扩展大语言模型的上下文窗口,而Generative Agent则利用短期记忆来保留情境上下文,支持情境敏感的决策。
长期记忆是智能体积累知识和经验的“仓库”,它包含显式记忆和隐式记忆。显式记忆类似于人类的陈述性记忆,用于存储事实和事件等信息;隐式记忆则像我们的程序性记忆,影响着智能体的行为和技能。比如Agent S在执行GUI自动化任务时,语义记忆存储在线网络知识,而情景记忆则记录任务经验;AAG通过类比定义和泛化程序,实现了程序性记忆的存储和检索。
(四)世界模型模块:智能体的“虚拟世界模拟器”
世界模型模块是智能体对外部环境的一种内部表示,它就像是智能体的“虚拟世界模拟器”,能够帮助智能体预测未来状态、规划行动并理解环境的动态变化。
人类在日常生活中会构建自己的世界模型,比如我们在打乒乓球时,能够预测球的轨迹,这就是大脑中的世界模型在起作用。在人工智能领域,世界模型的设计也有多种范式。隐式范式就像一个神秘的“黑匣子”,通过一个神经网络或潜在结构对环境动态进行编码,世界模型框架就是一个典型的例子,它利用变分自编码器和循环网络来预测未来的潜在代码。显式范式则像是将世界模型的各个部分清晰地展示出来,通过学习或编码转移函数和观察函数,使智能体能够更明确地进行预测和规划,像MuZero和Dreamer等模型就是采用这种范式。模拟器范式则是借助外部模拟器或真实世界来进行环境更新,比如SAPIEN提供的3D物理模拟环境,让智能体在其中进行策略训练。
不同的范式各有优劣,隐式范式简单灵活,但缺乏可解释性;显式范式更具可解释性,但对模型误差较为敏感;模拟器范式能提供准确的转换,但计算成本较高。在实际应用中,需要根据具体任务和需求来选择合适的范式。
(五)奖励模块:智能体的“行为指南针”
奖励模块是智能体学习和决策的“行为指南针”,它通过给予智能体奖励或惩罚信号,引导智能体采取合适的行动。在人类大脑中,奖励系统涉及多种神经递质和复杂的反馈机制,比如多巴胺在奖励学习中起着重要作用。
在智能体中,奖励模型可以分为外在奖励、内在奖励、混合奖励和分层奖励。外在奖励是由外部定义的信号,就像我们完成一项任务后得到的奖励一样,它可以引导智能体朝着特定目标行动。例如InstructGPT通过人类对模型输出的排名来提供持续的偏好信号,帮助模型调整行为。内在奖励则是智能体内部生成的信号,用于鼓励智能体进行探索和学习,比如好奇心驱动的奖励,它激励智能体去探索未知的领域,减少不确定性。混合奖励则结合了外在和内在奖励的优点,使智能体在探索和利用之间找到平衡。分层奖励则将复杂的目标分解为多个层次的子目标,为每个子目标分配相应的奖励信号,帮助智能体更好地学习复杂的行为。
(六)情感建模模块:赋予智能体“情感色彩”
情感建模模块试图赋予智能体类似人类的情感能力,让智能体能够理解和表达情感,更好地与人类进行交互。虽然智能体目前还没有真正的情感体验,但通过情感建模,它可以在一定程度上模拟情感对决策和行为的影响。
从心理学理论的角度来看,情感可以用多种方式来表示,比如离散的类别(如愤怒、快乐等)、连续的维度(如效价、唤醒度等),或者是两者的结合。基于这些理论,研究者们提出了多种情感建模的方法。一些模型通过在提示中嵌入情感刺激来影响智能体的输出,就像我们在与他人交流时,通过语气和表情来传达情感一样,情感提示可以使智能体在生成文本时更加符合情感需求。还有一些模型利用多模态数据,如音频、视觉和文本,来更好地识别和推理情感,像Emotion-LLaMA通过融合多模态信息,在情感理解和生成方面取得了更好的效果。
四、智能体的自我进化:不断升级的“智慧之旅”
智能体的自我进化能力是其不断提升性能和适应环境变化的关键,就像人类在成长过程中不断学习和进步一样。智能体的自我进化涉及多个方面,包括优化空间、优化算法以及在线和离线的自我改进。
(一)优化空间:多维度的自我提升
优化空间是智能体进行自我进化的“舞台”,主要包括提示优化、工作流优化和工具优化。
提示优化是智能体优化的基础环节,它就像是给智能体“打一剂强心针”,能够直接影响智能体的性能、延迟和成本。通过精心设计提示,智能体可以更好地理解任务并生成更准确的答案。例如,通过比较大语言模型生成的输出和任务的真实结果,或者利用大语言模型作为评判者来评估提示的有效性,从而不断优化提示。
工作流优化则关注多个大语言模型组件之间的协调和交互模式,就像优化一条生产线上各个环节的协作一样。通过优化工作流的节点和边,智能体可以更高效地完成复杂任务。例如,MetaGPT和AlphaCodium等系统采用的基于图的、神经网络或代码的结构来表示工作流,通过优化这些结构来提升系统性能。
工具优化是让智能体学会更好地使用外部工具,从而扩展其解决问题的能力。这就好比人类学会使用各种工具来提高工作效率一样,智能体可以通过学习从演示中模仿专家行为,或者根据环境反馈进行强化学习来优化工具的使用。例如,ToolFormer通过集成外部工具空间,如计算器、问答系统等,扩展了语言模型的能力;还有一些研究致力于开发新的工具,以满足不同任务的需求。
(二)优化算法:智能体进化的“动力引擎”
优化算法是推动智能体自我进化的“动力引擎”,传统的优化方法如梯度下降和零阶优化在处理离散和结构化问题时存在一定的局限性。而基于大语言模型的优化方法则为智能体的进化提供了新的途径。
基于大语言模型的优化方法利用自然语言作为优化的领域和反馈机制,通过迭代更新来改进智能体的性能。例如,一些方法通过随机搜索在离散的自然语言空间中优化提示,就像在一个巨大的语言宝库中随机探索宝藏;而梯度近似方法则通过估计下降方向来迭代改进解决方案,类似于在爬山时寻找最陡峭的上升路径,使优化过程更加高效。贝叶斯优化和代理建模则通过构建代理模型来减少与大语言模型的交互次数,降低优化成本,提高优化的稳定性和效率。
(三)在线和离线自我改进:不同场景下的成长策略
智能体的自我改进可以分为在线和离线两种方式,它们就像智能体在不同场景下的成长策略。
在线自我改进就像是智能体在“实战”中不断成长,它根据实时反馈动态调整自己的行为。例如,通过迭代反馈和自我反思,智能体可以识别错误并及时进行修正;在多智能体系统中,智能体之间的主动探索和协作可以帮助它们发现新的模式和改进工作流;实时奖励塑造则使智能体能够根据用户的交互动态调整奖励机制,更好地适应环境变化。
离线自我改进则像是智能体在“训练营”中进行集中训练,通过在高质量的数据集上进行批量训练和微调,智能体可以提高自己的泛化能力。例如,通过检索增强生成技术,智能体可以更好地利用外部知识来提升推理能力;元优化则可以优化智能体的组件和算法,使智能体能够更好地适应新的问题领域;系统的奖励模型校准可以确保奖励函数更加准确地反映任务的复杂性,提高智能体的性能。
此外,还有一些混合方法结合了在线和离线自我改进的优点,先通过离线预训练建立强大的基础能力,然后在在线阶段根据实时反馈进行动态调整,最后通过定期的离线整合来巩固和提升能力,使智能体在复杂的现实场景中能够更好地应对挑战。
五、智能体的协作与进化:群体智慧的力量
在广袤的数字天地中,单枪匹马的智能体宛如势单力薄的个体,在复杂任务面前往往力不从心。多智能体系统的出现,如同构建了一个紧密协作的团体,通过智能体间的协同,攻克了诸多难题,同时也让智能体在这一过程中实现进化。
(一)多智能体系统的架构搭建:打造高效协作网络
搭建多智能体系统,如同构建一座井然有序的城市。集中式架构中,存在一个“总指挥”,它掌控着系统的全局信息,对所有智能体发号施令,就像城市的中央调度中心。在物流配送模拟系统里,中央智能体收集各个配送点的订单信息、车辆状态以及交通路况,据此为每个配送智能体规划最优路线,确保配送高效有序。但这种架构的弊端也很明显,一旦“总指挥”出现故障,整个系统就会陷入瘫痪,如同城市的调度中心失灵,交通会陷入混乱。
而分布式架构则截然不同,它更像一个去中心化的社区,每个智能体都拥有一定的自主权,它们通过局部信息的交互与协作来完成任务。在分布式能源管理系统中,各个发电智能体和用电智能体相互独立又彼此协作。发电智能体根据自身的发电能力和周边用电需求,自主调整发电量;用电智能体则根据电价和自身需求,合理安排用电时间。这种架构的优势在于,即便部分智能体出现故障,其他智能体仍能继续工作,维持系统的基本运行,大大提高了系统的鲁棒性。
(二)多智能体协作的策略:携手攻克难题
多智能体在协作时,有多种策略可供选择,就像团队在完成任务时会制定不同的战术。任务分配策略如同给团队成员分工,合理的任务分配能显著提高工作效率。在智能工厂中,当有一批产品需要生产时,任务分配智能体会根据每个生产智能体的加工能力、当前任务负载等因素,将生产任务合理分配下去,确保生产过程高效顺畅。
协调策略则注重智能体间的动作配合,避免冲突。在多机器人搬运任务中,搬运机器人需要协调彼此的行动,防止在搬运过程中发生碰撞。它们通过实时通信,调整各自的位置和移动速度,有序地将货物搬运到指定地点。
合作学习策略让智能体在协作中共同进步。在一个多智能体游戏场景中,智能体们通过不断地交流和合作,学习到新的游戏策略。它们分享自己在游戏中的经验和发现,共同探索最优的游戏玩法,实现整体性能的提升。
(三)多智能体系统的进化:在协作中不断蜕变
多智能体系统在运行过程中,会不断进化以适应环境的变化,就像生物在自然选择中不断进化一样。遗传算法为多智能体系统的进化提供了一种思路,它模拟生物的遗传和进化过程,通过选择、交叉和变异等操作,对智能体的策略进行优化。在一个模拟生态系统中,每个智能体代表一种生物,它们通过遗传算法不断进化,适应环境的变化,有的智能体进化出更高效的觅食策略,有的智能体则进化出更强的防御能力。
强化学习同样在多智能体系统的进化中发挥着重要作用。智能体通过与环境的交互,根据获得的奖励或惩罚信号,调整自己的行为策略。在自动驾驶场景中,多个自动驾驶智能体通过强化学习,不断优化自己的驾驶行为,学会在复杂的交通环境中与其他车辆和行人和谐共处,提高驾驶的安全性和效率。
六、大语言模型驱动智能体的发展局限与突破方向
尽管大语言模型驱动的智能体已经取得了显著的进展,但前行的道路上依然存在诸多障碍,不过这也为技术的进一步发展指明了方向。
(一)数据质量与数量的双重困境:夯实发展根基
数据是大语言模型驱动智能体的“燃料”,然而,当前数据质量和数量方面的问题,严重制约了智能体的发展。一方面,数据噪声如同一粒沙子,影响了模型训练的效果。在文本数据中,可能存在拼写错误、语法错误以及虚假信息,这些噪声会误导模型的学习,使其生成不准确的结果。另一方面,特定领域的数据稀缺,如同巧妇难为无米之炊,限制了智能体在这些领域的应用。例如,在一些小众的科研领域,由于数据量有限,智能体难以学习到足够的专业知识,无法提供有价值的见解。
为了解决这些问题,数据清洗技术应运而生,它就像数据的“清洁工”,通过去除噪声、纠正错误,提高数据的质量。同时,数据增强技术则如同数据的“复制机”,通过对现有数据进行变换和扩充,增加数据的数量。例如,对图像数据进行旋转、缩放等操作,生成更多的训练样本,从而提升模型的泛化能力。
(二)模型性能与资源消耗的矛盾:寻求平衡之道
随着模型规模的不断增大,其性能得到了显著提升,但同时也带来了资源消耗过高的问题,这就像一辆高性能跑车,虽然速度快,但油耗也高。大语言模型在训练和推理过程中,需要消耗大量的计算资源和能源,这不仅增加了使用成本,还对环境造成了压力。
为了缓解这一矛盾,模型压缩技术成为了研究的热点。模型压缩就像给模型“瘦身”,通过剪枝、量化等操作,去除模型中的冗余参数,降低模型的复杂度,同时保持模型的性能。例如,通过剪枝技术,去除神经网络中不重要的连接,减少模型的计算量;通过量化技术,将模型参数用更低精度的数据表示,降低存储和计算成本。
此外,模型优化算法的改进也能提高模型的效率。新的优化算法就像更高效的引擎,能够在减少计算资源消耗的同时,加快模型的训练速度,使模型更快地收敛到最优解。
(三)人机交互的深度与自然度不足:迈向和谐共生
目前,大语言模型驱动的智能体在人机交互方面,还存在深度和自然度不足的问题。智能体与人类的对话,有时显得生硬和机械,无法真正理解人类的情感和意图,就像两个缺乏默契的交流者。
为了改善这一状况,情感计算技术逐渐兴起。情感计算就像赋予智能体一颗“同理心”,让它能够感知人类的情感状态,并做出相应的回应。通过分析人类的语音、表情和文本等多模态信息,智能体可以判断人类的情绪,如高兴、悲伤、愤怒等,并以合适的方式进行互动。
同时,知识图谱技术的应用,能让智能体更好地理解人类语言的含义。知识图谱就像一本百科全书,将各种知识以结构化的形式组织起来,智能体通过查询知识图谱,能够获取更准确的信息,从而在对话中给出更有针对性的回答,使人机交互更加自然和流畅。
七、大语言模型驱动智能体的未来图景:点亮无限可能
展望未来,大语言模型驱动的智能体将在各个领域掀起新的变革,为人类社会带来前所未有的机遇。
(一)生活领域:打造便捷生活新体验
在日常生活中,智能体将成为人们的贴心助手。清晨,智能体根据你的日程安排和偏好,为你制定早餐计划,并通过智能家居设备准备早餐。出行时,它能实时了解交通状况,为你规划最优路线,并预约合适的交通工具。购物时,智能体根据你的历史购买记录和当前需求,为你推荐合适的商品,甚至帮你完成下单操作。闲暇时光,它陪你玩游戏、听音乐、看电影,丰富你的娱乐生活,让生活变得更加便捷和有趣。
(二)科研领域:加速科学探索新征程
在科研领域,智能体将成为科学家的得力伙伴。在实验设计阶段,智能体根据已有的研究成果和数据,为科学家提供实验方案的建议,帮助他们节省时间和精力。在数据处理和分析阶段,智能体能够快速处理海量的数据,发现数据中的规律和潜在关系,为科学研究提供有价值的线索。在论文撰写阶段,智能体协助科学家组织思路、撰写论文,提高论文的质量和效率,加速科学探索的进程。
(三)产业领域:推动产业升级新变革
在产业领域,智能体将推动传统产业的数字化转型和升级。在制造业中,智能体实现生产过程的自动化和智能化控制,提高生产效率和产品质量,降低生产成本。在服务业中,智能体提供个性化的服务,提升客户满意度和忠诚度。在农业中,智能体帮助农民进行农作物的种植、灌溉和病虫害防治,提高农业生产的智能化水平,促进产业的可持续发展。
大语言模型驱动的智能体,正以蓬勃的发展态势,重塑着我们的生活、工作和学习方式。尽管前行的道路充满挑战,但随着技术的不断进步和创新,智能体必将为人类社会创造更加美好的未来 。
作者:张长旺,图源:旺知识
参考资料
- • 标题:Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems
- • 作者:Bang Liu, Xinfeng Li, Jiayi Zhang, Jinlin Wang, Tanjin He, Sirui Hong, Hongzhang Liu, Shaokun Zhang, Kaitao Song, Kunlun Zhu, Yuheng Cheng, Suyuchen Wang, Xiaoqiang Wang, Yuyu Luo, Haibo Jin, Peiyan Zhang, Ollie Liu, Jiaqi Chen, Huan Zhang, Zhaoyang Yu, Haochen Shi, Boyan Li, Dekun Wu, Fengwei Teng, Xiaojun Jia, Jiawei Xu, Jinyu Xiang, Yizhang Lin, Tianming Liu, Tongliang Liu, Yu Su, Huan Sun, Glen Berseth, Jianyun Nie, Ian Foster, Logan Ward, Qingyun Wu, Yu Gu, Mingchen Zhuge, Xiangru Tang, Haohan Wang, Jiaxuan You, Chi Wang, Jian Pei, Qiang Yang, Xiaoliang Qi, Chenglin Wu
- • 标签:人工智能、大语言模型、智能体
- • 概述:对大语言模型驱动的智能体进行了全面调研,从多方面阐述其原理、设计、进化等内容,并探讨了面临的挑战和未来发展方向。
- • 链接:https://arxiv.org/pdf/2504.01990
|
|