Manus 是真正意义上的智能体吗？

Manus 是真正意义上的智能体吗？

发表于昨天 14:00

Manus 被宣传为全球首款真正意义上的通用AI智能体（AI Agent），它能够独立完成从规划、执行到交付成果的全流程任务，这标志着国产AI在智能体领域的重要尝试。
Manus的技术核心在于其多代理架构（Multiple Agent Architecture），这种架构允许任务被拆分为规划、执行和验证等子模块，每个代理基于独立的语言模型运行，并通过协同工作来完成复杂任务。官方宣称，Manus能够在GAIA基准测试中超越了OpenAI的同类模型，取得了SOTA的成绩，这意味着它在解决真实世界问题的能力上达到了顶尖水平此外，Manus的功能特性包括自主任务执行能力，如代码编写、数据分析、可视化图表生成等；覆盖多个领域的处理能力，例如金融、教育、编程、创意设计等；以及工具调用与协作能力，能够直接操作浏览器、代码编辑器等工具。这些特性表明Manus不仅仅是一个简单的对话式AI助手，而是一个可以执行具体任务并产生实际结果的智能体。
尽管Manus展示了强大的自主性和跨平台操作能力,但在更广泛的场景下是否也能保持同样的效率还有待验证

发表于昨天 14:10

智能体最基本需要能帮助人类工作。但是就目前看到的测试情况，Manus还不具备这样的能力

发表于昨天 14:25

宣传中的“Manus”，通过他们的各种案例，确实是智能体
“智能体”是什么？

英文叫AI Agent，Open AI对它的定义是具有自主理解、感知、规划、记忆和使用工具的能力，有独立思考和行动能力，并以大脑为驱动。
AI Agent不只是大多数人接触到的AI工具类软件程序，如文心一言、通义千问等等，还可以是AI机器人、乃至虚拟角色都可能是。

比尔盖茨认为AI Agent不仅将改变人机交互方式，还将颠覆软件行业。在他的观点里，对AI Agent相当赞美。可以看出，人机交互会被彻底打破。

最直观的体验是各位手机内置的AI功能，例如小米的小爱同学，背后是大模型。
iPhone的Apple智能，只是在国内消费市场还暂时不能用。
需要了解的是当前大部分手机的AI智能仅限于工具类型，接下来的场景应该是植入手机的一个AI程序员，随时随刻能够通过调用手机数据实现用户各种各样的需求。
爆火的智能体---OpenAI发布“智能体API”、国产的智能体“manus”

API

熟悉大模型应用开发的人都知道，当今不少大模型提供商的服务都兼容 OpenAI 之前提出的 Chat Completions API，其对行业标准化做出了非常大的贡献。而今发布的 Responses API⁠ 或许也将成为智能体响应标准化的重要组成部分。
manus

Manus 是一款通用型 AI 助手，能将想法转化为行动：不止于思考，更注重成果。Manus 擅长处理工作与生活中的各类任务，在你安心休息的同时，一切都能妥善完成。
<hr/>Manus 是真正意义上的智能体吗？

目前来讲，我觉得还是要打个问号。

网上的声音太多，何不让子弹飞一会

发表于昨天 14:37

智能体一般分为两种，一种自研模型+智能体。
另一种是集成摸型+智能体。
前者像文心一言，混元，通义千问，星野。
后者很多，一般基于chatgpt，grok，gemini，claude，donald，deepseek。
后者的智能体，虽然很多都不是基于自家模型，但是，像群聊，组队模式，拟声等也可以算眼前一亮！不过，终归不是自己训练的模型，现在很多集成模型也在想办法训练自己的AI！
完全基于别人的AI的智能体终究还是比不过自己训练的！
不过，后者经常被查处是肯定的，毕竟总是有人开发不符合咱们法律法规的那种智能体平台！

发表于昨天 14:48

在讨论Manus是不是真正的智能体之前，我觉得有必要先讨论一下到底什么是智能体？
在一篇名为AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION的文章中，AI Agent被定义为一个复杂的、多维度的智能系统，是能够跨越物理世界和虚拟世界，并具备高度交互和适应能力的智能实体。

智能体通过整合大语言模型和视觉语言模型，能够处理包括视觉、语言、音频等不同类型的数据，agent不只是被动的接收信息，更要具备主动理解环境、根据信息进行推理、制定任务计划等功能，通过持续的学习，还要不断优化策略。
我理解就是这个智能体不能简简单单完成一个Chatbot的工作，而是要根据用户输入的prompt，以及自己能够收集到的所有信息，尽量完善的实现用户的要求。用户给出的prompt可能有不明确的地方，可能有忽略的地方，但是在给出“任务成品”的时候，agent要自行进行补充和完善。
那么看看Manus是否具备智能体的这些特征？
当然我并没有邀请码……只能根据Manus放出的那些cases简单分析一下了。

从它的精选cases页面来看，Manus给人的感觉更像是一个数据分析和可视化工具。
虽然它展示了处理不同领域任务的能力，比如旅行分析、股票研究、业务采购和保险比较等，但这些功能其实更接近于传统的数据处理和报告生成工具。
这些工作本质上是一个高度结构化和规则驱动的数据处理系统，说白了，其实已经有成熟的算法和模板可以用来处理输入数据，而生成的结果也可以比较容易的进行标准化和可视化处理。
虽然在我们外行人看起来，虚拟机“刷刷刷刷”的生成一堆代码，调用一堆网页，对数据进行加加减减处理啥的，效果挺炫酷的，但是这些操作其实看起来更像是一个精密的计算机程序，按照既定流程，在严格定义的规则框架内工作，并没有“自主”创造出啥来。
我想，这大概也是Github上迅速会出来一个名为OpenManus项目的原因吧。
我看了几个Manus的案例处理过程，我觉得吧，一个优秀的AI助手应当具备实时交互和透明的进度反馈机制，让用户能够随时了解任务的执行状态、中间结果，并能及时提出额外的输入或调整需求。然鹅，据我观察，从Manus给出的官方案例来看，目前好像并不具备这样实时交互的功能。

当前的界面给用户的感受是一个“黑盒”过程，用户提交需求后，系统就开始处理，但处理过程是不透明的。用户只能在右侧虚拟机的不断闪动中，大概猜测进行到了哪一步，无法知道预计什么时候完成、是否遇到了问题等等。比如说这个旅行规划的设计，万一在系统设计到一半时，我突然发现某个景点是我不想去的，并没有途径“告诉”系统进行优化，而只能呆呆的等待它执行完成，然后从头开始重新写一遍prompt，再次呆呆的等待执行结束。
从这个角度上来说，我觉得Manus并不够“智能”，称之为智能体似乎有些牵强。
不过，Manus却也给我们打工人提供了一次震撼。这些报表分析、产品研究之类的任务，现在都是由“人”来完成的，而Manus向我们证明，这些比较程式化的工作，未来完全有可能由AI代劳。想要在这些传统工作中与AI一较长短是十分不明智的，毕竟一个人无论如何也赢不过一个“人+AI”的超级组合。所以最好的选择是尽快学习大模型，掌握大模型，应用大模型，建议看看知乎知学堂的大模型应用开发公开课，从模型原理讲到落地应用，不但让我们能够了解强化学习和MoE，还能帮我们找到自己的工作与大模型的结合点，迅速提升工作效率。此外，作为未来很长一段时间内的科技主流，越早掌握大模型，就能越早让老板找到给你升职加薪的理由，不但不用惧怕中年危机，或许还会得到中年腾飞的机会。
即使没有看起来很炫酷的智能体，只要掌握了大模型的使用技巧，我们自己同样能够设计出高效的流程，让大模型好好帮我们干活，你会发现，不要加班费的大模型竟然如此可爱~
其实对于Manus来说，除了演示案例中那些看起来很炫酷的执行流程外，“到底依托于哪个大模型”才是影响执行效果的最大因素。
不同大模型在知识表征、推理能力和跨模态理解上存在着显著差异，这些差异会直接影响应用的输出质量。
比如在处理case中涉及到的那些工作时，模型要能够读取不同类型的数据，还要把这些数据进行整合分析，根据分析结果再进行推理，按照用户输入的prompt的要求进行结果输出。在这个过程中，不同模型的处理结果，恐怕比人和狗的差距都大。
选择了对的模型，结果合理，用户开心；选择了不太行的模型，结果一本正经的胡说八道，用户卸载应用了事。
从那些效果不错的cases来看，或许跟DeepSeek有着密不可分的关系。
不过同时也可以发现，那些cases都是一些计划撰写或者数据分析，并不涉及其他模态的数据，比如音频，比如视频。
当然，一方面应该是受到算力所限，不过另一方面，我猜测可能跟Manus所依托的大模型并不具备其他模态数据的处理能力有关。
而且根据我自己使用大模型的感受来看，我觉得还有一个问题恐怕需要Manus克服，就是输出稳定性这个问题。
在专业分析和数据处理场景中，结果的一致性和可重复性是核心要求。
比如说一个财务分析报告或者技术研究报告，如果每次生成的内容存在显著差异，或者稍微改动prompt后，重新生成的内容与之前大不相同，那将严重损害用户对agent的信任。尤其对于需要精确、可靠输出的商业应用来说，这种波动性是不可接受的。
大模型生成内容的这种不稳定性是由于生成过程中的随机采样机制造成的。
我们都知道，大模型输出的内容，实际上是一个概率输出的过程。既然有概率，那么这个过程必然包含随机性。虽然固定随机种子数，可以稍微减小一部分随机性，让结果变得尽量一致，但是想要完全消除这种随机性，却是不可能的。
那么，要是想得到比较好的输出结果，就需要找到模型灵活性与确定性之间的平衡，这个过程非常微妙，很难把握。
“过度约束”可能会损害模型的创造性和适应性，导致输出的结果死板生硬，难以令人满意；而缺乏约束则会导致不可预测的输出，甚至利用大模型一本正经胡说八道的能力，可能会对用户造成误导。
总之，虽然Manus是一款基于大模型的相当不错的应用，但是我觉得称之为AI智能体有些名不副实，毕竟只能输出文字或简单的报表，距离真正的AGI智能体还有很长的路要走。

Manus 是真正意义上的智能体吗？

本周热门