Manus真的那么牛吗？

Manus真的那么牛吗？

发表于昨天 13:41

没有邀请码，上周搭建了一个manus的平替:OpenManus，体验的方面，烂的一批。或许manus能好一点吧

发表于昨天 13:53

差不多得了，当然并没有你期待和从各种自媒体上宣传的那么牛，只是一款非常普通的AI Agent产品而已罢了。
现在热度其实已经几乎下降很多了，正好验证了我之前评价大模型的时候经常说的，大模型时代，一款产品到底如何，护城河到底有没有，护城河的水有多深，城墙有多高，从来都不是推广营销费用多少，也不是找到了多少家媒体转载，更不是找了多少大V写软文。
而是实打实技术驱动带来的用户体验决定的。很多大模型和基于大模型开发的 AI agent 产品这场竞赛，最终比拼的还是模型和产品实力，经过一段时间后能真正取得了多少用户，而不是花多少钱做了推广，用户不傻。
其实年初以来的Deepseek大模型就是最好的证明。DeepSeek 直接免费让全世界用户用上了o1级别的推理模型，让很多之前对大模型不太熟悉或者不太认可的人，第一次感受到了推理模型的魅力。用户们看着CoT推理过程，感受到test time scaling生成的高质量结果，大概率是会认可DeepSeek这种世界级sota模型的能力。
相比之下，Manus之所以能火起来，主要原因跟技术无关。而是Manus 所对标的OpenAI AI Agent 产品，发布后固然能给人眼前一亮的感觉，但是很遗憾，订阅价格实在太贵了，并没有开放免费使用，所以这类产品并不为大众所熟悉。于是相对于对话式大模型能被普通人广泛接触并日常使用，而大家对AI Agent产品并没有多少概念和使用体验，所以很容易被大量推广和新闻标题误导。
Manus 的真正能力上限，正是对标的OpenAI 公司的 AI Agent 产品所决定的。我们以 Operator，——这个非常典型的 CUA（Computer-Using Agent）——为例，从 Technical Report上就可以看出来尽管Test-time scaling在agent上效果非常明显，在OSWorld benchmark上，可以经过 100 步的 test time 推理，使得准确率达到36.4%了。
但是这个准确率其实不高，特别是对于一个面向 GUI 的 AI Agent 来说，人类准确率大概是72.4%，这相当于两倍的 Operator 的准确率。哪怕这个准确率，已经是 OpenAI 公司最先进 AI Agent 所能达到的水平了。
这也是为什么 OpenAI 会在官网上坚持声称 Operator仍是一款需要大量改进和完善的产品，仍是在早期研究阶段。实际上短期内AI Agent能力肯定还是很有限，需要不断迭代。在任务执行与适应性方面，尽管基于强化学习后训练的reasoning model发展迅速，但仍面临复杂任务规划的困难，许多日常操作往往超出其能力范围。由于具体使用条件千差万别，out of distribution的情况极易出现，因此AI Agent的适应性和泛化性仍需进一步提升。在多模态感知与操作层面，AI Agent可能因GUI特征提取错误而误识别屏幕上的按钮、文本框等元素，导致操作失误，尤其在需要精确输入数值的场景（如调整图像亮度、对比度）中更容易出错。
此外，由于训练数据training datasets的局限性和限制，AI Agent在特定场景下往往缺乏相应的操作知识，从而导致直接失败。还要再加上，大模型联网搜索时的信息污染问题也不容忽视，这会导致如DeepSeek等大模型生成错误结果，同时还需面对大模型生成过程中固有的幻觉（hallucination）问题。这些局限性在当前阶段直接制约了AI Agent在日常真实场景中的使用。
毕竟这个准确率的 AI Agent 不会给用户多少耐心来试错，几次不能得出正确结果后，往往只会被用户当成一个玩具，简单体验一下，后面就很少使用了。
当然了，尽管现在这类AI Agent产品，在实际使用场景中的准确率并不高，但正如我之前一直预测的那样，2025年本来就会是开启AI Agent产品百花齐放、百家争鸣的时代，随着基于推理模型为基座模型的 AI agent 不断发展进步，将来必然会被越来越多的普通用户所熟知和使用，所以，这方面的人才需求量，有很大概率是不断增加的，能在这个趋势中掌握大模型及应用开发的相关知识，是非常关键的。
正好啊，推荐大家趁此机会，去学习一下知乎知学堂推出了这个大模型应用开发公开课程，里面会对大模型相关的基础知识进行非常详细和全面地讲解，同时，也有利于大家学习和理解AI Agent产品的应用开发技术。课程链接如下：
如果学习了这个课程，对于掌握咱们这篇文章中分析的Manus等这类AI Agent产品的开发知识，肯定会有所裨益的。
还有一个侧面来证明 Manus 没有任何护城河，就是看复刻的难度，Manus这类项目没有任何护城河，如果一款 AI Agent 产品因为自身并没有独立的SOTA多模态基座模型，也没有强大的推理模型，所以被复刻是很容易的。

所以我们可以看到迅速出现OpenManus和OWL 等复刻项目，而且可以预见，接下来会更多，比如 OpenManus 项目后面又后续更新了OpenManus-RL，我看Github上stars数量还挺多的。总得来说，2025 年大概率是 AI Agent 的爆发之年，让我们拭目以待。

发表于昨天 14:05

打个比方，人都说西施漂亮，但我认为如果一个人真的人为西施漂亮，那这个人基本是个傻帽。如果是电视上看到的，那不是西施漂亮，那是演员漂亮；如果是看图像有其那种手绘的，那也不代表西施本人
所以，manus一个道理，牛逼啥了？牛逼在哪儿了？都是道听途说，说不定吹的那帮人还是托儿了，反正这社会，指鹿为马的事儿多了，不可信
从其他角度看，这破玩意申请了快半个月了，鸟动静没有，说是测试阶段，既然测试，广告而知何意？既然广而告之，又何必定义为测试。好比国家足球队，打世界杯之前，吹的自己多牛逼，能进决赛圈，结果连个越南泰国蕞尔小国都干不过，居心是啥，说白就是博关注求利益，就是炒作，反正没实际用之前就这么认为的，最后下个结论，不地道没德行

发表于昨天 14:20

2023 年用过他家的前身 Monica，基本就是调用各种 AI 的 API 实现，剩下一堆开源的不好用不稳定的东西。在国内没有同类替代品的时候还算有点用，花 700 开了个会员使用高级功能，用了一个多月整个软件不支持中文了。气死

发表于昨天 14:31

首先，我们先简单的回溯一下的Manus现在的情况。
   在Manus只有一个英文官网，和一个DC社群，然后就是大量自媒体无脑推荐，以一种爽文的形式来宣传Manus，疯狂鼓吹，然后就引起了传统媒体的关注，从而引爆全文，撬动流量之后的Manus更是以5W一个邀请码出现在咸鱼，相当火爆，以至于大家都在问它是谁，它怎么做到的，它真的这么牛之类的问题。
      从最近的消息看，它在发布的同时，居然发了一个加密币，所以，破案了，这场联动其实都只是为虚拟币造势，一场看似造神实则割韭菜的行为，直接有被伤害到。以至于现在大家做AI都不想讲这个东西。显得很没水平，也很没良心。
      虽然负面情绪爆棚，但是从这个事件里面其实也能明确一点，大家讨论Manus多牛，其实是在讨论AI工具到底能牛成什么样。
      Manus看起来是一个已经落地的AI产品，能够覆盖多种任务场景，所以大家都在期待这么一个综合性的工具，能够提升效率。今年确实是AI元年，至于哪一家能够手搓出这样一个综合性的产品，基本可以断定就是通吃市场了，从Manus这个事件里面就能窥探一二，一个只有视频的半成品都能有这么大的关注度，如果产品真的落地，不敢细想这数钱得数的多欢乐。
当然，Manus的最牛的一点，不是技术，不是营销，而是让很多人看到一片金矿，这几年真正意义上的蓝海。
   也得益于大模型的快速发展，让现在模型工具化具有了可行性，只是大家都还在摸索，AI产品的边界或者方向，因为AI实在是太新了，它和传统的IT行业不同，它需要跨界，需要人去判断AI的内容是否具有可用性，需要大量的经验积累之后，再去定义AI产品。
   这也是为什么去年一直是程序开发方面的AI产品更快的落地，因为现在倒腾AI产品的主要人群还是开发，未来会有更多的人来拥抱AI，开发出不同行业的AI产品，Manus只是点出了综合性Agent的可能性。
   目前主流AI的产品思路，个人理解可以是两个方向，一种是自主的Agent，一种是工作流主导的Agent，前者给一个任务，他自己就可以拆解任务调用资源去执行，并且能持续优化，整个任务过程不可控，可存在一些奇怪的结果，但是这样的Agent可以持续调整，直到输出正确；后者工作流主导的Agent，则是人为去定义工作流，在流程里让大模型去执行一个动作，这个任务实现全程可控，但是只能针对非常细节的工作，需要很强的逻辑梳理能力，两者都不是一条完美的解决方案。目前用的较多的应该是第二种，工作流主导的Agent。
   就像Manus一样，通过200行Python脚本指挥17个已经建好的工具去完成任务，把prmopt的作用发挥到极致，就像我那个啥都不懂的二舅在家里用17个专业人士盖了一套房子起来，他甚至不知道承重墙是啥，就这么粗暴的盖楼。我总担心二舅的房子会塌，因为结构不对，但我妈就不一样，我妈觉得那个楼看着挺好的，二舅不懂没事，能出东西就行。这也是现在多数外行看到的，只要有个产品，如果不是自己的专业领域也不太懂，看来其很厉害就行。
      Manus和Deepseek不同，Deepseek的火爆是受到大家广泛的真实使用后的认可，Manus就纯是一把虚火，大家谁都没用过，就看视频，确实那么回事，极少人从使用的角度去评估这个。
      越是了解AI行业之后，越难认可Manus真的牛，这个观点。特别是现在在自己已经开始手搓一些小工具之后。我觉得任何一个行业从业人员，在了解手搓AI小玩具的流程之后，出来的产品都会比Manus强，越资深越强。都不说现在智驾行业的东西了，就以自媒体为例，多数人都表示，AI会废了文科生，但是以文科生为代表的内容产出者把AI工具都玩出花了，批量抓取竞品的内容，用AI自动化分析，并结合竞品，热点自动产出内容，有点心的人可能还审核一下，不用心的人直接就发账号了，效果也非常明显。我曾经看着一个账号，用deepseek调整内容之后，浏览量直接从千级别涨到十万级别。你说Manus也能做，我信，但是针对某个账号的准确的运营，我就不信了。这种只有资深的自媒体人能够做到，搭框架确实AI强，在细节的优化之上，人是永远强于AI，AI只是一个工具。
   我一直在鼓励身边担心自己被优化的人，都去做一些AI小玩具，但是每个人普遍的反馈都是不会大模型，不知道算法，调参太麻烦，等着现成的产品，根本没必要，因为没有人比你更知道你想做的产品需要怎么解决问题。所以，这里给大家推荐知乎知学堂的大模型AI课程。
   课程会介绍模型的一些基本知识，还有一些原理，但是放心，不会让你去手搓模型，没必要也没意义，重点是怎么用，用什么方法可以达成目的，这才是重点，其次，学费其实是个很好的筛选门槛，你的同学必定是走在前沿的小伙伴，且在财力方面尚可的人，这些都是一些附加价值。
比如说这次Manus出来之后，大家都会频繁交流，基本判断这个产品言过其实，目前越扒越多的料也证实是这样的，更何况还有好些OpenManus，直接把Manus按在地上摩擦。其实就听个脉络就好，然后自己上手做几个小玩具，有点手感之后，再做一些复杂的东西。任何课都只是入门，每个人学习能力也不同，听课的目的也不一样，想清楚之后再去听课的感觉，和焦虑之下的听课的感觉完全不同。也希望朋友能够慎重。

Manus真的那么牛吗？

本周热门