Manus真的那么牛吗?

Manus真的那么牛吗?
收藏者
0
被浏览
96

5 个回答

ligb LV

发表于 昨天 13:41

没有邀请码,上周搭建了一个manus的平替:OpenManus,体验的方面,烂的一批。或许manus能好一点吧

steking LV

发表于 昨天 13:53

差不多得了,当然并没有你期待和从各种自媒体上宣传的那么牛,只是一款非常普通的AI Agent产品而已罢了。
现在热度其实已经几乎下降很多了,正好验证了我之前评价大模型的时候经常说的,大模型时代,一款产品到底如何,护城河到底有没有,护城河的水有多深,城墙有多高,从来都不是推广营销费用多少,也不是找到了多少家媒体转载,更不是找了多少大V写软文。
而是实打实技术驱动带来的用户体验决定的。很多大模型和基于大模型开发的 AI agent 产品这场竞赛,最终比拼的还是模型和产品实力,经过一段时间后能真正取得了多少用户,而不是花多少钱做了推广,用户不傻。
其实年初以来的Deepseek大模型就是最好的证明。DeepSeek 直接免费让全世界用户用上了o1级别的推理模型,让很多之前对大模型不太熟悉或者不太认可的人,第一次感受到了推理模型的魅力。用户们看着CoT推理过程,感受到test time scaling生成的高质量结果,大概率是会认可DeepSeek这种世界级sota模型的能力。
相比之下,Manus之所以能火起来,主要原因跟技术无关。而是Manus 所对标的OpenAI AI Agent 产品,发布后固然能给人眼前一亮的感觉,但是很遗憾,订阅价格实在太贵了,并没有开放免费使用,所以这类产品并不为大众所熟悉。于是相对于对话式大模型能被普通人广泛接触并日常使用,而大家对AI Agent产品并没有多少概念和使用体验,所以很容易被大量推广和新闻标题误导。
Manus 的真正能力上限,正是对标的OpenAI 公司的 AI Agent 产品所决定的。我们以 Operator,——这个非常典型的 CUA(Computer-Using Agent)——为例,从 Technical Report上就可以看出来尽管Test-time scaling在agent上效果非常明显,在OSWorld benchmark上,可以经过 100 步的 test time 推理,使得准确率达到36.4%了。
但是这个准确率其实不高,特别是对于一个面向 GUI 的 AI Agent 来说,人类准确率大概是72.4%,这相当于两倍的 Operator 的准确率。哪怕这个准确率,已经是 OpenAI 公司最先进 AI Agent 所能达到的水平了。
这也是为什么 OpenAI 会在官网上坚持声称 Operator仍是一款需要大量改进和完善的产品,仍是在早期研究阶段。实际上短期内AI Agent能力肯定还是很有限,需要不断迭代。在任务执行与适应性方面,尽管基于强化学习后训练的reasoning model发展迅速,但仍面临复杂任务规划的困难,许多日常操作往往超出其能力范围。由于具体使用条件千差万别,out of distribution的情况极易出现,因此AI Agent的适应性和泛化性仍需进一步提升。在多模态感知与操作层面,AI Agent可能因GUI特征提取错误而误识别屏幕上的按钮、文本框等元素,导致操作失误,尤其在需要精确输入数值的场景(如调整图像亮度、对比度)中更容易出错。
此外,由于训练数据training datasets的局限性和限制,AI Agent在特定场景下往往缺乏相应的操作知识,从而导致直接失败。还要再加上,大模型联网搜索时的信息污染问题也不容忽视,这会导致如DeepSeek等大模型生成错误结果,同时还需面对大模型生成过程中固有的幻觉(hallucination)问题。这些局限性在当前阶段直接制约了AI Agent在日常真实场景中的使用。
毕竟这个准确率的 AI Agent 不会给用户多少耐心来试错,几次不能得出正确结果后,往往只会被用户当成一个玩具,简单体验一下,后面就很少使用了。
当然了,尽管现在这类AI Agent产品,在实际使用场景中的准确率并不高,但正如我之前一直预测的那样,2025年本来就会是开启AI Agent产品百花齐放、百家争鸣的时代,随着基于推理模型为基座模型的 AI agent 不断发展进步,将来必然会被越来越多的普通用户所熟知和使用,所以,这方面的人才需求量,有很大概率是不断增加的,能在这个趋势中掌握大模型及应用开发的相关知识,是非常关键的。
正好啊,推荐大家趁此机会,去学习一下知乎知学堂推出了这个大模型应用开发公开课程,里面会对大模型相关的基础知识进行非常详细和全面地讲解,同时,也有利于大家学习和理解AI Agent产品的应用开发技术。课程链接如下:
如果学习了这个课程,对于掌握咱们这篇文章中分析的Manus等这类AI Agent产品的开发知识,肯定会有所裨益的。
还有一个侧面来证明 Manus 没有任何护城河,就是看复刻的难度,Manus这类项目没有任何护城河,如果一款 AI Agent 产品因为自身并没有独立的SOTA多模态基座模型,也没有强大的推理模型,所以被复刻是很容易的。

Manus真的那么牛吗?-1.jpg

所以我们可以看到迅速出现OpenManus和OWL 等复刻项目,而且可以预见,接下来会更多,比如 OpenManus 项目后面又后续更新了OpenManus-RL,我看Github上stars数量还挺多的。总得来说,2025 年大概率是 AI Agent 的爆发之年,让我们拭目以待。

迟钝的小松鼠 LV

发表于 昨天 14:05

打个比方,人都说西施漂亮,但我认为如果一个人真的人为西施漂亮,那这个人基本是个傻帽。如果是电视上看到的,那不是西施漂亮,那是演员漂亮;如果是看图像有其那种手绘的,那也不代表西施本人
所以,manus一个道理,牛逼啥了?牛逼在哪儿了?都是道听途说,说不定吹的那帮人还是托儿了,反正这社会,指鹿为马的事儿多了,不可信
从其他角度看,这破玩意申请了快半个月了,鸟动静没有,说是测试阶段,既然测试,广告而知何意?既然广而告之,又何必定义为测试。好比国家足球队,打世界杯之前,吹的自己多牛逼,能进决赛圈,结果连个越南泰国蕞尔小国都干不过,居心是啥,说白就是博关注求利益,就是炒作,反正没实际用之前就这么认为的,最后下个结论,不地道没德行

limao100 LV

发表于 昨天 14:20

2023 年用过他家的前身 Monica,基本就是调用各种 AI 的 API 实现,剩下一堆开源的不好用不稳定的东西。在国内没有 同类替代品的时候还算有点用,花 700 开了个会员使用高级功能,用了一个多月整个软件不支持中文了。气死

wddp LV

发表于 昨天 14:31

首先,我们先简单的回溯一下的Manus现在的情况。
       在Manus只有一个英文官网,和一个DC社群,然后就是大量自媒体无脑推荐,以一种爽文的形式来宣传Manus,疯狂鼓吹,然后就引起了传统媒体的关注,从而引爆全文,撬动流量之后的Manus更是以5W一个邀请码出现在咸鱼,相当火爆,以至于大家都在问它是谁,它怎么做到的,它真的这么牛之类的问题。
        从最近的消息看,它在发布的同时,居然发了一个加密币,所以,破案了,这场联动其实都只是为虚拟币造势,一场看似造神实则割韭菜的行为,直接有被伤害到。以至于现在大家做AI都不想讲这个东西。显得很没水平,也很没良心。
        虽然负面情绪爆棚,但是从这个事件里面其实也能明确一点,大家讨论Manus多牛,其实是在讨论AI工具到底能牛成什么样。
        Manus看起来是一个已经落地的AI产品,能够覆盖多种任务场景,所以大家都在期待这么一个综合性的工具,能够提升效率。今年确实是AI元年,至于哪一家能够手搓出这样一个综合性的产品,基本可以断定就是通吃市场了,从Manus这个事件里面就能窥探一二,一个只有视频的半成品都能有这么大的关注度,如果产品真的落地,不敢细想这数钱得数的多欢乐。
当然,Manus的最牛的一点,不是技术,不是营销,而是让很多人看到一片金矿,这几年真正意义上的蓝海。
       也得益于大模型的快速发展,让现在模型工具化具有了可行性,只是大家都还在摸索,AI产品的边界或者方向,因为AI实在是太新了,它和传统的IT行业不同,它需要跨界,需要人去判断AI的内容是否具有可用性,需要大量的经验积累之后,再去定义AI产品。
       这也是为什么去年一直是程序开发方面的AI产品更快的落地,因为现在倒腾AI产品的主要人群还是开发,未来会有更多的人来拥抱AI,开发出不同行业的AI产品,Manus只是点出了综合性Agent的可能性。
       目前主流AI的产品思路,个人理解可以是两个方向,一种是自主的Agent,一种是工作流主导的Agent,前者给一个任务,他自己就可以拆解任务调用资源去执行,并且能持续优化,整个任务过程不可控,可存在一些奇怪的结果,但是这样的Agent可以持续调整,直到输出正确;后者工作流主导的Agent,则是人为去定义工作流,在流程里让大模型去执行一个动作,这个任务实现全程可控,但是只能针对非常细节的工作,需要很强的逻辑梳理能力,两者都不是一条完美的解决方案。目前用的较多的应该是第二种,工作流主导的Agent。
       就像Manus一样,通过200行Python脚本指挥17个已经建好的工具去完成任务,把prmopt的作用发挥到极致,就像我那个啥都不懂的二舅在家里用17个专业人士盖了一套房子起来,他甚至不知道承重墙是啥,就这么粗暴的盖楼。我总担心二舅的房子会塌,因为结构不对,但我妈就不一样,我妈觉得那个楼看着挺好的,二舅不懂没事,能出东西就行。这也是现在多数外行看到的,只要有个产品,如果不是自己的专业领域也不太懂,看来其很厉害就行。
        Manus和Deepseek不同,Deepseek的火爆是受到大家广泛的真实使用后的认可,Manus就纯是一把虚火,大家谁都没用过,就看视频,确实那么回事,极少人从使用的角度去评估这个。
        越是了解AI行业之后,越难认可Manus真的牛,这个观点。特别是现在在自己已经开始手搓一些小工具之后。我觉得任何一个行业从业人员,在了解手搓AI小玩具的流程之后,出来的产品都会比Manus强,越资深越强。都不说现在智驾行业的东西了,就以自媒体为例,多数人都表示,AI会废了文科生,但是以文科生为代表的内容产出者把AI工具都玩出花了,批量抓取竞品的内容,用AI自动化分析,并结合竞品,热点自动产出内容,有点心的人可能还审核一下,不用心的人直接就发账号了,效果也非常明显。我曾经看着一个账号,用deepseek调整内容之后,浏览量直接从千级别涨到十万级别。你说Manus也能做,我信,但是针对某个账号的准确的运营,我就不信了。这种只有资深的自媒体人能够做到,搭框架确实AI强,在细节的优化之上,人是永远强于AI,AI只是一个工具。
       我一直在鼓励身边担心自己被优化的人,都去做一些AI小玩具,但是每个人普遍的反馈都是不会大模型,不知道算法,调参太麻烦,等着现成的产品,根本没必要,因为没有人比你更知道你想做的产品需要怎么解决问题。所以,这里给大家推荐知乎知学堂的大模型AI课程。
       课程会介绍模型的一些基本知识,还有一些原理,但是放心,不会让你去手搓模型,没必要也没意义,重点是怎么用,用什么方法可以达成目的,这才是重点,其次,学费其实是个很好的筛选门槛,你的同学必定是走在前沿的小伙伴,且在财力方面尚可的人,这些都是一些附加价值。
   比如说这次Manus出来之后,大家都会频繁交流,基本判断这个产品言过其实,目前越扒越多的料也证实是这样的,更何况还有好些OpenManus,直接把Manus按在地上摩擦。其实就听个脉络就好,然后自己上手做几个小玩具,有点手感之后,再做一些复杂的东西。任何课都只是入门,每个人学习能力也不同,听课的目的也不一样,想清楚之后再去听课的感觉,和焦虑之下的听课的感觉完全不同。也希望朋友能够慎重。

您需要登录后才可以回帖 登录 | 立即注册