如何评价 Manus ?

如何评价 Manus ?
收藏者
0
被浏览
87

4 个回答

璀璨千阳 LV

发表于 昨天 14:07

骗子!

一江不理我 LV

发表于 昨天 14:20

看下qwen怎么回答这个问题

如何评价 Manus ?-1.jpg

透露小温馨 LV

发表于 昨天 14:31

回答提问:如何评价Manus,有什么功能吗?
Manus是一款通用型的智能体,全球首款。但不是最后一款,对于这些AI产品来说,没有最好而只有更好,所以我们老百姓就心态平了,知道和关注相关信息就可以,最好是源头信息而不是二手信息,不必深度研究,因为速度太快了,一两天就来个更厉害的,而自媒体用的尖叫体也放大了这种焦虑。
而邀请码的倒卖实际上也因为太快拿不到变现,一个官方通告,那些拉的邀请码群就不做声了,骗都来不及。再睡一觉,它就和你熟悉的软体合作了。
如果不是AI博主要去最先拿到信息,老百姓观望即可。
今天的新闻:3月13日,Manus宣布与阿里通义千问团队达成战略合作,旨在基于开源模型实现其全部功能,满足中文用户需求。

cuiweizuishuai LV

发表于 昨天 14:42

Manus是由Monica公司发布的全球首款通用型AI Agent产品,定位于一个性能强大的通用型助手,能够独立思考、规划并执行复杂任务,直接交付完整的任务成果。‌‌


如何评价 Manus ?-1.jpg


Manus 这个名字灵感来源于拉丁格言 “Mens et Manus”(意为“头脑与双手”),寓意它既能动脑也能动手。

Manus的核心能力
之前的AI助手(如ChatGPT)的局限在于能说不会做——它们擅长生成文本、回答问题,但无法将想法转化为实际成果。而Manus的定位是通用人工智能代理,核心价值在于自主完成任务。不过Manus并非完全从零构建,它整合了Anthropic的Claude、阿里巴巴的Qwen等现有模型,通过微调实现多任务处理。

根据官方资料,Manus可独立完成跨领域任务,包括复杂流程自动化(撰写报告、做表、分析数据、安排行程)、多模态操作(处理文本、图像、代码)以及异步执行(即使设备关闭,任务仍可在云端持续运行)。这一能力主要依赖:

多代理架构:规划代理、执行代理、验证代理分工协作,模仿人类任务分解逻辑。每个代理在独立虚拟机中运行,通过API或消息队列通信,任务在沙盒环境中执行以避免干扰,并通过云扩展实现高可扩展性。

工具集成:调用Web浏览器、代码编辑器、数据库等外部工具,实现端到端闭环。例如,在房地产研究中,Manus使用Python计算预算并生成详细报告;在股票分析中,它直接调用金融API获取数据并可视化结果。

自适应学习:从用户互动中优化流程,提供个性化响应。例如,用户多次要求旅行规划后,Manus会自动优先考虑偏好酒店或交通方式。

Manus在MetaAI等机构设计的GAIA基准测试中表现亮眼,得分超越OpenAI DeepResearch等主流模型:

Level1(基础任务):86.5%(DeepResearch为74.3%);
Level2(多步骤任务):70.1%(DeepResearch为69.1%);
Level3(复杂决策):48.7%(DeepResearch为44.4%)。


如何评价 Manus ?-2.jpg

这一测试的关键在于解决现实问题而非记忆知识。例如,Manus可以在无人工干预下完成某安全社区调查、预算计算和房源筛选的复合任务。测试结果证明,它的能力已从实验室走向真实场景。

Manusvs与传统AI模型比较
与ChatGPT、Gemini等模型相比,Manus的差异点在于结果导向。

功能对比
ChatGPT:生成旅行建议,但无法预订航班或生成行程表;
Manus:直接输出完整旅行计划,包括机票、酒店、预算报告,甚至实时更新突发状况(如天气变化)。类似案例还包括网站开发(从需求到代码的全流程执行)和课程设计(自动生成教学大纲与习题库)。这种端到端交付能力,使其更像数字员工,而非工具。

行业影响
Manus的潜力可以在多个领域显现:

企业端:替代传统SaaS工具,自动化市场调研、客户管理、代码调试。例如,某企业使用Manus自动筛选B2B供应商并绘制潜在客户地图。

个人端:简化旅行规划、财务管理和内容创作。用户仅需输入目标,Manus即可输出可执行方案,例如在纽约旅行规划中,它不仅推荐景点,还会自动预订门票并生成每日路线导航。

据开发者透露,早期用户评价Manus为永不休息的实习生——高效、精准,且无需培训成本。异步执行特性(云端持续运行任务)进一步释放了用户的时间,真正实现设置即遗忘。

Manus的突破并非偶然,背后是多模态学习、强化学习与大模型融合的技术趋势。面对这场变革,开发者若仅停留在表层应用,将难以抓住底层逻辑。掌握大模型实战能力,例如DeepSeek同款MLA架构解析、MoE模型调优技巧,以及制作Manus代理,已成为AI人才的必备技能。

在这里给大家推荐一个 AI 大模型公开课,课程由一线工程师讲解,系统讲解LLMs集成、任务分解算法、多代理系统架构等核心内容,并剖析Manus等案例的技术实现。



课程着眼于实用技能的掌握,帮助大家掌握扎实的AI技术基础,从容应对未来技术变革,在AI浪潮中行稳致远。大家也不必过度担忧硬件限制,算法与实践同样关键。与其焦虑观望,不如沉淀技术,厚积薄发,为长远发展打下坚实基础。



如何评价 Manus ?-3.jpg


Manus团队称它是通用AI代理,但距离真正的AGI仍有差距。

首先,Manus需明确指令才能行动,无法主动发现问题(如旅行计划遭遇天气突变)。其次生成内容基于模式复制,缺乏情感或原创性,例如写歌时只能模仿现有风格而非注入情感。最后它依赖现有工具(如浏览器),但不会发明新方法。正如用户评价:它很神奇,但没有独立思考。

在用户早期测试中显示,Manus远未达到宣传中的可靠性。例如,用户要求订购炸鸡三明治时,系统两次尝试后崩溃;预订纽约至日本航班时,仅提供航空公司链接,无法完成支付;在事实核查任务中,Manus频繁遗漏基本信息甚至犯低级错误。人工智能初创公司Pleias的创始人亚历山大·多里亚直言,它像是一个聪明的实习生,但常陷入无限循环。


如何评价 Manus ?-4.jpg


(图源X:Derya Unutmaz, MD)


有些专家批评Manus的封闭测试策略,认为它的突破性能力需独立验证。例如,GAIA测试的具体分数未完全公开,且访问受限阻碍了学术界评估。同时指出限制性访问可能是营销噱头。近期,Manus的X账号因涉及加密货币诈骗被暂停(不过现在已经恢复更新了)。

未来展望
Manus的下一步的方向或许是:其一,会连接更多第三方应用(如某公司内部系统、设计软件),打造无缝工作流。开发者透露,未来将支持视频分析与实时数据处理。其二,继续提升图像、视频的实时理解能力,例如通过监控摄像头自动识别生产线故障。其三,建立可解释的决策机制,避免黑箱风险。团队计划引入伦理审查模块,确保任务执行符合合规标准。

我认为Manus是起点,而非终点。Manus的意义在于证明AI是可以行动,更加证明了2025年是AI Agent元年。

你认为Manus最终会走向AGI,还是止步于高级工具?欢迎在评论区分享你的观点。

您需要登录后才可以回帖 登录 | 立即注册