你用上Manus AI了吗?

据说咸鱼上内测邀请码都炒到上万了,不知道你用上了吗?
收藏者
0
被浏览
81

5 个回答

陈宸 LV

发表于 昨天 13:04

没用上,感觉更像是炒作,因为都有大佬进行了开源,也就是Open Manus,和Manus的差别不是很大。
如果你不知道怎么弄,那么可以看看这个攻略,讲的听清楚的。
Manus本地部署教程版 OpenManus本地配置文档下载 - 发现AI

wxw850227 LV

发表于 昨天 13:13

没用上,但是也不是很在乎了,这个感觉就是炒作的东西。
目前有技术大牛就行了开源,基本复现了,感觉没必要当韭菜被割。
真的想体验的话,可以试试OpenManus,方法如下。
Manus本地部署教程版 OpenManus本地配置文档下载 - 发现AI

wuchao LV

发表于 昨天 13:25

Manus 邀请码到现在也没有收到。但开源 Open Manus 倒是部署后使用了下。
对 Open Manus 的使用情况,可以参考文章:
如何评价OpenManus这个开源项目?Open Manus 控制台交互。Manus 属于界面交互。这部分有区别。要说其他区别,由于没有邀请码,也不能乱说是不是。

1x2s LV

发表于 昨天 13:34

过度吹捧了,没必要凑热闹,而且现在 Manus已经凉了,现在用的ChatGPT,  Claude 3.7 ,很强,也很好用。用作生产力工具,直接都是用最强模型,减少纠错成本。也不在乎多花的几块钱。目前O3 mini 和 Claude 3.7 已经帮我解决了数个网站BUG问题,还帮我开发出了一个抽奖功能 :请看 http://haootu.com/lottery.html

冰湖小生 LV

发表于 昨天 13:45

Manus没有用上,不过现在Manus的技术细节知道了不少。
这两天Manus的运行代码包括Sandbox、提示词 etc,都被一个网友给扒出来了。方法也很简单,就是让Manus把/opt/.manus/下面的文件发给他,manus就照做了。

你用上Manus AI了吗?-1.jpg

这位Jia网友还把获取的提示词等文件放到了GitHub上,再加上Manus团队后续披露的一些信息, 我们已经可以对Manus进行一个比较全面的分析了:
1,智能体设定(agent loop

Manus工作方式总结如下:
默认工作语言为英语,但会根据用户指定的语言切换。工作模式:

  • 通过消息工具与用户沟通
  • 访问带互联网连接的Linux沙盒环境
  • 使用Shell、文本编辑器、浏览器等软件
  • 编写和运行Python及其他编程语言的代码
  • 通过Shell独立安装所需软件包和依赖
  • 部署网站或应用并提供公共访问
  • 在必要时建议用户临时接管浏览器以进行敏感操作
  • 利用多种工具逐步完成用户分配的任务
工作流程为循环迭代,即Agent循环处理用户需求,逐步校验,直至解决。如下图所示:

你用上Manus AI了吗?-2.jpg

2,Manus人设(prompt.txt

Manus的设定就是一个有非常多工具的“AI Assistant”。核心能力覆盖信息处理、编程开发、系统操作与自动化任务。它能通过浏览器自动化、文件管理、命令行工具等多维度接口处理复杂工作流,支持JavaScript/Python等十余种编程语言及主流开发框架,实现从数据抓取、代码编写到应用部署的端到端支持。每种工具都有详细的指令要求。
工作流程如下图所示:

你用上Manus AI了吗?-3.jpg

3,工具设定(tools.json

Manus设置了大量的工具,分析如下:

你用上Manus AI了吗?-4.jpg

下面是按类别列出的所有工具:
浏览器操作 (12个)

  • browser_view - 查看当前浏览器页面内容
  • browser_navigate - 导航浏览器到指定URL
  • browser_restart - 重启浏览器并导航到指定URL
  • browser_click - 点击当前页面上的元素
  • browser_input - 在页面上的可编辑元素中覆写文本
  • browser_move_mouse - 移动光标到页面上的指定位置
  • browser_press_key - 模拟按键操作
  • browser_select_option - 在下拉列表中选择指定选项
  • browser_scroll_up - 向上滚动页面
  • browser_scroll_down - 向下滚动页面
  • browser_console_exec - 在浏览器控制台执行JavaScript代码
  • browser_console_view - 查看浏览器控制台输出
Shell操作 (5个)

  • shell_exec - 在指定shell会话中执行命令
  • shell_view - 查看指定shell会话的内容
  • shell_wait - 等待shell会话中运行的进程返回
  • shell_write_to_process - 向运行中的进程写入输入
  • shell_kill_process - 终止shell会话中运行的进程
文件操作 (5个)

  • file_read - 读取文件内容
  • file_write - 写入或追加内容到文件
  • file_str_replace - 替换文件中的指定字符串
  • file_find_in_content - 在文件内容中搜索匹配文本
  • file_find_by_name - 在指定目录中通过名称模式查找文件
部署工具 (3个)

  • deploy_expose_port - 临时公开本地端口以供公共访问
  • deploy_apply_deployment - 将网站或应用部署到公共生产环境
  • make_manus_page - 从本地MDX文件创建Manus页面
消息交互 (2个)

  • message_notify_user - 向用户发送不需要回复的消息
  • message_ask_user - 向用户提问并等待回复
信息查询 (1个)

  • info_search_web - 使用搜索引擎搜索网页
其他工具 (1个)

  • idle - 表示已完成所有任务并将进入空闲状态的特殊工具
4. 其他技术细节

据Jia披露,Manus使用了claude sonnet大模型,Claude Sonnet的编码能力非常强,倒是非常适合Manus的应用场景。另外还使用了browser_use(GitHub - browser-use/browser-use: Make websites accessible for AI agents)

你用上Manus AI了吗?-5.jpg

5. 未使用MCP

按Manus团队最新披露的消息没有使用MCP,而是使用的Code-Act(https://github.com/xingyaoww/code-act)

你用上Manus AI了吗?-6.jpg

6. 一些想法

看了最新的这些消息,把Manus的技术路线和演示都过了一遍,我对Manus的观感反而变的相对正面了。我现在觉得Manus还是实实在在做一些事情的,现在不开放访问,应该真的不是炒作,就这个自由度和安全控制程度,要是我也不敢马上放开大规模访问。
具体参考:
北方的郎:破解Manus工作原理:Claude Sonnet、29个工具、没用MCP、code-act 等
北方的郎:Manus用的黑科技,Browser-use(包括webui)部署及测试,整合配置ollama等服务

您需要登录后才可以回帖 登录 | 立即注册