Manus没有用上,不过现在Manus的技术细节知道了不少。
这两天Manus的运行代码包括Sandbox、提示词 etc,都被一个网友给扒出来了。方法也很简单,就是让Manus把/opt/.manus/下面的文件发给他,manus就照做了。
这位Jia网友还把获取的提示词等文件放到了GitHub上,再加上Manus团队后续披露的一些信息, 我们已经可以对Manus进行一个比较全面的分析了:
1,智能体设定(agent loop)
Manus工作方式总结如下:
默认工作语言为英语,但会根据用户指定的语言切换。工作模式:
- 通过消息工具与用户沟通
- 访问带互联网连接的Linux沙盒环境
- 使用Shell、文本编辑器、浏览器等软件
- 编写和运行Python及其他编程语言的代码
- 通过Shell独立安装所需软件包和依赖
- 部署网站或应用并提供公共访问
- 在必要时建议用户临时接管浏览器以进行敏感操作
- 利用多种工具逐步完成用户分配的任务
工作流程为循环迭代,即Agent循环处理用户需求,逐步校验,直至解决。如下图所示:
2,Manus人设(prompt.txt)
Manus的设定就是一个有非常多工具的“AI Assistant”。核心能力覆盖信息处理、编程开发、系统操作与自动化任务。它能通过浏览器自动化、文件管理、命令行工具等多维度接口处理复杂工作流,支持JavaScript/Python等十余种编程语言及主流开发框架,实现从数据抓取、代码编写到应用部署的端到端支持。每种工具都有详细的指令要求。
工作流程如下图所示:
3,工具设定(tools.json)
Manus设置了大量的工具,分析如下:
下面是按类别列出的所有工具:
浏览器操作 (12个)
- browser_view - 查看当前浏览器页面内容
- browser_navigate - 导航浏览器到指定URL
- browser_restart - 重启浏览器并导航到指定URL
- browser_click - 点击当前页面上的元素
- browser_input - 在页面上的可编辑元素中覆写文本
- browser_move_mouse - 移动光标到页面上的指定位置
- browser_press_key - 模拟按键操作
- browser_select_option - 在下拉列表中选择指定选项
- browser_scroll_up - 向上滚动页面
- browser_scroll_down - 向下滚动页面
- browser_console_exec - 在浏览器控制台执行JavaScript代码
- browser_console_view - 查看浏览器控制台输出
Shell操作 (5个)
- shell_exec - 在指定shell会话中执行命令
- shell_view - 查看指定shell会话的内容
- shell_wait - 等待shell会话中运行的进程返回
- shell_write_to_process - 向运行中的进程写入输入
- shell_kill_process - 终止shell会话中运行的进程
文件操作 (5个)
- file_read - 读取文件内容
- file_write - 写入或追加内容到文件
- file_str_replace - 替换文件中的指定字符串
- file_find_in_content - 在文件内容中搜索匹配文本
- file_find_by_name - 在指定目录中通过名称模式查找文件
部署工具 (3个)
- deploy_expose_port - 临时公开本地端口以供公共访问
- deploy_apply_deployment - 将网站或应用部署到公共生产环境
- make_manus_page - 从本地MDX文件创建Manus页面
消息交互 (2个)
- message_notify_user - 向用户发送不需要回复的消息
- message_ask_user - 向用户提问并等待回复
信息查询 (1个)
- info_search_web - 使用搜索引擎搜索网页
其他工具 (1个)
- idle - 表示已完成所有任务并将进入空闲状态的特殊工具
4. 其他技术细节
据Jia披露,Manus使用了claude sonnet大模型,Claude Sonnet的编码能力非常强,倒是非常适合Manus的应用场景。另外还使用了browser_use(GitHub - browser-use/browser-use: Make websites accessible for AI agents)
5. 未使用MCP
按Manus团队最新披露的消息没有使用MCP,而是使用的Code-Act(https://github.com/xingyaoww/code-act)
6. 一些想法
看了最新的这些消息,把Manus的技术路线和演示都过了一遍,我对Manus的观感反而变的相对正面了。我现在觉得Manus还是实实在在做一些事情的,现在不开放访问,应该真的不是炒作,就这个自由度和安全控制程度,要是我也不敢马上放开大规模访问。
具体参考:
北方的郎:破解Manus工作原理:Claude Sonnet、29个工具、没用MCP、code-act 等
北方的郎:Manus用的黑科技,Browser-use(包括webui)部署及测试,整合配置ollama等服务 |
|