外媒有些评价真不怎么高。观念也许有一定的新颖,却并是非革命性的东西。而且,仍处于测试阶段,在大多数任务中表现惨不忍睹
几周前,DeepSeek风靡一时,震惊了美国科技界,并在此过程中拖累了股市。这家中国人工智能公司推出了一款堪比ChatGPT o1的人工智能推理聊天机器人,但成本却只有前者的零头,这让所有人都感到惊讶。
从那以后,我们了解到硬件在开发ChatGPT这样的先进(前沿)人工智能方面仍将发挥关键作用,但软件优化也能有所帮助。此外,我们还了解到DeepSeek可能复制了ChatGPT的输出结果,以此作为加快训练速度的捷径。
DeepSeek的流行也让世界意识到,尽管中国的人工智能公司无法从英伟达和其他美国芯片制造商那里购买最新的芯片,但也不应该被排除在外。自DeepSeek发布以来,我们已经看到了一些来自中国的人工智能模型,这些模型旨在与Sora竞争。其中一些甚至可能比OpenAI的模型表现更好。
中国最新流行的AI名为Manus,来自一家名为The Butterfly Effect(蝴蝶效应)的公司。Manus并不是普通的ChatGPT或DeepSeek竞争对手。它应该是一个可以代表您编写代码或为您浏览网页的AI代理。我们已经有了来自Anthropic和OpenAI的此类代理。
OpenAI已经发布了两个AI代理,分别是Operator和Deep Research。但只有后者可供高级ChatGPT用户广泛使用。您仍然需要成为ChatGPT Pro用户才能访问Operator,而Deep Research则可在Plus计划中使用。
回到Manus;周末我在社交媒体上看到了关于它的新闻。显然,人工智能在测试中表现不错,人们急于使用它。邀请数量已经不多了,它们在网上可能要卖到几千美元。这是根据TechCrunch的说法,该网站测试了人工智能。
然而,Manus的炒作似乎没有根据。Manus仍处于测试阶段,在大多数任务中表现惨不忍睹。
马格努斯并不是全新的。也就是说,它可能不是从零开始训练的。报道称,《蝴蝶效应》使用了现有的AI模型,如Anthropic的Claude和阿里巴巴的Qwen。中国的人工智能公司在此基础上训练AI,使其能够创建研究报告、执行在线操作,甚至编写应用程序和游戏的代码。
Manus的一位首席研究员在X上暗示,该人工智能模型优于OpenAI迄今为止发布的深度研究和操作员人工智能代理。据称,在GAIA(人工智能助手的常用基准)的深度研究测试中,Manus的表现优于竞争对手。该测试考察了人工智能浏览网页和使用软件的能力。
“Manus”工程师Yichao“Peak”Ji在X上的一段视频中说道:“Manus”不仅仅是另一个聊天机器人或工作流程,它是一个完全自主的代理,弥合了概念和执行之间的鸿沟……我们将其视为人机协作的下一个典范”。
在现实生活中,接触到Manus的人并没有那么惊讶。人工智能可能已经风靡一时,但就即时能力而言,它并不是下一个DeepSeek。随着《蝴蝶效应》的改进,它可能会达到这个目标,但它无法真正超越竞争对手。
TechCrunch对Manus进行了各种人工智能代理应有的测试,但人工智能大多未能通过测试。Manus无法从附近一家顶级餐厅订餐。尽管有关于人类想要的航班类型的精确指示,但人工智能还是无法预订从纽约到日本的航班。
Manus也无法预订餐厅。TechCrunch随后要求人工智能开发一款以《火影忍者》为灵感的游戏,但半小时后出现了错误。
从头开始构建游戏是我认为人工智能会失败的那种任务。但是预订餐厅或点餐应该非常简单。OpenAI的Operator演示比这顺利得多。
这家中国人工智能公司向博客提供了关于Manus状态的以下声明,其中提供了你期望的借口;Manus处于测试阶段。但它们不都是吗?以下是评论:
作为一个小型团队,我们的重点是不断改进Manus,并开发真正能够帮助用户解决问题的AI代理……当前内测的主要目标是测试系统的各个部分,并找出问题。我们非常感谢大家分享的宝贵见解。
也就是说,Manus并不是中国下一个震惊美国人工智能领域的DeepSeek。它可能成为人工智能模型,但工程师们戏称这要等到不久的将来,而我们显然还没有达到这个水平。没有必要花数千美元来获取访问权限。
此外,就像DeepSeek一样,在使用中国制造的人工智能时,你应该清楚自己正在做什么,因为人工智能受当地法律和惯例的约束,包括隐私。
BGR2025年3月10日 |
|