Manus是一个上周预览发布的“自主”AI平台,其引发的热度甚至超过了泰勒·斯威夫特的演唱会。
Hugging Face的产品负责人称Manus“是我用过的最令人印象深刻的AI工具。” AI政策研究员Dean Ball描述Manus为“最复杂的AI计算机。”官方Discord服务器在短短几天内,Manus的成员数量增长到超过138,000人,Manus的邀请代码据称在中国的转售应用闲鱼上据报道以数千美元的价格出售。
但尚不清楚这种热度是否合理。
Manus并不是完全从零开始开发的。根据社交媒体上的报道该平台使用了现有和经过微调的AI模型的组合,包括Anthropic的Claude和阿里巴巴的Qwen,以执行诸如撰写研究报告和分析财务文件等任务。
然而在其网站上,Manus背后的中国初创公司Monica给出了一些平台据称可以完成的惊人例子,从购买房地产到编程电子游戏。
在X平台上,Manus的研究负责人Yichao “Peak” Ji暗示该平台优于OpenAI的深度研究和Operator等自主工具。Ji声称,Manus在一个名为GAIA的通用AI助手的流行基准测试中表现优于深度研究,该测试探测AI通过浏览网页、使用软件等方式执行工作的能力。
“[Manus]不仅仅是另一个聊天机器人或工作流程,”Ji在视频中说道。“它是一个完全自主的代理,弥合了构思和执行之间的差距[…]我们将其视为人机协作的下一个范式。”
但一些早期用户表示,Manus并不是万能的。
AI初创公司Pleias的联合创始人Alexander Doria在X平台上的一篇帖子中说他在测试Manus时遇到了错误信息和无休止的循环。其他X用户指出Manus在回答事实性问题时会出错并且不一致地引用其工作——而且经常遗漏网上容易找到的信息。
我自己使用Manus的体验并不是特别积极。
我要求该平台处理一个在我看来相当简单的请求:从我配送范围内的顶级快餐店订购一个炸鸡三明治。大约十分钟后,Manus崩溃了。第二次尝试时,它找到了符合我标准的菜单项,但Manus无法完成订购过程——甚至无法提供结账链接。
当我要求Manus预订从纽约到日本的航班时,它同样失败了。给出的指示我认为没有太多模糊空间(例如“寻找商务舱航班,优先考虑价格和灵活日期”),Manus所能做的就是提供几个航空公司网站和机票搜索引擎如Kayak的票价链接,其中一些链接是无效的。
希望接下来的任务能有所突破,我让Manus在步行范围内的餐厅为一人预订一个座位。几分钟后失败了。然后我让平台制作一个火影忍者风格的格斗游戏。半小时后出错了,这时我决定放弃。
Manus 的发言人通过 DM 向 TechCrunch 发送了以下声明:
“作为一个小团队,我们的重点是不断改进 Manus,并制造出真正帮助用户解决问题的 AI 代理 [...] 当前封闭测试的主要目标是对系统的各个部分进行压力测试并找出问题。我们非常感谢大家分享的宝贵见解。”
那么如果Manus未能实现其技术承诺,为什么它会爆红?几个因素促成了这一点,比如邀请的稀缺性所创造的排他性。
公平地说,Monica的Manus还处于早期访问阶段。公司声称正在努力扩大计算能力并修复报告的问题。但就目前平台的存在而言,Manus似乎是炒作跑在了技术创新的前面。