电脑突然狂弹网页?这次可能是人家在帮你干活

Source
电脑自己弹出来一堆网页?中病毒了吧!但这回真不是,还有可能是 AI agent 在帮你查东西干活。昨天世超去中关村智谱 OpenDay 凑了个热闹,近距离围观了智谱AI最新 AutoGLM 沉思的发布。相对大家伙儿已经很熟悉的各种 AI 助手只会打打嘴炮,智谱这 AI agent 已经不仅仅局限在你问我答上了,还能帮你直接动手完成任务,归纳总结,提升答案的深度和广度。


据说,AutoGLM 能先想再做,边做边想,听起来挺高深莫测的。

那具体效果咋样?世超当然也迫不及待地上手试了两天。

先下结论:AutoGLM 沉思功能上做的还不错,它能帮大家把一个复杂问题拆解,分步搜索,而且回答非常的全面。就是使用体验方面还有些提升空间。

有了它,感觉以后再也不怕老板让写年末总结报告了。

参考官网几个用例,咱来看看具体测试效果是啥样的。

事先说好啊,世超把问题扔给它就去开会了,全程没碰过一下鼠标键盘。以下所有操作解释权归 AutoGLM 沉思所有。

先来问问它:人形机器人技术对未来生产模式会有什么颠覆性影响?


这问题,换世超来也得想半天。但很快啊,AutoGLM 啪的一下就把思考步骤列出了一二三。

不仅能想,还敢干。AutoGLM 先打开了知乎,去知乎搜了搜人形机器人在工厂环境下的最新案例。


它甚至知道筛选信息。


字太多不想看?它来帮你看。


二十分钟后,AutoGLM 给出了一份总结报告。虽然也挺长的,但已经是几十篇网页的浓缩精华版了。


报告不仅概括了人形机器人可能在制造业,农业带来的生产模式变革,还提供了对企业和研究机构的建议。

要是自己看完这几十篇文章总结内容,二十个小时也未必够。

不知道你行不行,世超觉得自己不太行。

再测个栗子:前几天 ChatGPT-4o 的文生图模型一出,有的差友在视频下留言,原本是做设计师的,现在想转水电工了。

那怎么规划才能在六个月之内迅速成为一名优秀的电工呢?( 手动狗头 )

AutoGLM 先在知乎搜了搜,设计师转行做电工的相关信息。


别说,你真别说,这事看起来挺可行的,先例还不少……

知乎看差不多,再去搜搜小红书。


最后生成一份学习报告,详细列举了这六个月每一阶段的计划,该学习什么课程,具备哪些条件,报名哪些考试。


所以各位先别慌,按这个计划来,现在转行还来得及。

不过没有比较就没有伤害。世超又横向测试了一下,有些方面 AutoGLM 沉思还是不如一月份 OpenAI 搞出来的前辈 Operator 。

同样是搜索食谱,下面来看看这两个 agent 的表现有什么区别吧。

官方演示视频里可以看到,Operator 很丝滑地完成了奶油蛤蜊意面食谱的搜索。



再来看看 AutoGLM 沉思,提示让它给出一份糖醋排骨的食谱:


抛出问题,它很快开始思考,列出一个 5 步详细计划。

需要登录信息或者有弹窗的时候,也要人帮帮忙。


在搜索栏输入关键词不在话下。


一开始 AutoGLM 沉思的表现还挺靠谱的,顺利打开网页、搜食谱,感觉一切尽在掌握。直到它打开了 4 个小红书,3 个b站,2 个知乎页面,事情好像哪里不对劲了起来……


收手吧阿祖,是在家做糖醋排骨,不是国宴。

感觉 AutoGLM 总想做得更好,更全面,它会一直不停地搜索,更换信源,或者说希望找一个 “ 最优解 ”,一个 “ 标准答案 ”。

但是在面对 “ 糖醋排骨怎么做 ” 这种根本没有标准答案的问题时,它会花费大量时间去检索,总结。

其实答案早就找到了,但它可能是 INTJ 吧,总是不太满意。

十多分钟过去了,糖醋排骨好像怎么做都行,又怎么做都不行。比起 Operator,它太纠结了。

除了搜食谱,找路好像也不太适合它……世超从中关村出来,刚在颐和园爽玩一圈,还想去北大看看。惦记着刚刚掏着的好东西,就想问问它从颐和园到北京大学的公共交通路线。

18 分钟后,搜索终于结束了。


最后展示出的结果中,地铁,公交,自行车,步行等等情况都被考虑到了,总结的非常全面到位。

唯一的问题是世超已经在北京的春风里瑟瑟发抖了很久很久。

当然,这一点可能源自它 “ 沉思 ” 的特性,更适合解决复杂的,需要思考的问题。毕竟工具也要分使用场合,不能拿大炮轰蚊子。

不过在测试过程中,世超也确实遇到了一些其他的细节问题,会影响到使用体验。

比如在网页搜索结果给出之后,有时候会等待很久,再进行点击。

对话框显示它没有在思考,但网页上也没有在操作。作为旁观者的人类,看着它卡在那里,答案也在那里,却不能上手替它点击。

简直是新时代酷刑,焦虑值瞬间拉满。

但这毕竟只是个 Beta 测试版,正式版会不会修复这些问题还不好说。

综合来看,AutoGLM 沉思作为一款免费的国产 agent 表现还是不错的,相比起 200 刀一月的 OpenAI Operator 和一码难求的 Manus,性价比真心拉满了,至少能让大家先无痛体验一下 AI 帮自己干活是个啥感觉。

听说 4 月还会开源,到时候可以再来围观一下还有什么好玩的。