Agent OS的本地入口

2025-10-20|葬爱咸鱼|11 个实体|12 条关系

「小登赢老登」 9月中的时候,我的小登朋友钟十六说他要整个狠活,做一个类似Claude Code的产品。 我当时是真没什么期待。 所有人都在做Claude Code套壳,就像年初所有人都在做workflow一样。到了9月底,钟十 六把阶跃桌面助手的邀请码发给我,我也没有认真用👋😭👋 因为现在cc相关工具已经太多了。 而且,阶跃2C确实不行。之前的C端产品全军覆没——冒泡鸭和狸谱,一个已经关停,一个 即将关停。老板成天想的是和OPPO、千里科技这些大公司做定制开发生意。让我对阶跃 实在没什么好奇心。 直到国庆假期,我玩红色警戒,遇到一个真需求。 我下了上百张各个版本的地图,不同mod的地图后缀名不一样,需要统一改成.mpr。文件 夹里还有各种格式的压缩包、已解压的文件夹,非常混乱。 我试着给阶跃桌面助手一个指令:整理这个文件夹,统一后缀、解压文件、去重、归档到主 文件夹。 就这么一个我自己做要花半小时的工作,阶跃桌面助手真的完成了。 公众号后台扣 「114514」送红警地图包🥵 它调用本地终端写脚本改后缀,调用解压软件解压缩包,再用脚本归档,最后把需要删除的 文件放到一个待删除文件夹。花了五六分钟,把我的红警地图包整理得非常简洁。我只需要 把待删除文件夹拖进回收站就完事了。 扣「红警」也送 ☺️ 这是第一个Aha Moment。我突然意识到,它能操作本地终端,做任何云端AI做不到的事 情。 另一个Aha Moment是修复Claude Code环境。 我最近一直用cc写作,有时会在Claude和K2模型之间切换。国庆期间用了一段时间K2后, 想切回Claude就怎么也切不回来了。我设置了新的环境变量,但终端依然报API错误。 我上ChatGPT搜了一下。ChatGPT给了解决方案,但需要我自己创建脚本、保存到指定文件 夹,太繁琐了。

我试着把问题告诉阶跃桌面助手。它要了访问cursor应用数据的权限(我在cursor里用 cc),然后真的在终端里修复好问题了。 这对我来说是两个非常大的Aha Moment。 我的大部分需求,都已经被云端AI工具满足了。ChatGPT-5取代了我的搜索需求,Gemini 取代了轻量级的文字处理,Claude Code取代了重的写作任务。 不过,所有这些AI工具都有一个问题:没法获取本地环境。当Claude Code环境出错时,我 没法让任何AI工具来修复它。 但是,阶跃桌面助手可以做到这个事情。 所以国庆后,我和钟十六聊了聊。我大为震撼,bro这个产品从立项到上线只花了1个半 月,但完成度相当高。相较于cc的终端交互,他用普通用户更容易使用的悬浮窗,实现了本 地环境的Agent。 bro讲了一个很大的故事:他想做的是贾维斯。用悬浮窗这个形态,是因为想做一个新的 Agent OS入口🥵 贾维斯能帮钢铁侠自动完成任务,你说了什么需求,就自动完成,并交付结果。同时,贾维 斯能给你个性化的操作界面钢铁侠在家里工作室的3D显示屏。

这两点,就是Agent OS的核心。 悬浮窗和Workspace,对应的是两种不同的使用场景。 悬浮窗,很像钢铁侠穿着战甲在外面飞的时候,战甲里显示的那些信息。轻量、不干扰、随 时补充信息。 而Workspace,很像钢铁侠在家里工作间的那些大屏幕。个性化你看到的完整界面,提供更 丰富的GUI能力。 两者并列,服务轻重两种不同的场景。 大伙都在讲AI操作系统的故事,钟哥是把Agent OS讲得最清楚,并且真端出来了一个能用 的产品的。小登确实领先老登👍 但贾维斯只是愿景。这个故事能不能成,关键在本地环境。 从趋势上看,本地环境正在成为Agent的新战场。 云端Agent的问题是:需要上传文件、无法直接操作本地环境、安全性和隐私的顾虑。而本 地Agent可以直接访问你的文件、调用本地工具、符合用户的操作习惯。

但问题在于,现有的本地编程Agent,主要面向开发者,在终端调cc显然不适合普通用户。 所以,更大的价值在于,把本地编程Agent的能力带给普通用户。 最近一个很有意思的例子是Manus。Manus和微软达成了合作,现在可以直接在Windows 本地里调用Manus。比如用本地文件夹里的文档创建一个网站,只需要一键,Manus就会在 几分钟内构建一个网站。 Manus最重要的更新,不是它能生成网站,这属于没活硬整,而是可以访问Windows的本 地文件。 当然,阶跃桌面助手还比较早期,它能干的活,也都能找到替代品。 改文件后缀名这些活,Claude Code 本身也能干。Deep Research 我也不相信能超过 ChatGPT。并且,阶跃的悬浮窗退出之后,就没法用快捷键唤起了,你得重新打开应用。还 有不支持语音输入。 我直觉上会觉得,如果能按个快捷键直接语音输入到悬浮窗里,把需求讲给AI,让它去执 行,这个工作流会更闭环。 更大的问题是安全和信任。用这个产品,它需要非常多本地权限。处理终端问题的时候,它 还要访问我的Cursor应用程序的权限。 我确实没有那么信任阶跃,这对我来说是一个很大的顾虑。不过,钟十六说安全问题会用端 云结合来解决,用端侧模型来处理敏感信息,这是未来版本的规划。 但即便如此,阶跃桌面助手的价值还是很明确。把编程Agent的能力放到了本地环境,并且 把复杂的终端做得很简单易用。用古早的悬浮窗交互,试图做一个新的入口。 这个方向是对的。因为本地环境才是真正有价值的战场。 我之前写过一篇文章,讲Agent交易市场 Mulerun。 Mulerun的核心思路是,Claude Code这样的编程Agent会成为一种新入口的引擎。 用户在搜索框里提出需求,编程Agent就会生成若干一次性软件来满足用户的需求。不再是 去App Store下载固定的软件,而是根据你的需求,现场生成软件。 bro看到的,其实是同样的趋势。编程Agent带来的变化,是新入口和编程能力的提升。它 可以生成一次性软件,绕开传统服务商来直接满足用户需求。 不想看YouTube的Shorts,就生成一个去掉Shorts的版本。想在淘宝京东拼多多之间比价, 就生成一个三合一的比价工具。不需要等服务商来满足你,也不需要去App Store下载固定 的软件。你有需求,Agent就现场生成软件来满足你。 这就是编程Agent带来的变化:不再是服务商决定产品形态,而是用户需求驱动软件生成。

bro的切入点是本地环境。而Mulerun的切入点是云端。但本质上,大家看到的是同一个机 会:编程Agent会成为下一代入口的引擎。 从工具到入口到OS,这是一条清晰的演进路径。 现在,阶跃桌面助手是一个工具。未来,悬浮窗会成为一个新的交互入口。终局,是Agent OS,像贾维斯一样的存在。 Agent OS完全可以搭载在新的终端硬件上,手机、PC、汽车,乃至于plaud、芙崽、 looki。 本人至今未能成功 与芙崽对话😅 在PC端上,不用依赖终端的进展,独立APP也能获取必要权限和用户上下文,实现更快速 的迭代,同时具备向其余终端拓展的能力。此外,生产力也是当前用户更痛的场景。所以从 这个点做切入,更容易积累一些壁垒。 这是一个绝对大的故事。大伙讲的都是一样的故事,但钟哥不仅编得逻辑自洽,而且还端出 了能用的产品。执行力这一块属于是🥵 所有人都看到了这个趋势。PC厂、手机厂、车厂,都在尝试把Agent能力放进本地环境。谁 能建立这个入口,谁就有机会定义下一代操作系统。 云端的战争打出狗脑子来了,但面向普通用户的本地Agent产品才刚刚开始。 打通云端和本地,才是Agent OS能提供的新价值。