作者:王林Lincoln | MindsLeap创始人 | Founders Space合伙人 | 企业家AI俱乐部创始人
2026 年 3 月的最后一周,中国企业协作软件领域发生了一件耐人寻味的事:飞书、钉钉、企业微信——三大平台几乎在同一周内,不约而同地开源了各自的 CLI(命令行接口)工具。
这不是巧合。这三家公司在用行动回答同一个问题:软件的下一个用户,不是人类,是 AI agent。
先说清楚:CLI到底是什么?
如果你不是技术背景,CLI(Command Line Interface,命令行接口)这个词可能有点陌生。让我用一个类比解释。
你每天用的手机 App、电脑软件,都有漂亮的按钮、菜单、图标——这叫 GUI(图形用户界面),是为人类设计的。你用眼睛看,用手指点,软件通过视觉元素和你交流。
CLI 则完全不同。 它是一个纯文本的界面——你输入一行命令,软件返回一段文字结果。没有按钮,没有图标,没有动画。就像你给软件发一条"短信指令",它回复你一条"文字结果"。
举个例子。你想在飞书上给团队发一条消息:
- GUI 方式(给人用的):打开飞书 App → 找到群聊 → 点击输入框 → 打字 → 点击发送
- CLI 方式(给 agent 用的):输入一行命令
lark-cli im send --chat "产品团队" --text "周报已更新",回车,完成
对人类来说,GUI 更直觉。但对 AI agent 来说,CLI 才是它的母语——文本输入,文本输出,精确、高效、可自动化。
这就是为什么整个软件行业正在"CLI化":不是给人用的界面在倒退,而是在为一个全新的用户群体——AI agent——建造专属入口。
香港大学的 CLI-Anything:一键把任何软件变成 agent 工具
要理解这个趋势的深度,不妨看看香港大学数据智能实验室(HKUDS)在 2026 年 3 月发布的开源项目 CLI-Anything。
这个项目的口号是 "Making ALL Software Agent-Native"——让所有软件都能被 AI agent 原生操控。它做的事情,可以说把"软件CLI化"推到了极致:一行命令,就能把任何开源软件的源代码分析一遍,自动生成一套完整的 CLI 接口。
CLI-Anything 已经成功为 9 款主流软件生成了可工作的 CLI:
| 软件 | 领域 | 意味着什么 |
|---|---|---|
| GIMP | 图像编辑 | AI agent 可以直接执行"去背景、调色、裁剪" |
| Blender | 3D建模 | AI agent 可以直接渲染3D场景 |
| LibreOffice | 办公套件 | AI agent 可以直接生成PDF、转换格式 |
| Audacity | 音频编辑 | AI agent 可以直接处理音频文件 |
| Kdenlive | 视频编辑 | AI agent 可以直接剪辑视频、加特效 |
| ComfyUI | AI图像生成 | AI agent 可以直接控制 Stable Diffusion 流水线 |
关键在于,CLI-Anything 生成的不是"玩具"。它的 1,436 个端到端测试全部通过,100% 通过率——这些测试真实调用了软件后端,进行了真实的图像处理、3D渲染和文档转换。
项目上线数周内 GitHub 星标突破 21,000,由香港大学黄超教授团队主导开发。黄超教授的实验室此前已经打造了 LightRAG 等多个知名开源项目,累计超过 77,000 个 GitHub 星标。
这个项目的意义在于:它证明了"任何软件都可以CLI化"不是愿景,而是已经可以自动化实现的现实。 当 Photoshop、Blender 这样的重型专业软件都能被 AI agent 通过命令行操控时,你公司用的那些业务软件还会远吗?
飞书、钉钉、企业微信:一周之内的"军备竞赛"
让我们回到开头那个引人注目的时间线:
- 3月27日,钉钉开源 CLI 工具
- 3月28日,飞书开源
larksuite/cli,首日 GitHub 星标破千 - 3月29日前后,企业微信也推出了
wecom-cli
三大平台几乎同时行动,背后的逻辑高度一致:谁先让 AI agent 用起来最顺手,谁就能在下一个时代占据入口。
飞书:最激进的"全面开放"
飞书的 CLI 设计最为彻底,采用了三层命令架构:
- 快捷层:人类和 AI 都友好的高层命令,比如
lark-cli calendar +agenda直接看日程 - API命令层:100+ 条命令,覆盖日历、消息、文档、多维表格等 12 个业务域
- 原始API层:直接访问飞书全部 2,500+ 个开放接口
更重要的是它的 AI 原生设计细节:--dry-run 让 agent 在执行前预览副作用;结构化输出支持 JSON、CSV、表格等多种格式;--help 本身就是 agent 的自发现文档。飞书还同步提供了 20 个 AI Agent Skills 和独立的 MCP 服务器——CLI、MCP、Skills 三条路径互补,全方位拥抱 agent 生态。
飞书的策略很清晰:先全面开放,让尽可能多的 agent 生态接入,用规模换护城河。
钉钉:阿里生态的"悟空平台"
钉钉的打法不同。它花了一年时间重写后端,打造了"悟空平台"——一个统一的调度层,把产品能力转化为 AI 可调用的系统指令。钉钉的独特优势在于阿里生态的深度整合:淘宝、支付宝、阿里云的能力都可以作为 Skills 接入悟空平台。
不过,钉钉的 CLI 目前需要申请白名单才能使用,体现了"企业管控优先"的思路——和飞书的"先开放再治理"形成鲜明对比。
钉钉还做了一件值得关注的事:建立了专门的 MCP 应用市场(mcp.dingtalk.com),提供通讯录、部门管理、机器人消息等标准化服务。这意味着钉钉不只是把自己CLI化,还在搭建一个 agent 可以"逛"的工具商店。
企业微信:谨慎跟进
企业微信的动作相对保守,目前 CLI 工具覆盖 7 个业务域,且限制在 10 人以下企业使用。但它的存在本身就说明问题:连最保守的玩家都在布局,说明这个趋势已经不可逆转。
为什么是CLI,不是别的?
你可能会问:API 不是早就有了吗?为什么还要专门做 CLI?
这个问题的答案,恰恰揭示了 AI agent 时代软件设计逻辑的根本变化:
第一,自发现性。 AI agent 可以运行 --help 来理解一个 CLI 工具能做什么,不需要额外的文档。这就像一个新员工入职时,如果每个工具都能自我介绍,他的上手速度会快得多。
第二,文本原生。 大语言模型的核心能力就是处理文本。CLI 的输入输出都是文本,和 LLM 天然匹配。而 GUI 需要截屏、像素解析、坐标定位——这些对 AI 来说既低效又不可靠。
第三,可组合性。 CLI 命令可以用管道(|)串联,像搭积木一样组合出从未被预设过的操作流程。这种灵活性是固定的 API 端点很难提供的。
第四,轻量级。 CLI 按需执行,不占用持续连接和内存资源。对于需要同时操控几十个工具的 AI agent 来说,这比 MCP 的持久连接模式更高效。
全球信号:不只是中国在动
这个趋势不是中国独有的。同一时期,全球科技公司也在密集布局:
- Anthropic 的 Claude Code 和 Agent SDK,本身就是"软件CLI化"的最佳范例——一个 CLI 原生的 AI 产品
- Google 发布了
gws工具,让 AI agent 可以通过命令行操控 Google Workspace - Stripe 的 Agent Toolkit 让 AI agent 直接处理支付、创建订阅、管理账单
- Shopify 推出面向 agent 的 Commerce API,让 AI 直接管理电商运营
- MCP(Model Context Protocol) 正在成为 AI agent 连接各类软件的标准协议——这是 agent 时代的"USB接口"
当全球最头部的软件公司在同一个月密集发布 CLI 和 agent 接口,这不是巧合,这是基础设施级别的变迁信号。
一个正在发生的范式转移
让我用一个具体场景来说明这个变化的深度。
过去:一个运营人员打开飞书,手动创建文档、填写多维表格、发送群消息、安排日程。整个流程需要 GUI,因为用户是人。
现在:一个 AI agent 通过 lark-cli 自动拉取数据、生成周报、更新多维表格、给团队发送摘要。整个流程不需要任何图形界面——因为执行者不是人。
未来:你的企业中,80% 的重复性软件操作可能由 AI agent 完成。人类只负责设定目标、审核结果、处理异常。行业正在从 SaaS(Software as a Service)走向 RaaS(Result as a Service)——你不再为软件付费,而是为结果付费。
这意味着什么?软件正在从"人机交互"走向"机机交互",而 CLI 和 API 是机机交互的母语。
这个趋势背后的三个结构性变化
1. AI agent 正在成为软件的主要"购买者"
当 AI agent 替代人类完成日常操作,它对工具的"选择偏好"就会影响市场格局。一个 agent 不会因为某个软件的 UI 漂亮就选择它——它会选择 API 文档最清晰、CLI 最好用、集成最顺畅的那个。
这对 SaaS 公司的启示是:你的下一个大客户,可能不是某个企业的采购经理,而是某个企业部署的 AI agent。 未来衡量软件影响力的指标,可能不再是 DAU(日活跃用户数),而是"agent 调用频次"。
2. 软件的竞争维度正在改变
过去,软件产品竞争的维度是:UI 设计、用户体验、功能丰富度、品牌认知。
未来,竞争维度会增加一个全新的层面:agent 友好度——你的软件对 AI agent 来说好不好用?API 是否完备?CLI 是否稳定?输出是否结构化?错误处理是否机器可读?
这就像当年移动互联网兴起时,"移动端适配"从加分项变成了必选项。现在,"agent 适配"正在走同样的路。飞书三层命令架构、钉钉悟空平台、CLI-Anything 的自动化生成——这些都是在争夺"agent 适配"的先发优势。
3. 软件的定价和商业模式在进化
当软件的主要用户从人变成 agent,按"席位"收费的 SaaS 模式就会面临挑战。一个 agent 可以 7×24 小时运行,处理量远超人类——它算一个"席位"吗?
我们已经看到新的定价模型在出现:按 API 调用次数、按处理量、按结果付费。这不仅是定价方式的变化,更是价值衡量标准的变化——从"给多少人用"变成"创造了多少产出"。 据行业数据,中国 AI Agent 市场规模已从 2024 年的约 287 亿元增长到 2025 年的约 690 亿元,这个赛道的商业模式正在被快速验证。
企业家需要做的四个认知升级
第一,重新定义"用户"
你的软件产品、你的服务、你的内容,未来的消费者不仅是人类。AI agent 会代替人类去搜索信息、评估方案、执行采购、完成操作。你需要思考:我的产品对 agent 来说是否可访问、可理解、可操作?
这不是遥远的未来。当飞书已经提供了 20 个 AI Agent Skills,当钉钉已经建立了 MCP 应用市场,你的业务工具链是否已经准备好被 agent 接管?
第二,重新理解"界面"
界面不再只是屏幕上的像素。API 是界面,CLI 是界面,数据格式是界面,文档是界面。面向 agent 的界面设计,和面向人类的界面设计,是两套完全不同的逻辑。 前者追求结构化和可编程,后者追求直觉化和美观。未来的好产品,两者都需要。
CLI-Anything 项目给出了一个启发:它不是取消了 GIMP 或 Blender 的图形界面,而是在保留人类界面的同时,增加了一层"agent 界面"。双轨并行,才是正解。
第三,重新思考"护城河"
当 AI agent 能够轻松切换工具时,用户忠诚度和切换成本会大幅降低。你的界面做得再漂亮,agent 不在乎。真正的护城河会转移到:独特的数据、卓越的可靠性、深度的生态集成、以及 agent 工作流中的"默认位置"。
飞书选择全面开放来抢占生态位,钉钉依托阿里生态做深度整合——两种策略,本质上都是在争夺"成为 agent 默认工具"的位置。就像 Google 曾经花巨资成为 Safari 的默认搜索引擎——未来,企业可能会花巨资让自己的产品成为主流 AI agent 的"默认工具"。
第四,重新规划"组织能力"
当大量软件操作被 agent 接管,你的团队需要的能力会发生变化。过去需要"会用软件的人",未来需要"会指挥 agent 的人"。这不是简单的技能升级,而是角色定义的根本改变——从"操作者"变成"指挥官"。
过去你招一个运营,看的是"会不会用飞书、会不会做表格"。未来你可能看的是"能不能定义好 agent 的工作流、能不能判断 agent 输出的质量"。超过 60% 的中国企业已经把"碎片化的需求响应"列为规模化的最大障碍——而 agent 编排能力,恰恰是解决这个问题的钥匙。
写在最后:下一个十年的新常识
每一次计算平台的变迁,都会重新定义"好软件"的标准。PC 时代是功能完备,互联网时代是在线可达,移动时代是触屏友好,AI agent 时代是"机器可操作"。
2026 年 3 月,飞书、钉钉、企业微信同时推出 CLI 工具;香港大学证明任何软件都可以被自动CLI化;全球头部科技公司密集发布 agent 接口——这些事件叠加在一起,构成了一个清晰的信号:软件行业的"agent 适配"时刻已经到来。
作为企业家,你不需要今天就把所有产品 CLI 化。但你需要从现在开始建立一个认知:你的下一个最大的用户群体,可能根本不是人类。 为这个群体做好准备的企业,将在未来十年占据结构性优势。
软件 CLI 化不是技术圈的小众趋势,它是 AI agent 经济的基础设施建设。而每一次基础设施的变迁,都是新一代企业崛起的窗口期。
关于 MindsLeap 心智悦动
MindsLeap 心智悦动是硅谷知名孵化器 Founders Space 的中国区合作机构,长期致力于将全球最前沿的 AI 技术趋势与本土商业场景深度结合,为企业家提供"听得懂、学得会、用得上"的实战型学习体验。通过企业家 AI 俱乐部、AI 实战工作坊、全球创新游学等项目,MindsLeap 心智悦动帮助中国企业家建立 AI 时代的新认知、新能力、新连接,在技术变革的浪潮中抢占先机。
