思考

带 OpenClaw，像带一个能力极不均匀的员工

摘要：OpenClaw 最让人头疼的，不是能力不够，而是能力分布极不均匀：顺时像天才，乱时像失忆实习生。与其继续魔改追求更强，不如先回到官方基线，把稳定性做出来。

Dan Xu

09 Mar 2026 — 阅读时间 4 分钟

这段时间我越来越强烈地感觉：带 OpenClaw，有点像带一个能力极不均匀的员工。

他在某些时候，执行力惊人。任务一旦说清楚，边界一旦明确，工具一旦顺手，产出的速度和完成度，常常会让人怀疑：这东西是不是已经可以替代掉一部分日常协作了。

但在另一些时候，他又会突然像换了一个人。刚交代过的事情，后面会忘；刚承诺过不再犯的问题，过两天原样再来一遍；甚至有时你明明在等一个回复，他却像下线了一样，毫无动静。那种落差，不只是体验不好，是真的会把人搞崩。

我后来慢慢意识到，问题不在于 OpenClaw 不够强，而在于它的能力分布太不均匀。

它不是一个“平均水准很高”的助手，而是一个局部能力极强、系统稳定性又不够好的助手。任务结构清楚时，它像一个顶配执行者；链路稍微复杂一点，或者上下文稍微长一点，它又会暴露出非常低级的问题。说白了，它最像的不是一个成熟员工，而是一个时强时弱、还带点失忆体质的超强实习生。

真正麻烦的，也不是它偶尔犯错，而是它犯错的方式会伤害信任。

如果一个系统只是能力有限，你会自然降低预期；但如果它一会儿很惊艳，一会儿又很愚蠢，你就很难建立稳定的使用节奏。你会开始反复确认、反复补充、反复兜底。这样一来，表面上看是你在用一个高能力工具，本质上却变成了你在持续照顾一个不稳定系统。

这也是为什么，后面我对 OpenClaw 的判断发生了变化。

一开始，我会很自然地追求“更强”：更多能力、更长流程、更多自动化、更激进的魔改。因为每次调通一个点，反馈都很好，甚至会让人上瘾。

但用着用着就会发现，魔改这条路，短期收益很高，长期维护成本更高。你今天补了一个洞，明天多了一层能力，后天一升级，前面的补丁可能就一起松掉。到最后，系统不是死在功能不够，而是死在结构过于复杂、依赖关系太多、每次升级都像拆炸弹。

所以现在我反而更倾向于另一条路线：先不要追求它最强，先把它做稳。

先保证几件最基础的事情：能稳定回复，能少失忆，升级后不容易炸，出了问题能快速定位。先把它从“偶尔像天才、偶尔像智障”的状态，拉回到“整体靠谱、预期稳定”的状态。

这件事听起来像退一步，但本质上不是。

对工具系统来说，稳定性本身就是能力。一个只能在顺风局里表现惊人的系统，不是真正可依赖的系统。真正能进入日常工作流的，不一定是最聪明的那个，而是那个在大多数时候都不掉链子的那个。

说白了，OpenClaw 现在最需要的，未必是再加 20% 的能力，而是先减少 80% 的随机犯病。

这也是我最近越来越明确的一个想法：与其继续往上叠魔改，不如逐步回到官方版本，把基线先收敛出来。

官方版不一定最强，但通常更可预测；流程少一点，补丁少一点，优先级清楚一点，问题也更容易定位一点。先把系统做成“靠谱员工”，再去考虑把它培养成“天才员工”。

对个人使用 AI 来说，这可能也是一个很现实的判断。

我们真正需要的，不只是一个会偶尔惊艳我们的系统，而是一个能长期协作、不轻易把人折腾崩的系统。惊艳当然重要，但能不能长期交付，往往更重要。

如果把 AI 当成员工，那管理它的方式也应该变一变：不要太相信它“下次不会了”的口头承诺，要把流程写下来，把记忆外置，把验收做清楚，把边界钉死。

因为很多时候，不是它学不会，而是你不能把稳定性寄托在它“自己记住”。

本质上，AI 不是靠承诺变可靠的，而是靠系统约束变可靠的。

这件事，值得深思。

阅读更多

RSS早报 | 2026-06-13

当日整体观察 * AI竞争逻辑从“参数”向“入口”倾斜：苹果在系统底层集成的Siri AI揭示了其竞争底牌。巨头的优势不在于惊艳的独立大模型，而在于凭借无处不在的系统级入口与默认场景占据分发高地。 * 史上最大IPO重塑深科技估值锚：SpaceX正式挂牌，市值突破2万亿美元，马斯克晋升万亿富翁。在摩根大通等华尔街巨头的保驾护航下，资本市场正迎来对商业航天极限吸金能力的真实测试。 * AI应用端估值面临二级市场冷酷出清：智谱、MiniMax等头部AI公司在上市解禁期临近之际，股价于两周内接近腰斩；同时业内反馈“单纯卖Token极难变现”，但底层推理算力仍未饱和。这表明AI产业链的利润正被死死卡在基础设施层，应用端泡沫正在被挤压。 * 合规之手强力干预公募“风格漂移”：监管明确将基金经理严重偏离投资方向的行为纳入负面考核。这意味着过去几年机构资金跨界抱团炒作热门概念（如微盘股、AI）的博弈空间被实质性封堵。 * 半导体核心资产加速对接资本市场：国内存储芯片头部企业长鑫科技完成A股IPO注册，将在当前硬科技审查趋严的背景下，测试本土资本对战略级半导体资产的承接与定价能力。推

RSS早报 | 2026-06-12

当日整体观察 * 美伊冲突升级直接阻断全球货币宽松预期。美军周三对伊朗发动新一轮袭击导致原油价格跳涨，受此地缘与通胀双重压力逼迫，欧洲央行如期加息25个基点。这表明地缘黑天鹅正迅速通过能源通道实质性干预全球宏观政策节奏。 * SpaceX创纪录IPO开启深科技资本定价新纪元。SpaceX正式筹资750亿美元，贝莱德认购至少50亿，马斯克借此逼近全球首位万亿富翁。这场史诗级募资不仅将重塑太空与国防科技赛道的估值锚，也将极大测试当下二级市场的流动性承载力。 * 硬科技泡沫遭遇现实刺破，“全固态电池”神话证实造假。宣称“全球首款可量产全固态电池”的项目在5个月后被彻底锤实造假。这表明在庞大的资本焦虑与产业竞赛下，材料科学领域的尽职调查正面临极大挑战，伪科技泡沫开始出清。 * 国内低空经济破局转向出海合规。在经历了一季度的国内商业化需求验证阵痛后，头部企业峰飞获得海外适航认证。这标志着中国eVTOL厂商正试图通过拿下国际合规牌照，在海外寻求更早的商业化闭环与订单支撑。 * 在线旅游（OTA）平台的“算法寻租”遭遇强监管收口。市监总局等三部门集中约谈携程、同程等7家平台，直指“候补帮

RSS早报 | 2026-06-11

当日整体观察 * 宏观与地缘叠加冲击美股：中东战火重燃推升原油期货，叠加5月美国CPI超预期上行至4.2%，通胀担忧加剧导致道指单日暴跌逾950点，创下2026年最差单日表现。高昂的汽油价格正迅速吞噬过去一年多的工资涨幅。 * AI硬件下沉至个人终端：Nvidia推出首款专为AI Agent设计的PC芯片（RTX Spark）。这标志着AI Agent的算力基础设施正从纯云端向本地设备大规模迁移，PC和笔记本成为下一阶段AI落地争夺战的新核心入口。 * 科技股分化与算力路线争议：纳指在剧烈震荡中录得1月以来最大规模回调，美股芯片板块显露分歧。一份看空光电共封（CPO）产能的研报直接引发美股光通信板块抛售潮，并迅速传导至A股及港股，表明资本对AI底层硬件技术路线的预期极为敏感。 * 低空经济商业化遭遇现实阻力：一季度低空飞行器销量骤减，头部企业亿航的商业化运营仍面临破局难题。这表明在政策热潮之后，eVTOL赛道正面临真实需求验证与规模化落地的严峻考验。 * 全球能源供应链逼近红线：国际能源署（IEA）署长警告称，全球石油库存的持续下降可能导致能源市场进入“红色警戒区”。在中东

RSS早报 | 2026-06-10

当日整体观察 * OpenAI 正式启动首次公开募股（IPO）进程。在华尔街正以各种方式涌入 AI 淘金热的当下，这家引爆本轮 AI 浪潮的绝对头部企业走向二级市场，将成为顶尖 AI 初创公司估值逻辑和投资者真实买单意愿的终极测试。 * AI 智能体（Agent）生态在底层与应用端同时加速跃迁。底层模型方面，Anthropic 面向公众发布带护栏的“神话级”模型 Fable 5，加剧了模型安全与能力边界的博弈；国民级应用方面，微信智能体开始内测调取小程序完成交易和服务（美团、滴滴等首批接入），标志着大厂正实质性打通 AI 与商业变现的底层闭环。 * 预测市场正被加速纳入传统金融的合规治理框架。热门预测市场平台 Kalshi 计划要求用户披露工作单位以防范内幕交易，表明事件合约在规模急剧膨胀后，正面临类似证券市场的强力监管与利益冲突约束。 * 国内车企在智能化路线上出现“解绑”动作。赛力斯在承受原有的智能化体系合作成本后，开始接入字节跳动的“豆包”大模型，显示出汽车制造商在激烈的价格战下，正试图通过引入互联网大模型来重新夺回议价权与利润空间。 * 中东局势释放关键转折信号。特