Token 工厂之后,还需要一座“结果工厂”

摘要:Token 生产成本持续下降,但企业买的不是 token 而是结果;AI 下半场的核心竞争是 token 到有效结果的转化效率。

黄仁勋在 GTC 2026 上把一个比喻讲透了:数据中心不再是机房,而是 Token 工厂。

这个框架非常清晰。它让所有人都能用工业时代的直觉来理解 AI 基础设施的竞争逻辑——每瓦多少 token,每秒多少 token,每美元多少 token。就像发电厂比的是每度电成本,炼油厂比的是每桶原油出多少汽油。NVIDIA 的立场也很明确:我卖铲子,铲子越好,你挖矿越便宜,你就越该买我的铲子。

这套叙事没有错,而且在当前阶段确实抓住了一个关键事实:token 的生产成本正在以超出多数人预期的速度下降。一年前还觉得昂贵的百万 token 调用,今天已经可以用零点几美分解决。成本曲线在往下走,而且远没有到底。

但如果我们把视线从芯片厂商移到 AI 的实际使用者——那些试图用大模型完成业务任务的企业和开发者——就会发现,“Token 工厂”这个框架虽然有启发,但只讲了故事的上半段。

一个企业决定在某个环节部署 AI,它真正买的是什么?不是 token。是结果。

是一封能直接发出去的邮件,一份不需要人工大改的分析报告,一段能通过 code review 的代码,一次客服对话中让用户满意的回答。Token 只是中间产物。就像工厂买电不是为了看电表转,而是为了让机器把原材料变成产品。

这就引出一个“Token 工厂”框架没有覆盖的问题:token 的结果转化效率。

同样花 100 万个 token,不同系统能交付的有效结果差异极大。一个设计粗糙的 prompt 可能让模型消耗大量 token 却产出无法使用的内容;一个精心设计的 agent 工作流,可能用更少的 token 完成同样的任务,且返工率极低。

换句话说,AI 商业竞争至少要拆成两层来看。

上游,拼的是 token 生产效率。这是芯片、基础设施、模型训练的战场。谁能用更低的能耗和硬件成本生成更多 token,谁就在这一层占优。NVIDIA 讲的基本是这一层。

下游,拼的是 token 结果转化效率。同样数量的 token,谁能把它变成更高比例的“可交付结果”,谁的实际成本就更低——哪怕它的 token 单价更高。

一个直觉上的例子:如果模型 A 每百万 token 3 美分,但完成一个任务平均需要调用 5 次、消耗 50 万 token,人工还要花 20 分钟修改;模型 B 每百万 token 10 美分,但一次调用、8 万 token 就能出可用结果——对业务方来说,B 显然更便宜。

未来真正要比较的,可能不是每百万 token 单价,而是每个成功工单的成本、每篇可发布内容的成本、每个完成的代码任务的成本。

这个判断在一个条件下会变得更加重要:闭源模型长期占据主流。

如果主流大模型持续以 API 形式提供服务,调用方无法修改底层权重,那么模型本身的能力就是一个“给定条件”。你没法改它的推理链路,没法调它的注意力分布,没法在微观层面提升每个 token 的质量。

这时候,竞争的重心就必然转移到模型之外的系统能力上:Prompt 工程和 context 管理,Agent 编排和工作流设计,工具调用与外部知识检索,缓存、路由与成本控制,质量校验与人机协作。

这些都不是模型参数量能解决的问题。它们是系统工程问题。

在开源模型占主导的假设下,竞争者还可以通过微调、蒸馏、量化等方式从模型层面做差异化。但如果闭源模型持续领先,所有人面对的底模能力是一样的,差距就只能从系统层拉开。

这意味着一件事:AI 的竞争正在从“谁的模型更聪明”转向“谁的系统更能把模型的聪明变成结果”。

回到黄仁勋的 Token 工厂比喻。

它确实抓住了 AI 基础设施竞争的本质:规模化、工业化、成本持续下降。但这个比喻的局限在于,它天然站在供给侧视角。对于电力行业,发电成本当然重要,但真正决定经济价值的,是电被用来做了什么——驱动哪些机器、生产哪些产品、创造多少实际价值。

AI 行业正在经历类似的转变。Token 的生产问题正在被快速解决;token 的消费效率——或者说转化效率——才是接下来真正的战场。

AI 的上半场是让 token 变便宜。下半场是让 token 变有用。

前者靠芯片和算力,后者靠系统和工程。两者都是工业化能力,但后者对大多数企业来说更可触及,也更决定实际回报。

那些现在就在认真打磨“从 token 到结果”这段距离的团队,可能正在建立一种不太起眼但极其实在的竞争优势。

阅读更多

RSS早报 | 2026-06-13

当日整体观察 * AI竞争逻辑从“参数”向“入口”倾斜:苹果在系统底层集成的Siri AI揭示了其竞争底牌。巨头的优势不在于惊艳的独立大模型,而在于凭借无处不在的系统级入口与默认场景占据分发高地。 * 史上最大IPO重塑深科技估值锚:SpaceX正式挂牌,市值突破2万亿美元,马斯克晋升万亿富翁。在摩根大通等华尔街巨头的保驾护航下,资本市场正迎来对商业航天极限吸金能力的真实测试。 * AI应用端估值面临二级市场冷酷出清:智谱、MiniMax等头部AI公司在上市解禁期临近之际,股价于两周内接近腰斩;同时业内反馈“单纯卖Token极难变现”,但底层推理算力仍未饱和。这表明AI产业链的利润正被死死卡在基础设施层,应用端泡沫正在被挤压。 * 合规之手强力干预公募“风格漂移”:监管明确将基金经理严重偏离投资方向的行为纳入负面考核。这意味着过去几年机构资金跨界抱团炒作热门概念(如微盘股、AI)的博弈空间被实质性封堵。 * 半导体核心资产加速对接资本市场:国内存储芯片头部企业长鑫科技完成A股IPO注册,将在当前硬科技审查趋严的背景下,测试本土资本对战略级半导体资产的承接与定价能力。 推

By Dan Xu

RSS早报 | 2026-06-12

当日整体观察 * 美伊冲突升级直接阻断全球货币宽松预期。美军周三对伊朗发动新一轮袭击导致原油价格跳涨,受此地缘与通胀双重压力逼迫,欧洲央行如期加息25个基点。这表明地缘黑天鹅正迅速通过能源通道实质性干预全球宏观政策节奏。 * SpaceX创纪录IPO开启深科技资本定价新纪元。SpaceX正式筹资750亿美元,贝莱德认购至少50亿,马斯克借此逼近全球首位万亿富翁。这场史诗级募资不仅将重塑太空与国防科技赛道的估值锚,也将极大测试当下二级市场的流动性承载力。 * 硬科技泡沫遭遇现实刺破,“全固态电池”神话证实造假。宣称“全球首款可量产全固态电池”的项目在5个月后被彻底锤实造假。这表明在庞大的资本焦虑与产业竞赛下,材料科学领域的尽职调查正面临极大挑战,伪科技泡沫开始出清。 * 国内低空经济破局转向出海合规。在经历了一季度的国内商业化需求验证阵痛后,头部企业峰飞获得海外适航认证。这标志着中国eVTOL厂商正试图通过拿下国际合规牌照,在海外寻求更早的商业化闭环与订单支撑。 * 在线旅游(OTA)平台的“算法寻租”遭遇强监管收口。市监总局等三部门集中约谈携程、同程等7家平台,直指“候补帮

By Dan Xu

RSS早报 | 2026-06-11

当日整体观察 * 宏观与地缘叠加冲击美股:中东战火重燃推升原油期货,叠加5月美国CPI超预期上行至4.2%,通胀担忧加剧导致道指单日暴跌逾950点,创下2026年最差单日表现。高昂的汽油价格正迅速吞噬过去一年多的工资涨幅。 * AI硬件下沉至个人终端:Nvidia推出首款专为AI Agent设计的PC芯片(RTX Spark)。这标志着AI Agent的算力基础设施正从纯云端向本地设备大规模迁移,PC和笔记本成为下一阶段AI落地争夺战的新核心入口。 * 科技股分化与算力路线争议:纳指在剧烈震荡中录得1月以来最大规模回调,美股芯片板块显露分歧。一份看空光电共封(CPO)产能的研报直接引发美股光通信板块抛售潮,并迅速传导至A股及港股,表明资本对AI底层硬件技术路线的预期极为敏感。 * 低空经济商业化遭遇现实阻力:一季度低空飞行器销量骤减,头部企业亿航的商业化运营仍面临破局难题。这表明在政策热潮之后,eVTOL赛道正面临真实需求验证与规模化落地的严峻考验。 * 全球能源供应链逼近红线:国际能源署(IEA)署长警告称,全球石油库存的持续下降可能导致能源市场进入“红色警戒区”。在中东

By Dan Xu

RSS早报 | 2026-06-10

当日整体观察 * OpenAI 正式启动首次公开募股(IPO)进程。在华尔街正以各种方式涌入 AI 淘金热的当下,这家引爆本轮 AI 浪潮的绝对头部企业走向二级市场,将成为顶尖 AI 初创公司估值逻辑和投资者真实买单意愿的终极测试。 * AI 智能体(Agent)生态在底层与应用端同时加速跃迁。底层模型方面,Anthropic 面向公众发布带护栏的“神话级”模型 Fable 5,加剧了模型安全与能力边界的博弈;国民级应用方面,微信智能体开始内测调取小程序完成交易和服务(美团、滴滴等首批接入),标志着大厂正实质性打通 AI 与商业变现的底层闭环。 * 预测市场正被加速纳入传统金融的合规治理框架。热门预测市场平台 Kalshi 计划要求用户披露工作单位以防范内幕交易,表明事件合约在规模急剧膨胀后,正面临类似证券市场的强力监管与利益冲突约束。 * 国内车企在智能化路线上出现“解绑”动作。赛力斯在承受原有的智能化体系合作成本后,开始接入字节跳动的“豆包”大模型,显示出汽车制造商在激烈的价格战下,正试图通过引入互联网大模型来重新夺回议价权与利润空间。 * 中东局势释放关键转折信号。特

By Dan Xu