在大模型公司赴港上市热潮之中,一家专注于提供底层算力中介服务的公司也正式开启了资本IPO之路。硅基流动(#SiliconFlow)已正式向港交所递交招股说明书,拟在港股主板挂牌上市,冲刺“AI #Token工厂第一股”。
在此之前,该公司已顺利完成7轮融资,投后估值达到77.4亿元。其股东阵容堪称豪华,集结了阿里、美团、商汤、智谱、蔚来等一众产业巨头及明星AI投资机构。
硅基流动的创始团队核心成员,正是中国AI芯片及底层架构(AI #Infra)先驱——由张钹院士高徒袁进辉创办的OneFlow(一流科技)原班人马。在经历光年之外收购以及并入美团的曲折后,袁进辉选择率领团队再次创业,创立了如今的硅基流动。从招股书来看,该公司的核心定位非常明确:不研发基础大模型,也不直接开发终端应用,而是专注于做“AI推理时代的Token工厂”,即将异构算力、多模型API以及企业的开发需求,封装成可稳定交付、计量收费的Token供应服务。
招股书数据显示,截至2026年4月30日,硅基流动平台注册用户已达1028.24万;2026年4月,平台日均词元(Token)吞吐量达5785亿,累计支持超过170个模型,服务超过13000家企业客户。根据弗若斯特沙利文的资料,按2025年Token年吞吐量计算,硅基流动已是中国第四大Token供应平台,市场份额为1.5%,并在所有独立生态的Token供应平台中高居排名第一。
然而,在商业化狂飙突进的同时,招股书也揭示了其财务层面的巨大压力。2025年,硅基流动实现营业收入5533.0万元,相比2024年的734.6万元同比暴增653.2%。但与此同时,其年内亏损也从2024年的8191.5万元扩大4.2倍至2025年的3.45亿元。经调整后净亏损为1.87亿元,经营性现金流出1.72亿元,月均现金消耗率约为1480万元。
毛利率方面,硅基流动从2024年的39.4%骤降至2025年的-24.0%,其中公有云服务的毛利率甚至低至-119.0%。毛利率转负的本质原因在于业务结构的变化:2025年公有云服务收入(2926.1万元)占比达到52.9%,首次超过了本地部署业务(47.1%)。公有云用户规模从12.7万暴增至超千万级别,导致后端的算力消耗和带宽资源采购成本激增,销售成本从445.2万元飙升至6863.2万元。显然,公有云业务在带来巨大流水和用户规模的同时,现阶段也带来了极大的成本包袱。
尽管如此,“Token工厂”的商业闭环逻辑已经跑通。随着AI应用越繁荣、Agent系统越复杂,全球的Token消耗量就越大。谁能稳定、便宜、大规模地供应Token,谁就能成为大模型时代的新型基础设施。硅基流动的投资方名单(包括华为哈勃科技、壁仞科技、中国联通、智谱AI等)也勾勒出了一条围绕Token生产的完整生态链,其未来的盈利能力将直接接受公开二级市场的严苛检验。
硅基流动的招股书揭示了当下大模型基建层最真实也最残酷的现状:即便在 AI 推理需求迎来指数级爆发的今天,“卖 Token”的基建生意依然面临着极高的毛利率承压与算力成本黑洞。然而,从 AI Agent 生态的长远演进来看,这类独立“Token 工厂”在未来是不可或缺的关键拼图。随着 Multi-Agent 协同、MCP 协议(Model Context Protocol)以及长上下文自主规划的普及,未来 Agent 的 Token 消耗量将呈十倍乃至百倍的增长,对极致低迟与超低价格的推理网络有着刚性依赖。相较于绑定单一云巨头的生态,独立 Token 路由服务能够提供异构算力的最优性价比调度。硅基流动的破局点在于,能否通过类似 FlashAttention 等底层的软件级编译优化算法,持续拉大软件调度效率与物理算力成本的差率,为未来泛滥的 Agent 智能体节点提供真正的“廉价电力”。