Token工厂抢位战:谁会成为AI时代的“电厂”?

过去几年,地方政府谈人工智能,常见的关键词是“大模型”“智算中心”“算力集群”。到了2026年,一个更像工业时代的词开始频繁出现:Token工厂。Token(词元),是大模型处理和生成信息的基本单位。一次提问、一段回答、一份自动生成的报告、一行由AI补全的代码,都可以拆解为Token。过去,人们更习惯把它理解为技术概念;现在,它被推到了产业叙事的中心:谁能稳定、低成本、大规模地生产Token,谁就可能在AI基础设施重组中占据位置。这个说法听起来有些夸张。Token毕竟看不见、摸不着,但只要换一个角度看,Token工厂并非凭空造出的招商话术。大模型应用走向日常调用之后,AI竞争开始从“谁有模型”扩展到“谁能便宜、稳定、持续地调用模型”。模型能力固然重要,但当AI被嵌入办公、教育、医疗、制造、政务、金融等场景,真正制约使用规模的,往往变成每一次调用背后的算力成本、电力成本、网络时延和调度效率。这正…

又一美国科技巨头,悄然转向中国大模型

美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。随着顶尖美国模型服务成本持续攀升,以美国加密货币交易所Coinbase为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。Coinbase首席执行官Brian Armstrong上周末在社交平台X发文披露,公司已通过内部LLM网关,将智谱的GLM 5.2和月之暗面的Kimi K2.7设为全体工程师的默认大模型。Coinbase首席执行官Brian Armstrong发文称,已通过内部LLM网关把GLM 5.2和Kimi K2.7设为全体工程师的默认模型尽管没有披露具体数字,但是Armstrong表示,在Token使用量持续指数级增长的同时,通过换默认模型、智能路由、强化缓存,使得Coinbase的AI支出已被压缩近一半,并强调任何公司都可以照搬实现降本增效。他同时披露,公司91%的工程师从未触及原有的用量上限,因此本次成本优化并没有下调员工Token额度、而是把代码审查、文档总结等常规任…

DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

具身世界模型“我悟”通过合规备案

6月26日,北京人形机器人创新中心慧思开物平台的双大脑模型天鹕(Pelican-VL)和我悟(WoW)同步完成北京市网信办最新一批生成式人工智能服务备案。北京人形将正式启动慧思开物全系列模型Token服务,计划分阶段面向产业客户、科研机构、开发者全面开放API调用能力。责任编辑:刘德宾

运营商的“低价”算力套餐,开发者为何直呼用不起

每经记者 宋欣悦 祝 裕 每经编辑 陈 旭“9.9元买千万Token(词元)”“1元体验AI(人工智能)算力套餐”……近期,中国移动、中国联通、中国电信三大运营商均已推出种类丰富的Token套餐,试图将Token包装成下一个类“语音分钟数”产品,卖给用户。听着像白菜价,但《每日经济新闻》记者(以下简称每经记者)实测部分运营商产品发现,仅仅是输入一句“你好”,就会烧掉大约5万Token(约合0.125元)。不到1小时,15元的套餐就已见底。“用不起”,有开发者告诉每经记者,折算后月成本是现有主流AI订阅套餐的五六倍。如今,距离三大运营商推出Token套餐已过了1个月,每经记者走访成都、上海、北京、重庆等多地营业厅发现,不少工作人员对自家Token套餐一脸茫然。有中国联通工作人员直言“办不了,现在只是一个概念”;中国电信工作人员反问“你是要装宽带吗”;而线上客服在面对询问时,大部分也很难第一时间给出解读。这意…

集体押注世界杯,AI为何要扮演“懂球佬”

每经记者 温梦华 每经编辑 张益铭2026年美加墨世界杯才刚刚拉开帷幕,而赛场外的AI(人工智能)赛事研判、实力比拼,早已先行开启。日前,国产大模型Kimi(月之暗面)称将通过Agent(智能体)集群同时调度300个子Agent,公开预测104场世界杯赛事结果,并提出德国队或爆冷夺冠。Kimi同时上线了一场“押注”活动:奖池中有1万亿Tokens(词元),用户选队后球队赢了就可以瓜分Token,将体育赛事与AI用户运营深度绑定。《每日经济新闻》记者(以下简称每经记者)注意到,千问也紧随其后上线了相关活动。每经记者实测发现,豆包、元宝、DeepSeek(深度求索)、文心一言等国产大模型在被问及“2026年世界杯谁会夺冠”时,多数预测答案为“西班牙队”,判断逻辑也高度趋同。热闹之下,Kelly Bench(一个大模型评估测试平台)最新数据却显示,包括ChatGPT等在内的顶级模型在足球赌盘上表现惨淡。Kimi、千问等AI大模型为何要“押…

上海电信率先发布Token资费套餐,1元对应25万额度点,支持手机账单付

5月15日,上海电信宣布,即日起面向上海电信用户正式推出Token算力服务,成为上海首个发布Token资费套餐运营商。具体来说,一是按量订购,1元对应25万额度点(以KiMi-K2.5模型为例,约可支持调用25万输入Tokens);二是按需选择,用多少买多少,多买可享折扣,支持话费账单支付。另据记者从上海电信获悉,用户购买额度点后,通过标准API接口即可调用30余款主流大模型(文本、多模态),将AI能力集成到自己的软件、脚本或自动化流程中。以10元购买250万额度为例,约可让程序自动总结100本10万字的电子书。(上观新闻)责任编辑:刘德宾

阿里千问、DeepSeek齐出手 国产大模型“升级”Agent能力

每经记者 叶晓丹 每经编辑 杨军近期国产大模型动作频频。4月2日,阿里发布千问新一代大语言模型Qwen3.6-Plus。4月8日,DeepSeek(深度求索)上线专家模式,这是DeepSeek走红以来首次在产品端引入模式分层设计。此前3月份,DeepSeek释放了和Agent(智能体)相关的多个岗位招聘需求。《每日经济新闻》记者注意到,无论是阿里千问还是DeepSeek大模型,都在强化基础大模型Agent的能力。2026年初,以OpenClaw(一款开源人工智能体框架,俗称“龙虾”)为代表的“龙虾热”火爆国内外。如果说2025年还是“千模混战”,2026年AI(人工智能)主战场已全面转向智能体,Agent对Token(词元)的消耗正以百倍、千倍速度加快。IDC(国际数据公司)中国研究总监卢言霞向《每日经济新闻》记者表示,强化Agent能力是基础大模型2026年的重要发展方向,可能包括深度研究、智能办公、AI代码助手等通用场景。中国科学院计算所客座博士生导师、…

“囤词元”真能暴富?当心“词元”热潮下的三种新骗局

近期,国家数据局正式定名的AI领域核心术语——词元(Token)成为网络热词。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。“词元”这个新词实际上早已融入我们生活的方方面面。面对新技术新应用,我们既要主动拥抱、善加运用,又要防范风险、确保安全。什么是词元(Token)?简单来说,词元是AI大模型处理信息的最小单元,兼具可计量、可定价、可交易三大特征。它不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。词元应用场景远超AI领域,与日常生活紧密相关。身份凭证类,相当于数字世界的“临时身份证”,用于便捷登录各类平台、完成转账授权等,如微信登录第三方小程序、手机银行动态口令等,有明确有效期,兼顾便捷性与安全性。AI场景类,即官方定名的“词元”核心应用,是使用如AI写作、修图、剪辑等AI服务的消耗性资源。权益凭证类,可以理解成区块链场…