Token工厂抢位战:谁会成为AI时代的“电厂”?

过去几年,地方政府谈人工智能,常见的关键词是“大模型”“智算中心”“算力集群”。到了2026年,一个更像工业时代的词开始频繁出现:Token工厂。Token(词元),是大模型处理和生成信息的基本单位。一次提问、一段回答、一份自动生成的报告、一行由AI补全的代码,都可以拆解为Token。过去,人们更习惯把它理解为技术概念;现在,它被推到了产业叙事的中心:谁能稳定、低成本、大规模地生产Token,谁就可能在AI基础设施重组中占据位置。这个说法听起来有些夸张。Token毕竟看不见、摸不着,但只要换一个角度看,Token工厂并非凭空造出的招商话术。大模型应用走向日常调用之后,AI竞争开始从“谁有模型”扩展到“谁能便宜、稳定、持续地调用模型”。模型能力固然重要,但当AI被嵌入办公、教育、医疗、制造、政务、金融等场景,真正制约使用规模的,往往变成每一次调用背后的算力成本、电力成本、网络时延和调度效率。这正…

又一美国科技巨头,悄然转向中国大模型

美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。随着顶尖美国模型服务成本持续攀升,以美国加密货币交易所Coinbase为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。Coinbase首席执行官Brian Armstrong上周末在社交平台X发文披露,公司已通过内部LLM网关,将智谱的GLM 5.2和月之暗面的Kimi K2.7设为全体工程师的默认大模型。Coinbase首席执行官Brian Armstrong发文称,已通过内部LLM网关把GLM 5.2和Kimi K2.7设为全体工程师的默认模型尽管没有披露具体数字,但是Armstrong表示,在Token使用量持续指数级增长的同时,通过换默认模型、智能路由、强化缓存,使得Coinbase的AI支出已被压缩近一半,并强调任何公司都可以照搬实现降本增效。他同时披露,公司91%的工程师从未触及原有的用量上限,因此本次成本优化并没有下调员工Token额度、而是把代码审查、文档总结等常规任…

DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

具身世界模型“我悟”通过合规备案

6月26日,北京人形机器人创新中心慧思开物平台的双大脑模型天鹕(Pelican-VL)和我悟(WoW)同步完成北京市网信办最新一批生成式人工智能服务备案。北京人形将正式启动慧思开物全系列模型Token服务,计划分阶段面向产业客户、科研机构、开发者全面开放API调用能力。责任编辑:刘德宾

运营商的“低价”算力套餐,开发者为何直呼用不起

每经记者 宋欣悦 祝 裕 每经编辑 陈 旭“9.9元买千万Token(词元)”“1元体验AI(人工智能)算力套餐”……近期,中国移动、中国联通、中国电信三大运营商均已推出种类丰富的Token套餐,试图将Token包装成下一个类“语音分钟数”产品,卖给用户。听着像白菜价,但《每日经济新闻》记者(以下简称每经记者)实测部分运营商产品发现,仅仅是输入一句“你好”,就会烧掉大约5万Token(约合0.125元)。不到1小时,15元的套餐就已见底。“用不起”,有开发者告诉每经记者,折算后月成本是现有主流AI订阅套餐的五六倍。如今,距离三大运营商推出Token套餐已过了1个月,每经记者走访成都、上海、北京、重庆等多地营业厅发现,不少工作人员对自家Token套餐一脸茫然。有中国联通工作人员直言“办不了,现在只是一个概念”;中国电信工作人员反问“你是要装宽带吗”;而线上客服在面对询问时,大部分也很难第一时间给出解读。这意…

集体押注世界杯,AI为何要扮演“懂球佬”

每经记者 温梦华 每经编辑 张益铭2026年美加墨世界杯才刚刚拉开帷幕,而赛场外的AI(人工智能)赛事研判、实力比拼,早已先行开启。日前,国产大模型Kimi(月之暗面)称将通过Agent(智能体)集群同时调度300个子Agent,公开预测104场世界杯赛事结果,并提出德国队或爆冷夺冠。Kimi同时上线了一场“押注”活动:奖池中有1万亿Tokens(词元),用户选队后球队赢了就可以瓜分Token,将体育赛事与AI用户运营深度绑定。《每日经济新闻》记者(以下简称每经记者)注意到,千问也紧随其后上线了相关活动。每经记者实测发现,豆包、元宝、DeepSeek(深度求索)、文心一言等国产大模型在被问及“2026年世界杯谁会夺冠”时,多数预测答案为“西班牙队”,判断逻辑也高度趋同。热闹之下,Kelly Bench(一个大模型评估测试平台)最新数据却显示,包括ChatGPT等在内的顶级模型在足球赌盘上表现惨淡。Kimi、千问等AI大模型为何要“押…

【8点见】湖南一地教育局通报“非监考老师进入考场”

来源:央视网  央视网消息:每天8点,央视网为您梳理24小时内发生在咱们身边的大小事儿。  ·教育部:2026年全国高考报名人数为1290万人。  ·5月份中国物流业景气指数为50.3%,重回扩张区间。  ·外交部回应美伊当前局势:战事再起不符合任何一方利益。  ·赖清德称将处理TikTok小红书对台青影响,国台办回应:表明其心虚胆寒。  ·自然资源部对江西湖南贵州启动地质灾害防御Ⅳ级响应。  ·工信部向166家外资企业发放经营试点批复,覆盖全部增值电信业务。  ·国家广播电视总局部署开展微短剧有害低俗内容和侵权盗版专项治理。  ·71款移动应用违法违规收集使用个人信息被通报。  ·中国红十字会总会开展山西长治沁源县煤矿事故人道救助。  ·平陆运河全线通水,将于今年9月通航。  ·山西阳泉发现约2.95亿年前木化石。  ·交通运输部原总…

赖清德称将处理TikTok小红书对台青影响,国台办回应

6月3日,国务院台办举行例行新闻发布会。有记者问,近日,赖清德在与岛内高中生对谈时称,TikTok、小红书对台湾青年世代的影响已达安全危机,久而久之,台湾可能就没有守护民主的意志,会把“中国”当作好人;将要求“教育、文化部门妥善处理”。请问对此有何评论?发言人朱凤莲答问表示,大陆同胞对于台湾同胞,不仅是好人,更是亲人、家人。台湾同胞特别是台湾青年,越来越喜欢用大陆的社交软件,是因为他们可以用这些社交软件享受更多生活体验和自由表达的机会。他们分享美食美景,会收获满屏“好想去看看”的热情互动;他们发帖寻亲,会有许多的大陆网友热情响应提供线索;他们想交流学习,会刷到各类笔记教程,甚至是手把手的远程教导。所有温暖交集的瞬间都是两岸网友共享共创的双向奔赴,更是“两岸一家亲”的生动体现。朱凤莲说,大陆社交软件助力台湾青年成长、发展、圆梦,而赖清德当局却不断进行抹黑,甚至对…

新品密集迭代 AI眼镜仍需一个“杀手级”应用

证券时报记者 康殷今年以来,中国制造的平价AI眼镜在TikTok大卖、在海外爆火的消息不断,打开了这一单品的想象空间。在国内,AI眼镜赛道近期动作频频。XREAL推出副线品牌xbx,首款产品同步发售;雷鸟创新连发两款新品并预告次世代机型,科大讯飞发布搭载多语种翻译与智能体的AI眼镜。国际数据公司(IDC)数据显示,2025年全球智能眼镜市场出货量达1477.3万台,同比增长44.2%。其中,中国智能眼镜市场表现尤为突出,全年出货量为246万台,同比增长87.1%。然而,在新品浪潮与数据热度之下,AI眼镜从极客产品走向大众日用品,依然面临硬件门槛、场景落地和结构性障碍等重重关卡。先过“戴得住”这关过去几年,AI眼镜留给消费者的固有印象是“笨重”“压耳”“撑不过半天”。不过,这一认知在近期的新品发布中被刷新。雷鸟V4将机身重量控制在38克,首次搭载蓝鲸半固态电池与异形钢壳封装技术,电池容量较上代提升57%,连续播…