DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

6月27日,DeepSeek团队联合北京大学发布名为《DSpark》的研究论文(基于speculative decoding方向),提出一种用于加速大模型推理的新方法。论文指出,现有并行“草稿生成”方式虽然能一次生成更长token,但由于token间关联不足,容易导致被拒绝比例上升,并浪费验证算力。为此,DSpark引入半自回归结构,在并行生成骨干上加入轻量级顺序模块,以增强token之间的依赖关系,提高草稿质量。同时,DSpark提出“基于置信度的动态验证机制”,根据不同请求的成功概率与系统负载,自适应调整验证长度,从而减少无效计算开销。在离线测试中,该方法显著提升了可接受生成长度;在DeepSeek-V4线上系统中,相比基线模型,推理速度提升约60%–85%,并有效降低高并发下的吞吐损耗。论文同时开源模型检查点与训练框架DeepSpec,以推动社区进一步研究。责任编辑:刘德宾…

DeepSeek获510亿融资,投资方公布:腾讯、宁德时代、京东、网易等

据企查查APP显示,杭州深度求索人工智能基础技术研究有限公司(以下简称DeepSeek)获得A轮融资,融资金额约510亿元,企业估值约为4000亿元。长安街知事(微信ID:Capitalnews)注意到,除了风投机构,互联网巨头腾讯、京东、网易,新能源龙头宁德时代也出现在投资方名单中。DeepSeek成立于2023年7月17日,总部位于浙江省杭州市拱墅区,是从事大语言模型及多模态AI技术研发的有限责任公司,其推出的DeepSeek系列开源模型,是国内领先的开源大模型系列。DeepSeek的母公司幻方量化由梁文锋创立于2015年,巅峰时期资产管理规模突破700亿元。据媒体报道,梁文锋正是凭量化业务积累的利润,才支撑了DeepSeek“不融资、不商业化、不路演”的极简运营模式。直到今年6月初,DeepSeek才被曝正式启动首轮外部融资。据中国基金报报道,在DeepSeek的A轮融资中:创始人梁文锋或出资约200亿元,为本轮融资中最大单一出资方。腾讯出资约…

DeepSeek获510亿融资,投资方公布:腾讯、宁德时代、京东、网易等

据企查查APP显示,杭州深度求索人工智能基础技术研究有限公司(以下简称DeepSeek)获得A轮融资,融资金额约510亿元,企业估值约为4000亿元。长安街知事(微信ID:Capitalnews)注意到,除了风投机构,互联网巨头腾讯、京东、网易,新能源龙头宁德时代也出现在投资方名单中。DeepSeek成立于2023年7月17日,总部位于浙江省杭州市拱墅区,是从事大语言模型及多模态AI技术研发的有限责任公司,其推出的DeepSeek系列开源模型,是国内领先的开源大模型系列。DeepSeek的母公司幻方量化由梁文锋创立于2015年,巅峰时期资产管理规模突破700亿元。据媒体报道,梁文锋正是凭量化业务积累的利润,才支撑了DeepSeek“不融资、不商业化、不路演”的极简运营模式。直到今年6月初,DeepSeek才被曝正式启动首轮外部融资。据中国基金报报道,在DeepSeek的A轮融资中:创始人梁文锋或出资约200亿元,为本轮融资中最大单一出资方。腾讯出资约…

中央网信办举报中心开设“涉AI应用乱象举报专区”

来源:央视网  央视网消息:据“网信中国”微信公众号消息,为配合“清朗·整治AI应用乱象”专项行动,进一步规范AI服务和应用,促进行业健康有序发展,切实保障公民合法权益,中央网信办举报中心自2026年6月起开设“涉AI应用乱象举报专区”,专项受理公众举报。受理范围主要包括生成合成内容标识落实不到位、制作发布虚假不实和暴力低俗信息等14类问题。  一、受理范围  (一)AI应用服务违规类  1.未按规定履行大模型备案登记义务  2.AI平台安全和审核过滤能力不足  3.大模型训练语料安全问题  4.AI数据投毒问题  5.生成合成内容标识落实不到位  6.滥用AI技术开展违法违规活动  7.开源模型安全管理不到位  (二)AI信息内容乱象类  1.利用AI“魔改”经典、生成“数字泔水”  2.制作发布虚假不实信息  3.假冒仿冒他人  4.制作发布暴力低俗等不良信息  5.侵害未成年人权益  6.利…

直击英伟达GTC 2026黄仁勋演讲:英伟达正式进军PC芯片市场

来源:财联社财联社6月1日讯(编辑 刘蕊)北京时间2026年6月1日11:00,英伟达创始人兼CEO黄仁勋将在中国台北发表英伟达GTC台北2026主题演讲。本场演讲预计将围绕人工智能主题展开, 黄仁勋将登台揭晓驱动新一代AI的技术突破。财联社将全程文字直播本次演讲,敬请密切关注以下时间为北京时间12:40 黄仁勋发布面向WINDOWS系统个人电脑的新款处理器英伟达正式进军个人电脑芯片市场,推出全新处理器,意在打破英特尔在该领域的垄断地位,并推动PC设备适配人工智能时代的发展需求。黄仁勋表示,今年秋季起,戴尔、联想等主流PC品牌将陆续推出搭载RTX Spark超级芯片的笔记本及台式机。这款由英伟达联合联发科共同研发的产品,集成了处理器与显卡,可运行微软Arm架构版Windows系统。12:33 黄仁勋:Nemotron 3 Ultra是全球最具成本效益的开源模型黄仁勋:Nemotron 3 Ultra是全球首款基于混合架构的模型,结合了SSM状态空间模型和…