电脑维修 笔记本维修 手机维修 打印机维修 IT外包
24小时服务电话:0731-84688748  18229718750
地址:长沙市天心区青园街道友谊社区友谊小区A3栋15号

服务区域:湖南省政府方圆5公里内(友谊社区 青园小区 阳光嘉园 天一康园 湘超景园 国际公寓 HOPSCA写字楼 豪布斯卡 天城·泰祥苑 国检园 梦网景园 石人村金石·蓉园安置小区 鑫隆家园 湘诚嘉园 童话里 七星车城 华铁佳苑 巢之恋 鑫远杰座 鑫远华城 满庭芳 宽域 鑫天山水洲城 星语林名园 青园街道进湾子社区 白沙世纪佳园 长沙欧洲城 长沙奥林匹克花园 高升安置小区 湘府名邸 嘉尚君远 富景园 鑫源公寓 岳泰理想城 等等...)

行业新闻 - IT界最新新闻资讯挑选合辑。

更多行业资讯>> RSS镜像 RSS订阅
上一页 1 2 3 ... 5 下一页

∞ DeepSeek再放大招,推理速度狂飙85% 怎么做到的?

6月27日,DeepSeek公开DSpark技术报告和DeepSpec代码库。DeepSeek-V4的底座模型没有变,新增的是一个服务端推测解码模块:DSpark。DeepSeek在HuggingFace模型页里把话说得很直白:V4-Pro-DSpark和V4-Flash-DSpark"不是新模型"。这两个页面指向的是同一个模型检查点,加上推测解码模块后的服务版本。

这意味着,DSpark没有让模型突然变聪明。它瞄准的是模型上线之后,怎样更快、更便宜地把答案吐出来。

技术报告称,DSpark已部署在DeepSeek-V4的线上服务系统中。在真实用户流量下,相比此前的MTP-1生产基线,也就是DeepSeek上一代线上推测生成方案,V4-Flash的每用户生成速度提升60%到85%,V4-Pro提升57%到78%,前提是匹配吞吐条件。

这里的"快"也要收住口径。它主要指生成阶段,也就是模型持续输出token的那一段速度,不等于所有用户请求的端到端响应时间都同步快了85%。 长提示词的预填充、检索、工具调用、排队和网络延迟,仍然会影响用户实际等多久。

模型上线后,还有一笔推理账

这件事没有新模型发布热闹,但它更接近AI公司每天面对的现实:模型训练完之后,成本没有结束。

聊天机器人、代码助手、智能体和搜索式产品,每一次调用都在继续消耗GPU时间。模型慢一点,用户等得久一点;推理贵一点,厂商就更难把高质量模型开放给更多场景。

AI行业过去两年更习惯讨论训练成本:一家公司要买多少GPU、建多大的集群、花多少钱训练下一代模型。但模型真正变成产品之后,另一类成本会不断冒出来:推理。

训练像一次大工程,推理更像水电费。 只要用户还在问问题、智能体还在跑任务、代码助手还在生成补丁,模型就要继续消耗算力。

大模型服务最后都会回到两个指标:速度和单位token成本。API定价页面通常按输入token和输出token收费,企业内部也会把不同模型、缓存、路由和上下文长度拆成成本项。

DSpark不能直接等同于降价,但如果同样的GPU集群能在相近吞吐下让用户更快拿到答案,它意味着同样的硬件可以服务更多用户,或者同样的用户体验可以用更少的卡来提供。

"先猜,再验"

推测解码的思路,可以粗略理解成"先猜,再验"。

大模型生成文本时,通常是一个token接一个token往外吐。前一个token出来,后一个token才知道该接什么。这种方式稳,但慢。推测解码会让一个更轻的草稿模块提前猜出一段候选token,目标大模型再批量验证。猜对的部分直接接受,猜错的位置再修正。

小模型不能替大模型做决定。最终接受哪些token,仍然由目标模型校验;正确实现下,它改变的是生成方式,不改变目标模型的输出分布。 加速来自让大模型批量验证候选,而非逐步生成。

DSpark改的,是草稿怎么生成

论文没有只停在"先猜,再验"这层解释。它重点处理了草稿怎么生成。

现有的草稿策略大致分两类。自回归草稿器更稳,因为后一个token会看见前一个token,但草稿变长,延迟也就跟着上去。而并行草稿器更快,可以一次猜出一整段,但每个位置各猜各的,后面的token容易和前面脱节,接受率越往后越容易下滑。

DSpark选择折中。 论文题目里的关键词是"半自回归生成(Semi-Autoregressive Generation)",它先用并行方式提出一段候选,再用一个轻量顺序层修正后续token的条件关系。这样既保留并行生成的速度,又让后面的候选能看到前面已经猜了什么。

另一个关键点,是验证多长一段。

候选token猜得越多,不一定越省。如果明知道后半段很可能被拒绝,还交给大模型验证,就是把GPU时间花在低价值位置上。DSpark会看候选的置信度,也看当前系统负载,动态决定验证长度。 GPU空一些,可以多验;负载高时,就把算力留给更可能被接受的部分。

论文标题里的"置信度调度(Confidence-Scheduled)",说的就是这件事。

DSpark站在已有技术路线之上

DSpark站在推测解码已有路线之后,更像是DeepSeek把这条技术路线推到线上服务后的公开参照。

SpecInfer早在2023年就把小模型预测、token树(token tree)和并行验证放进大模型服务系统里;Medusa在2024年提出给模型加多个解码头,一次预测多个后续token;EAGLE系列则围绕草稿模型和动态草稿树(draft tree)继续提高接受率。vLLM、SGLang、TensorRT-LLM这类推理框架,也早就把推测解码当作降低延迟的重要工具。

DSpark的位置,在于它把几个生产问题放到一起处理:草稿怎么生成,候选怎么保持连贯,验证长度怎么随负载变化,线上真实流量下速度到底能提高多少。

论文里反复出现的关键词,也从"模型能力提升"转向每用户生成速度(per-user generation speed)、匹配吞吐(matched throughput)、服务等级协议(SLA)这些服务侧词汇。

这也解释了为什么不能只挑最大的数字看。论文里确实还有661%、406%这样的高倍吞吐数据,但它们来自更严苛的每用户速度目标:在那种设定下,旧基线本身已经接近服务能力的边界,DSpark的相对优势会被放大。

真正能说明常态收益的,还是前面那组数字:匹配吞吐、真实流量分布、对比对象是MTP-1。

DeepSpec能复现什么

DeepSeek同时开源了DeepSpec。这是一套用于训练和评估推测解码草稿模型的代码库,包含数据准备、训练和评估流程,也放出了Qwen3、Gemma等模型上的相关检查点。

不过,开源不等于"下载即复现"。 项目文档里提示,默认Qwen3-4B配置下,目标模型缓存可能接近38TB;默认训练脚本假设单节点8张GPU;如果要对齐论文结果,训练设置必须严格一致,特定领域还需要对草稿模型做额外微调。

外界可以验证方法的一部分,也可以把DeepSpec移植到其他开源模型上,但DeepSeek-V4线上服务里的那组速度提升数字,仍然来自DeepSeek自己的硬件规模、流量分布和生产系统调度。

开源的是方法,不是环境。

社区最关心的是复现边界

X上的讨论没有停在叫好,更像一群工程师在追问:这套办法到底怎么跑、能不能复现、边界在哪里。

AI研究者Ravid ShwartzZiv把DSpark概括为两类草稿器的折中:并行草稿器快,但接受率沿候选块衰减;自回归草稿器稳,但延迟随草稿长度上升。他特别提到DSpark加入的两个组件:置信度判断头和负载感知调度器,并补了一句关键边界:"和所有推测解码一样,它是无损的。"

工程师更关心的是能不能跑起来。vLLM贡献者Rafael Caricio称自己在双DGX Spark GB10上把DeepSeek-V4-Flash的DSpark模式跑通,单流解码约60 tok/s,大约是MTP-1的1.5倍。

他同时提到,真实代码会话暴露了合成基准测试看不到的问题:瓶颈不只是计算核心的速度,而是长上下文下草稿接受率会明显下滑。

Tech2Wild也给出了相近方向的现场数据,显示V4-Flash-DSpark已有人在特定vLLM环境里试跑。但这类结果高度依赖硬件型号、框架补丁版本、上下文长度和并发设置,换一套环境结果可能完全不同。

也有人专门提醒边界。AcingAI在X上指出,DeepSeek报告里的高倍数仍然是"自家硬件、自家MTP-1基线、匹配吞吐条件下"的结果,外部尚未完整复现。

这提醒我们,DSpark的一部分优势来自负载感知调度,而调度效果天然依赖生产环境的流量规模和硬件配置。

同样的能力,更少的算力

南华早报在6月28日的报道中,把DSpark放在推理瓶颈、芯片压力和用户等待时间里看。这个角度比"DeepSeek又发了什么模型"更接近产品现实。

AI公司还会继续比模型能力,但当能力差距被压缩,谁能把同样的能力更快、更便宜地交付出去,也会成为竞争的一部分。

DeepSeek这类公司尤其需要把这件事讲清楚。DeepSeek一直把低成本、高效率作为外界理解它的重要入口,从模型训练叙事到API价格,最被关注的不是它有没有再堆一个更大的参数规模,而是它能不能把同等能力做得更便宜。

DSpark延续的正是这条线:它不证明V4突然更聪明,它证明V4在服务用户时可以少浪费一部分推理算力。

如果把视角再放宽一点,推理优化也会影响开源模型生态。开源模型过去常被认为"便宜",但真正部署时,显存、吞吐、并发、延迟和运维复杂度都会变成成本。

一个模型能开源,只说明大家能拿到它;能不能便宜地服务大量用户,还要看推理栈能不能跟上。

DeepSpec放出Qwen3、Gemma等检查点,说明这件事已经不只停在DeepSeek-V4自己身上。迁移到什么程度,还要看社区适配、框架支持和硬件兼容的实际进展;但从目前公开信息看,DeepSeek已经让这条路线走出了自家模型。

DSpark的价值就在这里。它给V4增加了一层更接近生产系统的推理服务工具,而不只是一个新能力标签。

接下来值得看的,已经不止是DeepSeek自己能跑多快,还包括这条路线能被多少人走通。DeepSpec已经放出检查点和训练流程,推测解码正在从一家公司的工程选择,变成开源推理降低成本的通用手段,前提是其他框架和硬件能跟上。

∞ 数十起夹伤事故,暴露电吸门安全隐忧

近日,山东济南一儿童手指被车门夹手的视频引起了业内对于车门防夹功能,尤其是电吸门防夹功能的议论。早在2005年,传统燃油车已开始普及电吸门这一配置,且大多搭载在百万元级别的豪华车型上,被视为豪华车的标志性配置。到了新能源车时代,电吸门的价格不断下探,售价在15万元级别的新能源车也可以安上电吸门,以此作为汽车宣传的“黑科技”卖点之一。

根据多家车企产品企划人士的说法,电吸门设计的初衷是可以让关门声音更小,尽可能降低车内的乘客受到声音干扰,但随着车门重量不断增加、对侧翻等安全要求更严苛、车厢密封要求提升等考虑因素出现,电吸门能帮助力气小的女士、老人等群体更轻松地关门,成为了不少车企的必选项。

但在现实生活中,电吸门却吸住了不少人的手指。据第一财经记者不完全统计,近日被电吸门夹伤手指的案例已有数十起,轻则因挤压导致手指肿胀,重则出现手指骨折。在行业对车辆安全愈发重视之际,电吸门的“咬手”问题亟待解决。

“咬手”的电吸门

近年来,电吸门“咬手”安全事故频繁发生,是隐藏式门把手外的又一安全隐患,也为车门安全敲响了新的警钟。

第一财经记者了解到,电吸门是一种通过电力驱动,能让车门在关闭时自动完成吸合全锁紧的配置。它主要作用于车门关闭至半锁状态后,通过电机拉紧门锁拉索,让锁舌翻转,达到全锁紧状态。从视觉上看,这一关门过程像门被吸向车身,所以称为“电吸门”。

某新势力商企部负责人告诉记者,过去,电吸门是豪华车上才有的配置,在智能化技术进步后,新能源车为了带有高端品牌的体验感,让驾驶员、乘客更优雅地上车,很多车型甚至全系配置了电吸门。他称:“现在的车门越来越重,如果不配电吸门,可能会出现门锁只关到半锁状态,无法全紧,此时用户需要再次开合车门并极易出现大力摔门的情况,而电吸门就可以解决这个问题。”

但也有传统车企人士告诉记者,尽管公司现有的产品也有40万级别的车型,但在售车型均未配置电吸门,一方面是成本问题,另一方面是在前期用户调研中发现,电吸门属于用户非刚需配置,感知价值不高。

无法忽略的问题在于:电吸门频频“咬住”了人手,目前大多数电吸门,吸合阶段并不具有防夹功能。

根据连云港消防救援支队发布的视频信息,消防员通过模拟实际场景对电吸门进行实验。实验显示,电吸门在感应到障碍物后虽有一定的缓冲,但仍以较大力度闭合,对儿童或未观察到的乘客存在夹伤风险。资料显示,电吸门电机扭矩约有12至20牛/米,相当于约受到30公斤的挤压,足以对人的手指造成伤害。

比亚迪方面表示,对于MPV车型而言,电吸门最后的电吸阶段并非是侧滑门的滑动电机工作,此时不防夹。当前市场上的所有电动门,电吸阶段基本都是不防夹的。此前在问界M6发布会上,华为常务董事、终端BG董事长、产品投资评审委员会主任余承东表示,该车型在全车配备了电吸门,在吸合的过程中不能防夹。即在车门最后只剩一条缝、吸上的一瞬间,请勿将手指放进缝里,因为吸合过程中的物理设计决定了此时的车门无法防夹。

记者从多家车企研发人士处了解到,电吸门需要克服关门的反作用力,而常规的防夹设计逻辑也是通过感知反力和运动速度变化来判定是否启动防夹。因此,若在吸合过程中设置防夹功能,车门感应到阻力就会自动弹开,与电吸门吸合锁止的功能相冲突。由此,电吸门的防夹成为了多年来的行业难题。

2016年,美国一位宝马X5的车主因电吸门自动吸合被夹断了拇指指尖,伤势严重无法再移植。尽管宝马坚称车辆系统无故障,且用户手册已明确提示风险,但陪审团仍判定宝马承担全部责任,赔付车主约190万美元。

在国内,360创始人周鸿祎此前测试广汽昊铂某款车型车门“防夹功能”时,也被车门夹到了手指。本月初,某新势力车企车主也因电吸门夹手致轻微骨折,接诊医生称,电吸门挤压力极大,有皮肤脂肪缓冲仍致骨折,儿童更易出现粉碎性骨折等严重伤害。

成本与标准

在电吸门发展20余年的过程中,数百起电吸门致伤案例频发,车企也在积极想办法解决这一行业难题。

最常见的方式,即从结构尺寸上将电吸门吸合启动的间隙缩短至6~8mm,从吸合条件上规避事故发生。比如:蔚来称对于电吸门防夹保护,工程团队设计了“分段自吸”和“自吸打断”,同时将启动间隙降低至8mm以下;一汽奔腾的工程设计师也告诉记者,在开发团队多轮测试后,电吸门吸合启动间隙被压缩至8mm,“成年人的手指厚度普遍超过1cm,8mm的间隙意味着手指压根伸不进去吸合间隙”。

也有的车型采用电容式防夹方案,即在车门边缘放置一圈电容传感器感知物体介入。比如理想L9 Livis即采用了电容式防夹的方案,通过监测电容变化判定是否启动防夹。但也另有不少其他品牌高端车型只将电容式传感器布局在车窗线以下的半截车门边缘,仍有夹手风险。

此外,目前市面上几乎所有的车门防夹都需要“先夹到手指、再反弹”,无法提前预判,需要引起消费者重视。

从技术层面而言,预防电吸门“咬手”的事故仍有操作空间。从成本而言,车企是否愿意为此增加成本以提升安全冗余也是一大问题。

一家自主品牌研发工程师表示,四车门都配置“电吸门”成本价在2000~3000元,但后续选装电吸门的价格却是成本的2倍。此前,理想汽车CEO李想也在社交平台上谈到,如果前装标配电吸门成本只是500元,而后装电吸门成本则是5000元。他称,前装电吸门只是多了4个小电机,而后装电吸门成本之所以贵,是贵在各种线束和施工成本。

某汽车集团研发院人士告诉记者,最近这几年,由于行业价格战,车企也一直在尽可能降本,很多配置的安全冗余不在于技术难,但需要增加成本。基于降本的需要,这项安全冗余的量产上车就会很难。在更常规的操作中,电吸门的方案由供应商给出,而车企综合成本、车型定价等维度进行选择。

“目前,强制性国标没有针对电吸门防夹提出要求,绝大多数的车型也没有在吸合阶段有防夹的功能。”上述研发院人士告诉记者,现行的国标规定车门锁必须拥有双重安全冗余,即常说的一级锁、二级锁,但没有要求电吸门必须防夹。

根据GB 15086-2013《汽车门锁及车门保持件的性能要求和试验方法》,主门锁必须同时具备半锁紧(第一级锁止)位置与全锁紧(第二级锁止)位置两个档位。该试验方案还对两个档位规定了纵向、横向抗拉脱载荷与惯性防脱要求,两级锁止都要通过强度试验。即将于2027年实施的《汽车车门把手安全技术要求》强制性国家标准修订计划项目在征集意见中曾提到,规定了隐藏式车门内把手和应急式车门内把手的标志要求、电动式车门外把手的防夹要求与试验方法等。而对于电吸门夹手的风险和防夹要求等,上述两份标准均未有明确要求。

微信编辑 | 小羊

∞ DeepSeek V4正式版官宣7月中旬上线 高峰时段API价格翻倍

6月29日,DeepSeek团队宣布,DeepSeek V4正式版计划于7月中旬正式上线,本次版本更新将带来更多功能优化和性能提升。同时,为了更合理地配置资源、提升服务稳定性,正式版发布后将同步调整API定价策略,引入峰谷定价机制。

从价格表可以看到,API高峰时段价格将是平时价格的2倍,平时价格与DeepSeek V4 API目前定价相同。

高峰时间段为每天的上午9点到12点、下午2点到6点。


DeepSeek-V4模型预览版于4月24日上线并同步开源。DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:


∞ 全球十大广告平台中国企业占据五席

广告曾经主要是电视、杂志、报纸等新闻娱乐媒体的收入补贴来源。如今,广告更多成为各类线上服务的营收支柱,也越来越多地被商家用来压缩微薄的经营利润、拉动销售。

与此同时,中国企业在广告市场中的话语权大幅提升。智威汤逊母公司 WPP 旗下媒介采购部门整理的 2025 年全球广告售卖平台十强榜单,清晰印证了两大行业趋势。

数字广告蓬勃发展叠加中国企业快速崛起,广告行业的全球化属性愈发凸显:品牌方借助全球互联网平台,可在本土之外的各个国家投放广告。

除谷歌、元宇宙平台(Meta)这两家美国广告巨头外,榜单中还有四家电商企业,分别是亚马逊以及三家中国企业:阿里巴巴、特木(Temu)母公司拼多多、京东。其余上榜的中国广告平台包括:旗下拥有抖音、TikTok、TikTok 小店的字节跳动,微信所属的腾讯,以及短视频平台快手。榜单里仅剩的另一家美国企业为微软。

该数据综合了公开财报,以及 WPP 对未上市企业(如字节跳动)、未单独披露广告总收入企业(如微软)的预估数据。

二十年前,这份榜单基本由欧美传媒娱乐企业垄断,业务覆盖报纸、杂志、电视等领域。如今传统媒体已无一跻身前十,不过华纳兄弟探索公司与派拉蒙天空舞的合并落地后,这家新集团将重新回归榜单。迪士尼、康卡斯特等其他大型传媒企业的广告业务规模,均略低于榜单第十名快手。

行业格局的变迁充分说明:互联网企业抢走了大量原本支撑传统媒体生存的广告收入;而在数字赛道内部,各大零售平台效仿亚马逊,纷纷依托自有线上渠道搭建起庞大的广告业务体系。(就在上周,沃尔玛收购广告技术公司 Vibe,加码布局自有广告业务。)

电商平台的广告收入主要来源于各大品牌与中小商家,商家付费获得平台曝光机会,精准触达目标消费人群。

WPP 测算数据显示:零售媒体广告市场规模从 2020 年的 730 亿美元暴涨至去年的 1757 亿美元,预计 2030 年该市场规模将达到 2656 亿美元。

WPP 媒介部门全球商业情报总裁凯特・斯科特 - 道金斯表示,中国是全球最大的零售媒体广告市场。去年中国零售媒体广告投放规模达 776 亿美元,远超美国市场的 594 亿美元。

不过她也提到,随着字节跳动 TikTok 小店这类社交电商平台强势崛起,中国零售媒体广告增速大幅放缓:去年行业增速仅 4.5%,不足 2024 年增速的一半;WPP 预测今年增速将进一步回落至 2.8%。

斯科特 - 道金斯指出,互联网企业全球化广告业务扩张带来一个附属影响:广告对单一国家经济体的拉动作用越来越难以精准衡量。例如,一家中国企业可以在美国互联网平台投放面向巴西用户的广告,广告费在中国境内结算,资金并未流入巴西,但却可以拉动巴西当地的消费。

Meta 的财报就能直观体现这一现象,其营收同时按照用户所在地、广告投放客户所在地两个维度统计。以其一季度财报为例:亚太地区广告客户为 Meta 创造 154.45 亿美元营收,但面向亚太地区用户投放的广告仅带来 106 亿美元收入。

这意味着大量亚太企业在全球其他地区投放广告。与此同时,北美地区企业在 Meta 的广告投入为 212.67 亿美元,而面向北美用户的广告营收却达到 237 亿美元。由此可见,以往将广告支出占 GDP 比重作为行业分析指标的传统统计方式,如今已经不再精准。

究其本质,广告的最终目的是刺激消费成交。广告费未必会在目标投放国发生资金流转,却依然能够带动当地的经济活动。

∞ 比特币ETF料创推出以来最严重单月资金流出 净流出达40亿美元

美国上市的比特币ETF将面临自两年前推出以来最严重的月度资金流出。数据显示,6月份,投资者已从这13只比特币ETF中撤出超过41亿美元,创下自这些产品于2024年1月开始交易以来最大的单月净流出纪录。其中,贝莱德旗下管理资产规模最大的比特币现货ETF—— IBIT —— 单独就占了30亿美元的资金流出。


与此同时,比特币本身也正迈向自2022年6月以来表现最差的一个月, 当时一连串加密货币企业相继破产,最终引发了Sam Bankman-Fried旗下加密货币交易所FTX的倒闭。本月以来,比特币已累计下跌逾18%。自上周跌破6万美元关口后,其价格一直徘徊在这一水平附近。

市场情报公司Glassnode的分析师在最新报告中写道,“此次资金流出的规模和持续时间表明,传统投资者依然保持防御姿态。”分析师补充称,以往比特币出现回调时,往往会吸引资金流入ETF逢低买入;而这一次,投资者却选择降低敞口。