大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 721|回复: 0

格兰:重磅来袭!有哪些超预期?!

[复制链接]
发表于 2026-4-25 12:24:28 | 显示全部楼层 |阅读模式
  经常放鸽子的DeepSeek V4,终于露面了。

  过去几个月,DeepSeek V4一直活在烟雾弹里。每次问都是下周,结果下周之后还有下周。

  今天,DeepSeek直接把V4预览版放了出来,官网、App、API同步上线,直接引爆A股国产算力方向。

  回看过来,DeepSeek总是有种魔力,从不铺天盖地宣传,也没有一点点预告,突然就把大模型摆到大家眼前,震惊全世界。

  我很早就接触他们,他们一直就是这么一个态度,只管专心做事,总能把事做到极致。

  这次V4按规模推出了两个版本,Pro冲击性能极限,Flash让普通用户也能上手。

  比较惊艳的是Pro模型,在开源模型里没有任何对手,甚至性能已经能硬刚全球顶尖的闭源模型。

  在程序员的“奥赛场”Codeforces上,V4-Pro的评分已经超越了GPT-5.4。而在公认最难的数学和逻辑推理挑战中,V4-Pro更是直接挑落了模型界的三巨头。

  不出手则以,出手必惊人。

  此外,DeepSeek 此次还宣布,100万token上下文将成为所有官方服务的标配。

  在我看来,这足以重塑行业规则。

  普通用户在让AI读报告、啃书或分析复杂项目代码时,总有一个困扰,AI经常像小熊掰棒子一样,看了后面忘前面。或者因为内存不够用,没法一次性处理全部,只能被迫切片处理,拆成好几次跑。

  上下文越长,模型就越慢、越贵、越吃内存。

  所以,百万级别上下文,都是在各大模型里,VIP才能享受的奢侈品。

  现在,DeepSeek直接把奢侈品干成水电煤。

  DeepSeek之所以能达到这样的效果,并不是靠多买GPU,走老美大力奇迹的哪条路,而是在模型架构里,把长文本的成本结构改了。

  让模型先“压缩筛重点”,再“低成本看全局”,不用把100万token逐字逐句全量硬算一遍。

  用这个方法,DeepSeek硬是在算力和存力上,狠狠省下一块。

  直接看图吧。

  这样一来,结果就很明显了,开放百万上下文,刀是DeepSeek砍的,血是同行流的。

  不管是昨天的open AI、谷歌,还是今天的DeepSeek,中美两国的AI大模型发展,本质上都是在一步步向工业化靠拢。

  专业的性能比拼、技术变革聊完了,再讲点大家更爱听的,关于DeepSeek用国产算力的事儿。

  官方说法是,V4大模型适配了华为的昇腾芯片,明确说明支持部署和推理。

  这也是今天国产算力这条线能够有如此亮眼表现的核心原因。

  如果国内顶级模型只能靠英伟达的CUDA才能做好,那我们国产算力要么停留在故事层面,要么被迫跟在老美后面,始终看人家脸色。

  我之前得到过很多关于V4延期发布的消息,其中最敏感的都指向一个地方,训练段框架从英伟达向昇腾迁移太痛了。

  去年年中,DeepSeek甚至经历过一次比较严重的训练失败,当时最核心的问题,就是重新适配芯片效果不好。

  尽管目前V4是否完全基于昇腾训练还没有确认官宣,不过可以确定的是,华为的适配程度正在全面提升。

  和圈子里交流后,发现看法出奇一致,要在下半年加大力度支持华为。

  这就给了国产算力一个更大的想象力。虽然训练段海不能说完全脱离英伟达,但随着DeepSeek给昇腾预留真实生产路径,国内其他大模型也可以技术对标,让国产芯片有更多舞台展示。

  国产算力的身价,就得靠顶尖模型一轮一轮磨出来的。

  卖方当前比较大的共识是,国产算力产业链,已经正式挺进新阶段了。

  资金关注的重心不知不觉间,变成了能不能交付。

  问题出在哪呢?

  应用端,我们确实在大爆发。AI开始写代码、做Agent、读长文档、跑企业流程。

  3月豆包日均token使用量已经突破120万亿,季度环比增长140%。AI应用需求爆发,已经拉动算力价格持续上涨,模型厂商和云厂商也开始多轮涨价。

  看上去红红火火。

  可国产算力的供应增长,却没有那么快。

  去年国产化率,从35%提升到46%,看上去表现不错。国产AI芯片渗透率也在往上走。

  但这个增速还远远不够。

  因为我们国产卡单卡性能和海外最顶级芯片相比,确实差距,所以只能靠超节点来弥补。

  超节点不像外界想的那样,把8卡升级到更多卡,或者把卡堆得多一点就完了事了。

  这后面是一整套复杂的体系,算力协同、串联、散热、电源,哪样工作量都不小。

  也就是说,真正的难点不是有没有卡,是这些卡能不能真的成为一个整体,协同作战。

  超节点一旦放量,不光是芯片的事,带动的是一整条产业链。

  训练的时候,需要很多卡之间高速协同。推理的时候,长上下文会产生大量KV Cache缓存,对内存和互联要求非常高。

  芯片之间需要拼命交互数据,导致内部的交换机和交换芯片用量直接飙升,连带着像特制电路板、高级插头和光缆这些都成了刚需。

  发热量还像个大火炉,传统的风扇根本压不住,必须得100%全靠液冷系统来降温保命。

  同时整个供电系统也得跟着推倒重来,直接带火了一批高级电源和变压设备的生意。

  后面再看国产算力行情,不能只看谁站在最前面,更要看谁离真实交付最近。

  这轮国产算力,不要单纯理解成DeepSeek带来的情绪刺激,验证链条早就有了,DeepSeek将会作为催化,加速这一链条的推进。

  我们的国产算力+新能源双主轴,依旧是市场里最靓的仔。

  美中不足是指数稍微走低,带头走出这波行情的创业板,也回落到了5日线之下,完成一次像样的调整。

  不过单从量能上看,2.6万亿的成交还是说得过去的。3月以来,资金最怕周末川普有话要说,每到周五都会大幅流出避险。最近三周,反而有资金开始先手去博周末可能的利好了。

  这是一个非常值得关注的改变。市场的风险偏好,正在一步步变好。

  即便指数连续调整两天,我也不认识会改变上升格局,最多算是太拥挤了,整体兑现一波,震荡一下而已。

  长远看,调整是必要的,在得到充分换手后,我们的市场才能有更大的向上空间。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考

GMT+8, 2026-5-18 04:41 , Processed in 0.140647 second(s), 16 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表