格兰：重磅来袭！有哪些超预期？！

lameihua · 发表于 2026-4-25 12:24:28

　　经常放鸽子的DeepSeek V4，终于露面了。

　　过去几个月，DeepSeek V4一直活在烟雾弹里。每次问都是下周，结果下周之后还有下周。

　　今天，DeepSeek直接把V4预览版放了出来，官网、App、API同步上线，直接引爆A股国产算力方向。

　　回看过来，DeepSeek总是有种魔力，从不铺天盖地宣传，也没有一点点预告，突然就把大模型摆到大家眼前，震惊全世界。

　　我很早就接触他们，他们一直就是这么一个态度，只管专心做事，总能把事做到极致。

　　这次V4按规模推出了两个版本，Pro冲击性能极限，Flash让普通用户也能上手。

　　比较惊艳的是Pro模型，在开源模型里没有任何对手，甚至性能已经能硬刚全球顶尖的闭源模型。

　　在程序员的“奥赛场”Codeforces上，V4-Pro的评分已经超越了GPT-5.4。而在公认最难的数学和逻辑推理挑战中，V4-Pro更是直接挑落了模型界的三巨头。

　　不出手则以，出手必惊人。

　　此外，DeepSeek 此次还宣布，100万token上下文将成为所有官方服务的标配。

　　在我看来，这足以重塑行业规则。

　　普通用户在让AI读报告、啃书或分析复杂项目代码时，总有一个困扰，AI经常像小熊掰棒子一样，看了后面忘前面。或者因为内存不够用，没法一次性处理全部，只能被迫切片处理，拆成好几次跑。

　　上下文越长，模型就越慢、越贵、越吃内存。

　　所以，百万级别上下文，都是在各大模型里，VIP才能享受的奢侈品。

　　现在，DeepSeek直接把奢侈品干成水电煤。

　　DeepSeek之所以能达到这样的效果，并不是靠多买GPU，走老美大力奇迹的哪条路，而是在模型架构里，把长文本的成本结构改了。

　　让模型先“压缩筛重点”，再“低成本看全局”，不用把100万token逐字逐句全量硬算一遍。

　　用这个方法，DeepSeek硬是在算力和存力上，狠狠省下一块。

　　直接看图吧。

　　这样一来，结果就很明显了，开放百万上下文，刀是DeepSeek砍的，血是同行流的。

　　不管是昨天的open AI、谷歌，还是今天的DeepSeek，中美两国的AI大模型发展，本质上都是在一步步向工业化靠拢。

　　专业的性能比拼、技术变革聊完了，再讲点大家更爱听的，关于DeepSeek用国产算力的事儿。

　　官方说法是，V4大模型适配了华为的昇腾芯片，明确说明支持部署和推理。

　　这也是今天国产算力这条线能够有如此亮眼表现的核心原因。

　　如果国内顶级模型只能靠英伟达的CUDA才能做好，那我们国产算力要么停留在故事层面，要么被迫跟在老美后面，始终看人家脸色。

　　我之前得到过很多关于V4延期发布的消息，其中最敏感的都指向一个地方，训练段框架从英伟达向昇腾迁移太痛了。

　　去年年中，DeepSeek甚至经历过一次比较严重的训练失败，当时最核心的问题，就是重新适配芯片效果不好。

　　尽管目前V4是否完全基于昇腾训练还没有确认官宣，不过可以确定的是，华为的适配程度正在全面提升。

　　和圈子里交流后，发现看法出奇一致，要在下半年加大力度支持华为。

　　这就给了国产算力一个更大的想象力。虽然训练段海不能说完全脱离英伟达，但随着DeepSeek给昇腾预留真实生产路径，国内其他大模型也可以技术对标，让国产芯片有更多舞台展示。

　　国产算力的身价，就得靠顶尖模型一轮一轮磨出来的。

　　卖方当前比较大的共识是，国产算力产业链，已经正式挺进新阶段了。

　　资金关注的重心不知不觉间，变成了能不能交付。

　　问题出在哪呢？

　　应用端，我们确实在大爆发。AI开始写代码、做Agent、读长文档、跑企业流程。

　　3月豆包日均token使用量已经突破120万亿，季度环比增长140%。AI应用需求爆发，已经拉动算力价格持续上涨，模型厂商和云厂商也开始多轮涨价。

　　看上去红红火火。

　　可国产算力的供应增长，却没有那么快。

　　去年国产化率，从35%提升到46%，看上去表现不错。国产AI芯片渗透率也在往上走。

　　但这个增速还远远不够。

　　因为我们国产卡单卡性能和海外最顶级芯片相比，确实差距，所以只能靠超节点来弥补。

　　超节点不像外界想的那样，把8卡升级到更多卡，或者把卡堆得多一点就完了事了。

　　这后面是一整套复杂的体系，算力协同、串联、散热、电源，哪样工作量都不小。

　　也就是说，真正的难点不是有没有卡，是这些卡能不能真的成为一个整体，协同作战。

　　超节点一旦放量，不光是芯片的事，带动的是一整条产业链。

　　训练的时候，需要很多卡之间高速协同。推理的时候，长上下文会产生大量KV Cache缓存，对内存和互联要求非常高。

　　芯片之间需要拼命交互数据，导致内部的交换机和交换芯片用量直接飙升，连带着像特制电路板、高级插头和光缆这些都成了刚需。

　　发热量还像个大火炉，传统的风扇根本压不住，必须得100%全靠液冷系统来降温保命。

　　同时整个供电系统也得跟着推倒重来，直接带火了一批高级电源和变压设备的生意。

　　后面再看国产算力行情，不能只看谁站在最前面，更要看谁离真实交付最近。

　　这轮国产算力，不要单纯理解成DeepSeek带来的情绪刺激，验证链条早就有了，DeepSeek将会作为催化，加速这一链条的推进。

　　我们的国产算力+新能源双主轴，依旧是市场里最靓的仔。

　　美中不足是指数稍微走低，带头走出这波行情的创业板，也回落到了5日线之下，完成一次像样的调整。

　　不过单从量能上看，2.6万亿的成交还是说得过去的。3月以来，资金最怕周末川普有话要说，每到周五都会大幅流出避险。最近三周，反而有资金开始先手去博周末可能的利好了。

　　这是一个非常值得关注的改变。市场的风险偏好，正在一步步变好。

　　即便指数连续调整两天，我也不认识会改变上升格局，最多算是太拥挤了，整体兑现一波，震荡一下而已。

　　长远看，调整是必要的，在得到充分换手后，我们的市场才能有更大的向上空间。

		自动登录	找回密码
密码			立即注册