
21世纪经济报说念记者 彭新
重塑订价钱局,DeepSeek再度登场。
4月26日,DeepSeek发布API价钱调度公告,全系API输入缓存射中价钱降至首发价的十分之一,其中,Pro模子在2026年5月5日前还可类似2.5折限时优惠。
DeepSeek官方API订价页表示,本次降价袒护V4系列全模子,中枢调度连合在输入缓存射中场景。调价后,DeepSeek-V4-Flash每百万Tokens(词元)输入缓存射中价钱为0.02元,DeepSeek-V4-Pro为0.025元。
面向企业级用户的DeepSeek-V4-Pro降价幅度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前类似2.5折限时特惠,本体仅0.025元/百万Tokens,缓存未射中输入从12元降至3元,缓存未射中输出从24元降至6元。
此轮降价意味着,处分换取百万Token的长文本或复杂智能体任务时,DeepSeek关系模子的成本被拉非凡低的进度,对开采者而言,将不错以极低成本对DeepSeek V4进行评估测试。
有开采者合计,DeepSeek V4在工程层面进行了多项本事更正,戒指较前代成倍栽种——在百万级调用场景下,单Token推理算力消费已降至V3.2的27%,KV cache(键值缓存,大模子推理历程中占用显存的主要部分之一)的显存占用仅为原本的10%。在此基础上,DeepSeek降价老实守纪。
价钱攻势冲刺专科客户
行为开源模子,DeepSeek历来以“廉价+开源”政策眩惑开采者生态,并在性能上接近于当先的闭源模子,成为专科客户的性价比遴荐。
DeepSeek-V4按大小分为Pro和Flash两个版块,其中V4-Pro总参数为1.6万亿,激活参数490亿,是迄今为止参数目最大的开源权重模子,定位高性能任务;V4-Flash总参数2840亿,激活参数130亿,皇冠app(中国)官网入口主打低成本和高微辞,概况提供愈加速捷、经济的API劳动。两款模子均汲取MoE架构,也等于“搀杂民众模子”。
DeepSeek坦言,在Agentic Coding(智能体编程)评测中,DeepSeek-V4代码委用质料接近Claude Opus 4.6非念念考形态,但仍与Opus 4.6念念考形态存在一定差距;此外,DeepSeek-V4谢全国学问测评中仅次于Gemini-Pro-3.1,但逾越同期其他开源模子,在数学、STEM、竞赛型代码的测评中则并列全国顶级闭源模子。
从价钱上来看,V4-Flash走的是普惠阶梯,输入缓存射中0.02元/百万Tokens、未射中1元/百万Tokens、输出2元/百万Tokens的报价,对应中小开采者与轻量欺诈调用场景。V4-Pro更具性价比,其原价输出24元/百万Tokens的水平本就高于V4-Flash,但限时扣头后输出仅6元/百万Tokens,与上一代V3.2系列价钱绝顶,却对应着1.6万亿参数的旗舰模子智力,真钱三公棋牌官网极具性价比。
另一方面,DeepSeek也在积极适配国产算力,DeepSeek在订价阐明中提到,受限于高端算力,现在Pro版劳动微辞十分有限,瞻望下半年昇腾950超节点批量上市后,Pro价钱会大幅下调。这意味着,DeepSeek订价将有进一步下探空间。
本体上,DeepSeek正在积极适配国产算力,将V4的早期看望权限优先绽开给国内芯片厂商,而非英伟达、AMD等国际厂商,这被业内视为DeepSeek模子适配政策的要道转向。
凭据华为公开信息,昇腾超节点全系列居品已全面适配DeepSeek V4,可杀青V4-Pro约20毫秒、V4-Flash约10毫秒的低时延推理。基于昇腾950超节点,V4-Pro在8K输入场景下单卡Decode微辞约4700 TPS;V4-Flash在同等输入场景下单卡Decode微辞约1600 TPS。基于昇腾A3 64卡超节点的大EP(民众并行)部署形态下,V4-Flash在8K输入、1K输出场景下基于vLLM推理引擎可杀青2000 TPS以上的单卡Decode微辞。
摩尔线程露出,其联袂上海AI实践室DeepLink团队,率先在AI训推一体智算卡MTT S5000上完成了核默算子Day-0适配。现在算子通过率已超80%,杀青了模子发布与国产算力适配的同步落地。
竞争日趋热烈
这次降价刚巧寰球大模子厂商竞相以更廉价钱、更高戒指争夺开采者和企业客户之际。跟着企业级用户从早期试点转向领域化部署,推理和调用成本已取代单纯模子智力,成为大模子厂商间竞争的迫切成分。业内瞻望,DeepSeek此轮调价将进一步压低同业报价。
花旗在其最新研报指出,DeepSeek V4-Pro在中枢AI性能想法上已与顶尖闭源模子Claude Sonnet 4.6发达合手平,同期订价却远低于GPT-5.5。花旗合计,这一风景突显面前AI大模子赛说念中开源模子与闭源当先模子日益加重的南北极分化趋势。收货于极具成本竞争力的底层架构,开源模子在代码生成、智能体责任流及长文本等欺诈场景中,与闭源巨头的差距正在收缩。
在国产模子阵营里面,DeepSeek V4-Pro的限时扣头价亦彰着低于大皆同档位居品。按输出端价钱经营,DeepSeek V4-Pro扣头价为0.87好意思元/百万Tokens;智谱GLM-5.1、月之暗面Kimi K2.6的输出端报价诀别为4.4好意思元/百万Tokens和4.0好意思元/百万Tokens,约为其5倍和4.6倍。
凭据在寰球最大的API团员平台OpenRouter面前报价,阿里Qwen3.6 Plus输出端约为1.95好意思元/百万Tokens;MiniMax官方价钱表示,MiniMax M2.7输出端为1.2好意思元/百万Tokens。轻量档位中,阶跃星辰Step 3.5 Flash按OpenRouter报价为0.10好意思元输入/百万Tokens、0.30好意思元输出/百万Tokens,输出端与DeepSeek-V4-Flash的0.28好意思元/百万Tokens较为接近。
记者看到,OpenRouter上,DeepSeek V4系列模子的调用运转大幅增长,4月26日,DeepSeek V4-Flash的调用量为814亿Tokens,DeepSeek V4 Pro的调用量为96亿Tokens,带动DeepSeek在OpenRouter平台的总调用量创近期新高。
现在,DeepSeek仍是激勉老本市集对其竞争敌手的再行订价。4月27日,两大模子厂商股价重挫,MiniMax股价报收750.00港元/股,跌3.54%;智谱股价报收914.5港元/股,跌2.19%。
此外,DeepSeek近期传出融资音书。有市集音书称,腾讯和阿里正在战争DeepSeek融资事宜,公司估值或逾越200亿好意思元,但具体融资额及估值可能随磋商合手续调度。
海量资讯、精确解读,尽在新浪财经APP
背负剪辑:石秀珍 SF183真钱三公
银河游戏在线娱乐中国官网