3月1日 ,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,首次公布模型推理系统的核心优化方案,并披露理论成本利润率高达545% ,刷新了全球AI大模型领域的盈利高点,引发业内震动。
《概览》显示,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟 。
为了实现上述两个目标 ,DeepSeek使用大规模跨节点专家并行(EP)。首先EP使得批量尺寸大大增加,从而提高图形处理器(GPU)矩阵乘法的效率,提高吞吐。其次 EP 使得专家分散在不同的 GPU上 ,每个GPU只需要计算很少的专家,因此更少的访存需求,从而降低延迟 。
EP同时也增加了系统的复杂性。因此,《概览》就如何使用EP增大批量尺寸 、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。
DeepSeek还披露了DeepSeek的理论成本和利润率等关键信息 。
文章称 ,在北京时间2月27日12:00 至2月28日12:00,DeepSeekV3和R1推理服务占用节点总和,峰值占用为278个节点 ,平均占用226.75个节点(每个节点为8 个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本约为8.71万美元/天。
如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入大约56.20万美元 ,成本利润率为545% 。

DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,也预示着AI大模型的盈利闭环已从理想照进现实。此前发布的DeepSeek-V3模型训练成本仅557.6万美元 ,是同类产品的1%-5%。
DeepSeek此次在知乎发布《概览》,引来近600条评论、5000多点赞。有网友称,今日发布的《概览》技术文章是“开源周彩蛋” ,直接亮出了底牌 。有网友称赞:“太强了,AI算力成为水电的基础是要足够便宜,Deepseek迈出了一大步 ”。
《概览》发布也标志着全球关注的“DeepSeek开源周”正式收官。“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展 。其中 ,包括FlashMLA 、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。
科技早报 | 小米SU7 Ultra锁单量已突破一万台;DeepSeek理论成本利润率545%|界面新闻 · 科技
财说| DeepSeek披露成本利润率高达545%,为何龙头美格智能却收获一个跌停?|界面新闻 · 证券
百家号:国产黑料吃瓜免费-黑料不打烊51吃瓜网-DeepSeek亮出降价“底牌”,545%的利润率意味着什么?|界面新闻 · 科技
哔哩哔哩:黑料吃瓜网在线吃瓜-黑料吃瓜社-科技早报|DeepSeek上线V3版本;红果短剧即日起排查所有剧集|界面新闻 · 科技
DeepSeek被传从外部筹资,相关人士称融资消息均为谣言|界面新闻 · 科技
2月6日投资早报|国务院提出21条举措推动成品油流通高质量发展,万兴科技已完成DeepSeek-R1适配,慈星股份终止筹划购买资产事项股票复牌|界面新闻 · 证券
还没有评论,来说两句吧...