3月1日,DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。不久前,月之暗面、微软研究院、清华大学、阶跃星辰等开源项目参与者,均在知乎分享研究成果和经历。知乎一直是AI从业者和创业者密度最高的社区,此次DeepSeek选择知乎作为开源发布的最后一站,进一步引领了全网最重要的AI趋势发布。
作为“DeepSeek开源周”的收官之作,DeepSeeK知乎官方账号正式亮相,并发布文章详述V3/R1推理系统。文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行,但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。
值得一提的是,文章还率先披露了DeepSeek的成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”
据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论和赞叹。
“话不多说,DeepSeek和OpenAI一样重要。”知乎大模型话题优秀答主、算法工程师“刘聪NPL”如此评价。业内人士甚至认为,“DeepSeek开源周”的重要性已经超过了不久前OpenAI的发布会。DeepSeek用“量大管饱”的开源有力回击了欧美关于DeepSeek故意说低训练成本的说法,并且证明了在训练链路上存在极大的优化空间。“刘聪NPL”在开源周最后一天就感叹:“真没想到,最后一天DeepSeek对存储下手啊!”而知乎编程话题优秀答主“平凡”在第三天就做出判断:“这些工作几乎不可能在国外的AI公司里面完成。”
此次收官文章再次点燃了知乎对AI的讨论热情,相关问题下从业者云集。事实上,“发完论文,上知乎亲自答”,已成为人工智能研究者的风潮。2月20日,月之暗面开源MoBA框架研发人员鹿恩哲、苏剑林分别在知乎讲述了研发思路,引发了业界对“稀疏注意力”框架的讨论。与此同时,微软研究院、清华大学团队以及阶跃星辰开源模型参与者,均发文分享研究了各自成果与历程。这被业界称为继模型开源、论文开源之后的一次“思维链开源”。
知乎囊括了最广泛的互联网、AI、机器人等科技领域的从业者,是从业者最青睐的交流场所和思想碰撞的前沿阵地。此次,全球瞩目的DeepSeek将知乎作为了开源周的最后一站,更印证了知乎作为AI讨论第一阵地的独特平台价值。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
上一篇:成都航空口岸2025年出入境人员突破100万人次...
下一篇:返回列表
一直以来,嵌入式世界博览会以卓越的产品展示、丰富的信息内容以及高质量的参展商...
2025-02-27 23:02:32
2025年2月25日,显示产业龙头海信视像与AR领军企业XREAL宣布达成深...
2025-02-27 23:01:01
10年前,成者推出了世界上首款成册书籍扫描仪,一举改变了当时墨守成规的扫描方...
2025-02-27 21:02:30
2月27日,和讯投顾奇名在今日市场分析中指出,尽管大盘全天呈现大幅震荡走势,...
2025-02-27 19:36:29
随着我国新能源汽车保有量突破3140万辆,动力电池退役量逐年攀升,2030年...
2025-02-27 14:28:07
随着新能源汽车保有量快速增长,我国充电基础设施建设也随之驶入“快车道”。数据...
2025-02-27 14:24:59
2025年春节期间,健康养生风劲吹,保健品市场热度爆棚,主打“药食同源”的产...
2025-02-27 13:42:16
随着小米等科技巨头被传即将入局AI眼镜市场,2025年的“百镜大战”备受瞩目...
2025-02-27 13:41:58
2025年春节期间,健康养生风劲吹,保健品市场热度爆棚,主打“药食同源”的产...
2025-02-27 13:07:45
随着消费观念的转变和城镇化进程的加速,即时配送行业迅速崛起,成为物流领域的新...
2025-02-27 09:57:04