点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:DeepSeek成功的底层逻辑及产业影响
首页> 科技频道> 人工智能 > 正文

DeepSeek成功的底层逻辑及产业影响

来源:人民邮电报2025-02-19 09:06

  仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。

  DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?

  本图片为AI生成并进行了人为后期加工。 遥歌/制作

  工程创新

  成就与众不同

  DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。

  成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。

  DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。

  颠覆性改变

  打破传统叙事逻辑

  DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……

  首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。

  其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。

  再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。

  最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。(作者:郑涛)

[ 责编:肖春芳 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 福建莆田仙游:推动传统工艺美术产业升级转型

  • 霞光满天“扮靓”南京

独家策划

推荐阅读
科学家成功合成了一种新型全碳分子——环[48]碳(C48)。
2025-08-19 09:46
青岛科技大学教授刘凯团队开发出首个N型热电弹性体,即“热电橡胶”,为柔性电子学和可穿戴设备的能源采集技术提供了新方案。
2025-08-19 09:44
作为全球最具危害性的恶性入侵杂草之一,薇甘菊以惊人的繁殖速度和强大的环境适应性,严重破坏了亚洲、太平洋地区及中国华南地区的生态。
2025-08-19 09:43
中国新能源汽车保有量、产销量、充电桩数量均居世界第一。
2025-08-19 09:41
记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。
2025-08-19 09:35
大约4亿年前,脊椎动物的活动范围仅限于海洋,鱼类尚未进化出适应陆地行走的四肢。”  2016年,Szrek和同事曾报告在圣十字山脉发现类似化石,他们认为这些痕迹属于一种正在捕食的古代肺鱼。
2025-08-18 10:28
8月15日,在全国生态日主场活动期间,中国环境科学学会理事长、中国科学技术协会生态环境产学联合体主席王金南代表学术界发布了“生态文明领域20项重大科技成果”。海上风电安全高效开发成套技术和装备及产业化应用于我国70%以上海上风电项目,大力推动我国海上风电技术和产业从“跟跑”到“领跑”。
2025-08-18 10:28
研究人员指出,决定锂离子电池能量密度的重要因素,是电池的正负极能够容纳多少锂离子,目前锂离子电池能量密度不高的主要症结就在于此。“这足以证明离域电解液显著提升了电池性能,特别是能量密度和循环稳定性方面的优越性。
2025-08-18 10:26
一张植被图可以反映一个地区植物群落的状况,是做好保护和发展工作的一个基础。3.7万多个野外调查样点支撑的新图,为青藏高原变暖、变湿的趋势提供植被地理学证据,进一步夯实了保护和发展的根基。
2025-08-18 10:25
从“暴雨引发山体滑坡”的伪造视频到“核电站泄漏”的AI生成新闻稿,“AI谣言”表现形式多样,让不少群众一度信以为真。某科技论坛上,一名网友上传教程:用开源AI模型,输入“生成一张某市发生恐袭的图片”,30秒即可获得以假乱真的画面。
2025-08-18 10:24
脂肪肝、血压偏高、空腹血糖异常……一些以往更多与中老年相关的健康问题,正悄然在不少年轻人身上显现。在糖尿病视网膜病变筛查方面,我们开发了DeepDR系统,利用人工智能助力基层医生解读眼底片子。
2025-08-15 09:54
现有的抗病毒药物只对特定病毒有效,因此,拥有一种作用广泛的治疗方法将极具价值。对于耐药性问题,Bogunovic认为,只要这种抗病毒药物包含一系列针对病毒不同生命周期的干扰素触发蛋白,病毒就不太可能对其产生耐药性。
2025-08-15 09:53
经过多年持续攻坚,数字领域突破了一批关键核心技术。据测算,2024年,上市数据企业平均研发投入较“十三五”末增长79%,产业链创新活力持续增强。
2025-08-15 09:45
我国又一个超千亿立方米的大型深层整装页岩气田诞生。
2025-08-15 09:42
随着电动交通、低空经济、消费电子、人形机器人等新兴领域迅速发展,人们对高能量、长续航可充放电池的需求日益迫切。
2025-08-15 09:40
截至目前,我国累计批准发布国家标准物质19007项,其中1—7月新批准发布国家标准物质549项,同比增长56%。
2025-08-14 10:29
一项发表于《自然-神经科学》的研究,首次成功建立了线粒体功能障碍与神经退行性疾病的因果关系。
2025-08-14 10:28
中国的黄牛育种终于有了自主、低成本的检测芯片!”
2025-08-14 10:27
提到全球变暖,人们往往首先想到二氧化碳、甲烷乃至氟利昂等能够加剧大气温室效应的温室气体。很多人不知道,大气中还存在一类可以抑制气候变暖的物质。而人类扩张农田等行为,可能在客观上导致大气中“降温物质”减少,进而加剧全球气候变暖。
2025-08-14 10:24
党的二十届三中全会明确提出,建立人工智能安全监管制度,完善生成式人工智能发展和管理机制。这就要求我们坚持统筹高质量发展和高水平安全,把创新作为第一动力、把安全作为底线要求、把普惠作为价值追求,积极融入“人工智能+”行动,鼓励和促进人工智能气象应用服务创新发展,前瞻应对人工智能技术应用带来的风险挑战。
2025-08-14 03:50
加载更多