点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:DeepSeek如何落地?深信服总结AI建设规划指南
首页> 科技频道> 人工智能 > 正文

DeepSeek如何落地?深信服总结AI建设规划指南

来源:光明网2025-02-28 12:33

  DeepSeek横空出世,以低成本、高性能、强开源的三重属性颠覆大模型产业链的传统逻辑,为我们提出了发展AI技术的另一个解法——并非一味地追求算力膨胀。各行各业都在讨论和积极尝试DeepSeek,用户对于智能化的认知与实践正经历着新一轮的深刻变化,这些变化也影响着用户的AI规划和落地路径。

  全面拥抱DeepSeek,建设AI的共识空前一致

  各行业用户进行AI建设之前,往往要进行大量战略对齐工作,而在DeepSeek R1火爆之后,用户建设AI的共识达到空前一致,原本因技术不确定性而存在的观望态度迅速消解,取而代之的是对AI建设的战略聚焦。

  资源的重新配置体现为研发预算的倾斜、跨部门协作机制的建立,以及对长期技术投入的容忍度提升。这种自上而下的共识推动AI项目从边缘试点向核心业务渗透,形成了一种“技术驱动战略”的新型决策逻辑。

  DeepSeek重塑用户AI建设路线图

  一个典型的AI建设整体路线图,包括8个关键步骤,才能实现AI项目的全面落地与持续运营。

DeepSeek如何落地?深信服总结AI建设规划指南

  (一)把DeepSeek提升为战略级目标

  目标应与用户的战略紧密相连,确保AI的建设为实现整体战略目标服务。用户在建设AI时,经营目标、运营目标和部署目标相互依存,形成一个完整的目标体系。用户在部署大模型时需要清晰地识别其适用场景与局限,不能一刀切,而应制定合理和差异化的目标。因此,了解何时适合采用AI、何时避免使用AI,以及针对特定场景选择何种AI技术至关重要。

  DeepSeek大模型的突破性进展,抬高了大模型能力天花板,AI适用场景进一步扩大。它能够模拟人类专家级的逻辑推演过程,展现出极高的逻辑严密性,其核心在于将传统AI的“规则响应”升级为“认知推演”,这使得AI能够处理非结构化信息交织的模糊性场景。

  当这种接近人类高阶思维的能力注入业务场景,能力的质变直接打破了“AI仅适用于标准化场景”的固有认知,推动应用边界向战略规划、创新设计等高阶领域延伸。

  (二)评估现状,了解AI的落地成熟度

  在明确了DeepSeek的战略目标之后,我们需要了解用户自身所处的阶段,发现薄弱环节,并为下一步的建设方向提供指导。我们主要从4个方面来评估现状。

  1、战略与场景

  要确保用户内部已达成目标的对齐,同时需要优先选择符合战略目标,并且具备可行性的场景实施。

  2、数据就绪度

  AI项目的成功,一定是数据驱动的。无论是传统AI还是生成式AI,高质量的数据是AI模型项目的基础。但对于生成式AI来说,更重要的一点是数据的规模和多样性。比如DeepSeek R1模型能力强,一方面原因是算法创新,如MLA、强化学习等,更重要的是数据质量高、场景覆盖广。另外,想要长久保持AI模型的高质量服务,还需要不断采集数据、反馈数据,对模型进行迭代更新。

  3、AI项目的落地实施,离不开团队

  需要具备理解业务并转化为项目的核心架构,以及一些工程化的角色,如数据标注、清洗、模型训练和调参、工程优化等角色。DeepSeek的优异性能,让越来越多中小企业可以直接应用,进一步降低了工程化团队的要求,也会使得AI项目落地更加容易。

  4、资源就绪度

  指的是AI算力,包括计算、存储、网络等,以及为了实施项目所需要的一些基础框架、开发工具等,目的是提供对AI全生命周期的支撑。随着DeepSeek的规模化应用,AI行业重心从训练转向推理,未来推理算力的消耗和供给将会极大增加,推理算力占比将从30%提升到70%,用户在算力选择方面也会更加便利。

DeepSeek如何落地?深信服总结AI建设规划指南

  (三)选择DeepSeek应用场景

  如何选择AI应用场景,归根结底都是围绕降本增效、提升体验和模式创新三个方面来展开的,这些也是各行业智能化转型的终极目标。

  首先关注战略匹配度,看是否符合这三个方面的目标,其次是技术支撑,重点考虑是否是生成式AI的应用场景,以及通过哪些技术路径来支持场景落地。

  另外就是数据和AI基础设施:数据层面,需要具备精标注数据、反馈数据,以及垂类语料(无标注数据)条件;算力方面提供AI计算支撑;基础大模型方面,这是应用AI的最基础条件,用户需要考虑大模型的开源/闭源路线。目前开源路线已得到极大发展,尤其是DeepSeek生态已快速形成并在规模化扩张,芯片厂商、云厂商、软件厂商都在主动接入或适配,未来将会持续扩张。拥抱DeepSeek是一种更高性价比的选择。

  (四)初步评估可行性

  选定场景后,我们需要对某个特定场景进行初步可行性判断,这个判断需要业务、技术和工程角色共同参与评估。

  业务如何判断呢?DeepSeek的优异性能和获得的便利性,让我们可以随时进行场景验证。例如,业务方是合同审核部门,场景是审核合同里的关键内容是否缺失,那么可以基于DeepSeek进行初步验证,输入一段合同文本,输出就是几个关键字段和它的值,而目标就是提取这些信息,并且内容没有丢失。这是没有任何技术和工程参与优化的结果。这个工作业务团队是完全可以胜任的,如果让技术部门来判断,可能会存在业务知识缺少的情况,无法准确判断业务场景的可行性。

  技术部门则重点关注基础模型本身的能力,也就是大模型在预训练阶段基本定型的,主要包括它在预训练阶段使用的知识、采用了哪些语言、有没有用一些带有逻辑推理的语料。在这些方面,DeepSeek模型也表现出极为出色的能力,尤其是671B满血版,经历了SFT冷启动、COT数据、GRPO强化学习算法及全场景强化学习等多个创新点,模型已具备高效及强大的思考能力。

  最后是工程角度,在DeepSeek出现之前,使用大模型需要掌握一些Prompt(提示词)优化技巧,有时还需要结合few shot(示例),以及思维链等方式,来激发大模型本身的能力。而DeepSeek本身已经表现出了以接近人类专家的水平的思考过程,这就极大降低了Prompt设计工作的复杂程度。

  各行业用户内部,知识问答的需求将会爆发式增长,因为接入DeepSeek来实现企业RAG(检索增强)生成这种方式,整体的工程化落地难度也大大降低,越来越多用户会开始建设知识问答应用,以服务内部或外部客户。

  同样的,DeepSeek本身对语言理解能力以及对指令的遵循能力变得更好,所以进行大模型SFT(Supervised Fine-Tun-ing)微调甚至进行二次预训练,这种场景将会大幅减少,对其工程化团队的要求将大幅降低。

  (五)准备DeepSeek落地所需资源

  在确定初步可行之后,即可开始准备大模型落地所需资源。主要从4个方面准备:与建设场景相匹配的数据、算力、开发工具和团队。

  1、准备数据

  根据选择场景的不同,需要准备的数据也会有很大不同:

  RAG场景:文档预处理(如文档格式转换等)、文档解析(PDF识别,版式识别)、OCR(图像转文字)、文档切分(切分为小的片段)、数据增强(提取QA、生成摘要)。

  大模型微调场景:对于少数具备较强AI技术能力的团队,在微调场景需要准备:精标注QA数据(问答对形式)、准备指令数据(如人设遵循、输出格式要求等)。需要确保数据准确性(例如做过滤低质量,去掉重复数据等)、数据多样性(要能够覆盖各种真实应用场景)、数据一致性(数据不冲突)、数据增强(生成QA、摘要)等。

  二次预训练场景:这种需求只有在某个垂类领域的头部企业才会选择,包括:专业领域的语料(如金融、医疗等专业术语,这些领域使用语境等)。需要确保数据多样性(如覆盖场景种类足够多)、数据规模足够大(一般要达到数十亿级token以上)、一定的配比数据(增加通用领域数据做二次预训练,如1:1配置)、数据处理能力(去除重复数据、低质量数据、隐私数据、不合规数据等)。

  2、准备算力

  在大模型建设中,算力的多少决定了训练速度、效率和模型表现,是推动模型快速落地的关键资源。那么要准备多大的算力才能满足实际应用需求?这里有一些经验,可以用于快速进行算力数量估算(此处仅考虑GPU算力)。

  对于训练场景,全参微调所需的总显存一般为模型参数量(以B-十亿为单位)的20倍,例如70亿(7B)参数大模型,至少需要140G显存,按照单卡80G显存,则对应的GPU卡至少需要2张。而130亿(13B)参数大模型,至少需要260G显存,按照单卡80G显存,则对应的GPU卡至少需要4张。

  3、准备工具

  基础大模型的选择,往往决定了应用效果的基线。对于大多数用户来说,首选是DeepSeek R1系列蒸馏模型,在同等参数量下,相比其他开源大模型,它能够取得更好的效果。而在6个蒸馏模型中,32B参数量大模型能够在效果和落地成本方面取得较好的平衡,可以作为应用首选。

DeepSeek如何落地?深信服总结AI建设规划指南

  如果是为了解决特定场景下的应用目标问题,则需要AI应用开发工具,例如开发一个RAG应用、Agent智能体应用等,需要评估应用开发工具对场景效果的支撑。

  在模型微调和部署工具选择上,基于长远考虑,首先关注对资源的利用率和整体性价比,其次需要考虑工具的完整性、兼容性、易用性、可靠性以及安全性 。例如,在性价比方面,在相同的基础大模型条件下,平台对于算力资源消耗和模型服务性能如何;使用时学习门槛是否足够低,操作是否足够简便,过程是否自动化等。

  4、搭建团队

  大模型项目更依赖于数据驱动的效果调优、模型微调和二次预训练等技术,而传统系统更关注业务流程的实现与系统的长期稳定性。用户在推动大模型项目落地时,应根据首先落地的场景,来做差异化的团队配置。

  例如,初期只选择内部流程自动化场景,只需要做Prompt优化和系统对接就可以,所以在AI团队上重点配置提示词优化工程师、工程开发工程师;而在RAG应用场景,就需要文档数据预处理、检索优化等工程师。

  (六)分阶段实施

  阶段一:场景为王&运营提效

  场景为王,指的是选择最简单、最容易做出效果的场景去建设。当前,基于DeepSeek模型的RAG应用正成为各行业智能化转型的关键突破口。DeepSeek推动大模型技术逐步走向产业化规模化落地,用户亟需找到投入产出比高、见效快的AI应用场景。RAG技术凭借其“知识检索+智能生成”的双重能力,正成为用户构建智能系统的首选方案。

  对于希望快速实现AI价值的用户,建议优先选择知识密集度高、流程标准化强的场景切入,例如技术文档问答或产品知识库建设。通过小步快跑的方式,用户可在3个月内看到明显的效率提升,为后续更复杂的AI应用奠定基础。在实施过程中,要特别注意建立知识更新闭环,持续优化检索策略和生成质量,最终形成具有特色的智能知识中枢。

  相较于其他通用大模型,DeepSeek模型在构建企业RAG(检索增强生成)应用中的优势不仅体现在成本降低和技术性能提升,更能通过开源生态为用户提供从基础应用到深度智能的全链路支持。

  例如推理成本降低,DeepSeek在复杂推理任务(如金融研报生成)中实现了70%的成本降低。其蒸馏模型(如DeepSeek-R1)在更小规模下仍能保持高性能,减少了对高端计算资源的依赖;

  长思维链与自我验证,通过强化学习和模型蒸馏技术,DeepSeek能在小参数模型中实现长推理链与自我验证,满足用户对复杂场景的高准确率要求;

  开源商用授权,DeepSeek模型提供开源商用授权政策,用户可免费用于微调、量化及衍生开发,降低技术门槛和法律风险。

  以知识库检索问答(RAG)方案为例,用户正将AI应用从单点工具升级为全域知识中枢。某处于装备制造产业链下游的传统型企业,需要对接上千家上游元器件供应商。企业有数百名产品设计人员,主要工作是结合工艺参数的需求,进行物料选型,再给后续环节使用。

  物料总计有3000余个,对应1万多份物料技术规范文档。员工通过手动整理参数表格并结合人工核对来完成物料筛选,完成一个场景的物料选型往往需要数天时间,严重影响生产效率。当Deepseek出现后,用户可以通过对话的方式,让大模型准确回答其所需要的物料,使得整个过程缩短到分钟级,准确率达到90%以上。用户借助该能力中枢,正尝试对多个内部业务系统进行智能提效,如应用于研发、生产、供应链、销售、售后服务系统等,大幅提升效率和竞争力。

  另外需要注意的是,在企业级RAG应用上线后,需同步进行运营提效工作,持续收集场景反馈数据,对落地场景效果持续优化,才能在初始落地阶段产生明显价值。

  阶段二:场景扩展

  基于第一阶段的成功,用户要深入到核心业务场景去解决复杂的场景问题,发挥AI的价值,从辅助性角色变成核心角色。例如销售机器人、个性化服务机器人、运维机器人等。这个阶段的特点是复杂度更高,往往不是单靠大模型能完成的,需要借助小模型、智能体等来协作完成。

  阶段三:持续优化

  不管是什么样的AI模型,部署后,其固有知识相对不会变化,但业务场景不是一成不变的,如果不持续优化模型,它的效果会持续衰减。另外,随着落地的场景越来越多,并发量越来越大,它所消耗的资源也成倍增加,如果不对它的底层资源进行优化,后续将有非常大的成本支出。

  综上,我们可以通过不断采集、反馈、优化,形成数据闭环,来持续对场景做提效。构建数据反馈闭环是确保企业大模型适应业务变化的基础,优化后的模型重新部署到业务场景中,继续收集新的数据,形成持续反馈的闭环。这不仅让模型适应业务的变化,还能不断提高其在核心场景中的应用效果。

DeepSeek如何落地?深信服总结AI建设规划指南

  阶段四:赋能核心业务

  这是AI落地的终极目标,AI大量融入关键业务链条中,深入核心业务,比如制造业的研产供销服等环节。未来,用户的AI建设不断深入,将会覆盖到全部链条,例如——

  在研发板块,可以充分利用大模型的理解以及调用外部工具、生成代码的能力,辅助进行产品工艺设计和参数选择;

  在生产板块,可以通过语音自然语言交互,对机器人进行操作;

  在销售板块,大模型结合数字人,能够为用户提供更好的体验和服务响应;

  在设备运维方面,能够及时给出设备故障的维修方案;

  在运营方面,通过大模型提供个性化的数据分析和运营报告。

  (七)评估

  对大模型项目建设评估不仅是对一次项目执行结果的评估,更是对阶段性工作的评估,包括但不仅限于项目业务价值、用户体验、成本效益、模型性能与合规性、安全性等多个维度的综合评估。通过建立持续的监控与反馈机制,优化运营成本,分析模型的扩展潜力,并结合未来发展战略,用户可进一步确保大模型项目的成功和长期价值。

DeepSeek如何落地?深信服总结AI建设规划指南

  (八)持续运营

  只有坚持长期在数据和场景方面的运营深耕,才有助于构建持续竞争优势,这个过程可重点关注数据飞轮持续化和场景运营精细化。

  1、数据飞轮持续化:

  整合多源数据(销售、客服、供应链……),统一数据质量标准,设置专门的数据治理团队;

  设置模型效果评估标准(基于标准测试集和基于业务反馈结果);

  收集线上/线下反馈数据;

  关键指标监控(性能指标、业务指标,如转化率、复购率);

  明确实施微调优化的准入标准;

  通过持续的数据积累、数据反馈闭环,推动模型的不断优化和迭代。

  2、场景运营精细化:

  一把手牵头,发动各个业务部门梳理业务场景,细化到最小粒度场景;

  对全量场景做价值度评估,排优先级;

  建立业务部门和AI团队的场景对接机制,明确场景提出-评估-立项/关闭-建设-评估-运营的整个闭环;

  建立效果评估机制,对用户反馈做闭环跟踪;

  挖掘新场景,鼓励内部做业务场景与AI结合的创新。

  在这场由DeepSeek引发的智能化浪潮中,各行业用户的数字化转型路径都在发生变化,深信服将在这场变革中,助力用户更顺利地实现AI+云化升级。(科文)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 候鸟翔集黄河之滨

  • 河北雄安新区高质量建设的春日律动

独家策划

推荐阅读
27日,记者从广州大学获悉,该校与中国科学院、同济大学、美国宾夕法尼亚州立大学等高校科学家合作发现,位于火星北半球乌托邦平原南部的“祝融号”着陆区,其地下10—35米深处存在多层倾斜沉积结构。
2025-02-28 09:51
2月27日15时08分,长征二号丙运载火箭在酒泉卫星发射中心点火升空。
2025-02-28 09:50
北京大学常林研究团队与中国科学院空天信息创新研究院合作,成功开发出世界首款光子时钟芯片,可将芯片上的时间调控速度提升100倍。
2025-02-28 09:47
在宇宙中,有一类神秘天体——流浪行星
2025-02-28 09:46
从市场监管总局获悉,国际电工委员会近日正式发布由我国牵头制定的养老机器人国际标准。
2025-02-28 09:44
国际数据库事务处理性能委员会(TPC)近日宣布,阿里云PolarDB云原生数据库以远超原纪录的性能,登顶TPC—C基准测试排行榜,以每分钟20.55亿笔交易和单位成本0.8元人民币的成绩,刷新该榜单性能和性价比两项世界纪录。
2025-02-27 09:15
当物质处于地球上最低温度、最高压力等极端条件下,可能出现怎样的“超能力”?物态调控是物理学研究造福人类社会的重要途径,科学家对于物理世界极限的探寻从未停止。
2025-02-27 09:37
记者26日从中国科学院西北生态环境资源研究院获悉,该院敦煌戈壁荒漠研究站柳本立研究员团队以退役风机叶片为原料,成功研发出新型防沙材料,为循环利用退役风机叶片提供了新的解决方案。
2025-02-27 09:22
为学生量身定制学业规划、24小时解答疑难问题,为研究人员查找资料……“DeepSeek+高校”的智慧教学研究场景正在北京部分高校实现。AI浪潮已至,智慧校园是大势所趋,但AI与教育的融合仍有赖于师生素养提升、技术适应性及相关制度的建设完善。
2025-02-27 09:18
根据美国航天局最新测算结果,一颗编号为“2024 YR4”的小行星在2032年12月22日撞击地球的可能性已基本排除,撞击概率已降至0.004%。美航天局表示,小行星“2024 YR4”不再对地球构成重大威胁,它为天文学家提供了宝贵的机会来测试行星防御科研和预警流程。
2025-02-27 09:16
26日,全国规模最大、总投资最大、新能源占比最高的“沙戈荒”新能源外送基地电源项目——青海省柴达木格尔木东沙漠基地电源项目在青海格尔木开工。
2025-02-27 09:24
为加快补齐农村地区公共充换电设施短板,进一步释放新能源汽车消费潜力,财政部办公厅、工业和信息化部办公厅、交通运输部办公厅日前联合发布《关于开展2025年县域充换电设施补短板试点申报有关工作的通知》,明确2025年计划支持75个试点县改善充电基础设施。
2025-02-26 09:52
中国第四十次南极考察队利用我国自主研发设备,成功钻穿545米厚的冰层及冰岩夹层,获取了连续冰芯样品和基岩样品。拉斯曼丘陵地区位于伊丽莎白公主地冰盖末端,是东南极冰盖的溢流区之一。
2025-02-26 09:51
青藏高原高山特有物种是什么原因导致的?中国科学院青藏高原研究所生态系统功能与全球变化团队汪涛研究员联合瑞士巴塞尔大学、中国科学院西双版纳热带植物园和北京大学研究人员,
2025-02-26 04:20
近日,记者从吉林大学获悉,该校联合中山大学组成科研团队,发现了高温高压下石墨经由后石墨相形成六方金刚石的全新路径,并人工合成出高质量六方金刚石块材料,
2025-02-26 04:20
马家窑文化距今4000年的彩陶罐、红山文化神秘的陶塑人像、殷墟妇好墓出土的铜圆斝、山东滕州前掌大西周遗址出土的彩绘漆器……不同材质的文物是如何被修复的,又是如何被考古学者破译出古人留下的种种信息,复原出他们的生活图景?走进中国考古博物馆推出的“妙手活千秋——科技考古与遗产保护经典成就展”,答案就藏在其中。
2025-02-26 04:25
共筑数字童年新生态”为主题的“未成年人手机防沉迷座谈会”在京召开。李国强指出,沉迷手机不仅可能会导致视力损伤、睡眠障碍、颈椎问题等生理健康问题,还容易引发社交焦虑、注意力不专注等问题。
2025-02-25 09:34
自然资源部海洋战略规划与经济司24日发布的《2024年中国海洋经济统计公报》显示,过去一年,我国海洋经济呈现强劲发展势头,经济总量再上新台阶,首次突破10万亿元,达105438亿元,比上年增长5.9%,占国内生产总值的比重为7.8%。
2025-02-25 09:32
当前,我国大学生群体普遍来自独生子女家庭,在成长过程中通常得到父母及长辈的全方位关照,从而导致他们生活自理能力相对薄弱。
2025-02-25 09:31
2025年是“十四五”规划的收官之年,是巩固拓展脱贫攻坚成果同乡村振兴有效衔接5年过渡期最后一年,做好“三农”工作对全局发展至关重要。
2025-02-25 09:30
加载更多