点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干
首页> 科技频道> 人工智能 > 正文

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

来源:光明网2025-09-11 16:16

  光明网讯 国务院印发的《关于深入实施“人工智能+”行动的意见》指出,“加强数据供给创新。以应用为导向,持续加强人工智能高质量数据集建设。”当前,高质量数据集已成为驱动行业大模型应用落地的“核心燃料”。

  近日在贵阳举办的2025数博会上,建设高质量数据集、加快促进数据要素流通交易和释放数据价值成为讨论焦点。其间,浪潮软件集团金融业务总监王香萍分享了浪潮软件集团的探索与实践,为金融行业借助 AI 技术构建高质量数据集提供了参考样本。

AI赋能金融高质量数据集建设,怎么看、怎么办、怎么干

  王香萍(主办方供图)

  随着“人工智能+”行动的深入推进,人工智能在各行业的应用场景由点到面、由浅入深,正发生质的跃迁。这一变革浪潮中,金融行业作为数字化转型的前沿阵地,迎来从“数字化”向“数智化”跨越的重要机遇。伴随金融行业的发展,浪潮历经了从信息化到数字化、从数字化到“数智化”的升级,目前正在以深厚行业积累和AI、大数据技术,助力金融行业客户进入数智新时代。

  浪潮在深入参与数智金融建设中,认识到金融高质量数据集是驱动AI技术落地的基石。一方面,金融业务处理过程中产生的海量过程材料,为数据集的构建提供了丰富素材;另一方面,人工智能技术又能反向赋能数据集——通过精准处理、智能分析,不断丰富数据集的维度与价值。尤其在金融这一高度专业化的领域,数据必须具备高精准性、强行业规范性、高行业适配性三大核心特质,才能确保 AI 垂类模型训练“不跑偏”、决策优化“行业适用”,真正发挥技术价值。

  在王香萍看来,在商业银行核心的信贷风控领域,AI 技术的价值尤为突出。过往 AI 多聚焦 C 端金融应用,如今随着小微企业 B 端需求激增,其应用重心逐步转移。小微企业数量大、单体授信额度小、业务频次高、覆盖范围广的特点,对信贷风控的数据治理与高质量数据集生成提出更高要求。

  以商业银行普惠小微金融业务中高频次使用的“尽调报告”为例,其数据治理需重点突破两大核心要点:一是关系网精准构建。借助AI技术能够准确梳理企业股权链、供应链,以及企业实控人与经营团队的关系链,确保关联信息无遗漏、无偏差;二是单体、行业与异常特征值智能生成。通过AI技术自动计算企业财务指标与非财务指标,并与细分行业、通用行业的当期及历史数据进行对比分析,精准识别原始材料异常与外部信息异常,为风控决策提供全面的“风险画像”。

  针对这一需求,浪潮软件集团依托“星耀・模型引擎”,通过数据采集治理、模型深度分析两大核心能力,实现了对高质量尽调报告的自动化筛查与精准标注,大幅提升了尽调效率与数据质量。

  在实践中,浪潮软件集团已形成“数据底座支撑层—采存加工层—大模型加小模型决策引擎层—高质量数据集”的一体化实现路径。借助要素核查、行业分析、财务健康分析等轻量子模型,对小微企业尽调报告的质量、真实性进行评价与异常预警,以“小步快跑”的思路完成结构化与半结构化数据向高质量数据集的升级,既贴合金融业务逻辑,又能快速响应市场需求。

  王香萍表示,尽管AI为金融高质量数据集建设提供了有力支撑,有助于提升金融风控水平,然而不可忽视的是,在实践中仍面临不少挑战。诸如,业务与技术领域对多模态数据处理标准的理解偏差,导致数据应用衔接不畅;金融专业知识积累难度大,制约模型稳定性提升;信贷逻辑与技术逻辑的冲突,影响数据集实用性;同时,金融行业惯例下,结果可解释性与审计可溯源性难以满足监管要求等。

  金融高质量数据集建设面临广阔的机遇。在商业银行普惠金融领域,小微用户在授信、用信等金融行为中产生了海量数据。这些宝贵的“数据富矿”,为人工智能技术助力高质量数据集生成提供了坚实基础。随着人工智能技术的持续升级,以及数据要素与金融建设的深度融合,“以AI技术赋能金融高质量数据集建设”已具备广阔的应用空间与市场前景。

  王香萍认为,金融行业“在发展中防风险、在创新中保安全”的审慎监管逻辑,需贯穿AI赋能高质量数据集建设全过程。首先要严控数据源头质量,避免财报质量低、要素缺失等问题影响数据可信度;其次需明确法律、责任、条线归口,解决权责模糊问题;再者要强化隐私保护,防范企业与个人信息泄露;同时需警惕AI模型精准度不足或“AI幻觉”引发的风控“茧房”风险,以及数据传输中的网络安全风险。

  为此,浪潮软件集团倡议,金融科技厂商与金融机构需以开放态度推动技术创新,以审慎操作守住风险底线,共同实现“技术创新源自规范、AI能力创造价值、数智升级引领发展”的目标,为数字金融高质量发展注入新动能。(记者 战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2026年巴塞尔艺术展香港展会启幕

  • 江西上饶:防火宣传进景区

独家策划

推荐阅读
全国科学技术名词审定委员会25日发布《关于发布试用人工智能领域名词token中文名“词元”的公告》,决定在综合考量社会各界意见建议的基础上,优先推荐“词元”作为人工智能领域名词token的中文名,并面向全社会发布试用。
2026-03-26 09:23
木卫二是一颗冰封的木星卫星,也是太阳系内最有希望孕育地外生命的地方。“欧罗巴快船”团队认为,他们将发现适宜生命生存的海洋,但除非探测器真正抵达、展开探测,没有人能给出确切的答案。
2026-03-26 09:24
作者:陆俊杰(南通大学副校长,江苏省习近平新时代中国特色社会主义思想研究中心特约研究员)  在促进创新链产业链资金链人才链深度融合、推动科技成果高效转化应用上探索新途径,是“十五五”时期江苏经济社会发展的重要目标任务。深耕“双高协同”不仅是破解科研创新与产业需求脱节的关键举措,更是落实创新驱动发展战略的重要布局。
2026-03-26 09:24
记者从中国发明协会获悉:在瑞士日内瓦举行的第五十一届日内瓦国际发明展上,中国代表团共获得90项金奖、95项银奖和52项铜奖。
2026-03-26 09:30
工业和信息化部25日公布,今年前2个月,我国通信业运行平稳,电信业务总量保持增长,5G、千兆光网、物联网等网络基础设施建设有序推进。截至2月末,5G基站总数达490.9万个,比上年末净增7万个,占移动基站总数的38%。
2026-03-26 09:24
3月25日,国家自然科学基金委员会在2026中关村论坛年会开幕式上发布2025年度“中国科学十大进展”,10项重大基础研究突破入选。界面调控新方法创制面向空天应用的高性能柔性叠层太阳能电池示意图 国家自然科学基金委员会供图 
2026-03-26 09:22
3月25日,以“创新与发展”为永久主题,由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协和北京市政府共同主办的2026中关村论坛年会在北京拉开帷幕。
2026-03-26 09:21
记者24日从农业农村部获悉,农业农村部近日印发通知,督促指导各地依法严厉打击坑农害农、危害粮食安全和农产品质量安全违法行为,守护群众“舌尖上的安全”,持续夯实国家粮食安全根基。
2026-03-25 10:22
氢能兼具能源、资源、储能介质三重属性,氢能产业科技含量高、低碳属性强、发展空间大。通知提出到2030年,通过应用规模扩大,推动氢能应用技术、工艺、装备创新突破,实现燃料电池、电解槽、储运装置和材料等迭代升级,推动氢能成为新的经济增长点,支撑实现经济社会发展全面绿色转型。
2026-03-25 10:21
林间密密麻麻的印痕,正是东北虎豹国家公园生态环境越来越好的体现。在科技守护与不懈坚守下,东北虎豹国家公园的生态成果愈发显著:东北虎和东北豹的数量由公园试点初的27只和42只,增长至当前的70只和80只左右。
2026-03-25 10:11
国家卫生健康委和中国气象局24日联合发布首期全国花粉浓度预报服务提示,为公众提供精准防护指引。目前正值春季,以木本植物花粉传播为主,建议过敏人群及时关注本地花粉浓度和种类变化,必要时明确过敏原,提前做好防护和出行安排。
2026-03-25 10:04
自然资源部日前发布四川省冕宁县牦牛坪矿区稀土矿资源储量核实勘查项目成果,矿区新增稀土资源量966.6万吨。据悉,牦牛坪矿区稀土矿资源储量核实勘查项目还新增伴生萤石资源量2713.5万吨、伴生重晶石资源量3722.8万吨,均达到超大型规模,具有重大战略意义。
2026-03-25 10:00
记者了解到,自20世纪60年代推广杂交玉米种以来,我国玉米的单产提高了约2.7倍,其中51%的增益都来自优良杂交种的选育与应用。进一步研究发现,在现代杂交育种过程中,玉米的基因有害变异被不断清除或互补,并且,杂交种中有害等位基因被抑制表达的比例与其产量和育成年代同步增长。
2026-03-24 09:29
2023年,国务院部署开展专利转化运用专项行动(以下简称“专项行动”)。教育部科学技术与信息化司司长周大旺表示,教育部着力畅通科技成果转化的链条,加速把高校丰富的专利转变为产业发展的红利。
2026-03-24 09:28
走进内蒙古博物院的有机质文物修复室,时间似乎放慢了脚步,空气中透着静谧,只有工具偶尔轻碰的细微声响。”  无机质文物修复室里,文物修复师季园园展示了另一种“手术”场景。
2026-03-24 09:28
柳申滨最初以针刺治疗皮肤炎症及穴位敏化机制为切入点,试图探寻针刺调控皮肤靶器官的效应规律。”  通过和临床医生交流,柳申滨了解到,在压力、焦虑等心理应激状态下,特应性皮炎患者的皮肤炎症会显著加重。
2026-03-24 09:28
全球最大人工智能(AI)模型API聚合平台OpenRouter最新数据显示,3月16日至3月22日,全球AI大模型总调用量为20.4万亿Token,环比增长20.7%。”
2026-03-24 09:28
杂交稻的大面积推广显著提升了水稻产量,但其生产长期依赖程序复杂、成本高昂且需年年重复的杂交制种过程。
2026-03-23 09:40
近日,澳大利亚一位机器学习领域科技企业家,通过人工智能大模型自行设计肿瘤疫苗,救治自家患癌宠物犬的故事广受关注。
2026-03-23 09:39
记者从中国石化获悉,我国首套全链条国产化溶液法聚烯烃弹性体工业化装置在天津进入试运行,相关生产技术取得原创性突破,将有效缓解我国光伏等战略性新兴产业对该材料的进口依赖。
2026-03-23 09:33
加载更多