百望云数据要素案例
该数据要素项目案例由百望云投递并参与“数据猿年度金猿策划活动——2024数据要素产业年度创新服务企业榜单/奖项”评选。
在数字化浪潮奔涌的时代,数据要素已成为驱动经济发展的关键引擎,不仅蕴藏着巨大的经济价值,更蕴含着推动社会进步的无限潜能。数据要素贯穿于各个行业,为传统产业注入新的活力,也为新兴产业开辟无限可能。
百望云基于经合规授权的发票数据,进行产业链穿透,筛选出符合国家绿色产业政策的绿色产品交易相关信息,结合企业的工商、纳税、社保数据等多种数据要素进行有效融合。百望云结合先进的大数据处理技术与人工智能算法,为无锡企业征信构建了一套绿色金融模型。同时,也协助无锡征信将针对该模型形成的数据资产完成了数据资产入表,将数据转化成了具有高价值的生产力模型,联手多家银行在绿色金融领域服务了多家中小微企业。
时间周期:
项目开始时间:2023年9月20日
中间重要时间节点:
业务调研:2023年11月
产品设计:2024年2月
模型开发:2024年4月
项目完结时间:2024年5月
数据要素价值需求
数据要素的潮水已至,金融科技的未来可期,绿色金融的变革势在必行。
作为中国领先的票财税融一体化解决方案服务商和数据要素生态平台构建者,百望云积极聚合产业数商资源,搭建数据资产运营平台,共同解决数据要素的采集、加工、生产难题,推动数据要素的安全互换、互联,构建健全的数据资产运营生态体系,积极探索数据资产的价值创造和合理利用,促进数据要素市场的健康发展。
通过深入挖掘发票数据背后的价值,百望云让数据要素发挥了关键作用。无锡企业征信有限公司与百望云通过协议的方式,明确信息采集的原则以及各自在获得客户同意、信息采集、加工处理、信息更正、异议处理、信息安全等方面的权利义务和责任。通过运用数据要素赋能行业,该业务模式也为其他领域的数据应用提供了有益的借鉴和参考。
在客户向金融机构发起融资申请时,客户授权持牌金融机构可向依法设立/备案的企业征信机构获取客户的发票、税务等经营数据。发票数据通过无锡企业征信有限公司的系统或平台传输至金融机构,应用服务系统对于每一笔数据调用均准确记录授权时间、授权机构、授权号等信息。
同时,百望云根据发改委《绿色产业指导目录(2019年版)》中对绿色产业的描述关键词,与发票中的商品信息做了匹配。在协助金融机构获取企业数据时,金融机构从企业侧获取数据使用授权,百望云从企业侧获取数据采集授权,经无锡征信进行数据分析及加工传输至金融机构,形成从采集到应用的合规闭环链路,所以在数据获取及使用上是合理合法,具有法律依据。
未来,随着数据技术的不断发展和数据要素应用场景的不断拓展,百望云将在更多领域发挥重要作用,推动相关行业的快速发展和落地应用。
面临挑战
随着我国绿色金融的规模持续增长,绿色金融的健康发展也引发了各方的关注和讨论,绿色金融的健康发展也面临诸多挑战。
1. 对于绿色金融的分类和判断标准不统一:国内有三套绿色分类标准,在适用对象、项目范围、精细程度上存在差异。目前我国绿色金融标准体系与国际主流标准存在差异,同时国内不同标准也尚未达成一致,绿色项目认定口径、产品设计、信息披露和风险管理要求不尽相同,这会影响绿色金融的发展。
2. 存在大量信息不对称问题:这些因素可能会使我们面临“漂绿”“假绿”挑战,需要推动绿色数据信息的标准化建设与互联互通,金融机构等主体才能更好地识别与判断项目的风险收益特征。
3. 金融机构绿色金融产品的多样性不足:中小型金融机构缺乏对绿色项目精准分析的能力、专业化风控体系,难以基于中长期数据分析来判断绿色活动的风险特征,需要通过与专业第三方服务机构合作进行评估体系的搭建,确保绿色金融项目真正符合特定标准和要求。
4. 数据价值的增信能力不足:随着数据要素到数据资产的创新探索成为当前热点,在绿色金融领域推动数据资产化,也有助于为绿色金融创新提供重要的“数据增信”。
在实施过程中,我们面临多个技术挑战。首先,客户内部系统相对老旧且各部门数据分散,导致数据格式不统一,难以实现跨部门的实时数据调用。此外,企业数据往往呈孤立状态,数据要素流转不畅,无法形成统一的数据资产视图。
尤其是不同来源的外部数据和客户内部数据的标准不一致,增加了数据对接和清洗的复杂性。为了打通内外部数据通道,实现数据要素的全流程高效协作,我们构建了跨部门的协调机制,并引入了数据格式标准化和实时流处理技术,实现了数据要素的有效整合和智能匹配。
数据处理
百望云数据处理聚焦于多维度、多源数据的整合与精细化分析,以支持绿色金融的精准识别和用途验证,在数据类型、处理量和频率方面实现了高度的技术整合与优化处理,具体细节如下:
1. 发票数据处理:方案依托百望云平台的数据管道系统,每月处理超过2300万家企业的进项和销项发票,包含交易产品类别、金额、供应链条目等信息,数据量达到300TB。发票数据以增量数据的方式实时采集并更新,每日数据流入量达10TB,且通过预处理清洗、标准化后进行字段映射以满足绿色行业分类需求。
2. 信用报告与金融行为数据:从企业征信系统中调取企业金融数据,这些数据通过API接口直接接入系统,并在数据湖中存储,每日处理量为10GB。数据湖采用分布式存储架构,支持实时查询和并行处理,累计存储的企业信用记录超10亿条。为优化性能,通过分布式计算引擎对数据进行MapReduce处理,将不良信用和历史违约记录即时打标,以提升模型评估精度。
3. 实时交易流水数据处理:系统实时对接企业的交易流水数据,每天处理交易记录约1000万条,日数据处理总量约达500GB。流水数据在进入数据库前进行多层过滤和异常识别,通过实时流计算引擎筛查交易偏离及风险特征,确保资金使用流向精准映射到绿色产业领域。整个过程使用Flink流处理框架实现高并发处理和毫秒级响应。
4. 行业标准数据匹配:基于发改委《绿色产业指导目录》所定义的关键词和分类规则,发票商品项的关键词匹配在ElasticSearch环境中实现,支持高频率的批量查询。每日系统对发票数据中的商品信息与行业标准进行超过500万次关键词匹配,通过TF-IDF算法对发票中的商品描述与行业关键词相似度排序,并结合业务逻辑实现自动打标,确保绿色贷款识别精准度。
5. 动态数据更新与标签打标:方案中设计了基于流式数据的标签打标系统。标签打标系统结合模型推理与规则引擎,借助Hadoop HBase分布式存储架构,实现大规模企业标签的批量处理,系统响应延迟低于100ms。数据处理过程全面采用并行化、分布式架构,确保了高效、快速的数据集成和更新。实时监控和动态标签打标增强了数据的时效性,帮助金融机构高效跟踪资金流向的合法合规性。
应用技术与实施过程
百望云通过先进的数据技术和算法组合,构建了一个完整、精细的绿色金融数据要素服务流程。
具体来看,百望云系统整体架构采用分布式设计,能确保数据处理的高效性和可扩展性。在数据采集模块中,百望云从企业的进项与销项发票等渠道采集数据。数据采集过程通过ETL工具实现,自动化处理并生成日增量数据。
同时,在计算存储与应用服务层,百望云在数据处理与清洗方面,使用分布式计算框架Apache Spark进行数据清洗,保证数据一致性,包括异常值检测、格式转换、去重等,经过清洗的数据进入数据湖中。在数据存储与管理方面则使用多层次数据仓库,支持批处理与实时查询需求,适合不同数据维度的查询和分析。
在产品业务层面,百望云通过可视化工具、SaaS服务以及API接口等为前端提供数据访问,实现实时监控和可视化展示。
此外,百望云为确保数据传输和存储的安全性,系统采用AES-256位加密技术,数据访问层面则通过Kerberos认证和Apache Ranger权限管理实现用户认证和授权。数据传输通过SSL/TLS协议实现,保证数据在传输过程中的机密性。
生态伙伴合作
百望云通过与第三方服务机构等合作伙伴的紧密合作构建了完善的合作伙伴生态。目前,百望云已经和北京数交所、上海数交所、江苏华东数据交易所、盐城数据登记平台、无锡大数据集团等多个数据交易所和登记平台达成战略合作关系,可以帮助企业快速实现数据资产、数据产品的线上化登记上架。
这种生态构建不仅有助于项目在市场推广和业务拓展方面取得更好的效果还能够为项目提供持续的技术支持和资源保障。未来,随着合作伙伴生态的不断完善和拓展,本业务模式的可持续发展能力将得到进一步提升。
服务效果
百望云与无锡征信联合共创,搭建了企业征信领域的首个绿色金融模型,并计划在符合相关要求下实现近50万的数据资产入表。
无锡企业征信已利用该模型,联合多家股份制银行以及城商行,拓展涉农客户金融服务的可获得性,为企业提供“一站式”服务有效解决中小企业、个体工商户、农户贷款难问题,持续推进金融支持绿色。
本业务模式在推动银行业绿色金融发展的同时,也带来了显著的社会效应,有效缓解了中小微企业融资难、融资贵的问题,促进了企业的健康发展,增强了市场活力。同时,通过发票数字化和区块链技术的应用,提高了可信任度,降低了交易成本。
此外,项目还促进了金融科技的创新与发展,推动了数字经济与实体经济的深度融合。从更宏观的层面来看,本业务模式的成功实施有助于优化金融资源配置,促进经济结构的转型升级,为构建新发展格局贡献力量。
在数字化时代,百望云将继续发挥在赋能数字经济建设方面的撬动作用,以数字科技创新基因凸显的企业综合数字化转型服务商的身份,为千行百业提供数字化赋能,持续提升技术创新能力和产品落地能力,与合作伙伴并肩共进,助力更多企业在数字化浪潮中迈向更高峰!
相关企业介绍
·无锡征信
无锡企业征信有限公司(简称“无锡征信”)经无锡市人民政府批准,按照“政府主导,市场运作,企业管理”的原则设立。2023年1月成功完成人民银行企业征信机构备案。公司为政府机构、金融机构、社会各方提供全方位的征信服务,包括企业白名单服务助力金融机构精准营销;企业信用报告及数据接口服务为贷中审查提供合规、真实信息;动态监测服务为贷后管理提供及时风控预警,形成了覆盖众多业务场景、贯穿贷前贷中贷后全流程的信用服务产品体系。
·百望云
百望股份(股票代码:06657.HK)(简称“百望云”)是中国领先的票财税融一体化解决方案服务商和数据要素生态平台构建者。以“链接商业企业,让交易更简单”为使命,百望云致力于以数据驱动业务创新,为政府、企业及公共组织提供电子票据合规管理、智能财税管理、智能供应链协同、数字精准营销、智能风控等数字化解决方案和服务。
百望云积极聚合产业数商资源,搭建金数数据要素流通平台和数据资产运营平台,结合数据变现场景经验优势、数据资源优势和数据生态服务优势,共同解决数据要素的采集、加工、生产难题,推动数据要素的安全互换、互联,构建健全的数据资产运营生态体系,积极探索数据资产的价值创造和合理利用,促进数据要素市场的健康发展。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有