如何利用大数据平台，精准打击欺诈骗保_

来源：中国医疗保险

作者：陈治文成都市医疗保险信息服务中心

近年来，医保欺诈骗保等现象层出不穷，且逐渐呈现出复杂化、多样化、隐蔽化的特点，为我国医疗保险服务的监控和治理带来了巨大的挑战。传统的智能审核能解决合规性问题，针对隐藏在真实数据中的、违背合理性逻辑的欺诈骗保行为捉襟见肘，推进大数据手段在医保监管中的应用迫在眉睫。

2017年以来，成都市医疗保险信息服务中心建立大数据反欺诈平台，内置百余种创新算法，通过神经网络、机器学习、人工智能等深度数据挖掘，在海量数据中挖掘可疑行为，精确定位异常场景，为医保打击欺诈骗保提供依据。

唤醒沉睡资源，数据深度挖掘

经过多年医保事业的创新发展，成都市囤积了高质海量的医保数据资源。据统计，截至2018年末，成都基本医疗保险参保人数1682.22万，“两定”机构数量超过13000家。2018年全年，门诊统筹结算超614万人次，住院医疗费用结算超293万人次，日均医保刷卡26.13万人次，每天医保基金支出超过7100万元。数据存储日均新增5G，累计超过150T。面对如此庞大的数据金山，医保管理者该如何撬动？

对此，成都市医保信息服务中心科学研析，以大数据分析手段为主，以循证医学为辅，结合当前成熟先进的大数据算法，建立了大数据反欺诈平台。通过智能引擎对结算数据、电子病历等平台采集到的住院、门特相关数据进行全方位、多维度、长周期的分析，挖掘其中的行为模式、常用药方和治疗项目。再根据数据聚类，将存在其中的真实性问题数据识别出来，达到辅助工作人员决策，对医疗单位和参保人的精细化管理，控制欺诈骗保行为的目标。

定位真实场景，建立算法模型

以真实性问题为导向，围绕“住院行为真实性”和“门诊特殊疾病治疗真实性”两条主线，从现实欺诈场景出发，平台共设计了频繁就医识别监测、住院时间重叠识别监测、滞留住院识别监测、虚假医疗服务识别监测在内的四种算法模型。

比如频繁就医识别监测，重点针对有关联关系的参保人在相同时间相同医院的就诊行为监测。利用聚类算法识别出就诊行为高度一致的可疑行为，作为联合骗保疑点。

住院时间重叠识别监测，直观的数据表现是患者的住院时间存在重叠，可能导致患者在报销的过程中，由于各种原因，出现2次及以上的医保报销，造成医疗资源浪费。

滞留住院识别监测，重点针对患者在就诊的过程中出现连续7天以上未发生实质性治疗的行为监测，该类患者结算费用明细往往只有护理费、诊查费、床位费等，存在滞留住院浪费医疗资源的嫌疑。

虚假医疗服务识别监测，重点针对工作人员在对参保人药品、诊疗项目进行报销时发生对码错误的行为，具体数据表现如医院端名称与中心端名称不匹配，导致医保报销出现错误的经办人员违规操作等。

稽核反馈验证，持续优化拟合

在平台智能引擎识别出可疑数据后，中心按批次下发稽核任务，由稽核人员对可疑数据进行现场检查并将稽核结果反馈回系统，大数据算法模型自动获取反馈结果进行学习，从而对系统的算法进行优化更新，使算法在未来的异常识别过程中更加精准。

比如，中心在对2016年和2017年结算数据和明细数据进行专项筛查时，在“疑似重复报销”场景中，发现门诊特殊疾病结算数据可疑就诊记录377条，涉及医院30多家。中心据此分3批次下发稽核任务。经现场检查，共计查实疑点数据302条，查实率近80%。对此，中心利用稽核结果对平台该场景进行了集中优化，一举将“疑似重复报销”场景查实率提升至98%以上。

截至2019年4月底，中心利用大数据反欺诈平台共找到可疑就诊记录3526条，查实违规记录3192条，查实准确率达到90.53%，涉及金额3133519.9元，有效降低了基金损失。

借助大数据反欺诈平台，成都市在海量的医保数据中能够快速、准确筛查出相关异常记录，降低了人工审核的巨大成本，显著提升了识别欺诈行为的准确率，为打造风清气正的营商环境提供了医保助力。

下一步，中心将持续调整算法模型的方向和阈值，优化架构，推进任务精准度不断提升。同时，进一步拓展平台功能，开发如药品组滥用、过度医疗等其他违规场景算法模型。