作者
St. Francis Institute of Technology
- Vipula Rawte
- G Anuradha
摘要
普遍存在的欺诈现象对医疗保险体系造成了巨大的损失。欺诈把包括故意欺骗或者虚假陈述以谋取未经授权的利益。令人震惊的是医疗保险的欺诈发生率每年都在增长。数据挖掘技术被应用于检测和避免欺诈,这包括了解一些初步的医疗健康系统和欺诈的知识,并对医疗保险数据进行特征分析。数据挖掘技术分为两种,有监督和无监督。由于每种技术都有其优点和缺点,通过结合这两种技术,本文提出了一种新颖的混合方法来检测医疗保险行业的欺诈。
相关工作
欺诈可以分为以下类别:
- Billing for services not rendered
- Upcoding of services
- Upcoding of items
- Duplicate claims
- Unnecessary services
常用的方法:
- 异常检测
- SVM
- non-negative matrix factorization
- k-means algorithm
- outlier detection
方法
本文采用 Evolving Clustering Method(ECM)来聚类,因为数据是动态的,新数据会源源不断地产生,至于分类则使用 SVM 。
首先医保索赔会被根据疾病类型进行聚类,然后会被分类以识别出重复的索赔请求。
混合模型欺诈检测的流程如下图所示:
因为 SVM 是基于时间来分类,所以对于重复的请求可以有效地检测出来,如下图所示: