论文传送门

作者

St. Francis Institute of Technology

  • Vipula Rawte
  • G Anuradha

摘要

普遍存在的欺诈现象对医疗保险体系造成了巨大的损失。欺诈把包括故意欺骗或者虚假陈述以谋取未经授权的利益。令人震惊的是医疗保险的欺诈发生率每年都在增长。数据挖掘技术被应用于检测和避免欺诈,这包括了解一些初步的医疗健康系统和欺诈的知识,并对医疗保险数据进行特征分析。数据挖掘技术分为两种,有监督和无监督。由于每种技术都有其优点和缺点,通过结合这两种技术,本文提出了一种新颖的混合方法来检测医疗保险行业的欺诈。

相关工作

欺诈可以分为以下类别:

  • Billing for services not rendered
  • Upcoding of services
  • Upcoding of items
  • Duplicate claims
  • Unnecessary services

常用的方法:

  • 异常检测
  • SVM
  • non-negative matrix factorization
  • k-means algorithm
  • outlier detection

方法

本文采用 Evolving Clustering Method(ECM)来聚类,因为数据是动态的,新数据会源源不断地产生,至于分类则使用 SVM 。
首先医保索赔会被根据疾病类型进行聚类,然后会被分类以识别出重复的索赔请求。

Fraud Detection in Health Insurance using Data Mining Techinques

混合模型欺诈检测的流程如下图所示:
Fraud Detection in Health Insurance using Data Mining Techinques

因为 SVM 是基于时间来分类,所以对于重复的请求可以有效地检测出来,如下图所示:

Fraud Detection in Health Insurance using Data Mining Techinques

相关文章: