自动化规则的业务背景

       在许多金融公司的风控介绍中,都说自己用到了人工智能,机器学习,深度学习模型等技术,在人工智能的风口上,但凡讨论点技术问题都得跟AI沾点边,不说自己会点机器学习模型都不好意思出门。但是在生产应用中,人工智能模型,或者说机器学习模型存在着不可解释的问题,在我们公司内部,使用最广的还是规则引擎,目前来说还是没有一个可以完全脱离规则的金融公司。研究规则的自动生成具有其现实的意义,不单单是规则对于人来说易于理解,没有机器学习的门槛那么高,同时规则对于业务人员来说其可控性也是最好的。

       公司的风控后台的规则模块需要支持单条规则,组合规则以及评分规则等基本规则功能。单条和组合规则都是业务人员对数据理解后,抽象出来的数据组合逻辑,在设计过程中,需要对数据进行详尽的分析,测试,模拟等操作。人工规则的生成要经历比较长时间的数据分析过程,同时需要手动的部署到风控引擎上。在这样的业务背景下,我们引入了DarwinML自动化规则生成系统,DarwinML自动化规则生成有效的解决了业务人员设计规则的现实问题:

  1. 数据自动分析组合
  2. 基于数据的可定量的解释
  3. 连接规则引擎,一键部署

       DarwinML自动化规则生成可以帮助我们自动的生成规则。自动对数据进行分析,拆解多个树类模型算法得到其执行路径并转化为可运行的规则,基于DarwinML设计的优化损失函数,对规则的生产进行迭代优化,得到最优的规则集合。其缩短了人工规则的设计过程,提升了规则设计的效率和精确度。

 

DarwinML最佳规则的生成流程

 Step1: 数据导入 在DarwinML平台的数据管理界面,选择上传数据,上传完数据后,平台会给出一些数据清洗的建议,选择特征列和标签列。由于规则的特殊性,可以忽略平台给出的清洗建议,选择“保持不变(KeepAll)”,这样生成规则的变量名与选定数据集的变量名是一致的。

DarwinML自动化规则生成:在金融信贷领域的最佳实践

Step2: 创建规则生成项目 在DarwinML平台的项目管理界面,创建规则生成完整流程。

DarwinML自动化规则生成:在金融信贷领域的最佳实践

Step3:配置规则生成参数

  • Step3.1 基本信息

       填写工作流名称和工作流说明

DarwinML自动化规则生成:在金融信贷领域的最佳实践

  • Setp3.2:选择数据

       选择刚才导入的用于规则生成的数据

DarwinML自动化规则生成:在金融信贷领域的最佳实践

  • Step3.3: 模型选择与参数配置

       按默认配置即可,不选择模型,直接进入高级参数配置。高级参数中有超参优化参数和规则生成参数两种配置。超参优化参数按默认选择,规则生成参数是我们的核心配置参数,需要根据数据集做定制化配置,同时默认返回的参数已经根据数据做了定制的优化计算,因此不需要修改,默认参数即可。

DarwinML自动化规则生成:在金融信贷领域的最佳实践

DarwinML自动化规则生成:在金融信贷领域的最佳实践

DarwinML自动化规则生成:在金融信贷领域的最佳实践

  • Step3.4: 工作流确定并启动

DarwinML自动化规则生成:在金融信贷领域的最佳实践Step4: 等待工作流自动训练,评估规则

DarwinML自动化规则生成通过后端的分布式计算平台,对数据进行模型拟合和参数调节,基于一定的优化目标,返回用户期望的最优规则或最优规则集列表。在优化过程中,有4种算法并行执行,每种算法优化过程种的指标都会实时展现,还有TOP10的最优的规则排序。

DarwinML自动化规则生成:在金融信贷领域的最佳实践

DarwinML自动化规则生成:在金融信贷领域的最佳实践               DarwinML自动化规则生成:在金融信贷领域的最佳实践Step5:查看并导出规则生成结果

规则生成结果界面展示了规则生成的一些列评估指标。在规则集列表中,可以查看所有的规则,通过过滤调剂选择最佳规则或规则集合,通过导出按钮下载过滤出的规则列表。在关联规则集中,可以查看与当前规则最相关的规则列表,方便对规则进行分析。

       DarwinML自动化规则生成:在金融信贷领域的最佳实践

DarwinML自动化规则生成:在金融信贷领域的最佳实践

DarwinML自动化规则生成:在金融信贷领域的最佳实践

Step6:将导出的规则集合发布到Inference平台

在规则结果页面下载规则列表后,通过命令发布到Darwin Inference平台实现在线的规则预测和过滤。

DarwinML自动化规则生成的其他实践方式 

DarwinML生成规则后,删除掉关联度最高的变量,重新导入数据,进行规则生成。这样避免了高关联性变量对于规则集合整体的影响,使得其他关联性较低的变量的规则也可以产生规则。

DarwinML生成规则后,取出最佳的规则,基于这条规则过滤所有数据,移除那些满足最佳规则的数据,保存未被最佳规则过滤到的数据,重新设计最佳规则生成流程,并得到新一轮的最佳规则,迭代并生成下一轮的最佳规则。

实际的用户反馈

金融小贷用户在使用自动设计后,每期数据规则迭代在30分钟左右就可以生成100条以上独立有价值的规则。规则集的平均长度可以控制在5个变量以内。每条规则在数据样本比例上的提升能保持3倍以上,并且自动生成的模型可以帮助业务人员跳出思维的盲点,找到以前并不曾注意的风控点。

        

 

相关文章:

  • 2021-04-17
  • 2021-05-23
  • 2022-03-09
  • 2022-12-23
  • 2021-08-25
  • 2023-03-23
  • 2021-11-12
猜你喜欢
  • 2021-11-20
  • 2022-01-05
  • 2022-12-23
  • 2021-08-10
  • 2021-09-28
  • 2021-12-27
相关资源
相似解决方案