最近有人问我是否可以使用这个工具来做一些像名字识别这样的事情,所以我把它写成了一个备忘录。
我使用的工具
IBM 匹配 360,https://www.ibm.com/docs/ja/cloud-paks/cp-data/4.5.x?topic=services-match-360-watson
如果您在 IBM Cloud 上拥有一个使用名为工具的帐户,则可以免费试用。
(不过好像没有信用卡注册的账户是不能试用的。)
我觉得你知道这里就好了,但如果我敢写姓名识别是什么,“从多个数据库中,以姓名、地址、电话号码等信息为线索,哪里是同一个人的数据?是拼凑等的工作。
例如,我在公司网站上做了一个简单的问卷调查。另一方面,假设您有一个使用您的产品的客户列表。好像是想匹配收集本次回答问卷的人和已经在客户名单上的人,或者想搜索的时候。
去做
- 在 IBM Cloud 上订购服务
- 准备和注册数据
- 配置 Match 360 进行匹配
-
在 IBM Cloud 上订购服务
如果您没有 IBM Cloud 帐户,请先注册。在这里注册。
https://cloud.ibm.com/registration
接下来,您将在门户屏幕上订购 Match 360。
在目录中搜索“Match 360”。
目前只有一个免费的灯光计划,但我会用这个订购。
服务准备就绪后,单击“在 Cloud Pak for Data 中启动”以启动 match 360。
这是 Match360 的屏幕。 -
准备和注册数据
这次创建的数据在此站点上创建了虚拟数据。
https://testdata.userlocal.jp/
我创建了简单的数据,并根据创建的数据删除了一些项目。尤其是
(地址仅为县名,没有出生年月日、信用卡等详细信息)
假人.csv
dummyx.csv -
设置 Match 360 并匹配
让我们将上面创建的数据放入 Match 360 中。
我在右侧菜单中选择了数据设置并上传了 csv 数据。一旦数据进入,我们匹配资产属性、映射数据、发布数据模型并发布数据。
你可以参考这个动手操作的过程。
https://dataplatform.cloud.ibm.com/docs/content/wsj/mdm/end-to-end-tutorial.html接下来,设置匹配。您可以设置要匹配的项目。
这需要一些时间。 (但在 1 分钟内有 500 个数据)
匹配完成后,通过数据搜索进行搜索。例如,如果您搜索 Hiroko Saito
dummy 和 dummyX 中都有数据。
我发现回答问卷的斋藤先生和客户数据中的斋藤先生是同一个人。
-
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308630663.html