【发布时间】:2017-03-29 21:48:01
【问题描述】:
在使用 watson 个性洞察 API 时,我已经注意到一些奇怪的趋势,包括许多得分在各个维度上的平均值(例如,与许多人的合意度约为 0.27),这让我觉得这是在归因于某些东西。
在审查时,我注意到一个语言错位问题(即,如果它认为是英语,如果是西班牙语,你可能会得到奇怪的结果),这导致我询问,但没有找到答案:
沃森如何处理: 1) 消息中的网址(例如,许多推特帖子都有网址) 2)重复发帖(很多频道重复发帖很多次) 3) 特殊字符(很多帖子都有大量随机特殊字符)
我的目标是确定需要进行多少预处理才能使 watson 最有效。
【问题讨论】:
标签: ibm-cloud ibm-watson personality-insights