【发布时间】:2013-06-29 13:26:15
【问题描述】:
我需要按特征创建分类器,我有 1500 万行数据,例如:
{
"app_entertainment" : 1,
"app_widgets" : 2,
"arcade" : 8,
"books_and_reference" : 2,
"comics" : 0,
"brain" : 20,
"business" : 0,
"cards" : 5,
"casual" : 1,
"communication" : 4,
"education" : 0,
"finance" : 1,
"game_wallpaper" : 0,
"game_widgets" : 0,
"health_fitness" : 0,
"libraries_demo" : 0,
"racing" : 1,
"lifestyle" : 1,
"media_video" : 0,
"medical" : 0,
"music_and_audio" : 7,
"news_magazines" : 2,
"personalization" : 1,
"photography" : 0,
"productivity" : 4,
"shopping" : 1,
"social" : 1,
"sports_apps" : 1,
"sports_games" : 7,
"tools" : 15,
"transportation" : 2,
"travel_and_local" : 8,
"weather" : 3,
"app_wallpaper" : 0,
"entertainment" : 0,
"health_and_fitness" : 0,
"libraries_and_demo" : 0,
"media_and_video" : 0,
"news_and_magazines" : 0,
"sports" : 0
}
对于这样的每个数据集,我也知道它是真是假, 布尔值是拥有此数据集的用户是否点击了广告。
如何使用 mahout 训练分类器,训练后如何分类?
我在网上找到的一切都非常抽象,如何通过 java 做的例子并不多
【问题讨论】:
-
你试过什么?
-
我试图弄清楚如何训练它
-
你试图弄清楚如何训练它? 你在哪里卡住了,错误是什么?
标签: java data-mining data-modeling classification mahout