前几天有个学弟做毕业设计,问我推荐算法怎么做。
我之前没有接触过,稍微想了下 ,算法是基于模型的,这一点是可以肯定的。那么算法,推荐算法,听起来好像是挺唬人的。
实际上(个人见解):所谓推荐算法难是难在模型的建立,一旦模型建立起来了,应该就不需要算法了吧。也许推荐算法的核心就是模型建立的算法。
举个例子,模型:如果我已经知道你的预算是1000-2000,我就不会推荐超过2000的手机给你,而是推荐1000-2000的。这个很好理解。那么问题就在:我怎么知道你的预算是1000-2000。
这个模型有一个别名,叫画像,在用户这边,就叫做用户画像,等于是给你这个用户定义一个画像、轮廓、描述。
比如说程序员的画像:钱多话少死的早(开玩笑),那么找老公请找这一类的,没啥毛病吧?
当一个用户在你的网站,经常点击军事类的新闻/信息等,我们就可以给他一个简单的标签“这个认喜欢军事”,当有具体数据体现他看的100条信息中,有50条军事,30条政治,10条娱乐,10条其他。那么很明显下,我们给他推荐的信息,肯定优先军事,其次政治,而后娱乐再其他。
所以这里又出现了一个问题,信息的归属。首先每一条信息都需要有分类,这个是不容置疑的。手动分类也好,自动分类也好,总之他需要被分类。如果一条信息即是军事又是政治呢?
其实加个维度的模型建立就好了。