"竹杖芒鞋轻胜马, 一蓑烟雨任平生"

Do not deify machine learning,it is not that cool

机器学习实践:为大众点评打造推荐系统

20 Sep 2013
最近在看集体智慧系列相关的科普读物,看过一个算法我都会联想出至少一个相关应用场景实战演练一下。这也算是一个系列的开头吧。
由于相关系统的介绍都在各个项目下的README有所详述,这里只对背景和相关知识点做介绍。
###背景&相关知识点 一般的推荐系统是基于协同过滤算法来对用户和物品进行相似度度量,进而寻找到指定物品的最近邻进行推荐。某天外出吃饭,去大众点评网查看店家评价.发现大众点评似乎没有为用户提供推荐机制,然后看了看用户评论数据,包括对商家的总评分,分项评分(环境,口味,服务等),觉得不利用这些数据玩玩儿推荐真是暴殄天物。于是忙活起来,首先大众点评分类较细,为了快速实现实践检验真理的想法,这里只针对火锅分类爬用户评论,火锅分类下共50页左右的评论, 每10页进行划分,用一个进程去爬,2个小时左右浩浩荡荡完工。
然后对数据进行一系列格式化整理,以符合推荐算法输入要求.套上算法跑一跑,结果一般,中间对算法做了若干hack效果均不明显。然后用mathout也跑了一遍,进行A/B test,结果显然又是很不一样的。只是有一点让我感动,slope one算法跑出的结果和mathout竟然完全一致,当然,也跟这个算法相对简单有关系吧。可以推断的是,不像协同过滤算法,mathout并没有对这个算法做很多优化,否则结果不会完全一致。不过个人觉得这个算法简单到也没什么可观的可优化之处了.


###项目地址 https://github.com/zuojie/MichineLearningCases/tree/master/RecommendationsSys

comments powered by Disqus