Overview 内容相似推荐算法,是推荐系统当中的一个常用的算法。假设我们做的是文章推荐,那么,我们该怎样求两篇文章的相似度呢?本文将记录几个常用工具的使用方法。 1. jieba分词工具 可以说是当前最好用的中文分词组件。我们拿到文章的标题、摘要、全文之后,可以用jieba提取关键词,然后去另一篇文章当中做Doc2Vec,把另一篇文章转化为一个向量,可以用平均或者加权平均的方式得到一个...阅读全文>>