LibRec FilmTrust 数据集

FilmTrust为2011年从网站FilmTrust 完整抓取下来的数据集.

本数据集由两部分组成:ratings.txt 和 trust.txt.其中 ratings.txt包含35497条数据, 保存形式为 userid, movieid, movieRating trust.txt包含1853条数据,保存形式为 trustorId, trusteeId, trustRating

@INPROCEEDINGS{guo2013novel,
   author = {Guo, G. and Zhang, J. and Yorke-Smith, N.},
   title = {A Novel Bayesian Similarity Measure for Recommender Systems},
   booktitle = {Proceedings of the 23rd International Joint Conference on Artificial Intelligence (IJCAI)},
   year = {2013},
   pages = {2619-2625}
}

在配置文件中配置使用该文件的配置项为

# set data directory
dfs.data.dir=../data
# setting dataset name
data.input.path=filmtrust

在Java程序中配置方法为

conf.set("dfs.data.dir", "../data")
conf.set("data.input.path", "filmtrust");
下一节:Filter可以在评估时根据一定规则来过滤掉部分数据。 Filter的过滤对象是由recommender产生的recommendedList,recommendedList由一组recommendedItem构成,每个recommendedItem表示为一个三元组:(userId itemId value)。 目前支持的过滤器为GenericRecommendedFilter,其功能是返回recommendedList中包含指定userId或itemId的recommendedItem,指定的userId和itemId在GenericRecommendedFilter中以列表的形式提前设置。 目前Filter仅支持在Java代码中使用.