FilmTrust为2011年从网站FilmTrust 完整抓取下来的数据集.
本数据集由两部分组成:ratings.txt 和 trust.txt.其中 ratings.txt包含35497条数据, 保存形式为 userid, movieid, movieRating trust.txt包含1853条数据,保存形式为 trustorId, trusteeId, trustRating
@INPROCEEDINGS{guo2013novel,
author = {Guo, G. and Zhang, J. and Yorke-Smith, N.},
title = {A Novel Bayesian Similarity Measure for Recommender Systems},
booktitle = {Proceedings of the 23rd International Joint Conference on Artificial Intelligence (IJCAI)},
year = {2013},
pages = {2619-2625}
}
在配置文件中配置使用该文件的配置项为
# set data directory
dfs.data.dir=../data
# setting dataset name
data.input.path=filmtrust
在Java程序中配置方法为
conf.set("dfs.data.dir", "../data")
conf.set("data.input.path", "filmtrust");
下一节:Filter可以在评估时根据一定规则来过滤掉部分数据。 Filter的过滤对象是由recommender产生的recommendedList,recommendedList由一组recommendedItem构成,每个recommendedItem表示为一个三元组:(userId itemId value)。 目前支持的过滤器为GenericRecommendedFilter,其功能是返回recommendedList中包含指定userId或itemId的recommendedItem,指定的userId和itemId在GenericRecommendedFilter中以列表的形式提前设置。 目前Filter仅支持在Java代码中使用.