評価尺度
Precision , Recall, F-measure, R-Precision
真の結果: t(true) or f(false)
検索結果: p(positive) or n(negative)
再現率(Recall) | |
適合率(Precision) | |
F値(F-measure) | |
※F値は再現率と適合率の調和平均 |
マイクロ平均(micro average):システム指向の尺度(クエリを区別しない)
、 |
マクロ平均(macro average):ユーザ指向の尺度(クエリを区別し、それらを等しく重要と考える)
、 | |
R-Precision | |
※:正解文書数 | |
※:検索結果位の文書が正解か否か(1 or 0) |
MRR
Reciprocal Rank | |
Mean Reciprocal Rank | |
※はクエリの検索結果の(最も良い)正解出現順位 |
MAP
Average Precision | |
Mean Average Precision | |
※はクエリの検索結果位の文書が正解か否か(1 or 0) | |
※はクエリの検索結果1位からr位までの累積正解数 |