深度学习常用评价指标(Accuracy、Recall、Precision、HR、F1 score、MAP、MRR、NDCG)——推荐系统
·
混淆矩阵
混淆矩阵 | ||
P(Positives) | N(Negatives) | |
T(Ture) | TP:正样本,预测结果为正 | TN:负样本,预测结果为正 |
F(False) | FP:正样本,预测结果为负 | FN:负样本,预测结果为负 |
总结
Accuracy | ||
Recall | ||
Precision | ||
Hits Ratio | ||
F1 score | ||
Mean Average Precision | ||
Mean Reciprocal Rank | ||
Normalized Discounted Cumulative Gain |
1、准确率(Accuracy)
含义:预测正确的样本在所有样本中的比列。
公式:
注:在样本不平衡的情况下,不能作为很好的指标来衡量结果。
2、召回率(Recall)&查全率
含义:预测正确的正样本在所有正样本中所占的比例,即表示有多少比例的用户-物品交互记录包含在最终的预测列表中。
公式:
注:准确率和召回率都只能衡量检索性能的一个方面。
3、精确率(Precision)&查准率
含义:在全部预测为正的结果中,被预测正确的正样本所占的比例。
公式:
注:召回率和精确率是一对矛盾的指标,当召回率高的时候,精确率一般很低;精确率高时,召回率一般很低。
4、命中率(Hits Ratio)
含义:预测结果列表中预测正确的样本占所有样本的比例,即用户想要的项目有没有推荐到,强调预测的“准确性”。
公式:
N,表示用户总数量。
hits(i),表示第i个用户访问的值是否在推荐列表中,是则为1,否则为0。
5、F1分数(F1 score)
含义:精确率与召回率的调和均值。
公式:
6、平均精度均值(Mean Average Precision)
Average Precision(AP):平均精确率,在召回率从0到1逐步提高的同时也要保证准确率比较高,AP值尽可能的大。
含义:用多个来衡量性能,多个类别AP的平均值。
公式:
7、平均倒数排名(Mean Reciprocal Rank)
含义:平均结果中的排序倒数,表示待推荐的项目是否放在了用户更显眼的位置,强调“顺序性”。
公式:
N,表示用户的总数。
pi,表示第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi->∞。
8、归一化折损累计增益(Normalized Discounted Cumulative Gain)
含义:表示归一化加入位置信息度量计算的前p个位置累计得到的效益。
公式:
N,表示用户的总数。
pi,表示第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi->∞。
更多推荐
已为社区贡献4条内容
所有评论(0)