图像检索评价指标 1. Precision Recall F-Score Precision - 查准率;准确率 P r e c i s o n = #x68C0; #x7D22; #x5230; #x7684; #x76F8; #x4F3C; #x56FE; #x7247; #x4E2A; #x6570; #x68C0; #x7D22; #x5230; #x7684; #x5168; #x90E8; #x56FE;
图像检索评价指标
1. Precision & Recall & F-Score
Precision - 查准率;准确率
Precison=检索到的相似图片个数检索到的全部图片总数=预测为正样本的图片个数所有被预测为正样本的图片总数
Recall - 查全率;召回率
Recall=检索到的相似图片个数数据集里全部相似图片总数=预测为正样本的图片个数所有正样本的图片总数
查全率与查准率互相影响,最理想的是二值都高. 但一般情况下是,{查全率高,查准率低},{查全率低,查全率高}.
保证查全率的情况下,提升查准率——搜索任务等;
保证查准率的情况下,提升查全率——疾病监控、反垃圾邮件、地震检测、金融欺诈等;
F-Score - 对于查全率与查准率都具有较高要求
F−Score=(1+β2)Precision⋅Recallβ2⋅Precision+Recall
调节
β
值可以控制 Precision 和 Recall 的权重,
β<1
,查准率更重要;
β>1
,查全率更重要.
β=1
时,称为 F1-score 或 F1.
F1=2∗Precsion∗RecallPrecsion+Recall
注:分类问题中的
准确率(accuracy)=正确分类的样本数样本总数
2. AP & mAP
图像检索精度(average precision, AP)
图像平均检索精度(mean average precision, mAP)
假设图像库中与待查询图片相似的图片数为
N
,
第一次查询,返回
N1
张图片
Top k |
top1 |
top2 |
top3 |
|
top k1 |
返回的相似图片数
n1
n2
n3
nk
查准率 (precison)
n1/1
n2/2
n3/3
nk/k1
查全率 (recall)
n1/N
n2/N
n3/N
nk/N
第一次查询的检索精度
AP1=(n1/1+n2/2+n3/3+...+nk/k1)/k1
第二次查询,返回
N2
张图片
Top k |
top1 |
top2 |
top3 |
|
top k2 |
返回的相似图片数
t1
t2
t3
tk
查准率 (precison)
t1/1
t2/2
t3/3
tk/k2
查全率 (recall)
t1/N
t2/N
t3/N
tk/N
第二次查询的检索精度
AP2=(t1/1+t2/2+t3/3+...+tk/k2)/k2
平均查询精度
mAP=(AP1+AP2)/2
一个很好的图片概括: