Entfernung von Bhattacharyya
In der Statistik ist die Bhattacharyya-Distanz ein Maß für die Ähnlichkeit zweier diskreter Wahrscheinlichkeitsverteilungen . Er hängt mit dem Bhattacharyya-Koeffizienten zusammen , der ein statistisches Maß für die Überlappung zweier Stichprobensätze ist . Diese Metrik wird am häufigsten zum Abgleichen zwischen zwei Beobachtungen basierend auf dem Farbhistogramm verwendet. Diese Messung wird regelmäßig bei Klassifikationsproblemen , insbesondere im Bereich Computer Vision, eingesetzt .
Der Name der Distanz und der Koeffizient stammen von dem indischen Statistiker A. Bhattacharya (en) , der in den 1930er Jahren am Indian Institute of Statistics arbeitete . Der Koeffizient kann verwendet werden, um die relative Nähe der beiden betrachteten Mengen zu bestimmen. Es wird verwendet, um die Trennbarkeit von Klassen bei der automatischen Klassifikation zu messen .
Definition
Für zwei diskrete Wahrscheinlichkeitsverteilungen p und q, die auf demselben Wahrscheinlichkeitsraum definiert sind , wird die Bhattacharyya-Distanz berechnet durch:
DB(p,q)=-ln(BVS(p,q)){\ displaystyle D_ {B} (p, q) = - \ ln \ left (BC (p, q) \ right)}oder :
BVS(p,q)=Σx∈Xp(x)q(x){\ displaystyle BC (p, q) = \ sum _ {x \ in X} {\ sqrt {p (x) q (x)}}}ist der Bhattacharyya-Koeffizient.
Für kontinuierliche Wahrscheinlichkeitsverteilungen ist der Koeffizient definiert durch:
BVS(p,q)=∫p(x)q(x)dx{\ displaystyle BC (p, q) = \ int {\ sqrt {p (x) q (x)}} \, dx}In beiden Fällen und . Die Bhattacharyya-Distanz folgt nicht der Dreiecksungleichung , im Gegensatz zur Hellinger-Distanz , die aus der Bhattacharyya-Distanz durch definiert wird .
0≤BVS≤1{\ displaystyle 0 \ leq BC \ leq 1}0≤DB≤∞{\ displaystyle 0 \ leq D_ {B} \ leq \ infty}1-BVS{\ displaystyle {\ sqrt {1-BC}}}
Für multivariate Gaußsche Verteilungen gilt:
pich=NICHT(ichich,Pich){\ displaystyle p_ {i} = N (m_ {i}, P_ {i})}
DB=18(ich1-ich2)TP-1(ich1-ich2)+12ln(detPdetP1detP2){\ displaystyle D_ {B} = {1 \ über 8} (m_ {1} -m_ {2}) ^ {T} P ^ {- 1} (m_ {1} -m_ {2}) + {1 \ über 2} \ ln \, \ left ({\ det P \ over {\ sqrt {\ det P_ {1} \, \ det P_ {2}}}} \ right)},
wobei und die Mittelwerte und Kovarianzen der Verteilungen sind, und .
ichich{\ displaystyle m_ {i}}Pich{\ Anzeigestil P_ {i}}P=P1+P22{\ displaystyle P = {P_ {1} + P_ {2} \ über 2}}
Diese Schrift zeigt, dass im Gaußschen Fall der erste Term der Bhattacharyya-Distanz mit der Mahalanobis-Distanz zusammenhängt .
Bhattacharyya-Koeffizient
Hinweise und Referenzen
-
(in) A. Bhattacharyya , " Wir messen die Divergenz zwischen zwei statistischen Populationen, die durch ihre Wahrscheinlichkeitsverteilungen definiert sind " , Bulletin of the Calcutta Mathematical Society (in) , vol. 35,1943, s. 99–109, MR 0010358
-
(in) Sergios Theodoridis und Konstantinos Koutroumbas, Mustererkennung , Amsterdam / Boston, Academic Press,2006( ISBN 978-0-12-369531-4 ), s. 228
Siehe auch
Zum Thema passende Artikel
Literaturverzeichnis
- (en) F. Nielsen und S. Boltz , „ The Burbea-Rao and Bhattacharyya centroids “ , ArXiv: 1004.5049v1 ,2010( online lesen )
- (in) Thomas Kailath (in) , „ Die Divergenz und Bhattacharyya-Distanzmaße bei der Signalauswahl “ , IEEE Transactions on Communications Technology , vol. 15, n o 1,1967, s. 52-60 ( DOI 10.1109 / TCOM.1967.1089532 )
- (en) A. Djouadi , O. Snorrason und F. Garber , „ Die Qualität der Schätzungen des Bhattacharyya-Koeffizienten von Trainingsstichproben “ , IEEE Transactions on Pattern Analysis and Machine Intelligence , vol. 12, n o 1,1990, s. 92-97 ( DOI 10.1109 / 34.41388 )
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">