Entfernung von Bhattacharyya

In der Statistik ist die Bhattacharyya-Distanz ein Maß für die Ähnlichkeit zweier diskreter Wahrscheinlichkeitsverteilungen . Er hängt mit dem Bhattacharyya-Koeffizienten zusammen , der ein statistisches Maß für die Überlappung zweier Stichprobensätze ist . Diese Metrik wird am häufigsten zum Abgleichen zwischen zwei Beobachtungen basierend auf dem Farbhistogramm verwendet. Diese Messung wird regelmäßig bei Klassifikationsproblemen , insbesondere im Bereich Computer Vision, eingesetzt .

Der Name der Distanz und der Koeffizient stammen von dem indischen Statistiker A. Bhattacharya (en) , der in den 1930er Jahren am Indian Institute of Statistics arbeitete . Der Koeffizient kann verwendet werden, um die relative Nähe der beiden betrachteten Mengen zu bestimmen. Es wird verwendet, um die Trennbarkeit von Klassen bei der automatischen Klassifikation zu messen .

Definition

Für zwei diskrete Wahrscheinlichkeitsverteilungen p und q, die auf demselben Wahrscheinlichkeitsraum definiert sind , wird die Bhattacharyya-Distanz berechnet durch:

{\ displaystyle D_ {B} (p, q) = - \ ln \ left (BC (p, q) \ right)}

oder :

{\ displaystyle BC (p, q) = \ sum _ {x \ in X} {\ sqrt {p (x) q (x)}}}

ist der Bhattacharyya-Koeffizient.

Für kontinuierliche Wahrscheinlichkeitsverteilungen ist der Koeffizient definiert durch:

{\ displaystyle BC (p, q) = \ int {\ sqrt {p (x) q (x)}} \, dx}

In beiden Fällen und . Die Bhattacharyya-Distanz folgt nicht der Dreiecksungleichung , im Gegensatz zur Hellinger-Distanz , die aus der Bhattacharyya-Distanz durch definiert wird . ${\ displaystyle 0 \ leq BC \ leq 1}$ ${\ displaystyle 0 \ leq D_ {B} \ leq \ infty}$ ${\ displaystyle {\ sqrt {1-BC}}}$

Für multivariate Gaußsche Verteilungen gilt: ${\ displaystyle p_ {i} = N (m_ {i}, P_ {i})}$

{\ displaystyle D_ {B} = {1 \ über 8} (m_ {1} -m_ {2}) ^ {T} P ^ {- 1} (m_ {1} -m_ {2}) + {1 \ über 2} \ ln \, \ left ({\ det P \ over {\ sqrt {\ det P_ {1} \, \ det P_ {2}}}} \ right)}

wobei und die Mittelwerte und Kovarianzen der Verteilungen sind, und . $Mitte}$ $Pi$ ${\ displaystyle P = {P_ {1} + P_ {2} \ über 2}}$

Diese Schrift zeigt, dass im Gaußschen Fall der erste Term der Bhattacharyya-Distanz mit der Mahalanobis-Distanz zusammenhängt .

Bhattacharyya-Koeffizient

Hinweise und Referenzen

(in) A. Bhattacharyya , " Wir messen die Divergenz zwischen zwei statistischen Populationen, die durch ihre Wahrscheinlichkeitsverteilungen definiert sind " , Bulletin of the Calcutta Mathematical Society (in) , vol. 35,1943, s. 99–109, MR 0010358
(in) Sergios Theodoridis und Konstantinos Koutroumbas, Mustererkennung , Amsterdam / Boston, Academic Press,2006( ISBN 978-0-12-369531-4 ), s. 228

(fr) Dieser Artikel ist ganz oder teilweise dem englischen Wikipedia- Artikel " Bhattacharyya Distance " entnommen ( siehe Autorenliste ) .

Siehe auch

Zum Thema passende Artikel

Literaturverzeichnis

(en) F. Nielsen und S. Boltz , „ The Burbea-Rao and Bhattacharyya centroids “ , ArXiv: 1004.5049v1 ,2010( online lesen )
(in) Thomas Kailath (in) , „ Die Divergenz und Bhattacharyya-Distanzmaße bei der Signalauswahl “ , IEEE Transactions on Communications Technology , vol. 15, n o 1,1967, s. 52-60 ( DOI 10.1109 / TCOM.1967.1089532 )
(en) A. Djouadi , O. Snorrason und F. Garber , „ Die Qualität der Schätzungen des Bhattacharyya-Koeffizienten von Trainingsstichproben “ , IEEE Transactions on Pattern Analysis and Machine Intelligence , vol. 12, n o 1,1990, s. 92-97 ( DOI 10.1109 / 34.41388 )