Obwohl die Kurve gleich aussieht, was ist der Unterschied zwischen der Cauchy- und der Gaußschen Verteilung?


Antwort 1:

Ein Cauchy sieht nicht wie ein normaler aus. Wie genau ein Cauchy aussieht, hängt von den von Ihnen verwendeten Parametern ab, sieht aber nicht normal aus.

zB

set.seed (1234) # Setzt einen Zufallszahlen-Startwert x1 <- rcauchy (1000, 0, 1) x2 <- rnorm (1000, Mittelwert (x1), sd (x1)) Diagramm (Dichte (x1)) Diagramm (Dichte (x2))

Sieh überhaupt nicht gleich aus. Und x1 reicht von -178 bis 702, während x2 von -76 bis 71 reicht.


Antwort 2:

Wie Sie sehen können, sehen die beiden Kurven insofern ähnlich aus, als sie beide eine einzige „Beule“ haben und sich umso weiter ausbreiten, je weiter Sie kommen. Sie unterscheiden sich darin, dass der Cauchy einen schmaleren Peak hat und sich langsamer ausbreitet - es besteht eine viel größere Wahrscheinlichkeit, Werte zu erhalten, die weit vom Peak entfernt sind, verglichen mit der Normalverteilung. Dieser Unterschied führt mathematisch zu vielen verschiedenen Konsequenzen - wie zum Beispiel, dass der Cauchy keinen genau definierten Mittelwert und eine eigenartige Stichprobenverteilung hat, bei der das „Gesetz der großen Zahlen“ nicht gilt.


Antwort 3:

Obwohl die Kurve gleich aussieht, was ist der Unterschied zwischen der Cauchy- und der Gaußschen Verteilung?

Oberflächlich gesehen sehen sie ähnlich aus. Aber zeigen Sie mir ein Diagramm der Dichtefunktion einer Verteilung und sagen Sie mir, dass es entweder Cauchy oder Gauß ist, ich würde wissen, welche (vorausgesetzt, es war wirklich eine davon). Der Cauchy hat viel längere Schwänze.

Wenn wir eine Verteilungsfamilie mit unbekannten Parametern haben, möchten wir diese Parameter schätzen.

  • Die Gaußsche Verteilung hat zwei Parameter, den Mittelwert und die Standardabweichung. Wir könnten stattdessen andere Parameter verwenden, zum Beispiel den Median (der dem Mittelwert entspricht) und den Semi-Interquartil-Bereich (der ungefähr ist)
  • 0.67450.6745
  • mal die Standardabweichung). Der Mittelwert der Cauchy-Verteilung existiert nicht, aber der Median ist das Symmetriezentrum. Die Standardabweichung existiert ebenfalls nicht, aber der Durchschnitt der quadratischen Abweichungen vom Median ist unendlich.

Das ist also der Hauptunterschied. Wir können die Parameter beider Verteilungen als Median- und Semi-Interquartil-Bereich betrachten, aber wir können den Mittelwert und die Standardabweichung für den Cauchy nicht verwenden, da sie nicht existieren.

Wenn wir eine Stichprobe nehmen, um die Parameter einer Verteilung abzuschätzen, berechnen wir Statistiken wie den Mittelwert und die Standardabweichung der Stichprobenwerte. Diese Statistiken haben Verteilungen. Die Verteilung einer Stichprobenstatistik wird als Stichprobenverteilung bezeichnet.

  • Wenn die Verteilung der Population Gauß ist (die Stichprobenverteilung von), ist der Stichprobenmittelwert ebenfalls Gauß und weist eine viel kleinere Standardabweichung auf, sodass eine große Stichprobe genauere Schätzungen liefert als nur eine Beobachtung. Wenn die Verteilung Cauchy ist, ist die Der Stichprobenmittelwert hat ebenfalls eine Cauchy-Verteilung, aber genau den gleichen Median und Semi-Interquartil-Bereich wie die ursprüngliche Verteilung. Es hat keinen Vorteil, den Mittelwert einer Stichprobe zu ziehen.

Das ist also ein weiterer Unterschied. Der Mittelwert einer Stichprobe aus dem Gaußschen ist nützlich, um den Mittelwert (oder den Median) zu schätzen; Der Mittelwert einer Stichprobe für das Cauchy ist für die Schätzung des Medians nutzlos. Es ist besser, den Stichprobenmedian zu verwenden, der genauere Schätzungen liefert.

Ähnliche Argumente gelten für die Schätzung der Streuung (wie auch immer Sie sie definieren) einer der beiden Verteilungen. Die üblichen Schätzungen für eine Gaußsche Verteilung funktionieren für eine Cauchy-Verteilung nicht.

Der wirkliche Unterschied liegt in der mathematischen Formel für die Dichte. In der Standardform hat der Gaußsche Dichte

12πe12z2\frac1{\sqrt{2\pi}}e^{-\frac12z^2}

und der Cauchy hat Dichte

1π(1+z2)\frac1{\pi(1+z^2)}

.

Beachten Sie, dass die beiden

zz

s sind anders. Im ersten Fall beträgt die Standardabweichung

11

im zweiten Fall ist das obere Quartil

11

.

Die Verteilungsfunktion (die Wahrscheinlichkeit, dass

ZzZ\le z

) hat keine ordentlich geschlossene Form für die Gaußsche Verteilung, aber für das Cauchy

1πtan1(z)\frac1{\pi}\tan^{-1}(z)

.

Wenn Sie die Verteilungen auf denselben Achsen grafisch darstellen möchten, um den Unterschied zu erkennen, sollten Sie die Parameter anpassen. Also würde ich den Gaußschen so standardisieren, dass das untere und das obere Quartil sind

0.6745-0.6745

und

0.67450.6745

dh machen Sie die Standardabweichung gleich

1.48261.4826

und verwenden Sie das Standardformular für das Cauchy. Die Bereiche unter den Diagrammen sollten gleich sein, daher sollten die Höhen in der Mitte angemessen skaliert werden (

0.2690.269

für die Gaußsche und

0.3180.318

für den Cauchy - der Cauchy ist in der Mitte größer und in den Schwänzen höher).