Wie Sie die Stärke der Beziehung zu Quantifizieren mit Analytics

Sie können numerisch die Stärke eines Vereins quantifizieren durch die Pearson Produkt-Moment-Korrelation verwendet wird. Es ist oft nur der Korrelationskoeffizient bezeichnet und wird durch das Symbol r. Die Korrelation wird verwendet, um die Assoziation zwischen zwei kontinuierlichen Variablen zu quantifizieren, (wie Umsatz, Zeit oder Rating-Skalen).

Der Korrelationskoeffizient variiert von einem r von -1, die eine perfekte negative Korrelation zu 1 gibt, die eine perfekte positive Korrelation bedeutet. Die Abbildung zeigt drei Beispiele von Scatterplots, die eine perfekte negative Korrelation zeigen (r = -1), Keine Beziehungen (r 0 =) und eine perfekte positive Beziehung (r = 1).

bild0.jpg

zwei vollkommen korrelierter Variablen zu verwenden ist nicht hilfreich. Sie sind redundant- wenn Sie den Wert für eine Variable haben, können Sie perfekt die andere vorhersagen.

In der Praxis sind Korrelationen schwach bis stark. Einige Beispiele von Korrelationen unterschiedlicher Stärken gehören:

  • Größe und Gewicht: r = 0,8

  • Scholastic Aptitude Test (SAT) und Erste-Jahres-College-Sorten: r = 0,5

  • Usability und Kundenbindung: r = 0,7

Die Korrelation zwischen den Variablen bedeutet, dass eine Variable den Wert der anderen Variablen vorhersagen kann:

  • Wenn Sie eine Kunden Höhe kennen, können Sie sein Gewicht schätzen.

  • Wenn Sie ein Kunde Gewicht kennen, können Sie seine Höhe abzuschätzen.

Aber weil diese nicht perfekt Korrelationen, die weiterhin eine Korrelation von 1 oder -1 ist, desto mehr Fehler, den Sie bei der Vorhersage einer Variablen haben basierend auf der anderen Seite.

Berechnen einer Korrelation

Sie können den Korrelationskoeffizienten von Hand zu berechnen, oder wie Excel-Software, die für Sie zu berechnen.

mit der Pearson-Korrelation Formel eine Korrelation auf einer Reihe von Daten zu berechnen, die folgenden Schritte aus. (Die folgende Abbildung zeigt die Daten in diesem Beispiel verwendet werden.)

image1.jpg
  1. Stellen Sie die Daten in Zeilen und Spalten in Excel auf.


    Haben Sie eine Spalte für jede Variable und die IDs der Kunden. Jede Zeile sollte die gleiche Kundendaten auf zwei Variablen darstellen. Die nächste Abbildung zeigt 17 Kunden Zeit den Kauf und die Anzahl der Taps für den Kauf erforderlich zu machen.

    image2.jpg
  2. In einer beliebigen Zelle, Typ

    = PEARSON (
  3. Wählen Sie alle Werte für die erste Variable.

    Die Daten für die Zeit erscheint in Spalte B und die Daten geht von Zelle B2 B182 zu Zelle.

  4. Geben Sie ein Komma (,) und wählen Sie alle Werte für die zweite Variable.

    Diese Daten erscheinen in Spalte C, und die Daten geht von Zelle C2 C182 zu Zelle.

    Achten Sie darauf, die gleiche Anzahl von Werten für beide Variablen auszuwählen.

  5. Schließen Sie die Klammer und drücken Sie die Eingabetaste um die Korrelation zu erhalten.

    = PEARSON (B2: B182, C2: C182)

    Die Korrelation dieser Daten zwischen Hähnen und Zeit, ist 0,560666. Es gibt eine positive Korrelation zwischen der Zeit und Armaturen.

Interpretieren der Stärke einer Korrelations

Sobald Sie eine Korrelation zu berechnen, müssen Sie die Stärke der Beziehung zu interpretieren. Die Korrelation zwischen Hähnen und Zeit r = 0,56. Ist das eine starke Korrelation? Es hängt davon ab, ob.

Die Stärke einer Korrelations ist kontextabhängig. EIN # 147-köpfigen # 148- Korrelation in einem Kontext kann eine schwache Korrelation in einem anderen sein. Es hängt davon ab, wie viel Fehler, den Sie in Ihre Vorhersagen für sein Unrecht dulden und die Folgen können.

Zeit von Hähnen Vorhersage wahrscheinlich nicht einen Verlust von Leben oder Geld, beinhalten, so ist es stark genug, um nützlich zu sein. In der Tat ist es etwa die gleiche Stärke einer Assoziation zwischen der SAT und im ersten Jahr College-Sorten - wo viel auf dem Spiel, es gibt!

Während Korrelationen kontextabhängig sind, kann es helfen, einige Hinweise zu dem, was Sie mit dem Kunden-Analytics-Daten wahrscheinlich sehen werden. Ein berühmter Forscher mit dem Namen Jacob Cohen untersucht Korrelationen in den Verhaltenswissenschaften, etwas ähnliches Kundenverhalten zu messen, und sofern die folgenden Regeln basieren auf, wie häufig die Korrelationen wurden in der Peer-Review-Literatur:

  • Klein r = .10

  • Mittel: r = .30

  • groß r = .50

Daher ist es eine einfache Interpretation der Korrelation von r = 0,56 zwischen Hähnen und Zeit ist, dass es groß. Aber es ist ein weiterer Weg, um den Korrelationskoeffizienten zu interpretieren.

Bestimmtheitsmaß r2

Multiplizieren der Korrelationskoeffizienten selbst (Quadrierung es) eine Metrik bekannt als Bestimmtheitsmaß. Es wird dargestellt, wie r2 (ausgesprochen r-squared) und bietet eine bessere Möglichkeit, die Stärke einer Beziehung zu interpretieren.

Zum Beispiel kann eine Korrelation von r = 0,5 quadriert wird 0,25. Beachten Sie, dass r2 wird oft als ein Prozentsatz von 25% ausgedrückt. Für die Korrelation zwischen Hähnen und Zeit, die r2 ist 31%. Das bedeutet Abgriffe 31% der Variation in der Zeit erklären kann. Und umgekehrt Zeit erklärt 31% der Variation in Abgriffen. Wie können Sie, auch eine starke Korrelation von oben sehen r = 0,5 erklärt immer noch eine Minderheit der Unterschiede zwischen den Variablen.

Höhe, beispielsweise erklärt rund 64% der Variation in Gewicht. Das bedeutet, dass die Menschen die Höhen zu wissen, wird erklären, die meisten - aber nicht alle -, warum sie ein bestimmtes Gewicht. Andere Faktoren erklären 36% der Variation. Das würde die Dinge wie Bewegung, Ernährung gehören, oder genetische Faktoren, die manche Menschen in einer bestimmten Höhe wiegen machen als andere von der gleichen Höhe.

Verwenden Sie diese gleichen Ansatz bei Kundenanalysen korreliert. Finden Sie die Korrelation, quadratisch, und dann interpretieren die r-Quadrat-Wert. Wenn Einsätze hoch sind, möchten Sie hohe Korrelationen zu haben, und die meisten der Unterschiede zwischen den Variablen zu erklären. Mit Customer Analytics, sind es in der Regel mehrere Variablen, die eine andere Variable vorherzusagen.

Die Korrelation ist nicht Kausalität

Eines der wichtigsten Konzepte über Korrelation, die Sie wiederholt hören, weil es zu wiederholen wert ist, ist, dass Korrelation nicht Kausalität. Das bedeutet, dass, nur weil eine Variable mit einem anderen korreliert ist, bedeutet nicht, eine Variable durch eine andere Variable verursacht wird. Zeit verursacht keine Hähne. SAT-Scores verursachen keine höheren Klassen. Net Promoter Scores verursachen keine höheren Einnahmen.

Man kann sagen, es ist ein Verein, aber dieser Verein bedeutet nicht Kausalität.

Es könnte sein, dass ein neues Design höhere Website Conversion-Raten verursacht oder es könnte sein, dass ein Coupon erhöht Same-Store Sales. Allerdings könnte es auch andere Variablen sein, die tatsächlich Auswirkungen auf die Ergebnisvariable sind.

Zum Beispiel könnte es sein, dass Same-Store Sales sein bereits bei den Kunden wegen einer Zunahme zunahmen. Oder es könnte sein, dass mehr Kunden auf einer Website konvertieren (einen Kauf), weil die Wettbewerber Website aus dem gleichen Produkt verkauft - nicht wegen Ihrer Website-Design zu ändern. Bedenken Sie immer, was andere Variablen, die Beziehung könnte beeinflussen, wenn Aussagen über Verursachung machen.

» » » » Wie Sie die Stärke der Beziehung zu Quantifizieren mit Analytics