Kalkulator standardowego odchylenia

Standard deviation

Wklej listę liczb – kalkulator wygeneruje średnią, rozkładanie, odchylenie standardowe (dla próbki s przy n−1 jako liczniku oraz dla populacji σ przy n jako liczniku), współczynnik zmienności oraz wartości z-score dla każdego wyniku. Jest to przydatne, gdy chcesz sprawdzić, jak rozproszone są dane wokół ich średniej – kluczowy kryterium diagnostyczne przed przeprowadzeniem jakiegoś testu parametrycznego.

Jak oblicza się odchylkę standardową

  1. 1

    Wklej swoje numery.

    Wyróżnione komarami, przestrzeniami lub nowymi liniami. Wartości nie liczbowe są pomijane.

  2. 2

    Średnią linii x oblicza się.

    Suma podzielona przez liczbę.

  3. 3

    Odchylenia kwadratowe są sumowane.

    sum((x − x-bar)²).

  4. 4

    Podziel i weź korzeń.

    W przypadku próbki: podziel przez (n−1) i oblicz √. W przypadku populacji: podziel przez n i oblicz √.

Przykład vs populacja — kiedy użyć którego

Użyj populacji (n jako dzielnik) Użyj próbki (n−1 jako dzielnik)
Masz całą populację Masz próbę wyjętą z większej populacji
Pełny spis pracowników 20 klientów wybranych z tysięcy
Wszystkie 10 rzućów kości w danej sesji Wymiarowania z linii produkcyjnej

Podziałnik n−1 (korekcja Bessela) umożliwia uzyskanie nieuprzedzonego oszacowacza rozkładu wariancji populacji na podstawie danych próbki. Używanie podziałnika n prowadzi do systematycznego niedoceniania rzeczywistej rozkładu wariancji populacji. Dla dużych wartości n różnica ta maleje, jednak ma znaczenie przy małych wielkościach próbek.

Intuicja dotycząca standardowego odchylenia

Jeśli zestaw ma średnią równą 100 i standardową odchylkę wynoszącą 15, to (za założenia przybliżonej normalności rozkładu):

– 68% wartości mieści się w przedziale 85–115 (1 standardowa odchylka). – 95% wartości w przedziale 70–130 (2 standardowe odchylenia). – 99,7% w przedziale od 55 do 145 (3 standardowe odchylenia).

To zasada 68–95–99,7, nazywana również zasadą empiryczną. Wartości IQ, wzrost ludzi oraz wiele innych naturalnych parametrów dobrze jej odpowiadają.

Koeficient zmienności

CV = SD / średnia. Bezjednostkowa miara rozproszenia – przydatna przy porównywaniu zmienności w zbiorach danych o różnych średnich. Wartość CV równa 0,1 (10%) oznacza mniej więcej, że odchylenie standardowe wynosi 10% średniej. Nie ma sensu używać tej wartości dla danych, które mogą przekraczać zero.

Wartości Z-score

Dla każdego wartości x oblicza się wartość z = (x – średnia) / SD, która pokazuje, ile standardowych odchyleń powyżej lub poniżej średniej znajduje się dane vrijmo. Wartość |z| > 2 często uznaje się za sygnał wykluczającego; |z| > 3 jest bardzo rzadkie w danych normalnych.

Najczęstsze błędy

Używanie populacji, gdy należy użyć próbki, co prowadzi do niedocenienia zmienności w zbiorze danych próbki. – Połączenie średniej i standardowego odchylania z różnych jednostek. Zawsze sprawdź skalę. – Zastosowanie zasad rozkładu normalnego do danych niormalnych. Dane asymetryczne lub wielomodalne naruszają heurystykę 68–95–99,7. Najpierw sporządzisz histogram. – Ignorowanie wartości odchylnych: Jedna wartość ekstremalna może trzykrotnie zwiększyć standardową odchylkę. Dla danych o silnych ogonach istnieją bardziej odporny metody oceny, takie jak mediana absolutnej odchylki lub przedział międzykwartowy.

Najczęściej zadawane pytania

Excel posiada dwie funkcje: STDEV (dla próbki, z liczbą elementów równą n−1) oraz STDEVP (dla populacji, z liczbą elementów równą n). Upewnij się, że używasz tej funkcji odpowiadającej założeniu dotyczącemu próbki lub populacji.

Tak – standardowa odchylka ma identyczne jednostki co Twoje pomiary (cm, dolary, sekundy). Variancja jest wyrażona w kwadratowych jednostkach, dlatego standardowa odchylka jest łatwiejsza do odczytania.

Wartość standardowego odchylenia (SD) w próbie jest definiowana dla n ≥ 2. Przy wartościach n < 30 zaleca się podanie przedziałów ufności otaczających wartość SD lub stosowanie bardziej niezawodnej metody.

Rozmiar standardowy (SD) jest nadal definiowany. Dla procentu p wynosi SD = √(p × (1 − p)). W próbie składającej się z 60 % wartości równych 1 wartość SD wynosi √(0,6 × 0,4) ≈ 0,49, niezależnie od liczby obserwacji.