Kalkulator standardowego odchylenia
Wklej listę liczb – kalkulator wygeneruje średnią, rozkładanie, odchylenie standardowe (dla próbki s przy n−1 jako liczniku oraz dla populacji σ przy n jako liczniku), współczynnik zmienności oraz wartości z-score dla każdego wyniku. Jest to przydatne, gdy chcesz sprawdzić, jak rozproszone są dane wokół ich średniej – kluczowy kryterium diagnostyczne przed przeprowadzeniem jakiegoś testu parametrycznego.
Jak oblicza się odchylkę standardową
-
1
Wklej swoje numery.
Wyróżnione komarami, przestrzeniami lub nowymi liniami. Wartości nie liczbowe są pomijane.
-
2
Średnią linii x oblicza się.
Suma podzielona przez liczbę.
-
3
Odchylenia kwadratowe są sumowane.
sum((x − x-bar)²).
-
4
Podziel i weź korzeń.
W przypadku próbki: podziel przez (n−1) i oblicz √. W przypadku populacji: podziel przez n i oblicz √.
Przykład vs populacja — kiedy użyć którego
| Użyj populacji (n jako dzielnik) | Użyj próbki (n−1 jako dzielnik) |
|---|---|
| Masz całą populację | Masz próbę wyjętą z większej populacji |
| Pełny spis pracowników | 20 klientów wybranych z tysięcy |
| Wszystkie 10 rzućów kości w danej sesji | Wymiarowania z linii produkcyjnej |
Podziałnik n−1 (korekcja Bessela) umożliwia uzyskanie nieuprzedzonego oszacowacza rozkładu wariancji populacji na podstawie danych próbki. Używanie podziałnika n prowadzi do systematycznego niedoceniania rzeczywistej rozkładu wariancji populacji. Dla dużych wartości n różnica ta maleje, jednak ma znaczenie przy małych wielkościach próbek.
Intuicja dotycząca standardowego odchylenia
Jeśli zestaw ma średnią równą 100 i standardową odchylkę wynoszącą 15, to (za założenia przybliżonej normalności rozkładu):
– 68% wartości mieści się w przedziale 85–115 (1 standardowa odchylka). – 95% wartości w przedziale 70–130 (2 standardowe odchylenia). – 99,7% w przedziale od 55 do 145 (3 standardowe odchylenia).
To zasada 68–95–99,7, nazywana również zasadą empiryczną. Wartości IQ, wzrost ludzi oraz wiele innych naturalnych parametrów dobrze jej odpowiadają.
Koeficient zmienności
CV = SD / średnia. Bezjednostkowa miara rozproszenia – przydatna przy porównywaniu zmienności w zbiorach danych o różnych średnich. Wartość CV równa 0,1 (10%) oznacza mniej więcej, że odchylenie standardowe wynosi 10% średniej. Nie ma sensu używać tej wartości dla danych, które mogą przekraczać zero.
Wartości Z-score
Dla każdego wartości x oblicza się wartość z = (x – średnia) / SD, która pokazuje, ile standardowych odchyleń powyżej lub poniżej średniej znajduje się dane vrijmo. Wartość |z| > 2 często uznaje się za sygnał wykluczającego; |z| > 3 jest bardzo rzadkie w danych normalnych.
Najczęstsze błędy
– Używanie populacji, gdy należy użyć próbki, co prowadzi do niedocenienia zmienności w zbiorze danych próbki. – Połączenie średniej i standardowego odchylania z różnych jednostek. Zawsze sprawdź skalę. – Zastosowanie zasad rozkładu normalnego do danych niormalnych. Dane asymetryczne lub wielomodalne naruszają heurystykę 68–95–99,7. Najpierw sporządzisz histogram. – Ignorowanie wartości odchylnych: Jedna wartość ekstremalna może trzykrotnie zwiększyć standardową odchylkę. Dla danych o silnych ogonach istnieją bardziej odporny metody oceny, takie jak mediana absolutnej odchylki lub przedział międzykwartowy.
Najczęściej zadawane pytania
Excel posiada dwie funkcje: STDEV (dla próbki, z liczbą elementów równą n−1) oraz STDEVP (dla populacji, z liczbą elementów równą n). Upewnij się, że używasz tej funkcji odpowiadającej założeniu dotyczącemu próbki lub populacji.
Tak – standardowa odchylka ma identyczne jednostki co Twoje pomiary (cm, dolary, sekundy). Variancja jest wyrażona w kwadratowych jednostkach, dlatego standardowa odchylka jest łatwiejsza do odczytania.
Wartość standardowego odchylenia (SD) w próbie jest definiowana dla n ≥ 2. Przy wartościach n < 30 zaleca się podanie przedziałów ufności otaczających wartość SD lub stosowanie bardziej niezawodnej metody.
Rozmiar standardowy (SD) jest nadal definiowany. Dla procentu p wynosi SD = √(p × (1 − p)). W próbie składającej się z 60 % wartości równych 1 wartość SD wynosi √(0,6 × 0,4) ≈ 0,49, niezależnie od liczby obserwacji.