Perbezaan antara Standard Deviation dan Error Standard Perbezaan Antara
Pengenalan
Standard D eviation (SD) dan S tandard > E rror (SE) adalah terminologi yang seolah-olah sama; Walau bagaimanapun, mereka secara konseptual sangat berbeza-beza bahawa mereka digunakan hampir bergantian dalam kesusasteraan Statistik. Kedua-dua istilah biasanya didahului oleh simbol ditambah-tolak (+/-) yang menandakan fakta bahawa mereka menentukan nilai simetrik atau mewakili pelbagai nilai. Selalunya, kedua-dua istilah muncul dengan purata (min) satu set nilai diukur.
Menariknya, SE tidak mempunyai kaitan dengan standard, dengan kesilapan, atau dengan komunikasi data saintifik.Satu pandangan terperinci mengenai asal usul dan penjelasan SD dan SE akan mendedahkan, mengapa statistik ahli profesional dan mereka yang menggunakannya secara cursorily, kedua-duanya cenderung untuk menyalahi undang-undang.
Deviasi Standard (SD)
SD adalah statistik
deskriptif yang menerangkan penyebaran taburan. Sebagai metrik, ia berguna apabila data diedarkan secara normal. Walau bagaimanapun, ia kurang berguna apabila data sangat miring atau bimodal kerana ia tidak menggambarkan bentuk distribusi yang sangat baik. Biasanya, kami menggunakan SD apabila melaporkan ciri-ciri sampel, kerana kami berhasrat untuk menggambarkan berapa banyak data yang berubah-ubah di sekitar min. Statistik berguna yang lain untuk menghuraikan penyebaran data adalah pelbagai antara kuartil, persentil ke-25 dan ke-75, dan julat data.
deskriptif juga, dan ia ditakrifkan sebagai kuadrat sisihan piawai. Ia tidak biasanya dilaporkan apabila menerangkan keputusan, tetapi ia adalah formula matematik yang boleh dikendalikan secara matematik (a) jumlah penyimpangan kuasa dua) dan memainkan peranan dalam pengiraan statistik.
P & Q dengan varians yang diketahui var (P) & < var (Q) , maka varians jumlah P + Q sama dengan jumlah varians: var (P) + > var (Q) . Kini jelas mengapa ahli statistik suka bercakap mengenai variasi. Tetapi sisihan piawai membawa erti yang penting untuk disebarkan, terutamanya apabila data diedarkan secara normal: Maksud interval +/- 1 SD boleh dijangkakan untuk menangkap 2/3 sampel, dan selang bermakna
+ - 2 SD dijangka dapat menangkap 95% sampel. SD memberikan petunjuk sejauh mana tanggapan individu terhadap soalan berbeza atau "menyimpang" dari min.SD memberitahu penyelidik bagaimana penyebaran jawapannya - apakah mereka tertumpu di sekitar min, atau tersebar luas & luas? Adakah semua responden anda menilai produk anda di tengah skala anda, atau adakah ada yang meluluskannya dan ada yang tidak setuju? Pertimbangkan percubaan di mana responden diminta menilai produk pada satu siri atribut pada skala 5 mata. Maksud untuk sekumpulan sepuluh responden (bertanda 'A' melalui 'J' di bawah) untuk "nilai yang baik untuk wang" adalah 3. 2 dengan SD dari 0. 4 dan min bagi "kebolehpercayaan produk" ialah 3. 4 dengan SD dari 2. 1. Pada pandangan pertama (melihat hanya dengan cara), nampaknya kebolehpercayaan dinilai lebih tinggi daripada nilai. Tetapi SD yang lebih tinggi untuk kebolehpercayaan dapat ditunjukkan (seperti ditunjukkan dalam taburan di bawah) bahawa respons sangat terpolarisasi, di mana kebanyakan responden tidak mempunyai masalah kebolehpercayaan (menilai atribut sebagai "5"), tetapi segmen responden yang lebih kecil tetapi penting masalah kebolehpercayaan dan menilai sifat "1". Melihat maksudnya sahaja menceritakan sebahagian daripada cerita, namun, lebih kerap daripada tidak, inilah yang ditumpukan para penyelidik. Pengagihan maklum balas adalah penting untuk dipertimbangkan dan SD menyediakan langkah deskriptif berharga ini.
Responden
Nilai Baik untuk Wang
Kebolehpercayaan Produk
A | 3 | 1 |
B | 3 | 1 |
C | 3 < 3 | 1 |
E | 4 | 5 |
F | 4 | 5 |
G | 3 | 5 |
H | 3 | 5 |
I | 3 | 5 |
J | 3 | 5 |
Mean | 3. 2 | 3. 4 |
Std. Dev. | 0. 4 | 2. 1 |
Tinjauan Pertama: Responden menarafkan produk pada skala 5-point | Dua taburan tindak balas yang sangat berbeza terhadap skala penarafan 5-point dapat menghasilkan makna yang sama. Pertimbangkan contoh berikut yang menunjukkan nilai tindak balas untuk dua penilaian yang berbeza. | Dalam contoh pertama (Penilaian "A"), SD adalah sifar kerana SEMUA respons adalah tepat nilai min. Tanggapan individu tidak menyimpang dari min. |
Dalam Penilaian "B", walaupun kumpulan bermakna adalah sama (3. 0) sebagai taburan pertama, Standard Deviation lebih tinggi. Perbezaan Piawai 1. 15 menunjukkan bahawa jawapan individu, secara purata *, sedikit lebih dari 1 mata jauh dari min. | Responden | Penilaian "A" |
Penilaian "B"
A
3
1
B | 3 | 2 |
C | 3 | 2 |
D | 3 | 3 |
E | 3 | 3 |
F | 3 | 3 |
G | 3 3 | H |
3 | 4 | I |
3 | 4 | J |
3 | 5 | Mean |
3. 0 | 3. 0 | Std. Dev. |
0. 00 | 1. 15 | Kajian Kedua: Responden menarafkan produk pada skala 5-point |
Cara lain untuk melihat SD adalah dengan merancang pengedaran sebagai histogram jawapan. Pengedaran dengan SD rendah akan dipaparkan sebagai bentuk sempit tinggi, manakala SD yang besar akan ditunjukkan oleh bentuk yang lebih luas. | SD umumnya tidak menunjukkan "betul atau salah" atau "lebih baik atau lebih buruk" - SD yang lebih rendah tidak semestinya lebih diingini. Ia digunakan semata-mata sebagai statistik deskriptif. Ia menerangkan pengagihan berkaitan dengan min. | T |
penafian teknikal yang berkaitan dengan SD | Pemikiran SD sebagai "penyelewengan purata" adalah cara yang sangat baik untuk memahami maknanya secara konseptual. Walau bagaimanapun, ia tidak dikira sebagai purata (jika ia adalah, kita akan menyebutnya "sisihan purata"). Sebaliknya, ia adalah "diseragamkan," kaedah yang agak rumit untuk mengira nilai menggunakan jumlah kotak itu. | Untuk tujuan praktikal, pengiraan tidak penting. Kebanyakan program tabulasi, hamparan atau alat pengurusan data lain akan menghitung SD untuk anda. Lebih penting ialah memahami apa yang disampaikan oleh statistik. |
Ralat Piawai
Ralat piawai adalah statistik
yang menyimpulkan
yang digunakan apabila membandingkan sampel (purata) di seluruh populasi. Ia adalah ukuran ketepatan ketepatan
. Purata sampel adalah statistik yang diperoleh daripada data yang mempunyai pengedaran pendasar. Kami tidak dapat menggambarkannya dengan cara yang sama seperti data, kerana kami telah melakukan eksperimen tunggal dan hanya mempunyai satu nilai. Teori statistik memberitahu kita bahawa min sampel (untuk sampel yang "cukup" dan di bawah beberapa keadaan teratur) adalah hampir diedarkan secara normal. Penyimpangan piawai pengedaran normal ini adalah apa yang kita sebut ralat standard.
Rajah 2.
Pengedaran di bahagian bawah menunjukkan
penyebaran data, sedangkan pengedaran di bahagian atas adalah pengedaran teoretis dari sampel sampel. SD 20 adalah ukuran penyebaran data, sedangkan SE 5 adalah ukuran ketidakpastian sekitar min sampel. Apabila kita ingin membandingkan cara hasil daripada eksperimen dua sampel Rawatan A vs Rawatan B, maka kita perlu untuk menganggarkan sejauh mana kita mengukur cara. Sebenarnya, kami berminat dengan sejauh mana kami mengukur perbezaan antara kedua-dua cara. Kami panggil ukuran ini kesilapan standard perbezaannya. Anda mungkin tidak terkejut untuk mengetahui bahawa kesilapan standard perbezaan cara sampel adalah fungsi kesilapan standard cara: Sekarang bahawa anda telah memahami bahawa ralat standard min (SE) dan sisihan piawai pengagihan (SD) adalah dua binatang yang berbeza, anda mungkin tertanya-tanya bagaimana mereka mendapat keliru di tempat pertama. Walaupun mereka berbeza secara konseptual, mereka mempunyai hubungan mudah secara matematik: , di mana n ialah bilangan titik data.
Perhatikan bahawa ralat standard bergantung pada dua komponen: sisihan piawai sampel, dan ukuran sampel n . Ini menjadikan akal intuitif: semakin besar sisihan piawai sampel, semakin kurang tepat kita boleh kira-kira anggaran kami dari min yang benar.Selain itu, besar saiz sampel, lebih banyak maklumat yang kita ada mengenai penduduk dan lebih tepatnya kita dapat menganggarkan maksud sebenar.
SE adalah petunjuk kebolehpercayaan min. SE kecil adalah petunjuk bahawa min sampel adalah refleksi yang lebih tepat dari min populasi sebenar.Saiz sampel yang lebih besar biasanya akan menghasilkan SE yang lebih kecil (sementara SD tidak terjejas secara langsung oleh saiz sampel).
Kebanyakan kajian tinjauan melibatkan lukisan sampel dari populasi. Kami kemudian membuat kesimpulan tentang populasi dari hasil yang diperoleh daripada sampel itu. Jika sampel kedua diambil, keputusan mungkin tidak sepadan dengan sampel pertama. Jika nilai min bagi atribut penarafan ialah 3. 2 untuk satu sampel, mungkin 3.4 untuk sampel kedua saiz yang sama. Sekiranya kita menarik bilangan sampel yang tidak terhingga (saiz yang sama) dari populasi kita, kita dapat memaparkan cara diperhatikan sebagai pengedaran. Kita kemudiannya boleh mengira purata semua cara sampel kita. Maksud ini akan menyamai maksud sebenar penduduk. Kita juga boleh mengira SD pengagihan cara sampel. SD dalam pengedaran cara sampel ini adalah SE bagi setiap sampel sampel individu.Oleh itu, kita mempunyai pemerhatian yang paling ketara:
SE adalah SD penduduk penduduk. Contoh Mean
1st
3. 2
2
3. 4 ke 3
3. 3 | 4 |
3. 2 | ke-5 |
3. 1 | …. |
…. | …. |
…. | …. |
…. | …. |
…. | …. |
…. | Mean |
3. 3 | Std. Dev. |
0. 13 | Jadual yang menggambarkan hubungan antara SD dan SE |
Sekarang jelas bahawa jika SD dari taburan ini membantu kita untuk memahami sejauh mana contoh sampel adalah dari min populasi sebenar, maka kita boleh menggunakannya untuk memahami bagaimana tepat mana-mana purata sampel individu adalah berkaitan dengan min yang benar. Inilah intipati SE. | |
Sebenarnya, kita hanya membuat sampel tunggal dari populasi kita, tetapi kita boleh menggunakan hasil ini untuk menyediakan anggaran keandalan sampel sampel yang diperhatikan. | Malah, SE memberitahu kita bahawa kita boleh 95% yakin bahawa sampel sampel yang diperhatikan adalah ditambah atau dikurangkan kira-kira 2 (sebenarnya 1. 96) Kesilapan Standard dari penduduk penduduk. |
Jadual di bawah menunjukkan pengagihan respons dari sampel pertama (dan hanya) yang digunakan untuk penyelidikan kami. SE dari 0. 13, yang agak kecil, memberi kami petunjuk bahawa min kita relatif hampir dengan min yang benar dari populasi keseluruhan kita. Margin kesilapan (pada 95% keyakinan) untuk min kami adalah (kira-kira) dua kali nilai (+/- 0. 26), memberitahu kita bahawa min yang benar kemungkinan besar antara 2. 94 dan 3. 46. | |
Responden
Penilaian
A 3
B
3
C