Perbezaan Antara T-TEST dan ANOVA Perbezaan Antara
T-TEST vs ANOVA
Mengumpul dan mengira data statistik untuk memperoleh purata proses yang panjang dan membosankan. Ujian t dan analisis satu arah varians (ANOVA) adalah dua ujian paling biasa yang digunakan untuk tujuan ini.
Ujian t ialah ujian hipotesis statistik di mana statistik ujian mengikuti taburan t Pelajar jika hipotesis nol disokong. Ujian ini digunakan apabila statistik ujian mengikuti taburan normal dan nilai istilah skala dalam statistik ujian diketahui. Sekiranya istilah skala tidak diketahui, ia kemudian digantikan dengan anggaran berdasarkan data yang ada. Statistik ujian akan mengikuti pengagihan t-Pelajar.
William Sealy Gosset memperkenalkan t-statistik pada tahun 1908. Gosset adalah seorang ahli kimia untuk pembuatan bir Guinness di Dublin, Ireland. Kilang bir Guinness mempunyai dasar untuk merekrut graduan terbaik dari Oxford dan Cambridge, memilih dari mereka yang boleh menyediakan aplikasi biokimia dan statistik kepada proses perindustrian syarikat yang ditubuhkan. William Sealy Gosset adalah salah seorang graduan itu. Dalam proses itu, William Sealy Gosset menyusun ujian-t, yang pada mulanya dibayangkan sebagai cara untuk mengawasi kualiti stout (bir gelap pembuatan bir menghasilkan) dengan cara yang kos efektif. Gosset menerbitkan ujian di bawah nama 'Pelajar' di Biometrika, sekitar 1908. Alasan nama pen itu adalah desakan Guinness, kerana syarikat itu mahu mengekalkan dasar mereka tentang penggunaan statistik sebagai sebahagian daripada 'rahsia perdagangan' mereka.
Statistik ujian T secara umumnya mengikut bentuk T = Z / s, di mana Z dan s adalah fungsi data. Variabel Z direka untuk menjadi sensitif kepada hipotesis alternatif; Secara berkesan, besarnya pemboleh ubah Z lebih besar apabila hipotesis alternatif adalah benar. Dalam masa yang sama, 's' adalah parameter skala, yang membolehkan pengagihan T ditentukan. Andaian yang mendasari ujian t adalah bahawa a) Z mengikuti taburan normal standard di bawah hipotesis nol; b) ps2 mengikuti pengedaran Ï ‡ 2 dengan p darjah kebebasan di bawah hipotesis nol (di mana p ialah pemalar positif); dan c) nilai Z dan nilai s adalah bebas. Dalam jenis ujian t tertentu, syarat-syarat ini adalah akibat dari populasi yang dipelajari, serta cara di mana data dicampurkan.
Sebaliknya, analisis varians (ANOVA) adalah koleksi model statistik. Walaupun prinsip ANOVA telah digunakan oleh para penyelidik dan ahli statistik untuk jangka masa yang panjang, tidak sampai 1918 bahawa Sir Ronald Fisher telah membuat cadangan untuk memformalkan analisis varians dalam artikel bertajuk 'Korelasi Antara Saudara-saudara dengan Anggaran Mendelian Pusaka'.Sejak itu, ANOVA telah berkembang dalam skop dan aplikasinya. ANOVA sebenarnya adalah salah nyata, kerana ia tidak berasal dari perbezaan variasi melainkan dari perbezaan antara cara kumpulan. Ia merangkumi prosedur yang berkaitan di mana varians yang diperhatikan dalam pembolehubah tertentu dibahagikan kepada komponen yang boleh dikaitkan dengan pelbagai variasi yang berlainan.
Pada asasnya, ANOVA menyediakan ujian statistik untuk menentukan sama ada cara beberapa kumpulan adalah sama dan, sebagai hasilnya, umumkan ujian t kepada lebih daripada dua kumpulan. ANOVA boleh menjadi lebih berguna daripada ujian t-dua kerana ia mempunyai peluang yang lebih kecil untuk melakukan kesilapan jenis I. Sebagai contoh, mempunyai ujian dua t sampel yang banyak akan mempunyai peluang yang lebih besar untuk melakukan kesilapan daripada ANOVA pembolehubah yang sama yang terlibat untuk mendapatkan min. Model ini adalah sama dan statistik ujian adalah nisbah F. Dalam istilah yang lebih mudah, ujian-t adalah hanya satu kes khas ANOVA: melakukan ANOVA akan mempunyai keputusan yang sama dengan pelbagai ujian t. Terdapat tiga kelas model ANOVA: a) Model kesan-kesan tetap yang menganggap data berasal dari populasi normal, berbeza hanya dengan cara mereka; b) Model kesan rawak yang menganggap data menggambarkan hierarki pelbagai populasi yang perbezaannya dikekang oleh hierarki; dan, c) Model kesan campuran yang merupakan situasi di mana kedua-dua kesan tetap dan rawak ada.
Ringkasan:
- Ujian t digunakan apabila menentukan sama ada dua purata atau cara adalah sama atau berbeza. ANOVA lebih disukai apabila membandingkan tiga atau lebih purata atau cara.
- Ujian t mempunyai lebih banyak peluang untuk melakukan kesalahan yang lebih banyak digunakan, oleh itu ANOVA digunakan ketika membandingkan dua cara atau lebih.