Perbezaan antara varians Sampel & varians Populasi

Anonim

Penjelasan

Dalam Statistik istilah pensampelan merujuk kepada pemilihan sebahagian daripada data statistik agregat untuk tujuan mendapatkan maklumat yang relevan mengenai keseluruhannya. Agregat atau keseluruhan maklumat statistik mengenai sifat khusus semua ahli yang diliputi oleh penyiasatan disebut 'populasi' atau 'alam semesta'. (Das, N. G., 2010). Bahagian terpilih penduduk yang digunakan untuk mendapatkan ciri-ciri penduduk atau alam semesta disebut sebagai 'sampel'. Penduduk diambil dari unit individu atau ahli, dan beberapa unit dimasukkan ke dalam sampel. Jumlah bilangan populasi dipanggil saiz populasi, dan sampel itu dipanggil saiz sampel. Penduduk dan sampel boleh menjadi terhingga atau tak terbatas dan sama seperti mereka boleh wujud atau hipotesis.

Varians: Varians adalah nilai berangka yang menunjukkan betapa luas angka individu dalam kumpulan data mengedarkan diri mereka tentang min. Itulah sejauh mana setiap nombor adalah dari min, dan dengan itu antara satu sama lain. Varians nilai sifar bermakna semua data adalah sama. Lebih banyak varians, lebih banyak lagi nilai-nilai yang menyebarkan tentang min, oleh itu antara satu sama lain. Kurangkan varians, kurang nilai yang menyebarkan tentang min, oleh itu antara satu sama lain, dan varians tidak boleh negatif.

Perbezaan antara varians populasi dan varians sampel

Perbezaan utama antara varians populasi dan varians sampel berkaitan dengan pengiraan varians. Varians dikira dalam lima langkah. Maksud pertama dikira, maka kita mengira penyimpangan dari min, dan ketiga penyimpangan adalah kuadrat, keempat penyimpangan kuadrat disimpulkan dan akhirnya jumlah ini dibahagikan dengan bilangan item yang dikira varians. Oleh itu, variance = Σ (xi-x -) / n. Di mana xi = ith. Nombor, x- = min dan n = bilangan item …

Sekarang, apabila varians dikira dari data populasi, n sama dengan bilangan item. Oleh itu, jika varians dalam tekanan darah semua 1000 orang akan dikira dari data tekanan darah semua 1000 orang, maka n = 1000. Walau bagaimanapun apabila varians dikira dari data sampel 1 akan ditolak dari n sebelum membahagikan jumlah penyimpangan kuasa dua. Jadi dalam contoh di atas jika data sampel mempunyai 100 item, penyebutnya akan menjadi 100 - 1 = 99.

Oleh kerana itu, nilai varians yang dikira dari data sampel adalah lebih tinggi daripada nilai yang boleh didapati dengan menggunakan data populasi. Logik melakukan itu adalah untuk mengimbangi kekurangan maklumat tentang data penduduk. Tidak mustahil untuk mencari perbezaan ketinggian dalam manusia, kerana kekurangan mutlak maklumat tentang ketinggian semua makhluk hidup, bukan untuk membincangkan masa depan.Sekalipun kita mengambil satu contoh sederhana, seperti data populasi pada ketinggian semua lelaki hidup di AS, secara fizikal mungkin, tetapi kos dan masa yang terlibat dalam hal ini akan mengalahkan tujuan perhitungannya. Ini adalah sebab data sampel diambil untuk kebanyakan tujuan statistik, dan ini disertakan dengan kekurangan maklumat mengenai majoriti data. Untuk mengimbangi ini, nilai varians dan sisihan piawai, yang mana kuasa kuadrat kuadrat adalah lebih tinggi sekiranya data sampel daripada varians dari data populasi.

Ini bertindak sebagai perisai automatik untuk penganalisis dan pembuat keputusan. Logik ini berlaku untuk keputusan mengenai belanjawan modal, kewangan peribadi dan perniagaan, pembinaan, pengurusan lalu lintas, dan banyak bidang yang berlaku. Ini membantu pemegang kepentingan berada di pihak yang selamat semasa mengambil keputusan atau untuk kesimpulan lain.

Ringkasan: Varians penduduk merujuk kepada nilai varians yang dikira daripada data populasi, dan varians sampel adalah varians yang dikira dari data sampel. Disebabkan nilai penyebut ini dalam formula untuk varians dalam kes data sampel adalah 'n-1', dan ia adalah 'n' untuk data populasi. Oleh itu, kedua-dua varians dan sisihan piawai yang diperolehi daripada data sampel adalah lebih daripada yang diperoleh daripada data populasi.