SEAMEO - TROPMED 1 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________ III. KONSEP DASAR ANALISIS STATISTIK 14 Desember 2005 [email protected] Setelah kita mempelajari cara mendeskripsikan data, maka tahap berikutnya adalah menyajikan atau mempresentasikan data dalam bentuk tabel atau gambar. Untuk dapat menentukan angka statistik mana yang tepat untuk ditampilkan dalam tabel atau digunakan dalam gambar, maka kita harus memahami terlebih dahulu konsep dasar analisis statistik yang berkaitan dengan aplikasi dari distribusi normal dan uji hipotesa. Aplikasi dari Distribusi Normal Secara sederhana, ada dua macam distribusi data: normal dan tidak normal. Karakteristik dari distribusi normal (lihat gambar 3.1.): 1. Distribusi data berupa kurva simetris berbentuk bel (bell-shape) 2. mean = median = mode mean = median = mode 50% 50% Kita konsentrasikan pembahasan pada distribusi normal karena banyak aplikasinya untuk menentukan pilihan angka statistik. Sebagian besar pola distribusi dari data noncategorical adalah distribusi normal karena: 1. sebagian besar data terletak dibagian tengah kurva dan hanya sebagian kecil data terletak pada kedua ekor kurva, 2. kurva distribusi data akan berbentuk bell dan terbagi menjadi 2 bagian sama besar/simetris, 3. karenanya nilai rata-rata dari suatu data set (mean) akan terletak di bagian tengah kurva pula, 4. dan karena median adalah angka paling tengah dari sederetan angka yang berurutan dalam suatu data set, maka mean = median. Untuk data yang terdistribusi normal, sebagian besar angka dalam data set akan terletak antara 2 SD atau kurang lebih sama dengan 95% dari area kurva. Dan hanya sebagian kecil (5%) angka yang terletak diluar kurva. Angka yang ada diluar kurva ini dianggap ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module SEAMEO - TROPMED 2 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________ sebagai angka “ekstrim” atau outlier yang kemungkinan diperoleh karena kesalahan atau error dalam pengambilan data. Karenanya angka 5% seringkali dipakai sebagai titik potong untuk besarnya error yang dapat ditolerir atau menentukan apakah suatu hasil analisis statistik signifikan atau tidak. Besarnya error dari suatu uji statistik dapat dihitung, hasil perhitungannya disebut dengan p-value: 1. p-value < 0,05: menunjukkan bahwa error uji statistik lebih kecil dari besarnya error yang bisa ditolerir (0,05), maka hasil analisis tersebut adalah signifikan 2. p-value > 0,05: menunjukkan bahwa error uji statistik lebih besar dari besarnya error yang bisa ditolerir (0,05), maka hasil analisis tersebut adalah tidak signifikan Normalitas dari distribusi suatu data dapat diuji dengan menggunakan uji KolmogorovSmirnov (disebut juga K-S test atau Levene test) atau Shapiro-Wilk, tetapi pada umumnya uji Kolmogorov-Smirnov yang sering dipergunakan dengan langkah-langkah sebagai berikut: 1. Klik Analyze – Descriptive Statistics – Explore (lihat gambar 3.1) Gambar 3.1a. Uji normalitas dengan KS test 2. Dalam kotak dialog Explore kita masukkan data noncategorical yang akan diuji normalitas distribusinya ke dalam box Dependent List. Dalam hal ini kita gunakan contoh variabel HAZ anak (var: chaz) dan variabel usia ibu (var: mage) (lihat gambar 3.1b). 3. Kemudian tekan tombol Plots untuk membuka kotak dialog Explore: Plots. Dalam kotak dialog ini, pilih Normality plots with test, lalu klik Continue – OK (lihat gambar 3.1b). ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module SEAMEO - TROPMED 3 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________ Gambar 3.1a. Uji normalitas dengan KS test 4. Hasil uji normalitas dapat dilihat pada tabel Tests of Normality yang terlihat pada output 3.1. Jika kita lihat p-value (pada kolom Sig.) dari nilai HAZ dengan menggunakan uji Kolmogorov-Smirnov > 0,05 (p-value = 0.200), sementara p-value dari umur ibu < 0,05 (p-value = 0,000). Interpretasi dari hasil adalah nilai HAZ terdistribusi normal karena p-value > 0,05, hal ini menunjukkan tidak adanya perbedaan signifikan antara distribusi data nilai HAZ dengan distribusi data referens yang selalu normal. Atau dengan kata lain, data nilai HAZ mempunyai distribusi yang sama dengan data referens yang selalu terdistribusi normal. Sebaliknya, data umur ibu terdistribusi tidak normal karena p-value dari K-S test < 0,05 menunjukkan bahwa distribusi dari data umur ibu tidak sama dengan distribusi data referens yang selalu normal. Output 3.1. Hasil uji normalitas Tests of Normality a Kolmogorov-Smirnov Statistic df Sig. Nilai HAZ (tinggi menurut umur) anak Umur ibu (dalam tahun) Statistic Shapiro-Wilk df Sig. .022 961 .200* .997 961 .114 .136 961 .000 .955 961 .000 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Dengan membaca uraian diatas, maka untuk data yang terdistribusi normal, mean adalah angka statistik yang representatif untuk mendeskripsikan suatu data tersebut. Tetapi mean tidak cukup mendeskripsikan suatu data set tanpa disertai dengan informasi tentang ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module SEAMEO - TROPMED 4 Regional Center for Community Nutrition - University of Indonesia ____________________________________________________________________________________________________________ sebaran data. Informasi tentang sebaran data yang tepat ditampilkan bersama dengan mean adalah Standar Deviasi (SD) karena angka ini menerangkan rata-rata jarak semua angka dalam data set terhadap mean. Cara penulisan dalam laporan: mean ± SD. Jika data tidak terdistribusi normal, maka mean tidak representatif untuk mendeskripsikan data set. Karena seperti kita ketahui bahwa mean adalah nilai rata-rata, jika data tidak terdistribusi normal, kemungkinan ada banyak outlier di dalam data set, dan nilai mean akan sangat dipengaruhi oleh nilai outlier tersebut. Dalam hal ini median dapat digunakan sebagai pengganti. Sama halnya dengan mean yang harus disertai dengan SD, median biasanya disertai 2 (dua) angka statistik yang menunjukkan sebaran data berupa: 1. data maksimum dan data minimum atau 2. percentile: bisa berupa kombinasi 5th dan 95th percentile atau 10th dan 90th percentile atau 20th dan 80th percentile Penulisan dalam laporan: 1. median (minimum; maksimum) atau, 2. median (5th percentile; 95th percentile) atau, 3. median (10th percentile; 90th percentile) atau, 4. median (20th percentile; 80th percentile). Uji hipotesa (Hypothesis Testing) Selain digunakan untuk mendeskripsikan data, ilmu statistic juga dapat dipergunakan untuk menguji hipotesa. Hipotesa adalah pernyataan/asumsi yang ingin kita uji kebenarannya melalui survei atau studi yang kita lakukan. Jadi pada saat kita merancang suatu studi atau survei, biasanya selalu berlandaskan pada hipotesa yang kita buat sebelumnya. Ada dua macam hipotesa yang harus kita buat: 1. Null hypothesis (Ho): asumsi bahwa tidak ada perbedaan atau hubungan yang signifikan antara suatu kondisi dengan kondisi yang lainnya. 2. Alternative hypothesis (Hi): asumsi bahwa ada perbedaan atau hubungan yang signifikan antara suatu kondisi dengan kondisi yang lainnya. Seperti halnya dalam ilmu hukum kita mengenal azaz “praduga tak bersalah”, maka dalam ilmu statistik kita juga mengunakan Null hypothesis (Ho) sebagai hipotesa dasar pada saat kita melakukan uji statistik. Jika dihubungkan dengan penjelasan diatas tentang p-value, maka: 1. kita menerima Null hypothesis (Ho) jika p-value > 0,05 2. kita menerima Alternative hypothesis (Hi) jika p-value < 0,05 ________________________________________________________________________________________________ LW/Basic Biostatitics_2005/HKI/module