III. KONSEP DASAR ANALISIS STATISTIK

advertisement
SEAMEO - TROPMED
1
Regional Center for Community Nutrition - University of Indonesia
____________________________________________________________________________________________________________
III. KONSEP DASAR ANALISIS STATISTIK
14 Desember 2005
[email protected]
Setelah kita mempelajari cara mendeskripsikan data, maka tahap berikutnya adalah
menyajikan atau mempresentasikan data dalam bentuk tabel atau gambar. Untuk dapat
menentukan angka statistik mana yang tepat untuk ditampilkan dalam tabel atau
digunakan dalam gambar, maka kita harus memahami terlebih dahulu konsep dasar
analisis statistik yang berkaitan dengan aplikasi dari distribusi normal dan uji hipotesa.
Aplikasi dari Distribusi Normal
Secara sederhana, ada dua macam distribusi data: normal dan tidak normal. Karakteristik
dari distribusi normal (lihat gambar 3.1.):
1. Distribusi data berupa kurva simetris berbentuk bel (bell-shape)
2. mean = median = mode
mean = median = mode
50%
50%
Kita konsentrasikan pembahasan pada distribusi normal karena banyak aplikasinya untuk
menentukan pilihan angka statistik. Sebagian besar pola distribusi dari data noncategorical adalah distribusi normal karena:
1. sebagian besar data terletak dibagian tengah kurva dan hanya sebagian kecil data
terletak pada kedua ekor kurva,
2. kurva distribusi data akan berbentuk bell dan terbagi menjadi 2 bagian sama
besar/simetris,
3. karenanya nilai rata-rata dari suatu data set (mean) akan terletak di bagian tengah
kurva pula,
4. dan karena median adalah angka paling tengah dari sederetan angka yang berurutan
dalam suatu data set, maka mean = median.
Untuk data yang terdistribusi normal, sebagian besar angka dalam data set akan terletak
antara 2 SD atau kurang lebih sama dengan 95% dari area kurva. Dan hanya sebagian
kecil (5%) angka yang terletak diluar kurva. Angka yang ada diluar kurva ini dianggap
________________________________________________________________________________________________
LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED
2
Regional Center for Community Nutrition - University of Indonesia
____________________________________________________________________________________________________________
sebagai angka “ekstrim” atau outlier yang kemungkinan diperoleh karena kesalahan atau
error dalam pengambilan data. Karenanya angka 5% seringkali dipakai sebagai titik
potong untuk besarnya error yang dapat ditolerir atau menentukan apakah suatu hasil
analisis statistik signifikan atau tidak. Besarnya error dari suatu uji statistik dapat
dihitung, hasil perhitungannya disebut dengan p-value:
1. p-value < 0,05: menunjukkan bahwa error uji statistik lebih kecil dari besarnya error
yang bisa ditolerir (0,05), maka hasil analisis tersebut adalah signifikan
2. p-value > 0,05: menunjukkan bahwa error uji statistik lebih besar dari besarnya error
yang bisa ditolerir (0,05), maka hasil analisis tersebut adalah tidak signifikan
Normalitas dari distribusi suatu data dapat diuji dengan menggunakan uji KolmogorovSmirnov (disebut juga K-S test atau Levene test) atau Shapiro-Wilk, tetapi pada
umumnya uji Kolmogorov-Smirnov yang sering dipergunakan dengan langkah-langkah
sebagai berikut:
1. Klik Analyze – Descriptive Statistics – Explore (lihat gambar 3.1)
Gambar 3.1a. Uji normalitas dengan KS test
2. Dalam kotak dialog Explore kita masukkan data noncategorical yang akan diuji
normalitas distribusinya ke dalam box Dependent List. Dalam hal ini kita gunakan
contoh variabel HAZ anak (var: chaz) dan variabel usia ibu (var: mage) (lihat
gambar 3.1b).
3. Kemudian tekan tombol Plots untuk membuka kotak dialog Explore: Plots. Dalam
kotak dialog ini, pilih Normality plots with test, lalu klik Continue – OK (lihat
gambar 3.1b).
________________________________________________________________________________________________
LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED
3
Regional Center for Community Nutrition - University of Indonesia
____________________________________________________________________________________________________________
Gambar 3.1a. Uji normalitas dengan KS test
4. Hasil uji normalitas dapat dilihat pada tabel Tests of Normality yang terlihat pada
output 3.1. Jika kita lihat p-value (pada kolom Sig.) dari nilai HAZ dengan
menggunakan uji Kolmogorov-Smirnov > 0,05 (p-value = 0.200), sementara p-value
dari umur ibu < 0,05 (p-value = 0,000). Interpretasi dari hasil adalah nilai HAZ
terdistribusi normal karena p-value > 0,05, hal ini menunjukkan tidak adanya
perbedaan signifikan antara distribusi data nilai HAZ dengan distribusi data referens
yang selalu normal. Atau dengan kata lain, data nilai HAZ mempunyai distribusi yang
sama dengan data referens yang selalu terdistribusi normal. Sebaliknya, data umur ibu
terdistribusi tidak normal karena p-value dari K-S test < 0,05 menunjukkan bahwa
distribusi dari data umur ibu tidak sama dengan distribusi data referens yang selalu
normal.
Output 3.1. Hasil uji normalitas
Tests of Normality
a
Kolmogorov-Smirnov
Statistic
df
Sig.
Nilai HAZ (tinggi
menurut umur) anak
Umur ibu (dalam tahun)
Statistic
Shapiro-Wilk
df
Sig.
.022
961
.200*
.997
961
.114
.136
961
.000
.955
961
.000
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Dengan membaca uraian diatas, maka untuk data yang terdistribusi normal, mean adalah
angka statistik yang representatif untuk mendeskripsikan suatu data tersebut. Tetapi mean
tidak cukup mendeskripsikan suatu data set tanpa disertai dengan informasi tentang
________________________________________________________________________________________________
LW/Basic Biostatitics_2005/HKI/module
SEAMEO - TROPMED
4
Regional Center for Community Nutrition - University of Indonesia
____________________________________________________________________________________________________________
sebaran data. Informasi tentang sebaran data yang tepat ditampilkan bersama dengan
mean adalah Standar Deviasi (SD) karena angka ini menerangkan rata-rata jarak semua
angka dalam data set terhadap mean. Cara penulisan dalam laporan: mean ± SD.
Jika data tidak terdistribusi normal, maka mean tidak representatif untuk
mendeskripsikan data set. Karena seperti kita ketahui bahwa mean adalah nilai rata-rata,
jika data tidak terdistribusi normal, kemungkinan ada banyak outlier di dalam data set,
dan nilai mean akan sangat dipengaruhi oleh nilai outlier tersebut. Dalam hal ini median
dapat digunakan sebagai pengganti. Sama halnya dengan mean yang harus disertai
dengan SD, median biasanya disertai 2 (dua) angka statistik yang menunjukkan sebaran
data berupa:
1. data maksimum dan data minimum atau
2. percentile: bisa berupa kombinasi 5th dan 95th percentile atau 10th dan 90th percentile
atau 20th dan 80th percentile
Penulisan dalam laporan:
1. median (minimum; maksimum) atau,
2. median (5th percentile; 95th percentile) atau,
3. median (10th percentile; 90th percentile) atau,
4. median (20th percentile; 80th percentile).
Uji hipotesa (Hypothesis Testing)
Selain digunakan untuk mendeskripsikan data, ilmu statistic juga dapat dipergunakan
untuk menguji hipotesa. Hipotesa adalah pernyataan/asumsi yang ingin kita uji
kebenarannya melalui survei atau studi yang kita lakukan. Jadi pada saat kita merancang
suatu studi atau survei, biasanya selalu berlandaskan pada hipotesa yang kita buat
sebelumnya. Ada dua macam hipotesa yang harus kita buat:
1. Null hypothesis (Ho): asumsi bahwa tidak ada perbedaan atau hubungan yang
signifikan antara suatu kondisi dengan kondisi yang lainnya.
2. Alternative hypothesis (Hi): asumsi bahwa ada perbedaan atau hubungan yang
signifikan antara suatu kondisi dengan kondisi yang lainnya.
Seperti halnya dalam ilmu hukum kita mengenal azaz “praduga tak bersalah”, maka
dalam ilmu statistik kita juga mengunakan Null hypothesis (Ho) sebagai hipotesa dasar
pada saat kita melakukan uji statistik.
Jika dihubungkan dengan penjelasan diatas tentang p-value, maka:
1. kita menerima Null hypothesis (Ho) jika p-value > 0,05
2. kita menerima Alternative hypothesis (Hi) jika p-value < 0,05
________________________________________________________________________________________________
LW/Basic Biostatitics_2005/HKI/module
Download