ANOVA - ITB BLOGS

advertisement
Hamidah Aprilia (10109078)
ANOVA (Analysis of Variance) PADA PRODUK CEREAL
A. ANOVA
ANOVA adalah salah satu analisis statistika yang sering dimanfaatkan untuk
mengecek perbedaan nilai rata-rata dari dua atau lebih kelompok data. Secara umum
terdapat dua penerapan ANOVA yaitu pengujian hipotesis dan estimasi. Dalam kasus ini,
akan digunakan aplikasi dari ANOVA yang berupa pengujian hipotesis untuk menguji
kesamaan (dan/atau perbedaan) rata-rata berat kedua produk Cereal (Kellog dan Nestle).
Adapun dataset kedua produk yang bernama cereal memiliki dua buah variable sebagai
berikut:
brand, merupakan variable yang menyatakan dua kelompok produk data yaitu Kellog
dan Nestle.
weigth, merupakan variable yang menyatakan rata-rata berat dari brand terkait pada
observasi tertentu dalam satuan ons.
Pada dasarnya pengujian hipotesis dengan teknik ANOVA mensyaratkan beberapa
asumsi yang harus dipenuhi, antara lain:
 Observasi sampel data saling bebas. Artinya tidak ada informasi salah satu kelompok
data yang mempengaruhi kelompok data lainnya. Observasi yang diambil secara acak
biasanya akan saling bebas.
 Data sampel yang digunakan berdistribusi Normal. Hal ini mutlak diperlukan mengingat
prosedur awal ANOVA menggunakan uji F yang mensyaratkan data berdistribusi Normal.
Pengecekan normal tidaknya suatu kelompok data akan ditinjau dengan melihat
histogram yang diaprokasimasi Normal serta melalui tampilan probability plot. Apabila
data sampelnya tidak berdistribusi Normal, untuk data-data yang berjumlah banyak (>40
data) dapat dilakukan aproksimasi Normal berdasarkan Teorema Limit Pusat.
 Variansi seluruh kelompok data sampel bernilai equal (sama). Adapun kehomogenan
(ke-equal-an) dari variansi dapat dievaluasi dari hasil F-test dan t-test.
Apabila ketiga asumsi di atas tidak dipenuhi, penarikan kesimpulan maupun pengambilan
keputusan dapat meberikan hasil yang tidak valid.
Hamidah Aprilia (10109078)
B. PROSEDUR ANOVA
Beberapa langkah-langkah untuk menguji hipotesis apakah rata-rata berat dari
kedua kelompok sampel Kellog dan Nestle bernilai sama adalah sebagai berikut:
1. Mengecek keabsahan asumsi bahwa data brand Kellog dan Nestle masing-masing
berdistribusi Normal.
2. Mengecek keabsahan asumsi bahwa variansi kedua brand memliki variansi yang
sama dengan uji-F, yang dapat dinyatakan sebagai
dan
3. Mengecek apakah rata-rata berat dari produk Nestle dan Kellog bernilai sama
melalui uji-t, yang dinyatakan dengan notasi hipotesis
dan
C. OUTPUT SAS dan ANALISIS
Output dari software SAS dalam ketiga langkah prosedur ANOVA di atas adalah
sebagai berikut:
PROC UNIVARIATE: pengecekan kenormalan sampel data Kellog dan Nestle
Sample data Kellog
Hamidah Aprilia (10109078)
Dengan bantuan proc univariate, terlihat bahwa histogram dari brand Nestle saat
didekati dengan distibusi Normal memiliki sebuah nilai ekstrim yang terletak di ujung kiri
data (bernilai 15.07), selebihnya data tercakup dalam kurva aprokasimasi Normal. Hal yang
sama terjadi pada tampilan probability plot brand Nestle, dimana terdapat sebuah nilai
ekstrim (ditandai dengan lingkaran merah) yang melenceng jauh dari line (garis). Untuk lebih
memastikan bahwa brand Nestle memang berdistribusi Normal telah dilakukan pengujian
Goodness-of-Fit Test. Berdasarkan pengujian tersebut, nilai p-value untuk ketiga statistic uji
Goodness-of-Fit berada di atas level 10% yaitu 15%, 25%, dan 25%. Artinya, tidak terdapat
cukup bukti untuk menolak hipotesis kenormalan brand Nestle. Sehingga ditarik kesimpulan
bahwa brand Nestle berdistribusi Normal.
Sample data Nestle
Untuk sample data brand Nestle dilakukan pengujian serupa dengan proc univariate.
Dari tampilan histogram dan probability plot dapat dikatakan bahwa brand Nestle
cenderung berdistribusi Normal. Hal ini disebabkan tidak nampak munculnya data ekstrim
yang berada di luar jangkauan kurva aproksimasi Normal (pada histogram) dan line. Selain
itu berdasarkan pengujian Goodness-of-Fit Test diketahui bahwa tidak terdapat cukup bukti
untuk menolak hipotesis kenormalan brand Nestle. Adapun p-value dari statistic uji juga
melebihi tingkat 10%, yakni 15%, 25%, dan 25%. Oleh sebab itu, terbukti bahwa brand
Nestle memang berdistribusi Normal.
Hamidah Aprilia (10109078)
PROC TTEST : pengecekan kehomogenan variansi dari dua kelompok sampel data
Berdasarkan output proc ttest, diketahui bahwa statistic uji (F-test) yang
menyatakan hipotesa
memiliki p-value sebesar 0.246. Artinya tidak
terdapat cukup bukti untuk menolak hipotesa kehomogenan variansi kedua brand tersebut.
Sehingga untuk langkah pengujian difference of means, statistic uji yang dipilih haruslah
equal variances. Pemilihan statistic uji (antara equal dan unequal variances) sangat penting
dan harus tepat. Hal ini disebabkan kesalahan pemilihan statistic uji dapat mengakibatkan
penarikan kesimpulan di tahap difference of means menjadi tidak valid juga.
PROC TTEST : pengecekan kehomogenan means data variable brand
Dari penjelasan sebelumnya statistic uji yang harus digunakan dalam pengujian
difference of means adalah equal variances dengan metode Pooled. Ternyata p-value dari
statistic uji tersebut bernilai <0.01%. Apabila dibandingkan dengan alpha=10% (atau 5%), pvalue masih bernilai jauh di bwah alpha. Sehingga hipotesis
jelas ditolak.
Dengan kata lain, terdapat perbedaan rata-rata berat kedua produk Cereal (Kellog dan Nestle).
D. KESIMPULAN
Berdasarkan serangkaian proses ANOVA, dapat disimpulkan bahwa:
Brand Kellog dan Nestle terbukti memiliki perbedaan rata-rata berat produk cereal.
Selang kepercayaan diffrenece of weight means terletak di (-0.0498, -0.0281) dan tidak
mencakup nol (0), sehingga terbukti bahwa memang terdapat perbedaan yang signifikan
diantara berat kedua produk Cereal tersebut.
Hamidah Aprilia (10109078)
E. LAMPIRAN
Output dari fundamental statistical concept dari brand Kellog dan Nestle adalah:
Adapun program SAS nya berbentuk seperti di bawah ini:
libname data 'D:\SAS academy\PR2';
/* import data cereal.xlx dan menampilkan sebagian data (10 data paling
awal)*/
proc print data=data.cereal (obs=10);
title 'Partial Listing of Cereal Data';
run;
/* proses sorting data cereal berdasarkan brand-nya */
proc sort data=data.cereal out=sorted_cereal;
by brand;
run;
/* menguji kenormalan data Nestle dan data Kellogs */
proc univariate data=sorted_cereal;
by brand;
var weight;
histogram weight / normal;
probplot weight / normal (mu=est sigma=est
color=blue w=1);
title 'Analisis Univariate Untuk Data Sereal (Nestle dan Kellogs)';
run;
Hamidah Aprilia (10109078)
/* menguji equality of variance dan equality of means dari data Nestle dan
data Kellogs */
proc ttest data=data.cereal;
class brand;
var weight;
title 'Menguji Equality of Means Untuk Kedua Jenis Cereal'
' Brands';
run;
Download