Hamidah Aprilia (10109078) ANOVA (Analysis of Variance) PADA PRODUK CEREAL A. ANOVA ANOVA adalah salah satu analisis statistika yang sering dimanfaatkan untuk mengecek perbedaan nilai rata-rata dari dua atau lebih kelompok data. Secara umum terdapat dua penerapan ANOVA yaitu pengujian hipotesis dan estimasi. Dalam kasus ini, akan digunakan aplikasi dari ANOVA yang berupa pengujian hipotesis untuk menguji kesamaan (dan/atau perbedaan) rata-rata berat kedua produk Cereal (Kellog dan Nestle). Adapun dataset kedua produk yang bernama cereal memiliki dua buah variable sebagai berikut: brand, merupakan variable yang menyatakan dua kelompok produk data yaitu Kellog dan Nestle. weigth, merupakan variable yang menyatakan rata-rata berat dari brand terkait pada observasi tertentu dalam satuan ons. Pada dasarnya pengujian hipotesis dengan teknik ANOVA mensyaratkan beberapa asumsi yang harus dipenuhi, antara lain: Observasi sampel data saling bebas. Artinya tidak ada informasi salah satu kelompok data yang mempengaruhi kelompok data lainnya. Observasi yang diambil secara acak biasanya akan saling bebas. Data sampel yang digunakan berdistribusi Normal. Hal ini mutlak diperlukan mengingat prosedur awal ANOVA menggunakan uji F yang mensyaratkan data berdistribusi Normal. Pengecekan normal tidaknya suatu kelompok data akan ditinjau dengan melihat histogram yang diaprokasimasi Normal serta melalui tampilan probability plot. Apabila data sampelnya tidak berdistribusi Normal, untuk data-data yang berjumlah banyak (>40 data) dapat dilakukan aproksimasi Normal berdasarkan Teorema Limit Pusat. Variansi seluruh kelompok data sampel bernilai equal (sama). Adapun kehomogenan (ke-equal-an) dari variansi dapat dievaluasi dari hasil F-test dan t-test. Apabila ketiga asumsi di atas tidak dipenuhi, penarikan kesimpulan maupun pengambilan keputusan dapat meberikan hasil yang tidak valid. Hamidah Aprilia (10109078) B. PROSEDUR ANOVA Beberapa langkah-langkah untuk menguji hipotesis apakah rata-rata berat dari kedua kelompok sampel Kellog dan Nestle bernilai sama adalah sebagai berikut: 1. Mengecek keabsahan asumsi bahwa data brand Kellog dan Nestle masing-masing berdistribusi Normal. 2. Mengecek keabsahan asumsi bahwa variansi kedua brand memliki variansi yang sama dengan uji-F, yang dapat dinyatakan sebagai dan 3. Mengecek apakah rata-rata berat dari produk Nestle dan Kellog bernilai sama melalui uji-t, yang dinyatakan dengan notasi hipotesis dan C. OUTPUT SAS dan ANALISIS Output dari software SAS dalam ketiga langkah prosedur ANOVA di atas adalah sebagai berikut: PROC UNIVARIATE: pengecekan kenormalan sampel data Kellog dan Nestle Sample data Kellog Hamidah Aprilia (10109078) Dengan bantuan proc univariate, terlihat bahwa histogram dari brand Nestle saat didekati dengan distibusi Normal memiliki sebuah nilai ekstrim yang terletak di ujung kiri data (bernilai 15.07), selebihnya data tercakup dalam kurva aprokasimasi Normal. Hal yang sama terjadi pada tampilan probability plot brand Nestle, dimana terdapat sebuah nilai ekstrim (ditandai dengan lingkaran merah) yang melenceng jauh dari line (garis). Untuk lebih memastikan bahwa brand Nestle memang berdistribusi Normal telah dilakukan pengujian Goodness-of-Fit Test. Berdasarkan pengujian tersebut, nilai p-value untuk ketiga statistic uji Goodness-of-Fit berada di atas level 10% yaitu 15%, 25%, dan 25%. Artinya, tidak terdapat cukup bukti untuk menolak hipotesis kenormalan brand Nestle. Sehingga ditarik kesimpulan bahwa brand Nestle berdistribusi Normal. Sample data Nestle Untuk sample data brand Nestle dilakukan pengujian serupa dengan proc univariate. Dari tampilan histogram dan probability plot dapat dikatakan bahwa brand Nestle cenderung berdistribusi Normal. Hal ini disebabkan tidak nampak munculnya data ekstrim yang berada di luar jangkauan kurva aproksimasi Normal (pada histogram) dan line. Selain itu berdasarkan pengujian Goodness-of-Fit Test diketahui bahwa tidak terdapat cukup bukti untuk menolak hipotesis kenormalan brand Nestle. Adapun p-value dari statistic uji juga melebihi tingkat 10%, yakni 15%, 25%, dan 25%. Oleh sebab itu, terbukti bahwa brand Nestle memang berdistribusi Normal. Hamidah Aprilia (10109078) PROC TTEST : pengecekan kehomogenan variansi dari dua kelompok sampel data Berdasarkan output proc ttest, diketahui bahwa statistic uji (F-test) yang menyatakan hipotesa memiliki p-value sebesar 0.246. Artinya tidak terdapat cukup bukti untuk menolak hipotesa kehomogenan variansi kedua brand tersebut. Sehingga untuk langkah pengujian difference of means, statistic uji yang dipilih haruslah equal variances. Pemilihan statistic uji (antara equal dan unequal variances) sangat penting dan harus tepat. Hal ini disebabkan kesalahan pemilihan statistic uji dapat mengakibatkan penarikan kesimpulan di tahap difference of means menjadi tidak valid juga. PROC TTEST : pengecekan kehomogenan means data variable brand Dari penjelasan sebelumnya statistic uji yang harus digunakan dalam pengujian difference of means adalah equal variances dengan metode Pooled. Ternyata p-value dari statistic uji tersebut bernilai <0.01%. Apabila dibandingkan dengan alpha=10% (atau 5%), pvalue masih bernilai jauh di bwah alpha. Sehingga hipotesis jelas ditolak. Dengan kata lain, terdapat perbedaan rata-rata berat kedua produk Cereal (Kellog dan Nestle). D. KESIMPULAN Berdasarkan serangkaian proses ANOVA, dapat disimpulkan bahwa: Brand Kellog dan Nestle terbukti memiliki perbedaan rata-rata berat produk cereal. Selang kepercayaan diffrenece of weight means terletak di (-0.0498, -0.0281) dan tidak mencakup nol (0), sehingga terbukti bahwa memang terdapat perbedaan yang signifikan diantara berat kedua produk Cereal tersebut. Hamidah Aprilia (10109078) E. LAMPIRAN Output dari fundamental statistical concept dari brand Kellog dan Nestle adalah: Adapun program SAS nya berbentuk seperti di bawah ini: libname data 'D:\SAS academy\PR2'; /* import data cereal.xlx dan menampilkan sebagian data (10 data paling awal)*/ proc print data=data.cereal (obs=10); title 'Partial Listing of Cereal Data'; run; /* proses sorting data cereal berdasarkan brand-nya */ proc sort data=data.cereal out=sorted_cereal; by brand; run; /* menguji kenormalan data Nestle dan data Kellogs */ proc univariate data=sorted_cereal; by brand; var weight; histogram weight / normal; probplot weight / normal (mu=est sigma=est color=blue w=1); title 'Analisis Univariate Untuk Data Sereal (Nestle dan Kellogs)'; run; Hamidah Aprilia (10109078) /* menguji equality of variance dan equality of means dari data Nestle dan data Kellogs */ proc ttest data=data.cereal; class brand; var weight; title 'Menguji Equality of Means Untuk Kedua Jenis Cereal' ' Brands'; run;