APLIKASI KOMPUTER LANJUTAN TEORI DAN PRAKTEK Zaenal Wafa [email protected] | 081270388939 Silabus Kuliah O O O O O O O O O O O O Pengenalan SPSS Tipe Data Statistik dan Statistik Deskriptif One Sample T. Test Independent T.Test One Way Anova Regresi Regresi Berganda Korelasi Validitas & Realibilitas Uji Asumsi Klasik Analisis Jalur MRA Penilaian Variabel Penilaian : 1. Tugas 2. Quiz 3. UTS 4. UAS 5. Tugas Akhir Kontrak Belajar O Batas keterlambatan saudara 15 menit O Berpakaian Rapi dan Sopan O Selama Perkuliahan berlangsung di harapkan tidak kelur masuk kelas PERTEMUA KE - 1 Tipe Data Statistik dan Statistik Deskriptif Cont.. O Dalam melakukan analysis data , kita harus memahami terlebih dahulu konsep dari jenis data statistik yaitu numeric dan kategorik. O Data numeric adalah data yang berbentuk angka ( kombinasi dari 0,1,2..9 ) dan merupakan gambaran hasil mengukur atau menghitung. O Data Kategorik merupakan data yang berbentuk peryataan, kualitas, atau pengelompokan misal (laki/perempuan, baik/buruk, setuju/tidak, SD/SMP/SMA/PT/, dls) Statistik deskriptif Statistik deskriptif berupa frekuensi dan nilai-nilai pusat (central tendency). Frekuensi biasanya dimunculkan dalam bentuk proporsi atau persentase untuk data atau variabel kategorik. Sedangkan nilai pusat berupa nilai tengah dan nilai sebaran (mean, median, dll) untuk data atau variabel numerik. Cont.. O Analysis data numeric akan berbeda dengan analysis data kategorik, termasuk termasuk penyajian dan interprestasinya. Data numeric biasanya disajikan dalam bentuk nilai tengah dan nilai sebaran ( misal ratarata dan standart deviasi ) sedangkan nilai kategorik ditampilkan dalam bentuk persen. LATIHAN : O Berikut ini adalah Buku Kode yang memuat variabel, keterangan dan value yang mempengaruhi berat bayi lahir. O Instruksi : simpan file saudara dengan nama Pertemuan1. BUKU KODE VARIABEL VIEW SPSS DATA VIEW SPSS ANALYSIS DESKRIPTIF DATA KATEGORIK O Cara yang paling sering digunakan adalah dengan mengunakan tabel frekuensi. O Langkahnya : O Pada Menu Bar, Klik ANALYZE > DESCRIPTIVE > FREQUENCIES … O Pada sehingga akan ditampuilkan layar sebagai berikut : 2 1 3 RESULT : Cont.. O Pada kolom Frequency menunjukkan jumlah kasus dengan nilai yang sesuai, jadi pada contoh diatas, terdapat 3 ibu yang berpendidikan SD dari 12 Ibu yang ada, Proporsi yang dapat dilihat dari kolom Percent pada kolom diatas adalah 25,0% ibu yang berpendidikan SD O Kolom Valid Percen menampilkan proporsi jika missing cases tidak diikutsertakan yaitu 25,0% O Kolom Comulative Percen menjelaskan tetang persen komulatif, jadi pada contoh diatas ada 75,0% ibu yang perpendidikan SD – SMP ( 25,0% + 50 ,0%) PENYAJIAN DATA KATEGORIK O Penyajian data mempunyai prinsip efisiensi, Sajikan hanya informasi Penting saja. O Contoh : LATIHAN ANALYSIS DATA KATEGORIK O Buatlah tabel distribusi frekuensi untuk variabel HT , ROKOK dan bblr O Diminta : a. Sajikan, b. Interpretasikan Pertemuan ke-2 ANALYSIS DESKRIPTIF DATA NUMERIK ANALYSIS DESKRIPTIF DATA NUMERIK O Pada data numerik atau kontinyu, peringkasan data dapat dilakukan dengan melaporkan ukuran tengah dan sebarannya. Ukuran tengah yang dapat digunakan adalah : O rata-rata, median dan modus. Sedangkan ukuran sebaran yang dapat digunakan adalah : O nilai minimum, maksimum, range, standar deviasi dan persentil. O Dari ukuran-ukuran tersebut, yang paling sering digunakan adalah rata-rata dan standar deviasi. O O Pada file SPSS bayi2015 diatas, lakukan langkah berikut ini : O Analyze Descriptive Statistic Descriptive … sehingga akan ditampilkan kotak dialog sbb : Result Nilai rata-rata dapat dilihat pada kolom Mean, sedangkan nilai standar deviasi dapat dilihat pada Std Devation. Pada contoh di atas, rata-rata umur ibu adalah 25 tahun dengan standar deviasi 4,178 umur minimun 19 tahun serta umur maksimum 34 tahun. Dengan cara di atas, kita dapat memperoleh nilai rata-rata, minimum, maksimum serta standar deviasi. Tetapi kita tidak memperoleh nilai standar error, padahal nilai ini diperlukan untuk melakukan estimasi inteval pada parameter populasi. O Analyze Descriptive Statistic Descriptive … sehingga akan ditampilkan kotak dialog deskriptive sbb, kemudian klik OPTION Result + Dari hasil tersebut kita dapat melakukan estimasi interval dari berat bayi. Kita dapat menghitung 95% confidence interval berat bayi, yaitu 1559,00 + 1,96 x 129,326 (mean + SE mean). Jadi kita 95% yakin bahwa rata-rata berat bayi di populasi berada pada selang 1305 sampai 1812 gram. *1,96 nilai interval standart devisiasi O Cara yang lain untuk mengeluarkan nilai statistik deskriptif dari data numerik (nilai rata-rata/mean std. Dev) beserta 95% confidence interval adalah sebagai berikut: Dari menu utama, pilihlah: O Analyze Descriptive Statistic Explore sehingga akan ditampilkan kotak dialog Explorer sebagai berikut : O Dari hasil tersebut kita mendapatkan estimasi titik dan estimasi interval dari variabel numerik yang diukur. Kita dapat melihat nilai rata-rata dan 95% confidence interval dari BBAYI yaitu 1559.00 gram (1274.36—1843.64), kita 95% yakin bahwa rata-rata berat bayi di populasi berada pada selang 1274.36 sampai 1843.64 gram. Nilai ini tidak jauh berbeda dengan nilai yang dihitung dari output yang didapat pada langkah slide 25 sebelumnya. GRAFIK HISTOGRAM PADA DATA NUMERIK O Langkahnya : Klik Graph > Klik Legacy Dialog > Klik Histogram Result UJI NORMALITAS DISTRIBUSI DATA NUMERIK O Pengujian normalitas adalah pengujian tentang kenormalan distribusi data. Uji ini merupakan pengujian yang paling banyak dilakukan untuk analisis statistik parametrik. Karena data yang berdistribusi normal merupakan syarat dilakukannya tes parametrik. Sedangkan untuk data yang tidak mempunyai distribusi normal, maka analisisnya menggunakan tes non parametric. O Statistik Parametrik Parametrik dalam arti harfiah yaitu asumsi tentang parameter dari distribusi data populasi yang digunakan untuk menguji hipotesis mendekati normal atau mendekati distribusi normal setelah teorema limit sentral. O Statistik Nonparametrik Non-parametrik adalah metode yang tidak mendasarkan pada asumsi distribusi populasi. Dalam arti sempit non-parametrik adalah sebuah kategori nol karena hampir semua uji statistik mengasumsikan satu atau lain hal tentang sifat-sifat populasi. Klik Analyze > klik Descriptive Statistic > kemudian klik Explore… Pada kotak dialog tersebut, pilih variabel UMUR dan BBAYI, Kemudian klik tanda panah ke kanan >, untuk memasukkannya ke kotak Dependent list berikutnya klik Plot lalu klik Histogram dan Normality plot with result Tests of Normality Kolmogorov-Smirnova Statistic df Sig. Statistic df umur .167 12 .200* .960 12 bbayi .154 12 .200* .931 12 * This is a lower bound of the true significance. a Lilliefors Significance Correction Shapiro-Wilk Sig. .780 .395 O Dengan uji Kolmogorov-Smirnov, disimpulkan bahwa pada alpha 0.05 distribusi data umur ibu adalah normal (nilai-p = 0.780) begitu juga dengan distribusi data berat bayi normal (nilai-p = 0.395). O Apabila diperhatikan grafik HISTOGRAM maka terlihat bahwa data umur ibu memang terlihat normal, dengan grafik distribusi tidak miring ke kanan (miring positif +) PERTEMUAN KE 3 TRANSFORMASI DATA & T - TEST Independen sample T-TEST O Uji-t untuk data independen dilakukan terhadap dua kelompok data yang tidak saling berkaitan antara satu dengan lainnya. Misalnya membandingkan kelompok intervensi dengan kelompok kontrol atau kelompok ibu-ibu perokok dengan ibu-ibu bukan perokok adalah dua kelompok yang tidak saling berkaitan. O Pada analisis ini kita akan melihat apakah ada perbedaan berat bayi yang lahir dari ibu perokok dengan bayi yang lahir dari ibu bukan perokok. Kita akan melakukan uji hipotesis apakah ada perbedaan rata-rata berat bayi yang lahir dari ibu bukan perokok dengan rata-rata berat bayi yang lahir dari ibu perokok Klik Pada option dan tentukan derajat kepercayaan yang diinginkan Hasil tersebut memperlihatkan bahwa ada 10 ibu yang tidak perokok dan mereka mempunyai rata-rata berat bayi sebesar 1686.40 gram. Sedangkan 2 ibu yang perokok melahirkan bayi yang lebih rendah beratnya daripada kelompok sebelumnya yakni dengan rata-rata 922.00 gram. Uji-t independen menyajikan dua buah uji statistik. Pertama adalah uji Levene’s untuk melihat apakah ada perbedaan varians antara kedua kelompok atau tidak. Kedua adalah uji-t untuk melihat apakah ada perbedaan rata-rata kedua kelompok atau tidak. Jika p-value (Sig.) dari uji Levene’s besar dari nilai α (0.05), hal ini berarti varians kedua kelompok adalah sama, maka signifikansi uji-t yang dibaca adalah pada baris pertama (Equal variances assumed). Tetapi jika p-value dari uji Levene’s kecil atau sama dengan nilai α (0.05), hal ini berarti bahwa varians kedua kelompok adalah tidak sama, maka signifikansi uji-t yang dibaca adalah pada baris kedua (Equal variances not assumed). O Pada contoh diatas signifikansi uji Levene’s adalah 0.611, berarti varians kedua kelompok adalah sama, maka hasil uji-t pada baris pertama memperlihatkan p-value (sig.) adalah 0.018 untuk uji 2-sisi. (Jika uji yang kita lakukan adalah uji 1-sisi maka nilai p-value harus dikalikan 2 sehingga menjadi 0.036). Dapat kita simpulkan bahwa secara statistik rata-rata berat bayi yang lahir dari populasi ibu yang tidak perokok lebih tinggi dari populasi ibu perokok. PAIRED SAMPLE T TEST (UJI BEDA DUA SAMPEL BERPASANGAN) O Paired sample t test merupakan uji beda dua sampel berpasangan. Sampel berpasangan merupakan subjek yang sama namun mengalami perlakuan yang berbeda. CONTOH KASUS Akan diteliti mengenai perbedaan penjualan sepeda motor merk A disebuah Kabupaten sebelum dan sesudah kenaikan harga BBM. Data diambil dari 15 dealer. Data yang diperoleh adalah sebagai berikut : No Sebelum Sesudah 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 67 75 81 60 80 75 71 68 80 78 71 80 65 57 78 68 76 80 63 82 74 70 71 82 79 78 77 69 67 68 O Klik ANALYZE > COMPARE MEANS > PAIRED SAMPLES t Tes O Bagian pertama. Paired Samples Statistic O Menunjukkan bahwa rata-rata penjualan pada sebelum dan sesudah kenaikan BBM. Sebelum kenaikan BBM rata-rata penjualan dari 15 dealer adalah sebanyak 72.4, sementara setelah kenaikan BBM jumlah penjualan rata-rata adalah sebesar 73.6 unit O Bagian Dua. Paired samples Correlatian O Hasil uji menunjukkan bahwa korelasi antara dua variabel adalah sebesar 0.809 dengan sig sebesar 0.000. Hal ini menunjukkan bahwa korelasi antara dua rata-rata penjualan sebelum dan sesudah kenaikan adalah kuat dan signifikan. Hipotesis Hipotesis yang diajukan adalah : O Ho : rata-rata penjualan adalah sama O H1 : rata-rata penjualan adalah berbeda Nilai t hitung adalah sebesar -1.031 degan sig 0.320. Karena sig > 0.05 maka dapat disimpulkan bahwa Ho diterima, artinya rata-rata penjualan sebelum dan sesudah kenaikan BBM adalah sama (tidak berbeda). dengan demikian dapat dinyatakan bahwa kenaikan harga BBM tidak mempengaruhi jumlah penjualan sepeda motor di kabupaten A. Kasus : independet sample ttest Kasus 1 : Suatu tes dilakukan untuk melihat tingkat stress pada karyawan yang ditempatkan di ruangan berarsitektur tradisional dan ruang berarsitekstur modern dengan data sebagai berikut : Paired Sample t-test O Dilakukan beberapa sample data sebelum dan sesudah dilakukan pengetesan dengan hasil sebagai berikut : O Sajikan dan interpretasikan O Sajikan dan interpretasikan ( soal dan jawaban di buat di microsft word O Variabel view : 1 id, 2.arsitektur (value :1.modern, 2. tradisional) O O O Hipotesa untuk menjawab kasus diatas. H0 : tidak ada perbedaan stres karyawan ketika berada di ruang tradisional dengan ketika berada di ruang modern H1 : Ada perbedaan stress karyawan ketika berada di ruang tradisional dengan ketika berada di ruang modern Question ? O Jelaskan perbedaan paired sample t test dan independet sample t test O Kapan saudara akan mengunakan alat uji paired sample t- test dan independet sample t test O Uji-Anova digunakan untuk melihat perbedaan rata- rata dari dua atau lebih kelompok independen (data yang tidak saling berkaitan antara satu dengan lainnya). O contoh analisis ini kita akan melihat apakah ada perbedaan berat bayi yang lahir dari ibu yang berpendidikan SD, ibu yang berpendidikan SMP, dengan ibu yang berpendidikan SMA. Kita akan melakukan uji hipotesis apakah ada perbedaan rata-rata berat bayi yang lahir dari ibu dari jenis pendidikan yang berbeda Untuk melakukan uji Anova, harus dipenuhi beberapa asumsi, yaitu: Sampel berasal dari kelompok yang independen (nilai pada satu kelompok tidak tergantung pada nilai di kelompok lain ) Varian antar kelompok harus homogen Data masing-masing kelompok berdistribusi normal Langkah Uji Anova O 1. Bukalah file BAYI95.SAV sampai tampak pada Data editor window. O 2. Klik Analyze > Compare Means > One-way ANOVA Kemudian Klik Option > Klik Descriptive dan Homogeneity of …. Kemudian klik Continue dan Klik Ok RESULT ANALISIS DATA Pada hasil di atas terlihat bahwa rata-rata berat bayi pada ibu dengan pendidikan SD adalah 1233.33 gram, pada ibu dengan pendidikan SMP adalah 1648.50 gram, dan pada ibu berpendidikan SMA adalah 1705.67 gram. Standar deviasi, nilai minimummaximun, dan interval 95% tingkat kepercayaan juga diperlihatkan O Salah satu asumsi dari uji Anova adalah varians masing-masing kelompok harus sama. Untuk itu dilakukan uji homogenitas varians yang hasilnya memperlihatkan bahwa p-value (sig.) lebih besar dari nilai α=0.05, berarti varians antar kelompok adalah sama O Pada hasil di atas diperoleh nilai ANOVA F = 1.091 dengan p- value=0.000 (dalam keadaan ini boleh juga ditulis p < 0.001). O Hipotesis nol pada uji ANOVA adalah tidak ada perbedaan rata-rata berat bayi antara kelompok ibu dengan pendidikan SD, SMP, dan SMA. O Sedangkan hipotesis alternatifnya adalah salah satu nilai rata-rata berat bayi berbeda dengan lainnya. O Dengan menggunakan α=0.05, dari hasil di atas kita menolak hipotesis nol. Sehingga kita menyimpulkan ada perbedaan berat badan bayi dari ke tiga kelompok ibu tersebut (setidaknya salah satu nilai mean berbeda dengan lainnya). Namun, kita belum tahu kelompok mana yang berbeda antara satu dengan yang lainnya untuk mengetahui perbedaan kelompok bisa mengunakan Post Hock Test Analisi Regresi Syarat Pengujian Analisis Regresi 1. Asumsi Normalitas Kenormalan data diperlukan dalam analisis regresi, salah satu metode yang digunakan dalam menguji normalitas adalah metode Kolmogorov Smirnov (KS), dalam metode KS penerimaan H0 mengindikasikan bahwa data yang dianalisis tersebut tersebar normal Jika nilai Sig value > 0,05 maka data regresi mengikuti sebaran normal, dan jika sebaliknya nilai Sig value < 0,05 maka dinyatakan bahwa sebaran data tidak normal 2. Asumsi Homogenitas / Heteroskedastisitas O Salah satu metode yang digunakan dalam menganalisa homogen atau tidaknya suatu data dalam regresi adalah Uji Levene ( levene test) O Jika Sig Value > 0.05 maka H0 diterima, artinya data bersifat homogen sebaliknya O Jika Sig Value <0.05 H0 di tolak, artinya data bersifat tidak homogen 3. Asumsi tidak terjadi Multikolinier Kolinier Ganda merupakan hubungan linier yang sama kuat antara variabel-variabel bebas dalam persamaan regresi berganda. - Adanya kolinier berganda ini menyebabkan pendugaan koefisien menjadi tidak stabil. - Sebagai catatan tidak multikolinier hanya terjadi pada regresi berganda saja, untuk regresi sederhana tidak terjadi kr variabel bebasnya hanya satu. O Asumsi tidak terjadi autokorelasi O Uji korelasi digunakan untuk melihat kebebas data, kebebasan disini dimaksudkan bahwa data suatu observasi tertentu tidak dipengaruhi data observasi sebelumnya. O Salah satu metode yang digunakan dalam menguji autokorelasi adalah metode Durbin Watson (DW) Latihan : Regresi Sederhana O Klik Analyze > Regression > Linier sehingga akan ditampilkan tampilan pada gambar berikut : Output Interpretasi O Pada Uji Anova terlihat bahwa terdapat pengaruh yang significant antara Variabel Promosi (X1) terhadap variabel sales(Y) dimana: O Nilai Sig < Alpha 5% ( 0,000 < 0,05) O Atau pada uji-t terlihat nilai t hitung > t tabel (6,384) atau nilai alpha < 0.05 (0,000 < 0,05) O Dari data tersebut diatas juga terlihat adanya korelasi yang kuat antara variabel Promosi(X1) terhadap variabel Sales(Y) hal ini dibuktikan dengan nilai korelasi(R) sebesar 0.612, O sedangkan pada koefisien determinasinya (R Square) yaitu kemampuan untuk mempengaruhi antar variabel Promosi terhadap Sales sebesar 0.375 dan masih terdapat 62.5% (100%-37,5%) varibel lain yang mempengaruhi Sales (selain variabel promosi tersebut) O Nilai Konstanta sebesar 214.675 menunjukkan bahwa jika tidak ada aktivitas Promosi(X1=0) maka nilai sales/penjualan hanya sebesar 214.675 O Nilai Slop 4.176 menunjukkan bahwa setiap kenaikan kegiatan promosi 1 juta Rupiah, maka hal tersebut akan meningkatkan sales/penjualan sebesar 4.176 juta rupiah. Take Home • Sajikan dan Interpretasika n No Kunjungan Kepuasan 1 47098 6754 2 56847 7925 3 36984 5687 4 87489 9483 5 23346 3514 6 38660 6642 7 41835 7411 8 60149 9935 9 25524 3543 10 55911 7634 11 47683 7603 KASUS : REGRESI BERGANDA Tahap : 1. Lakukan Uji Normalias O Klik Analyze > Klik Dtescriptive Statistik > Explore O Berdasarkan hasil pengujian di dapat KS hitung untuk Kunjungan, tanggapan dan Kepuasan sebesar 147,173, dan 173 dengan nilai sigfikasi / nilai sig sebesar 200,200,200, dengan nilai sig > 0.05 maka dapat dikatakan bahwa sebaran data tersebut diatas adalah Normal Tahap 2. Melakukan Uji Homogenitas O Buat variabel baru dengan nama group, kemudian isikan datanya sebagai berikut O Catatan : buatlah pengelompokan data, sbg contoh sauadara mempunyai 10 data, maka group angka 1 dari no 1 – 5 lalu group angka 2 dari 6-10 O Berdasarkan Levene Test tersebut diatas didapatkan nilai signifikasi/nilai sig sebesar 0.261 untuk variabel kunjungan, kemudian 0,730 untuk tanggapan dan 0.727 untuk kepuasan, sehingga dapat disimpulan bahwa sebaran data bersifat homogen dengan nilai sig > 0.05 Tahap 3|4 Bebas Multikolinier dan Multikorelasi O Klik analyze > Klik Regression > Linear kemudian silahkan setting sesuai dengan kotak dialog linerar regression dan Linerar Regression Statistik berikut ini O Interprestasi Uji Asumsi bebas Multiklinieritas (Nilai VIF) O Berdasarkan data diatas didapat nilai VIF sebesar 4.994 untuk variabel bebas Kunjungan dan 4.994 untuk variabel bebas tanggapan karena nilai VIF dibawah 10 maka dapat disimpulkan bahwa semua variabel tersebut bebas multi kolinieritas (Nilai VIF) artinya tidak saling berhubungan / korelasi antar variabel bebas Interprestasi Uji Asumsi bebas Autokorelasi ( Nilai Durbin Watson ) O Berdasarkan data diatas, didapat nilai Durbin- watson sebesar 1.467 sehingga dapat disimpulkan tidak terjadi autokorelasi berdasarkan ketentuan autokrelasi terjadi jika nilai Durbin-Watson : 1 < DW < 3