paired sample t test

advertisement
APLIKASI KOMPUTER LANJUTAN
TEORI DAN PRAKTEK
Zaenal Wafa
[email protected] | 081270388939
Silabus Kuliah
O
O
O
O
O
O
O
O
O
O
O
O
Pengenalan SPSS
Tipe Data Statistik dan Statistik Deskriptif
One Sample T. Test
Independent T.Test
One Way Anova
Regresi
Regresi Berganda
Korelasi
Validitas & Realibilitas
Uji Asumsi Klasik
Analisis Jalur
MRA
Penilaian
Variabel Penilaian :
1. Tugas
2. Quiz
3. UTS
4. UAS
5. Tugas Akhir
Kontrak Belajar
O Batas keterlambatan saudara 15 menit
O Berpakaian Rapi dan Sopan
O Selama Perkuliahan berlangsung di
harapkan tidak kelur masuk kelas
PERTEMUA KE - 1
Tipe Data Statistik dan Statistik Deskriptif
Cont..
O Dalam melakukan analysis data , kita harus
memahami terlebih dahulu konsep dari jenis
data statistik yaitu numeric dan kategorik.
O Data numeric adalah data yang berbentuk
angka ( kombinasi dari 0,1,2..9 ) dan
merupakan gambaran hasil mengukur atau
menghitung.
O Data Kategorik merupakan data yang berbentuk
peryataan, kualitas, atau pengelompokan misal
(laki/perempuan, baik/buruk, setuju/tidak,
SD/SMP/SMA/PT/, dls)
Statistik deskriptif
 Statistik deskriptif berupa frekuensi dan
nilai-nilai pusat (central tendency).
 Frekuensi biasanya dimunculkan dalam
bentuk proporsi atau persentase untuk
data atau variabel kategorik. Sedangkan
nilai pusat berupa nilai tengah dan nilai
sebaran (mean, median, dll) untuk data
atau variabel numerik.
Cont..
O Analysis data numeric akan berbeda dengan
analysis data kategorik, termasuk termasuk
penyajian dan interprestasinya. Data
numeric biasanya disajikan dalam bentuk
nilai tengah dan nilai sebaran ( misal ratarata dan standart deviasi ) sedangkan nilai
kategorik ditampilkan dalam bentuk persen.
LATIHAN :
O Berikut ini adalah Buku Kode yang memuat
variabel, keterangan dan value yang
mempengaruhi berat bayi lahir.
O Instruksi : simpan file saudara dengan nama
Pertemuan1.
BUKU KODE
VARIABEL VIEW SPSS
DATA VIEW SPSS
ANALYSIS DESKRIPTIF DATA
KATEGORIK
O Cara yang paling sering digunakan adalah
dengan mengunakan tabel frekuensi.
O Langkahnya :
O Pada Menu Bar, Klik ANALYZE >
DESCRIPTIVE > FREQUENCIES …
O Pada sehingga akan ditampuilkan layar
sebagai berikut :
2
1
3
RESULT :
Cont..
O Pada kolom Frequency menunjukkan jumlah kasus
dengan nilai yang sesuai, jadi pada contoh diatas,
terdapat 3 ibu yang berpendidikan SD dari 12 Ibu yang
ada, Proporsi yang dapat dilihat dari kolom Percent
pada kolom diatas adalah 25,0% ibu yang
berpendidikan SD
O Kolom Valid Percen menampilkan proporsi jika missing
cases tidak diikutsertakan yaitu 25,0%
O Kolom Comulative Percen menjelaskan tetang persen
komulatif, jadi pada contoh diatas ada 75,0% ibu yang
perpendidikan SD – SMP ( 25,0% + 50 ,0%)
PENYAJIAN DATA KATEGORIK
O Penyajian data mempunyai prinsip efisiensi,
Sajikan hanya informasi Penting saja.
O Contoh :
LATIHAN ANALYSIS DATA
KATEGORIK
O Buatlah tabel distribusi frekuensi untuk variabel HT ,
ROKOK dan bblr
O Diminta : a. Sajikan, b. Interpretasikan
Pertemuan ke-2
ANALYSIS DESKRIPTIF DATA NUMERIK
ANALYSIS DESKRIPTIF
DATA NUMERIK
O Pada data numerik atau kontinyu, peringkasan
data dapat dilakukan dengan melaporkan
ukuran tengah dan sebarannya. Ukuran tengah
yang dapat digunakan adalah :
O rata-rata, median dan modus.
Sedangkan ukuran sebaran yang dapat digunakan
adalah :
O nilai minimum, maksimum, range, standar
deviasi dan persentil.
O Dari ukuran-ukuran tersebut, yang paling sering
digunakan adalah rata-rata dan standar deviasi.
O
O Pada file SPSS bayi2015 diatas, lakukan
langkah berikut ini :
O Analyze  Descriptive Statistic 
Descriptive … sehingga akan ditampilkan
kotak dialog sbb :
Result
Nilai rata-rata dapat dilihat pada kolom Mean, sedangkan nilai
standar deviasi dapat dilihat pada Std Devation. Pada contoh di
atas, rata-rata umur ibu adalah 25 tahun dengan standar deviasi
4,178 umur minimun 19 tahun serta umur maksimum 34 tahun.
Dengan cara di atas, kita dapat memperoleh nilai rata-rata,
minimum, maksimum serta standar deviasi. Tetapi kita tidak
memperoleh nilai standar error, padahal nilai ini diperlukan untuk
melakukan estimasi inteval pada parameter populasi.
O Analyze  Descriptive Statistic  Descriptive …
sehingga akan ditampilkan kotak dialog
deskriptive sbb, kemudian klik OPTION
Result
+
Dari hasil tersebut kita dapat melakukan estimasi interval dari
berat bayi. Kita dapat menghitung 95% confidence interval berat
bayi, yaitu 1559,00 + 1,96 x 129,326
(mean + SE mean). Jadi kita 95% yakin bahwa rata-rata berat
bayi di populasi berada pada selang 1305 sampai 1812 gram.
*1,96 nilai interval standart devisiasi
O Cara yang lain untuk mengeluarkan nilai
statistik deskriptif dari data numerik (nilai
rata-rata/mean std. Dev) beserta 95%
confidence interval adalah sebagai berikut:
Dari menu utama, pilihlah:
O Analyze  Descriptive Statistic Explore
sehingga akan ditampilkan kotak dialog
Explorer sebagai berikut :
O Dari hasil tersebut kita mendapatkan estimasi
titik dan estimasi interval dari variabel numerik
yang diukur. Kita dapat melihat nilai rata-rata
dan 95% confidence interval dari BBAYI yaitu
1559.00 gram (1274.36—1843.64), kita 95%
yakin bahwa rata-rata berat bayi di populasi
berada pada selang 1274.36 sampai 1843.64
gram. Nilai ini tidak jauh berbeda dengan nilai
yang dihitung dari output yang didapat pada
langkah slide 25 sebelumnya.
GRAFIK HISTOGRAM PADA DATA NUMERIK
O Langkahnya : Klik Graph > Klik Legacy Dialog
> Klik Histogram
Result
UJI NORMALITAS DISTRIBUSI
DATA NUMERIK
O Pengujian normalitas adalah pengujian tentang
kenormalan distribusi data. Uji ini merupakan
pengujian yang paling banyak dilakukan untuk
analisis statistik parametrik. Karena data yang
berdistribusi normal merupakan syarat
dilakukannya tes parametrik. Sedangkan untuk
data yang tidak mempunyai distribusi normal,
maka analisisnya menggunakan tes non
parametric.
O Statistik Parametrik
Parametrik dalam arti harfiah yaitu asumsi tentang
parameter dari distribusi data populasi yang
digunakan untuk menguji hipotesis mendekati normal
atau mendekati distribusi normal setelah teorema
limit sentral.
O Statistik Nonparametrik
Non-parametrik adalah metode yang tidak
mendasarkan pada asumsi distribusi populasi. Dalam
arti sempit non-parametrik adalah sebuah kategori nol
karena hampir semua uji statistik mengasumsikan
satu atau lain hal tentang sifat-sifat populasi.
 Klik Analyze > klik Descriptive Statistic > kemudian klik
Explore…
 Pada kotak dialog tersebut, pilih variabel UMUR dan
BBAYI, Kemudian klik tanda panah ke kanan >, untuk
memasukkannya ke kotak Dependent list berikutnya klik
Plot lalu klik Histogram dan Normality plot with
result
Tests of Normality
Kolmogorov-Smirnova
Statistic df
Sig.
Statistic df
umur
.167
12
.200* .960
12
bbayi
.154
12
.200* .931
12
* This is a lower bound of the true significance.
a Lilliefors Significance Correction
Shapiro-Wilk
Sig.
.780
.395
O Dengan uji Kolmogorov-Smirnov,
disimpulkan bahwa pada alpha 0.05
distribusi data umur ibu adalah normal
(nilai-p = 0.780) begitu juga dengan
distribusi data berat bayi normal (nilai-p =
0.395).
O Apabila diperhatikan grafik HISTOGRAM
maka terlihat bahwa data umur ibu memang
terlihat normal, dengan grafik distribusi
tidak miring ke kanan (miring positif +)
PERTEMUAN KE 3
TRANSFORMASI DATA & T - TEST
Independen sample T-TEST
O Uji-t untuk data independen dilakukan terhadap dua
kelompok data yang tidak saling berkaitan antara
satu dengan lainnya. Misalnya membandingkan
kelompok intervensi dengan kelompok kontrol atau
kelompok ibu-ibu perokok dengan ibu-ibu bukan
perokok adalah dua kelompok yang tidak saling
berkaitan.
O Pada analisis ini kita akan melihat apakah ada
perbedaan berat bayi yang lahir dari ibu perokok
dengan bayi yang lahir dari ibu bukan perokok. Kita
akan melakukan uji hipotesis apakah ada perbedaan
rata-rata berat bayi yang lahir dari ibu bukan perokok
dengan rata-rata berat bayi yang lahir dari ibu
perokok
Klik Pada option dan tentukan derajat kepercayaan yang diinginkan
Hasil tersebut memperlihatkan bahwa ada 10 ibu yang tidak perokok dan
mereka mempunyai rata-rata berat bayi sebesar 1686.40 gram.
Sedangkan 2 ibu yang perokok melahirkan bayi yang lebih rendah beratnya
daripada kelompok sebelumnya yakni dengan rata-rata 922.00 gram.
Uji-t independen menyajikan dua buah uji statistik. Pertama adalah uji Levene’s
untuk melihat apakah ada perbedaan varians antara kedua kelompok
atau tidak. Kedua adalah uji-t untuk melihat apakah ada perbedaan rata-rata
kedua kelompok atau tidak. Jika p-value (Sig.) dari uji Levene’s besar
dari nilai α (0.05), hal ini berarti varians kedua kelompok adalah sama,
maka signifikansi uji-t yang dibaca adalah pada baris pertama
(Equal variances assumed). Tetapi jika p-value dari uji Levene’s kecil atau
sama dengan nilai α (0.05), hal ini berarti bahwa varians kedua kelompok
adalah tidak sama, maka signifikansi uji-t yang dibaca adalah pada baris
kedua (Equal variances not assumed).
O Pada contoh diatas signifikansi uji Levene’s
adalah 0.611, berarti varians kedua kelompok
adalah sama, maka hasil uji-t pada baris
pertama memperlihatkan p-value (sig.) adalah
0.018 untuk uji 2-sisi. (Jika uji yang kita lakukan
adalah uji 1-sisi maka nilai p-value harus
dikalikan 2 sehingga menjadi 0.036). Dapat kita
simpulkan bahwa secara statistik rata-rata berat
bayi yang lahir dari populasi ibu yang tidak
perokok lebih tinggi dari populasi ibu perokok.
PAIRED SAMPLE T TEST (UJI BEDA
DUA SAMPEL BERPASANGAN)
O Paired sample t test merupakan uji beda dua
sampel berpasangan. Sampel berpasangan
merupakan subjek yang sama namun
mengalami perlakuan yang berbeda.
CONTOH KASUS
Akan diteliti mengenai perbedaan penjualan sepeda motor merk A
disebuah Kabupaten sebelum dan sesudah kenaikan harga BBM.
Data diambil dari 15 dealer.
Data yang diperoleh adalah sebagai berikut :
No
Sebelum
Sesudah
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
67
75
81
60
80
75
71
68
80
78
71
80
65
57
78
68
76
80
63
82
74
70
71
82
79
78
77
69
67
68
O Klik ANALYZE > COMPARE MEANS > PAIRED
SAMPLES t Tes
O Bagian pertama. Paired Samples Statistic
O Menunjukkan bahwa rata-rata penjualan pada sebelum dan
sesudah kenaikan BBM. Sebelum kenaikan BBM rata-rata
penjualan dari 15 dealer adalah sebanyak 72.4, sementara
setelah kenaikan BBM jumlah penjualan rata-rata adalah sebesar
73.6 unit
O Bagian Dua. Paired samples Correlatian
O Hasil uji menunjukkan bahwa korelasi antara dua variabel adalah
sebesar 0.809 dengan sig sebesar 0.000. Hal ini menunjukkan
bahwa korelasi antara dua rata-rata penjualan sebelum dan
sesudah kenaikan adalah kuat dan signifikan.
Hipotesis
Hipotesis yang diajukan adalah :
O Ho : rata-rata penjualan adalah sama
O H1 : rata-rata penjualan adalah berbeda
Nilai t hitung adalah sebesar -1.031 degan sig 0.320.
Karena sig > 0.05 maka dapat disimpulkan bahwa Ho
diterima, artinya rata-rata penjualan sebelum dan
sesudah kenaikan BBM adalah sama (tidak berbeda).
dengan demikian dapat dinyatakan bahwa kenaikan
harga BBM tidak mempengaruhi jumlah penjualan
sepeda motor di kabupaten A.
Kasus : independet sample ttest
Kasus 1 : Suatu tes dilakukan untuk melihat
tingkat stress pada karyawan yang
ditempatkan di ruangan berarsitektur
tradisional dan ruang berarsitekstur modern
dengan data sebagai berikut :
Paired Sample t-test
O Dilakukan
beberapa sample
data sebelum dan
sesudah dilakukan
pengetesan dengan
hasil sebagai
berikut :
O Sajikan dan interpretasikan
O Sajikan dan
interpretasikan ( soal
dan jawaban di buat di
microsft word
O Variabel view : 1 id,
2.arsitektur (value
:1.modern, 2.
tradisional)
O
O
O
Hipotesa untuk menjawab kasus diatas.
H0 : tidak ada perbedaan stres karyawan ketika berada di ruang tradisional
dengan ketika berada di ruang modern
H1 : Ada perbedaan stress karyawan ketika berada di ruang tradisional dengan
ketika berada di ruang modern
Question ?
O Jelaskan perbedaan paired sample t test
dan independet sample t test
O Kapan saudara akan mengunakan alat uji
paired sample t- test dan independet
sample t test
O Uji-Anova digunakan untuk melihat perbedaan rata-
rata dari dua atau lebih kelompok independen
(data yang tidak saling berkaitan antara satu
dengan lainnya).
O contoh analisis ini kita akan melihat apakah ada
perbedaan berat bayi yang lahir dari ibu yang
berpendidikan SD, ibu yang berpendidikan SMP,
dengan ibu yang berpendidikan SMA. Kita akan
melakukan uji hipotesis apakah ada perbedaan
rata-rata berat bayi yang lahir dari ibu dari jenis
pendidikan yang berbeda
 Untuk melakukan uji Anova, harus dipenuhi
beberapa asumsi, yaitu:
 Sampel berasal dari kelompok yang
independen (nilai pada satu kelompok tidak
tergantung pada nilai di kelompok lain )
 Varian antar kelompok harus homogen
 Data masing-masing kelompok berdistribusi
normal
Langkah Uji Anova
O 1. Bukalah file BAYI95.SAV sampai tampak
pada Data editor window.
O 2. Klik Analyze > Compare Means > One-way
ANOVA
Kemudian Klik Option > Klik Descriptive dan
Homogeneity of ….
Kemudian klik Continue dan Klik Ok
RESULT
ANALISIS DATA
Pada hasil di atas terlihat bahwa rata-rata berat bayi
pada ibu dengan pendidikan SD adalah 1233.33
gram, pada ibu dengan pendidikan SMP adalah
1648.50 gram, dan pada ibu berpendidikan SMA
adalah 1705.67 gram. Standar deviasi, nilai minimummaximun, dan interval 95% tingkat kepercayaan juga
diperlihatkan
O Salah satu asumsi dari uji Anova adalah
varians masing-masing kelompok harus sama.
Untuk itu dilakukan uji homogenitas varians
yang hasilnya memperlihatkan bahwa p-value
(sig.) lebih besar dari nilai α=0.05, berarti
varians antar kelompok adalah sama
O Pada hasil di atas diperoleh nilai ANOVA F = 1.091 dengan p-
value=0.000 (dalam keadaan ini boleh juga ditulis p < 0.001).
O Hipotesis nol pada uji ANOVA adalah tidak ada perbedaan rata-rata
berat bayi antara kelompok ibu dengan pendidikan SD, SMP, dan SMA.
O Sedangkan hipotesis alternatifnya adalah salah satu nilai rata-rata
berat bayi berbeda dengan lainnya.
O Dengan menggunakan α=0.05, dari hasil di atas kita menolak
hipotesis nol. Sehingga kita menyimpulkan ada perbedaan berat
badan bayi dari ke tiga kelompok ibu tersebut (setidaknya salah satu
nilai mean berbeda dengan lainnya). Namun, kita belum tahu
kelompok mana yang berbeda antara satu dengan yang lainnya untuk
mengetahui perbedaan kelompok bisa mengunakan Post Hock Test
Analisi Regresi
Syarat Pengujian Analisis
Regresi
1.
Asumsi Normalitas
Kenormalan data diperlukan dalam analisis
regresi, salah satu metode yang digunakan
dalam menguji normalitas adalah metode
Kolmogorov Smirnov (KS), dalam metode KS
penerimaan H0 mengindikasikan bahwa data
yang dianalisis tersebut tersebar normal
Jika nilai Sig value > 0,05 maka data regresi
mengikuti sebaran normal, dan jika sebaliknya
nilai Sig value < 0,05 maka dinyatakan bahwa
sebaran data tidak normal
2. Asumsi Homogenitas / Heteroskedastisitas
O Salah satu metode yang digunakan dalam
menganalisa homogen atau tidaknya suatu
data dalam regresi adalah Uji Levene (
levene test)
O Jika Sig Value > 0.05 maka H0 diterima,
artinya data bersifat homogen sebaliknya
O Jika Sig Value <0.05 H0 di tolak, artinya
data bersifat tidak homogen
3. Asumsi tidak terjadi Multikolinier
Kolinier Ganda merupakan hubungan linier yang
sama kuat antara variabel-variabel bebas dalam
persamaan regresi berganda.
- Adanya kolinier berganda ini menyebabkan
pendugaan koefisien menjadi tidak stabil.
- Sebagai catatan tidak multikolinier hanya terjadi
pada regresi berganda saja, untuk regresi
sederhana tidak terjadi kr variabel bebasnya
hanya satu.
O Asumsi tidak terjadi autokorelasi
O Uji korelasi digunakan untuk melihat
kebebas data, kebebasan disini
dimaksudkan bahwa data suatu observasi
tertentu tidak dipengaruhi data observasi
sebelumnya.
O Salah satu metode yang digunakan dalam
menguji autokorelasi adalah metode Durbin
Watson (DW)
Latihan : Regresi Sederhana
O Klik Analyze > Regression > Linier sehingga akan
ditampilkan tampilan pada gambar berikut :
Output
Interpretasi
O Pada Uji Anova terlihat bahwa terdapat pengaruh
yang significant antara Variabel Promosi (X1)
terhadap variabel sales(Y) dimana:
O Nilai Sig < Alpha 5% ( 0,000 < 0,05)
O Atau pada uji-t terlihat nilai t hitung > t tabel (6,384)
atau nilai alpha < 0.05 (0,000 < 0,05)
O Dari data tersebut diatas juga terlihat adanya korelasi
yang kuat antara variabel Promosi(X1) terhadap
variabel Sales(Y) hal ini dibuktikan dengan nilai
korelasi(R) sebesar 0.612,
O sedangkan pada koefisien determinasinya (R Square)
yaitu kemampuan untuk mempengaruhi antar variabel
Promosi terhadap Sales sebesar 0.375 dan masih
terdapat 62.5% (100%-37,5%) varibel lain yang
mempengaruhi Sales (selain variabel promosi
tersebut)
O Nilai Konstanta sebesar 214.675 menunjukkan
bahwa jika tidak ada aktivitas Promosi(X1=0) maka
nilai sales/penjualan hanya sebesar 214.675
O Nilai Slop 4.176 menunjukkan bahwa setiap
kenaikan kegiatan promosi 1 juta Rupiah, maka hal
tersebut akan meningkatkan sales/penjualan
sebesar 4.176 juta rupiah.
Take Home
• Sajikan dan
Interpretasika
n
No
Kunjungan
Kepuasan
1
47098
6754
2
56847
7925
3
36984
5687
4
87489
9483
5
23346
3514
6
38660
6642
7
41835
7411
8
60149
9935
9
25524
3543
10
55911
7634
11
47683
7603
Download