statistika - etrinaldi

advertisement
BAHAN AJAR
STATISTIKA
Oleh:
Dr. Samsudi, M.Pd
JURUSAN TEKNIK MESIN - FAKULTAS TEKNIK
UNIVERSITAS NEGERI SEMARANG 2008
Samsudi - STATISTIKA
1
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Alloh SWT , yang telah melimpahkan
petunjuk, bimbingan dan kekuatan lahir-batin sehingga dapat menyusun bahan ajar ini.
Sasaran yang akan dicapai dengan buku Statistika ini adalah: (1) memberikan dasardasar pemahanan dan pengertian beberapa istilah statistika serta mafaatnya, (2)
menggunakan statistika sebagai alat bantu dalam penyusunan laporan penelitian, (3)
menggunakan rumus-rumus dan teknik analisis Statistika dan (4) memiliki sikap teliti
dan cermat dalam menerima dan menggunakan sesuatu.
Bahan ini terdiri atas 9 (sembilan) bab, yaitu: (1) Konsep dan Pengertian Statistika, (2)
Distribusi Frekuensi, (3) Ukuran Statistika, (4) Deviasi Rata-rata dan Standar Deviasi,
(5) Uji Hipotesis, (6) Teknik Analisis Korelasional, (7) Teknik Analisis Komparasional,
(8) Teknik Analisis Variansi, (9) Analisis Regresi. Setiap bab terdiri atas beberapa sub
bab serta dilengkapi dengan soal-soal untuk latihan.
Penulis menyampaikan terima kasih sebanyak- banyaknya kepada fihak-fihak yang
telah membantu penyusunan buku ini. Kritik dan saran yang bersifat konstruktif sangat
penulis harapkan untuk kesempurnaan buku ini.
Semarang, Oktober 2008
Dr. Samsudi, M.Pd
Samsudi - STATISTIKA
2
DAFTAR ISI
KATA PENGANTAR …………………………………………………
DAFTAR ISI ……………………………………………………………
ii
iii
BAB I
KONSEP DAN PENGERTIAN STATISTIKA ………….
1.1. Pengertian Statistika ...................................................
1.2. Statistika dalam Pelelitian ............................................
BAB II
DISTRIBUSI FREKUENSI ................................................
2.1. Distribusi Frekuensi ....................................................
2.2. Grafik dan Tabel Distribusi Frekuensi ........................
BAB III UKURAN STATISTIKA ...................................................
3.1. Pengukuran Tendensi Sentral .....................................
3.2. Mean ..........................................................................
3.3. Median ………………………………………………
3.4. Mode ………………………………………………..
BAB IV DEVIASI RATA-RATA DAN STANDAR DEVIASI ......
4.1. Pengukuran Variabilitas .............................................
4.2. Deviasi Rata-rata (Mean Deviation) ...........................
4.3. Standard Deviasi ……………………………………
BAB V
UJI HIPOTESIS ..................................................................
5.1. Pengertian Hipotesis …………………………………
5.2. Menyatakan Hipotesis ………………………………..
5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean ……
5.4. Standar Kesalahan Perbedaan Mean ………………..
BAB VI TEKNIK ANALISIS KORELASIONAL …………………
6.1. Arah Hubungan ……………………………………..
6.2. Koefisien Korelasi .......................................................
6.3. Korelasi setujuduct Moment dan Cara Menghitungnya
6.4. Uji Taraf Signifikansi ……………………………….
BAB VII TEKNIK ANALISIS KOMPARASIONAL ..........................
7.1. Chi Kuadrad ...............................................................
7.2. t-Score ........................................................................
BAB VIII ANALISIS VARIANSI .......................................................
8.1. Konsep Mean Kuadrat ..................................................
8.2. F – Ratio ……………………………………………..
8.3. Anava pada Distribusi Tunggal ……………………..
8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda .........
BAB IX
ANALISIS REGRESI …………………………………..
9.1 Analisis Regresi Linear Satu Prediktor ………………
9.2. Analisis Varians Garis Regresi ……………………..
9.3. Analisis Regresi: Dua Prediktor …………………….
9.4. Analisis Regresi : m – Prediktor ……………………
DAFTAR PUSTAKA .............................................................................
Samsudi - STATISTIKA
1
2
2
3
4
7
11
12
12
13
14
18
19
19
20
25
26
26
26
27
30
31
31
31
34
37
37
41
48
49
50
57
61
67
69
76
79
86
88
3
BAB I
KONSEP DAN PENGERTIAN STATISTIKA
Tujuan
Mahasiswa memiliki pemahaman tentang konsep statistika dalam konteks penelitian,
pengolahan data dan penarikan kesimpulan, serta memahami statistika dalam kaitannya
dengan kegiatan penelitian
Samsudi - STATISTIKA
4
1.1. Pengertian Statistika
Istilah STATISTIKA memiliki pengertian berbeda dengan STATISTIK.
Statistik merupakan kumpulan data, bilangan atau non bilangan yang disusun/disajikan
sedemikian rupa (biasanya dalam bentuk tabel atau grafik) yang menggambarkan suatu
persoalan atau keadaan. Sedangkan Statistika adalah pengetahuan yang berhubungan
dengan cara-cara pengumpulan, penyajian, pengolahan dan analisis data, serta teknikteknik analisis data.
Statistika digunakan sebagai cara-cara ilmiah untuk mengumpulkan, menyusun,
meringkas dan menyajikan data penelitian. Lebih lanjut statistika merupakan cara untuk
mengolah data tersebut dan menarik kesimpulan-kesimpulan yang teliti dan keputusankeputusan yang logik dari pengolahan data tersebut. Sedangkan statistik lebih banyak
digunakan untuk menggambarkan keadaan atau permasalahan seperti pencataan
banyaknya penduduk, penarikan pajak, dan semacamnya.
1.2. Statistika dalam Pelelitian
Dalam rangka kegiatan penelitian, seperti yang telah disinggung di depan, fungsi
dan peranan statistika dijelaskan sebagai berikut:
1. Statistika memungkinkan pencatatan secara eksak data penelitian.
2. Statistika memandu peneliti menganut tata fikir dan tata kerja yang definit dan
eksak.
3. Statistika menyediakan cara-cara meringkas data ke dalam bentuk yang lebih
banyak artinya dan lebih gampang mengerjakannya.
4. Statistika memberi dasar-dasar untuk menarik kongklusi-kongklusi melalui prosesproses yang mengikuti tata cara yang dapat diterima oleh ilmu pengetahuan.
5. Statistika memberi landasan untuk meramalkan secara ilmiah tentang sebagaimana
sesuatu gelaja akan terjadi dalam kondisi-kondisi yang telah di ketahui.
6. Statistika memungkinkan peneliti menganalisis, menguraikan sebab-akibat yang
kompleks dan rumit, yang tanpa statistika akan merupakan peristiwa yang
membingungkan, kejadian yang tak teruraikan.
Soal Latihan
1.
2.
3.
4.
5.
Berikan definisi pengertian Statistika. Bagaimanakah pengertian tersebut dapat
dibagi?
Manfaat apakah yang dapat dipetik mahasiswa selaku calon sarjana, dengan
mempelajari Statistika Pendidikan? Jelaskan jawaban saudara!
Syarat apakah yang harus dipenuhi sekumpulan angka atau bilangan, sehingga ia
dapat disebut data Statistika?
Sebutkan tiga prinsip yang harus dipegang dalam rangka pengumpulan data
Statistika!
Jelaskan mengenai cara yang akan ditempuh dan alat yang dapat dipergunakan,
dalam rangka menghimpun data Statistik!
Samsudi - STATISTIKA
5
BAB II
DISTRIBUSI FREKUENSI
Tujuan
Mahasiswa memiliki pemahaman tentang distribusi frekuensi dan tabel/grafik distribusi
frekuensi
Samsudi - STATISTIKA
6
2.1. Distribusi Frekuensi
2.1.1. Variabel Penelitian
Seorang peneliti akan mengadakan penelitian tentang kecerdasan murid-murid
dalam berhitung; seorang ahli beton mengadakan penelitian tentang campurancampuran beton, seorang ahli pertanian meneliti benih-benih baru. Kecerdasan,
berhitung, campuran beton dan benih-benih baru, itu semuanya merupakan obyek
penelitian. Obyek yang diteliti itu disebut variabel penelitian.
2.1.3. Variabel Kontinu dan Diskrit
Kalau seorang guru menyelenggarakan penelitian tentang angka rata-rata muridmuridnya dalam berhitung, maka guru tersebut melihat nilai-nilai ujian mereka atau
nilai-nilai dalam buku nilai. Nilai dalam berhitung itu disebut nilai variabel.
Ada dua macam nilai variabel, yaitu nilai yang bersambung atau kontinu dan nilai
yang terpisah atau diskrit. Nilai tinggi orang misalnya, adalah nilai yang kontinu, sebab
jika kita sebutkan tinggi si A 165 cm, pada hakekatnya tinggi si A itu tidak mutlak
tepat 165 cm, melainkan misalnya 165, 30 cm pada umumnya angka 165 cm, itu
ditetapkan untuk mewakili tinggi orang dari 164,50 cm, sampai 165,49 cm. Mereka
yang tingginya 165,50 cm sampai dengan 165,49 cm, dicatat 166 cm. Dengan kata lain,
angka 0,50 ke atas dibulatkan atas, sedang angka di bawah 0,50 dihilangkan.
2.1.4. Distribusi Frekuensi Tunggal
Dalam suatu penelitian tentang kecakapan berhitung, pada Mata Pelajaran
Matematikan, siswa kelas 4, 5 dan 6 suatu sekolah yang berjumlah 70 orang, diperoleh
nilai rapor sebagai berikut:
7
6
7
5
6
6
7
6
6
6
5
5
6
6
6
6
5
6
7
7
7
5
7
6
6
6
7
7
5
6
7
8
Nilai-nilai
4
6
7
6
7
7
6
6
6
5
6
5
7
5
6
7
6
7
5
5
7
7
5
6
5
8
7
7
6
5
7
8
6
6
5
8
5
6
Melihat angka-angka di atas kita belum dapat memperoleh gambaran apa-apa. Untuk
mendapatkan gambaran dan kesimpulan, kita perlu mengatur angka-angka itu menjadi
suatu tabel sebagai berikut :
NILAI
8
7
6
5
4
TABEL 2.1
TABEL NILAI-NILAI BERHITUNG 70 ORANG SISWA
Jari-jari
Frekuensi
4
////
21
//// //// //// //// /
28
//// //// //// //// //// ///
16
//// //// //// /
1
/
+
N
= 70
Samsudi - STATISTIKA
7
+ N adalah singkatan dari kata Number, yang berarti jumlah frekuensi variabel
Tabel di atas disebut Tabel Distribusi Frekuensi Tunggal. Istilah “Distribusi” digunakan
dalam statistika untuk menunjuk adanya (seolah-olah) “Penyebaran” nilai-nilai dengan
jumlah orang yang mendapat nilai itu, sedang istilah ”Tunggal” menunjukkan tidak
adanya pengelompokan nilai-nilai variabel dalam kolom pertama.
2.1.5. Distribusi Frekuensi Bergolong
Hasil-hasil Psikotest dari sebagian calon-calon mahasiswa suatu Fakultas adalah
sebagai berikut :
18
21
10
21
12
17
21
20
13
22
11
12
12
16
8
16
20
10
10
16
16
19
4
7
10
17
20
14
19
10
(23)
6
7
14
14
19
10
10
11
12
15
15
13
15
18
23
5
14
19
13
17
(3)
19
9
15
13
19
16
10
19
12
16
15
14
16
8
20
15
15
14
13
Nilai yang tertinggi dari hasil ujian masuk itu adalah 23, sedang nilai terendah adalah
tiga. Jika susun tabel distribusi tunggal, maka kita harus membuatnya sepanjang 21
baris (dari 23-3 plus 1). Dengan demikian kita akan menjumpai tabel sebagai berikut :
TABEL 2.2
TABEL HASIL PSIKOTEST DARI CALON-CALON MAHASISWA
Kelompok
Frekuensi
Nilai
(f)
6
21-23
13
18-20
17
15-17
16
12-14
11
9-11
5
6-8
3
3-5
Jumlah
71
2.1.6. Beberapa Istilah dalam Distribusi Bergolong
Interval Kelas. Tiap-tiap kelompok nilai variabel disebut interval kelas. Dalam
Tabel 3.2 di atas kita jumpai ada tujuh interval kelas dengan masing-masing berisi tiga
nilai variabel. Interval Kelas biasa disingkat dengan sebutan kelas atau interval saja.
Batas Kelas. Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dari
kelas yang lain. Nilai-nilai 21 dan 23 pada kelas yang teratas dari Tabel 3.2 itu adalah
nilai-nilai yang membatasi kelas itu dari kelas lainnya yang berdekatan.
Batas Atas dan Batas Bawah dan batas atas. Kita lihat dalam kolom nilai
variabel dalam Tabel 3.2 itu ada dua deret angka-angka batas kelas, deret sebelah kiri
dan deret sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka
Samsudi - STATISTIKA
8
21,18,15,21,9,6 dan 3. Angka-angka itu semuanya menjadi batas bawah dari masingmasing kelasnya. Sebab itu angka-angka itu di sebut “Batas bawah” (Lower Limits).
Angka-angka dideret sebelah kanan ialah angka-angka 23, 20, 17, 14, 11, 8 dan 5.
Angka-angka ini masing-masing menjadi batas kelas, deret sebelah kiri dan deret
sebelah kanan. Angka-angka batas di deret sebelah kiri ialah angka-angka 21, 18, 15,
12, 9, 6 dan 3. Angka-angka itu disebut “Batas Atas” (Upper Limits).
Batas Semu dan Batas Nyata. Kalau kita letakkan pada garis mendatar kelaskelas dalam Tabel 3.2 itu akan kelihatan sebagai berikut :
5
6
20 21
3
8
9
11 12
23
15
14
17 18
Nampak kepada kita dari pemeriksaan lukisan di atas bahwa angka 5 dan angka 6
misalnya, bukanlah batas yang nyata antara kelas yang terendah dengan kelas di
atasnya. Demikian juga angka-angka 20 dan 21.
Lebar Kelas. Kita periksa kembali tabel 3.2 Interval kelas yang tertinggi di
tandai dengan angka 21 dan 23. Kedua angka itu sebenarnya hanyalah batas kelas saja
(batas semu). Antara keduanya masih ada satu angka lagi, yaitu angka 22. Demikian
juga kelas yang keempat dari atas, sebenarnya mengandung angka-angka 3,4, dan 5.
Jadi tiap-tiap kelas itu sebenarnya mengandung atau terdiri atas tiga angka. Inilah yang
disebut lebar kelas dapat didefinisikan sebagai batas lebar atas nyata dikurangi batas
bawah nyata dari kelas-kelas yang bersangkutan. Lebar kelas biasa diberi simbul “i”.
Jika orang mengatakan “i” sama dengan tiga, ini berarti bahwa distribusi frekuensi
disusun dalam tabel atau grafik yang menggunakan interval kelas dengan isi tiga angka
atau nilai dalam tiap-tiap intervalnya.
Titik Tengah. Yang dimaksud dengan “Titik Tengah” adalah angka atau nilai
variabel yang terdapat ditengah-tengah interval kelas. Jika interval kelas memuat angkaangka 13, 14 dan 15, yang menjadi titik tengahnya adalah angka 14. Jika luas kelasnya
genap, seperti 20, 21, 22 dan 23 titik tengahnya adalah separo dari jumlah angka-angka
tengah, yaitu 21,5 (dari ½ x ( 21 ditmbah 22).
Jumlah Interval . Yang disebut jumlah interval ialah banyaknya interval yang
digunakan dalam penyusunan distribusi. Dalam tabel 3.2 diatas jumlah intervalnya ada
tujuh.
Jarak Pengukuran. Kalau kita mengukur tinggi sejumlah orang, dan kita
menjumpai angka pengukuran yang tertinggi 180 cm. Dan angka pengukuran yang
terendah, 145 cm, kita mempunyai jarak pengukuran 35 cm. (dari 180 cm, dikurangi
145 cm).
2.1.7. Menetapkan Jumlah Interval
Salah satu masalah yang kita hadapi bila kita hendak menyusun tabel dengan
interval-interval adalah menetapkan jumlah interval. Penetapan ini dipengaruhi oleh
beberapa faktor, antara lain adalah faktor-faktor jumlah frekuwensi (N), jarak
pengukuran (R), lebar interval yang hendak digunakan (i), dan tujuan penyusunan
distribusi itu. Pada prinsipnya jumlah interval kelas janganlah terlalu sedikit, sehingga
pola-pola kelompok menjadi kabur.
Akan tetapi jumlah interval itu juga jangan terlalu besar, sehingga kita tidak
dapat mendapat gambaran tentang pola kelompok. Petunjuk yang mutlak tidak ada
dalam hal ini. Tetapi dalam psikologi dan pendidikan dapat kita anut kebiasaan
Samsudi - STATISTIKA
9
mennggunakan 5 sampai 15 interval. Kalau R besar sekali, biasanya orang
menggunakan 10 smapai 20 interval. Akan tetapi hal ini tidak boleh diikuti secara
membabi buta.
2.1.8. Menentukan Lebar Interval
Jika R sudah diketahui dan jumlah interval kelas sudah ditentukan, pada
dasarnya i sudah diketemukan. Rumus dari i adalah sebagai berikut :
i=
JarakPengukuran( R )
JumlahInterval
Jadi kalau misalnya hasil pengukuran kita tentang tinggi orang yang tertinggi adalah
180 cm dan yang terendah adalah 145 cm, dan kita telah menetapkan jumlah intervalnya
sebanyak 9 buah, maka
i=
180,50 − 144,50 36
=
=4
9
9
2.1.9. Pengertian Distribusi Frekuensi
Distribusi Frekuensi adalah penyusunan bahan-bahan atas dasar nilai variabel
dan frekuensi tiap-tiap nilai variabel itu. Tabel untuk distribusi frekuensi, disebut tabel
distribusi frekuensi atau tabel frekuensi saja. Distribusi tunggal adalah distribusi yang
tidak menggunakan penggolongan-golongan. Distribusi Bergolong menggunakan
interval-interval kelas dalam penyusunannya.
2.2. Grafik dan Tabel Distribusi Frekuensi
Terdapat beberapa macam grafik dan tabel distribusi frekuensi. Namun dalam sub
ini akan dibicarakan tiga macam yang pokok, yakni Histogram, Frekuensi Poligon, dan
Ogive.
2.2.1. Histogram
Grafik histogram biasa disebut juga Bar Diagram, yaitu suatu grafik yang
berbentuk segi empat.
Nilai
8
7
6
5
4
TABEL 2.3
NILAI-NILAI BERHITUNG 72 ORANG MURID
Frekuensi
Batas Nyata +
8,5
4
7,5
23
6,5
28
5,5
16
4,5
1
3,5
Samsudi - STATISTIKA
10
Jumlah :
--
72
Grafik 2.1. Histogram
2.2.2. Poligon
Dengan grafik polygon kita dengan mudah dapat membandingkan keadaan
distribusi, jika kedua distribusi itu dilukiskan dalam satu grafik. Hal ini dapat kita lihat
dengan jelas pada keadaan sebagai berikut:
Grafik 3.2. Poligon
Samsudi - STATISTIKA
11
2.2.3. Ogive
Ogive dapat dibuat baik dari distribusi tunggal maupun dari distribusi tergolong.
Di bawah ini diberikan contoh untuk membuat grafik ogive dari distribusi bergolong.
TABEL 2.4
TABEL DISTRIBUSI UNTUK CONTOH MEMBUAT GRAFIK OGIVE
Interval
Batas
Frekuensi
Frekuensi Meningkat
Nilai
Nyata
( f _)
(ef)
38,5
2
35,5
100
36-38
3
98
32,5
33-35
2
95
29,5
30-32
6
26,5
93
27-29
5
87
23,5
24-26
5
82
20,5
21-23
5
17,5
77
18-20
14
72
14,5
15-17
10
58
11,5
12-14
17
8,5
48
9-11
15
31
5,5
6-8
14
2,5
16
3-5
2
2
0,5
0-2
Jumlah
N = 100
--
Grafik 2.3. Ogive
Samsudi - STATISTIKA
12
Soal Latihan
1 . Jelaskan perbedaan diantara data kontinyu dan data diskrit.
2. Jelaskan pula tentang perbedaan antara data interval dan data ordinal.
3. Berikan contoh demikian rupa sehingga menjadi cukup jelas apa yang dimaksud
dengan data primer dan data sekunder.
4. a. Interval 40 – 49; tentukan Midpointnya!
b. Interval 37 – 40; berapakah Nilai Relatifnya?
c. Interval 59 – 78; berapakah Nilai nyatanya?
d. Interval 35 – 40; berapakah lower limitnya?
e. Interval 71 – 75; berapakah upper limitnya?
5. Jelaskan apa yang dimaksud frekuensi!
6. Jelaskan langkah yang sebaiknya ditempuh dalam membuat Tabel Distribusi
Frekuensi Data Tunggal!
7. Data di bawah ini: Nilai hasil ulangan harian dari sejumlah 60 orang siswa SMP
dalam bidang studi Bahasa Indonesia adalah sebagai berikut:
7
4
3
9
7
10
5
6
4
7
6
8
8
8
6
5
3
7
3
6
5
8
9
6
6
8
5
6
5
6
4
5
4
4
7
5
6
7
8
6
6
7
7
5
6
7
3
7
5
9
5
8
8
6
9
7
6
10
7
6
Soal : Aturlah (susunlah) dan kemudian sajikanlah data tersebut diatas dalam bentuk:
a. Tabel Distribusi Frekuensi, dengan mengindahkan persyaratan tertentu sehingga
dapat disebut Tabel distribusi frekuensi yang baik.
b. Tabel Persentase
c. Tabel Presentase Kumulatif
8. Lukislah data pada soal nomor 7 diatas dalam bentuk Histrogram Frekuensi!
Samsudi - STATISTIKA
13
BAB III
UKURAN STATISTIKA
Tujuan
Mahasiswa memiliki pemahaman tentang ukuran statistika yang meliputi tendensi
sentral, rerata, dan sebaran data.
Samsudi - STATISTIKA
14
3.1. Pengukuran Tendensi Sentral
Jika dilakukan penelitian terhadap motivasi, pada umumnya dapat diketahui
bahwa sebagian besar dari orang yang diteliti mempunyai motivasi yang “normal”.
Kemudian jika diambil angka 100 sebagai indeks (ukuran) normalitas, maka sebagian
besar orang yang kita selidiki akan mempunyai angka motivasi di sekitar 100. Hanya
sebagian kecil saja dari mereka yang angka motivasinya menyimpang jauh dari indeks
normalitas itu.
Salah satu tugas dari statistika adalah mencari suatu angka di sekitar mana nilainilai dalam suatu distribusi memusat. Angka yang menjadi pusat suatu distribusi disebut
“tendensi sentral”. Ada tiga macam tendensi sentral yang sangat penting untuk dibahas,
yakni: Mean, Median, dan Mode. Ketiganya mempunyai cara-cara menghitung yang
berbeda-beda, dan mempunyai arti yang berbeda pula sebagai alat untuk mengadakan
deskripsi sesuatu distribusi.
3.2. Mean
Mean berarti “angka rata-rata”. Dari segi aritmetik Mean adalah “jumlah nilainilai dibagi dengan jumlah individu”. Sebagai contoh, ada tiga orang berpenghasilan
10, 15 dan 20 rupiah tiap harinya. Rata-rata penghasilan mereka adalah 15 rupiah tiap
harinya. Ini dicari dengan cara sebagai berikut :
10 + 15 + 20 45
Penghasilan rata-rata =
=
= 15
3
3
Dari pernyataan itu dapat dikemukakan rumus Mean sebagai berikut :
X + X 2 + X 3 .... X n −1 + X n
Mean = 1
N
Rumus itu disingkat sebagai berikut :
∑X
M =
N
Simbul Σ adalah huruf Yunani yang disebut “Sigma” dan mempunyai arti jumlah.
a. Mean yang Ditimbang
Jika ada empat orang yang berpenghasilan 10 rupiah, seorang yang berpenghasilan
15 rupiah, dan seorang yang berpenghasilan 20 rupiah seharinya, maka Mean dari
penghasilan mereka tidak lagi 15 rupiah, melainkan 12,50 rupiah. Hal ini dapat dicari
dengan tabel sebagai berikut :
TABEL 3.1
TABEL CONTOH MENCARI MEAN YANG DITIMBANG
Penghasilan
Frekuensi
fX
(X)
(f)
Samsudi - STATISTIKA
15
20
15
10
1
1
4
20
15
40
N = 6
Σ fX = 75
Rumus Mean yang ditimbang adalah sebagai berikut :
M =
∑
fX
N
Diisi dengan bahan-bahan dari Tabel 12
75
M =
= 12,50
6
b. Menghitung Mean dari Distribusi Bergolong
Sekali lagi perlu diingatkan disini bahwa X adalah mewakili “titik tengah” dari
interval kelas dalam distribusi.
TABEL 3.2
TABEL CONTOH MENCARI MEAN DARI DISTRIBUSI BERGOLONG
Penghasilan
(X)
145-149
140-144
135-139
130-134
125-129
120-124
115-119
110-114
105-109
100-104
95-99
90-94
85-89
80-84
Titik Tengah
(X)
147
142
137
132
127
122
117
112
107
102
97
92
87
82
f
fX
1
3
5
8
11
17
21
22
24
20
15
12
6
2
147
426
685
1056
1397
2074
2457
2464
2568
2040
1455
1104
522
164
Jumlah
--
N = 167
ΣfX =18559
M =
∑
fX
N
=
18559
= 111 ,13
167
3.3. Median
Median dapat dibatasi sebagai “suatu nilai yang membatasi 50 persen frekuensi
distribusi bagian bawah dengan 50 per sen frekuensi distribusi bagian atas.” Kita
misalkan ada distribusi penghasilan dari tujuh orang seperti tersebut dalam tabel
dibawah ini.
TABEL 3.3
TABEL CONTOH DISTRIBUSI PENGHASILAN UNTUK MENCARI MEDIAN
Individu
Samsudi - STATISTIKA
Penghasilan (Rp)
16
1
2
3
4
5
6
7
10
12
13
14
16
16
20
a. Median pada Distribusi dengan Frekuensi Genap
Jika suatu distribusi mempunyai frekuensi genap, maka median dihitung secara
kom setujumi, yaitu dengan membagi dua nilai-nilai variabel yang ada ditengah-tengah
distribusi. Misalkan ada empat orang yang masing-masing mempunyai tinggi badan
162, 162, 164 dan 166 cm, ditambah 164 cm, kemudian dibagi dua. Pemecahan
semacam ini sama sekali tidak bertentangan dengan definisi median, sebab angka 163
cm, itu sebagai batas antara tinggi 162 dan 164 cm, membatasi 50 persen frekuensi
variabel di bagian atas, yaitu dua orang, dan 50 per sen frekuensi variabel di bagian
bawah distribusi, yaitu dua orang.
b. Mencari Median dari Distribusi Bergolong
Rumus untuk mencari median dari distribusi bergolong adalah sebagai berikut :
⎡1 / 2 N − cfb ⎤
Median = Bb + ⎢
(7)
⎥i
fd
⎣
⎦
Dalam mana :
Bb Adalah batas bawah (nyata) dari interval yang mengandung median
Cfb Frekuensi kumulatif (frekuensi meningkat) di bawah interval yang
mengandung median,
fd
Frekuensi dalam interval yang mengandung median
i
Lebar interval, dan
N
Jumlah frekuensi dalam distribusi
Penggunaan rumus itu dapat kita lihat dari pekerjaan di bawah ini :
TABEL 3.4
TABEL CONTOH MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG
Interval Nilai
f
cf
55
1
100-104
54
3
95-99
51
5
90-94
fd
46
9
85-89
37
(13)
80-84
(24)
10
75-79
14
6
70-74
8
4
65-69
4
3
60-64
1
1
55-59
55
Jumlah
-Samsudi - STATISTIKA
17
Dalam contoh diatas, jumlah frekuensinya (atau N ) ada 55. Kalau ini kita bagi
dua hasilnya sama dengan 27,5 itu. Setelah ½ N ini kita ketemukan maka langkah
selanjutnya adalah menemukan interval kelas yang mengandung frekuensi kumulatif
27,5 itu, interval kelas yang kita maksudkan adalah 80-84, sebab cf 27,5 terkandung
dalam cf 37.
Batas bawah (nyata) atau Bb dari interval yang mengandung median itu adalah
79,50. Separo dari jumlah frekuensinya, atau ½ N adalah 55/2, sama dengan 27,50.
Frekuensi kumulatif di bawah interval yang mengandung median adalah 24 (24 adalah
cf di bawah 37, sedang cf 37 adalah cf yang mengandung median). Frekuensi dalam
interval adalah 13, sedang lebar interval atau i-nya ada lima. Diisikan dalam rumus kita
jumpai perhitungan sebagai berikut :
⎡1 / 2 N − cfb ⎤
⎡ 27,50 − 24 ⎤
Mdn = Bb + ⎢
⎥i = 79,50 + ⎢
⎥5
13
fd
⎣
⎦
⎣
⎦
⎡ 3,50 × 5 ⎤
= 79,50 + ⎢
⎥ = 79,50 + 1,346 = 80,846
⎣ 13 ⎦
atau 80,85
Jadi, median dari distribusi tersebut 80,5.
3.4. Mode
a) Dalam Distribusi Tunggal
: Nilai variabel yang mempunyai frekuensi
tertingi dalam distribusi;
: Titik tengah interval kelas yang
b) Dalam Distribusi Bergolong
mempunyai frekuensi tertinggi dalam distribusi
a. Mode dalam Distribusi Tunggal
Jika ada serangkaian nilai-nilai 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, nilai yang timbul
paling banyak adalah 8. Nilai 8 itu disebut Mode dari distribusi nilai-nilai itu. Kalau
suatu distribusi sudah disusun dalam tabel, maka untuk mencari Mode-nya kita melihat
pertama kolom frekuensi.
TABEL 3.5
MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG
Nilai
Frekuensi
1
10
0
9
15
8
18
7
4
6
3
5
1
4
1
3
Samsudi - STATISTIKA
18
Frekuensi yang tertinggi dari distribusi tersebut adalah 18. Nilai yang mempunyai
frekuensi tertinggi itu adalah nilai 7. Jadi yang menjadi modenya adalah nilai 7.
b. Tempat Kedudukan Mean, Median, dan Mode dalam Distribusi
Tempat kedudukan Mean, Median dan Mode dalam satu distribusi sangat
tergantung kepada bentuk distribusinya. Kita ingat kembali ada distribusi yang simetri
dan ada yang juling.
Jika dari suatu distribusi simetri normal kita hitung mean, median, dan modenya,
maka akan kita jumpai sifat yang khas, yaitu bahwa ketiga tendensi sentral itu bersekutu
satu sama lain. Hal ini mudak kita mengerti, sebab pada distribusi normal, mean
membagi dua sama banyak frekuensi variabel di atas dan dibawahnya. Dengan
demikian mean ini mempunyai fungsi seperti median. Karena yang menjadi mode
dalam distribusi normal adalah nilai yang ada pada mean, maka dengan sendirinya
mode itu bersekutu dengan mean. Jadi pada distribusi normal mean, median, dan mode
ketiga-tiganya berimpit. Untuk ilustrasi periksalah grafik 4.1.
frekuensi
N i l a i
Median
Mode
Grafik 3.1 Ilustrasi mean, median dan mode
Mean
Soal Latihan
1. Jelaskan tentang segi segi kebaikan dan kelemahan yang dimiliki oleh:
a. Mean; b. Median; c. Modus.
2. Dalam kedaan yang bagaimana seharusnya kita mencari (menghitung);
a. Mean; b. Median; c. Modus.
3. Jelaskan adanya saling hubungan antara Mean, Median dan Modus dengan
mengemukakan contohnya!
4. Jelaskan bahwa Percentile sangat berguna untuk dipergunakan sebagai alat atau
ukuran untuk:
a. Mengubah raw score menjadi Nilai Standart Sebelas (Stanel).
b. Menetapkan Nilai Batas Lulus dalam suatu tes atau seleksi.
Samsudi - STATISTIKA
19
5. Dari sejumlah 266 orang lulusan SMK yang mengikuti Tes Seleksi Penerimaan
Calon Mahasiswa Baru pada sebuah Perguruan Tinggi, berhasil dicatat sekor hasil
ujian mereka dalam mata ujian Fisika sebagai berikut:
Sekor:
90-94
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
frekuensi
4
10
14
19
30
33
40
32
25
21
18
10
6
3
1
266=N
Soal:
a. Berapakah Nilai Rata –rata hitung yang berhasil dicapai oleh 266 orang calon
yang mengikuti Tes Seleksi tersebut (dengan catatan bahwa perhitungan Nilai
Rata-rata Hitung itu hendaknya dilakukan dengan menggunakan Metode
Panjang dan Metode Singkat)?
b. Ubahlah hasil tes tersebut menjadi STANEL (Nilai Standart Sekala Sebelas),
dengan menggunakn ukuran Percentile!
c. Sekor berapa yang merupakan modus dari data tersebut diatas?
d. Jika dari jumlah 266 orang calon itu yang akan diluluskan (dinyatakan
diterima sebagai mahasiswa baru) hanya 45 orang, tetapkan Niali Batas
Lulusnya dengan menggunakan ukuran Percentile!
6. Dari kegiatan eksperimen yang dilakukan 6 kali, diperoleh sekor sebagai berikut:
Esperimen ke:
1
2
3
4
5
6
Samsudi - STATISTIKA
Sekor:
26
13
20
18
10
15
20
Carilah Nilai Rata-rata Ukur dari sekor hasil eksperimen tersebut di atas tanpa
menggunakn daftar logarithma.
BAB IV
DEVIASI RATA-RATA DAN STANDAR DEVIASI
Tujuan
Mahasiswa memiliki pemahaman tentang deviasi rata-rata dan standar deviasi
Samsudi - STATISTIKA
21
4.1. Pengukuran Variabilitas
Ada dua orang atlet loncat tinggi yang sedang dilatih untuk menghadapi
kompetisi nasional atletik. Ahmad menunjukkan loncatan yang tidak dipastikan:
kadang-kadang dia meloncat setinggi 195, tetapi kadang-kadang dia hanya dapat
meloncat setinggi 165 cm. Mahmud, sebaliknya menunjukkan loncatan yang lebih
mantap sungguhpun dia tidak pernah meloncat setinggi 195 cm, tetapi dia juga tidak
pernah meloncat serendah 165 cm. Paling rendah loncatannya adalah 171 cm, sedang
paling tinggi 189 cm. Persoalannya adalah siapa yang akan dimajukan dalam
perlombaan kejuaran nasional itu apabila hanya seorang peloncat saja yang
diperkenankan untuk dimajukan. Loncatan Ahmad agak jauh dari mean loncatannya,
dibandingkan dengan loncatan Mahmud. Dengan istilah statistika dikatakan bahwa
loncatan Ahmad mempunyai variabilitas yang lebih besar dari pada loncatan Mahmud.
Yang dimaksud dengan variabilitas adalah derajat penyebarannilai-nilai variabel
dari suatu tendensi dalam suatu distribusi. Jika dua distribusi, katakana distribusi A dan
distribusi B dibandingkan, dan distribusi A menunjukkan penyebaran nilai-nilai
variabelnya yang lebih besar dari pada distribusi B, maka dikatakan bahwa distribusi A
mempunyai variabilitas yang lebih besar dari distribusi B. Variabilitas ini juga disebut
dispersi.
Untuk memutuskan apakah Ahmad ataukah Mahmud yang harus dimajukan dalam
perlombaan kejuaraan Nasional loncat tinggi, maka pelatih membutuhkan pengukuran
variabilitas loncatan kedua orang itu. Ada beberapa macam cara untuk mencari
variabilitas. Di sini yang akan dibicarakan hanyalah yang pokok-pokok saja, yaitu Mean
Deviation, dan Standard Deviation.
4.2. Deviasi Rata-rata (Mean Deviation)
Mean Deviation atau Average Deviation atau Deviasi Rata-rata adalah rata-rata
dari deviasi nilai-nilai dari Mean dalam suatu distribusi, diambil nilainya yang absolute.
Yang dimaksud dengan deviasi absolute adalah nilai-nilai yang negatif. Secara
aritmatika mean deviasi dapat didefinisikan sebagai mean dari harga mutlak dari deviasi
nilai-nilai individual.
Yang pertama dilakukan alada menghitung Mean, kemudian ditentukan berapa
besarnya penyimpangan tiap-tiap nilai dari mean itu. Misalnya, jika seorang mempunyai
IQ 110, sedang mean IQ dari grupnya = 100, maka deviasi IQ orang tesebut adalah 110
– 100 = +10. Jika orang lain dalam grup itu mempunyai IQ 85, maka deviasi orang itu
adalah 85 – 100 = - 15. Deviasi yang bertanda plus menunjukkan deviasi di atas mean,
sedang yang bertanda minus menunjukkan deviasi di bawah mean. Akan tetapi dalam
perhitungan mean deviasi tanda minus ditiadakan. Dalam statistika, deviasi diberi
simbul dengan huruf-huruf kecil seperti x, y, d, dan sebagainya. Rumusnya adalah x =
X – M atau y = Y – M. d = D – M, dan sebagainya.
Samsudi - STATISTIKA
22
Adapun rumus dari Mean deviasi adalah :
MD
=
Di mana :
∑
x
N
MD
∑x
= Mean Deviasi
= Jumlah deviasi dalam harga mutlaknya
N
= Jumlah Individu / Kasus
Bagaimana menerapkan rumus itu untuk memperhitungkan mean deviasi dari
suatu distribusi dapat dilihat dari contoh sederhana di halaman berikut :
TABEL 4.1
TABEL CONTOH MENCARI MEAN DEVIATION
Deviasi dari Mean
Nilai Variabel
Dengan nilainya absolut
5
19
4
18
3
17
2
16
1
15
0
14
1
13
2
12
3
11
4
10
5
9
∑
-Dengan N = 11 dan
MD
=
∑
x = 30
x = 30 maka
30
= 2 , 73
11
4.3. Standard Deviasi
Secara matematik Standard Deviasi dibatasi sebagai “Akar dari Jumlah deviasi
kuadrad dibagi banyaknya individu” dalam distribusi. Untuk mencari standard deviasi
pertama-tama kita harus mencari mean ini dapat dicari dengan rumus yang sudah kita
ketahui :
∑x
M =
N
Dengan mengetahui mean ini kita dapat mencari deviasi nilai individual dari
mean. Ini dicantumkan dalam kolom kedua. Jumlah deviasi dari mean ini, yaitu Σ, x1 .
harus sama dengan NOL.
Samsudi - STATISTIKA
23
TABEL 4.2
TABEL CONTOH MENCARI STANDARD DEVIASI
Nilai
Deviasi dari
Deviasi dari
Variabel
Mean
Mean Kuadrat
(X)
(X)
(X2)
25
+5
19
16
+4
18
9
+3
17
4
+2
16
1
+1
15
0
0
14
1
-1
13
44
-2
12
9
-3
11
16
-4
10
25
-5
9
Total
7
80
Rumus stanadar deviasi sebagai berikut :
SD
∑
=
X
2
N
Dalam mana :
SD
= Standard Deviasi
2
∑x
= Jumlah deviasi Kuadrat, dan
N
= Jumlah individu / kejadian dalam distribusi
SD kadang-kadang diberi simbul ζ, disebut sigma (dari salah satu huruf Yunani), yang
diartikan Standart Devasi
4.3.1. Cara Lain Untuk Menghitung SD
Rumus untuk menghitung SD seperti yang telah dibicarakan dimuka adalah rumus
yang paling sederhana. Frekuensi dari tiap-tiap nilai tidak akan satu. Melainkan
berbeda-beda, bergerak dari bilangan 0 ke bilangan yang tak terhingga.
Rumus untuk menghitung SD dari distribusi yang tidak sama frekuensi tiap-tiap
nilai variabelnya adalah sebagai berikut :
SD =
Samsudi - STATISTIKA
∑
fx
2
N
24
Kedua rumus yang telah kita ketahui itu disebut rumus deviasi. Distribusi
demikian karena rumus itu menggunakan deviasi dari mean sebagai salah satu
komponennya. Di halaman berikut contoh mencari SD dengan rumus itu.
TABEL 4.3
TABEL UNTUK MENGHITUNG SD DENGAN RUMUS DEVIASI
X
f
fx
x
fx
fx2
38,88
10,80
+3,60
30
3
10
60,84
23,40
+2,60
81
9
9
33,28
20,80
+1,60
104
13
8
8,28
13,80
+0,60
161
23
7
3,84
9,60
-0,40
144
24
6
25,48
18,20
-1,40
65
13
5
57,60
24,00
-2,40
40
10
4
57,80
17,00
-3,40
15
5
3
∑f2 = 286,00
N = 100 ∑ fx = 640
M =
∑ fx
SD =
N
=
640
=
100
= 6,40
∑ fx
2
N
268,00
100
= 2,86
= 1,69
4.3.2. Rumus Angka Kasar
Rumusnya adalah sebagai berikut :
SD
=
∑
f 2
N
⎡
− ⎢
⎣
∑
fx ⎤
⎥
N
⎦
2
Contoh menggunakan rumus tersebut:
TABEL 4.4
CONTOH MENGGUNAKAN RUMUS ANGKA KASAR UNTUK MENCARI SD
X
f
fx
fx2
38,88
30
3
10
60,84
81
9
9
33,28
104
13
8
8,28
161
23
7
3,84
144
24
6
25,48
65
13
5
57,60
40
10
4
Samsudi - STATISTIKA
25
3
5
N = 100
∑fX = 640
∑
f
2
⎡
− ⎢
⎣
∑
⎤
⎥
⎦
fX
SD
=
SD
=
4382
100
=
43 , 82 − 40 , 96
=
2 , 86
N
15
N
⎡ 640
− ⎢
⎣ 100
⎤
⎥
⎦
57,80
∑fx2 = 4382
2
2
= 1 , 69
4.3.3. Standar Kesalahan Mean
Rumus standard kesalahan mean sangatlah sederhana. Rumus itu berbunyi
sebagai berikut :
SD
M
=
SD
N −1
Jadi, apa yang harus kita kerjakan untuk memperoleh SDM adalah: pertama,
mencari SD dari angka kasar dari sampel kita; kedua, membagi SD itu dengan akar
dari jumlah subyek dalam sampel dikurangi satu.
TABEL 4.5
TABEL CONTOH MENCARI SDM
frekuensi
fx
(f)
8,00
1
0,00
0
77,00
11
136,50
21
144,00
24
49,50
9
25,00
5
4,50
1
72
444,50
N
∑fx
Nilai
(X)
8,0
7,5
7,0
6,5
6,0
5,5
5,0
4,5
Total :
Simbul :
M =
SD
fx2
64,00
00,00
539,00
887,25
864,00
272,25
125,00
20,25
2771,75
∑ fx2
∑ fx = 444,50 = 6,17
72
N
=
∑
fx
N
2
− M
Samsudi - STATISTIKA
2
26
=
2771,75
− 6,17 2
72
= 38,4965 − 38,0689
= 0,4276
= 0,654
0,654
0,654
SD
=
=
= 0,078
SDM =
N −1
72 − 1 8,426
Soal Latihan
1. Berikan sebuah contoh sehingga menjadi cukup jelas, apa yang dimaksud dengan
deviasi!
2. Jelaskan hubungan antara deviasi Rata-rata (Average Deviation) dan deviasi Standart
(Standart deviation)!
3. Semakin kecil Deviasi Standart dari sekelompok data, maka data tersebut semakin
besifat homogen. Betulkah penyataan itu? Jelaskan denagn menggunakan sebuah
contoh!
4. Tunjukkan bahwa antara Deviasi Rata-rata dan Deviasi Standart terdapat saling
hubungan! Berikan contohnya!
5. Kemukakan beberapa keunggulan Deviasi Rata-rata dan Deviasi Standart.
6. Mean dan deviasi standart dapat dipergunakan sebagai alat bantu dalam rangka
Evaluasi Hasil Belajar Anak Didik. Jelaskan pernyataan tersebut!
7. Data yang tertera pada table berikut:
x
31
30
29
28
27
26
25
24
23
Total
f
4
4
5
7
12
8
5
3
2
50=N
fx
124
120
145
196
324
208
125
72
46
1360=ΣfX
x
x2
fx2
Soal:
a. Buatlah table distribusi frekuensinya;
b. Carilah Nilai Rata-rata Hitungnya;
c. Carilah Deviasi Rata-ratanya;
d. Carilah deviasi Standartnya dengan menggunakan cara mencari Deviasi Standart
untuk data tunggal yang sebagian atau seluruh sekornya berfrekuensi lebih dari
satu.
Samsudi - STATISTIKA
27
BAB V
uji hipotesisi perbedaan mean
Tujuan
Samsudi - STATISTIKA
28
Mahasiswa memiliki pemahaman tentang hipotesis, pengujian hipotesis perbedaan
antara dua mean dan standar kesalahan perbedaan dua mean
Beberapa ahli statistika menyarankan agar diadakan pembedaan antara statistika
inferensial yang bertugas mengadakan estimasi dengan statistik inferensial yang
bertugas mengadakan pengujian hipotesis. Statistik inferensial untuk estimasi terutama
mencurahkan perhatian pada kegiatan mengadakan estimasi tentang parameter dari
penelitian terhadap sampel yang baik. Dengan sampel yang baik dimaksudkan (a)
sampel yang diambil secara random; dan (b) sampel yang setujuposional jika populasi
terdiri dari sub-sub golongan.
5.1. Pengertian Hipotesis
Istilah hipotesis sebenarnya adalah kata majemuk, terdiri dari kata-kata hipo dan
tesis. Hipo berasal dari kata Junani hupo, yang berarti dibawah, kurang atau lemah.
Tesis berasal dari kata Junani thesis, yang berarti teori atau setujuporsi yang disajikan
sebagai bukti. Hipotesis adalah pernyataan yang masih lemah kebenarannya dan masih
perlu diuji kenyataannya. Jika suatu hipotesis telah diuji kebenarannya, namanya bukan
lagi hipotesis, melainkan suatu tesis.
Suatu hipotesis akan diterima kalau data-data dan bahan-bahan penelitian
membenarkan pernyataan itu. Dan akan ditolak jika kenyataan menyangkalnya. Pada
gilirannya suatu tesis dapat dipandang sebagai hipotesis kalau oleh suatu alasan suatu
penelitian masih menginginkan mengujinya kembali.
5.2. Menyatakan Hipotesis
Apabila akan diadakan penelitian komparatif tentang kecerdasan (atau variabelvariabel lainnya) wanita dan pria, kita dapat menyatakan hipotesis dalam bentuk yang
bermacam-macam:
(1) Pria lebih cerdas dari pada wanita.
(2) Wanita lebih cerdas dari pada peria.
(3) Wanita dan pria sama cerdasnya.
(4) Tidak ada perbedaan kecerdasan antara pria dan wanita.
(5) Wanita lebih cerdas dalam bidang A, tetapi pria lebih cerdas dalam bidang B.
(6) Wanita dan pria sama cerdasnya dalam bidang A, tetapi wanita lebih cerdas dalam
bidang B.
Tiap-tiap hipotesis selalu dinyatakan dalam bentuk statemen atau pernyataan,
bukan dalam bentuk pertanyaan. Hipotesis yang paling sederhana, setidak-tidaknya dari
teoritik, adalah apa yang disebut hipotesis nihil atau null hypothesis. Istilah nihil di sini
Samsudi - STATISTIKA
29
menunjuk kepada tidak adanya perbedaan antara sampel yang satu dengan sampel
lainya dalam sesuatu hal yang diteliti.
5.3. Menguji Hipotesis-Perbedaan Antara Dua Mean
Tujuan suatu eksperimen adalah mencari pengaruh dari perlakuan yang
dibedakan. Jadi misalnya kalau kita mengadakan eksperimen tentang akibat
kepemimpinan yang demokratik dan kepemimpinan yang otokratik, kita
memperlakukan suatu kelompok dengan pemimpin yang demokratik dan kelompok lain
dengan pemimpin yang otokratik. Kemudian kita cari ada tidaknya perbedaan antara
tingkah laku kedua kelompok itu. Tiap-tiap eksperimen akhirnya harus membandingkan
sedikitnya dua kelompok dalam segi-segi yang dieksperimenkan.
5.4. Standar Kesalahan Perbedaan Mean
Apabila kita ambil sepasang sampel yang masing-masing terdiri dari anak-anak
laki-laki dan perempuan dan kita hitung mean-meannya, kita memperoleh perbedaan
mean antara kedua sampel dari kedua jenis kelamin itu. Demikian seterusnya, kita dapat
mengambil pasangan-pasangan sampel lain dari kedua jenis kelamin itu, kita akan
memperoleh distribusi perbedaan mean. Distribusi ini disebut distribusi sampling
distribution of the mean differences, atau distribusi sampling daripada perbedaan
mean. Statistik untuk ini disebut standard kesalahan perbedaan, yang tidak lain dan
tidak bukan adalah SD dari pada perbedaan-perbedaan. Standard kesalahan perbedaan
mean diberi simbul SD (M1 – M2) atau disingkat saja SDbM.
Rumus standard kesalahan perbedaan mean:
SD
bM
=
SD
2
M
+ SD
1
2
M
2
Keterangan:
= Standard Kesalahan Perbedaan Mean.
SDbM
SD
2
M1
= KUADRAT Standard kesalahan mean dari sampel I, Disebut juga
varians mean sampel I.
SD
2
M2
= KUADRAT Standard kesalahan mean dari sampel II, Disebut juga
varians mean sampel II.
Untuk mencari standard kesalahan mean rumusnya adalah:
− SD
atau jika dikuadradkan menjadi
SD M =
N −1
SD 2
2
SD M =
N − 1
Contoh:
TABEL 5.1
TABEL DISTRIBUSI HASIL UJIAN SEMESTER SISWA LAKI-LAKI DAN PEREMPUAN
Samsudi - STATISTIKA
30
Interval
x
52
47
42
37
32
27
22
17
12
7
-
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
Total :
LAKI-LAKI
f
fx
0
0
235
5
294
7
407
11
128
4
351
13
286
13
204
12
192
16
0
0
81
2.097
fx
2
y
52
47
42
37
32
27
22
17
12
7
-
0
11.045
12.348
15.059
4.096
9.477
6.292
3.468
2.304
0
64.089
PEREMPUAN
f
fy
fy2
2.704
52
1
2.209
47
1
15.876
378
9
6.845
185
5
7.168
224
7
8.748
324
12
3.388
154
7
4.624
272
16
2.880
240
20
147
21
3
81
1.897
54.589
Dengan kode x untuk laki-laki dan y untuk perempuan, maka statistiknya adalah
sebagai berikut :
∑
Mx =
SD
fx
N
=
2
M
=
∑
2 .007
= 25 ,89
81
fx
− M M2
N M
84 .089
=
− 25,89
81
= 791, 22 − −670 , 29
= 120 ,93
2
Mx
SD
SDM2
120,93 120,93
=
=
=
= 1,51
N X − 1 81 − 1
80
My =
SDy2 =
∑ fy = 1.897 = 23,42
81
Ny
∑
fy
2
Ny
− M Y2
SD M2 =
=
SD Y2
N
−1 =
y
125 , 44
81 − 1
125 , 44
= 1, 57
80
54.589
− 23,422
81
= 673,94 − 548,50
=
= 125,44
SDbM = SDM2 X + SDM2 y
=
1 , 51 + 1 , 57
=
3 , 08
= 1 , 75499
Samsudi - STATISTIKA
31
Soal Laihan
1. Data tes kecerdasan siswa yang masuk pagi dan masuk siang:
Interval
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
Total :
x
50
42
41
37
32
25
22
17
12
7
-
Masuk pagi
fx
0
5
7
11
4
13
13
12
16
0
81
f
fx2
y
52
47
42
35
32
25
22
17
12
7
-
f
Masuk siang
fy
fy2
1
1
9
5
7
12
7
16
20
3
81
Hitunglah:
a. Mean masing-masing variabel
b. Standar deviasi
c. Standar deviasi perbedaan mean dari dua variabel
Samsudi - STATISTIKA
32
BAB VI
TEKNIK ANALISIS KORELASIONAL
Tujuan
Mahasiswa memiliki pemahaman tentang teknik-teknik korelasi dalam analisis
statistika yang meliputi: arah hubungan, koefisien korelasi, korelasi product,
moment dan uji taraf signifikansi
Samsudi - STATISTIKA
33
Salah satu teknik statistika yang sering digunakan untuk mencari hubungan
antara dua variabel adalah teknik korelasi. Dua variabel yang hendak diteliti
hubungannya itu biasa diberi kode varaibel X dan variabel Y. Jadi misalnya, kita ingin
menetapkan apakah ada hubungan atau tidak antara tinggi badan dan kecerdasan,
variabel tinggi badan kita beri kode X, sedang variabel kecerdasan kita sebut Y, atau
sebaliknya.
6.1. Arah Hubungan
Jika kenaikan nilai variabel X selalu disertai kenaikan nilai variabel Y, dan
sebaliknya turunnya nilai variabel x selalu diikuti oleh turunnya nilai varaibel y, maka
hubungan semacam itu disebut hubungan yang positif. Namun sebaliknya jika kenaikan
nilai variabel X yang tinggi selalu disertai oleh turunnya nilai variabel Y, atau jika
turunnya nilai variabel X selalu diikuti oleh naiknya nilai varaibel Y, hubungan antara
kedua variabel tersebut disebut bersifat negatif.
Perlu diketahui, ada juga kemungkinannya bahwa kedua variabel itu tidak
mempunyai hubungan, atau dalam istilah teknis statistika dikatakan mempunyai
hubungan yang nihil, jika kenaikan variabel yang satu kadang-kadang disertai turunnya
nilai variabel lainnya, dan kadang-kadang juga diikuti oleh kenaikan nilai variabel yang
lain tersebut.
6.2. Koefisien Korelasi
Pada umumnya besar-kecilnya hubungan dinyatakan dalam bilangan. Bilangan
yang menyatakan besar-kecilnya hubungan itu disebut koefisien hubungan atau
koefisien korelasi. Koefisien korelasi itu bergerak diantara 0,000 sampel +1,000 atau di
antara 0,000 sampai -1,000, tergantung kepada arah korelasi, nihil, positif, dan negatif.
Salah Satu sarat yang perlu diperhatikan dalam penggunaan teknik korelasi
adalah bahwa hubungan antara x dan y adalah hubungan yang linier. Artinya jika kita
buat scatter diagram (diagram pencaran) dari nilai-nilai variabel x dan nilai-nilai
varaibel y, maka dapat kita tarik garis lurus pada pencaran titik-titik kedua nilai
variabel itu.
6.3. Korelasi setujuduct Moment dan Cara Menghitungnya
Sebenarnya ada berbagai macam teknik statistik yang digunakan untuk mencari
korelasi. Tetapi satu diantaranya yang dikembangkan oleh KARL PEARSON dan
Samsudi - STATISTIKA
34
disebut teknik korelasi prouduct moment dari PEARSON. Rumus koefisien korelasi
product moment adalah:
rxy =
Di mana :
rxy
xy
SDx
SDy
N
∑ xy
N.SDx SDy
= Koefisien korelasi antara x dan y
= setujuduct dari x kali y
= Standard deviasi dari varaibel x
= Standard deviasi dari variabel y.
= Jumlah subyek yang diselidiki
Contoh menghitung korelasi product moment:
TABEL 6.1
KOEFISIEN KORELASI
ANTARA VARAIBEL KEMAMPUAN BERBAHASA (X) DAN MATEMATIK (Y)
Subyek
Kemamp.
Matematik
Subyek
Kemamp.
Matematik
No.
Berbahasa
(Y)
No.
Berbahasa
(Y)
(X)
(X)
1.
130
20
16.
178
35
2.
132
24
17.
172
30
3.
152
28
18.
165
28
4.
142
23
19.
160
27
5.
184
37
20.
148
25
6.
190
32
21.
180
24
7.
150
25
22.
149
25
8.
170
23
23.
188
36
9.
181
29
24.
167
29
10.
164
35
25.
162
27
11.
175
32
26.
145
23
12.
135
22
27.
150
29
13.
147
24
28.
160
30
14.
162
26
29.
172
31
15.
136
21
30.
154
30
Langkah-langkah menghitung koefisien korelasi dengan rumus di atas adalah :
1. Cari mean dari kedua variabel yang bersangkutan sebut kedua mean itu Mx dan My.
2. Cari SD dari kedua varaibel itu. Sebut kedua SD itu SDx dan SDy.
3. Cari deviasi-deviasi tiap-tiap nilai kedua variabel itu. Sebut –x untuk deviasi
variabel x dan y untuk variabel Y. Jangan lupa mengecek:
∑x=0
dan
∑
y = 0
4. Kalikan tiap-tiap x dengan tiap-tiap y yang sebaris, dan masukkan dalam kolom xy,
dan
Samsudi - STATISTIKA
35
5. Jumlahkan kolom xy untuk memperoleh
Subyek
(1)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
Total :
∑ xy .
TABEL 6.2
TABEL UNTUK MENGHITUNG KOEFISIEN KORELASI
PRODUCT MOMENT, BAHAN DIAMBIL DARI TABEL 6.1
y
y2
x
y
x
x2
(2)
(3)
(4)
(5)
(6)
(7)
130
20
-30
900
-8
64
132
24
-28
784
-4
16
152
28
-8
64
0
0
142
23
-18
324
-5
25
184
37
+24
576
+9
81
190
32
+30
900
+4
16
150
25
-10
100
-3
9
170
23
+10
100
-5
25
181
29
+21
441
+1
1
184
35
+4
16
+7
49
175
32
+15
225
+4
16
135
22
-25
625
-6
36
147
24
-13
169
-4
16
162
26
+2
4
-2
4
136
21
-24
576
-7
49
178
172
165
160
148
180
149
188
167
162
145
150
160
172
154
4.800
Samsudi - STATISTIKA
35
30
28
27
25
34
25
36
29
27
23
29
30
31
30
840
+18
+12
+5
0
-12
+20
-11
+28
+7
+2
-15
-10
0
+12
-6
0
324
144
25
0
144
400
121
784
49
4
225
100
0
144
36
8.304
+7
+2
0
-1
-3
+6
-3
+8
+1
-1
-5
+1
+2
+3
+2
0
49
4
0
1
9
36
9
64
1
1
25
1
4
9
4
624
xy
(8)
+240
+112
0
+90
+216
+120
+30
-50
+21
+28
+60
+150
+52
-4
+168
+126
+24
0
0
+36
+120
+33
+224
+7
-2
+75
-10
0
+36
-12
+1890
36
Dengan tabel di atas dapat kita peroleh data sebagai berikut:
Variabel Kemampuan Berbahasa
Variabel Matematik
1. N = 30
∑x
∑Y
2. M x =
2. M Y =
N
N
4.800
840
=
= 160
=
= 28
30
30
3. SDx =
=
∑x
2
3. SDy =
N
8.304
= 16,64
30
=
4.
∑ xy = 1.890
∑y
2
N
624
= 4,56
30
Besarnya koefisien korelasi:
1.890
∑ xy =
= 0,830
rxy =
N .SDx SDy (30)(16,64)(4,56)
6.4. Uji Taraf Signifikansi
Tabel korelasi itu mencantumkan batas-batas nilai r yang signifikan (berarti)
pada taraf-taraf signifikansi tertentu. Jika nilai r yang kita peroleh sama dengan atau
lebih besar dari pada nilai r dalam tabel r itu, maka nilai r yang kita peroleh itu
signifikan. Dengan nilai r yang signifikan kita akan menolak hipotesis yang
mengatakan bahwa korelasi antara x dan y dalam populasi adalah nul, atas dasar taraf
signifikansi yang kita gunakan (yaitu 5% atau 1%).
Nilai yang kita peroleh adalah 0,830. Dengan nilai f itu kita hendak menguji
apakah nilai itu signifikan ataukah tidak atas dasar taraf signifikan 5%. Jumlah subyek
atau N yang diselidiki ada 30. dengan melihat N = 30 dalam kolom N dan membacanya
kekanan dalam kolom taraf signifikansi 5% dakan tabel r maka kita ketemukan bilangan
0,361. Bilangan ini menunjukkan bilangan batas signifikansi. Oleh karena nilai r yang
kita peroleh, yaitu 0, 830 berada jauh di atas batas signifikansinya, yaitu 0,361, maka
nilai r yang kita peroleh itu kita katakan signifikan. Dengan demikian kita menolak
hipotesis nihil yang mengatakan bahwa nihil r dalam populasi adalah nul (tidak ada
korelasi antara x dan y, atau tegasnya tidak ada korelasi antara pengetahuan umum dan
matematik).
Soal Latihan
1. Berikan pengertian tentang kolerasi!
2. Apa yang dimaksud dengan kolersi positif dan kolerasi negatif!
Samsudi - STATISTIKA
37
3. Jelaskan difinisi tentang angka Indeks kolerasi!
4. Jelaskan tentang pengertian dan penggunaan dari teknik Kolerasi Product Moment
dan Pearson!
5. Data:
Subyek:
Sekor pada Variabel:
X
Y
A
8
5
B
4
5
C
6
7
D
5
6
E
7
6
F
4
5
G
9
6
H
6
7
I
5
6
J
6
7
Soal: Selidikilah dengan secara seksama, apakah memang terdapat korelasi positif
yang signifikan antara sekor variabel X dan sekor variabel Y, dengan cara:
a. Merumuskan hipotesis alternatifnya
b. Merumuskan hipotesa Nihilnya
c. Melakukan perhitungan untuk memperoleh angka Indeks Korelasi rxy, dengan
mencari SD-nya lebih dulu!
d. Memberikan interpretasi sederhana (secara kasar) terhadap rxy.
e. Memberikan interpretasi terhadap rxy dengan cara berkonsultasi pada Tabel
Nilai “r” Product moment.
f. Kesimpulan apa yang dapat saudara kemukakan?
6. Data:
Sekor Variabel X:
67
72
66
70
73
72
70
73
74
66
72
73
70
72
70
68
79
66
68
71
73
71
73
69
68
66
72
71
71
60
68
67
69
70
71
Sekor Variabel Y (Urutan sama dengan variabel Y):
59
64
58
62
65
64
62
65
66
58
64
65
62
64
62
60
60
58
60
63
65
63
65
61
60
58
64
63
65
60
62
60
59
64
66
69
73
67
70
72
71
71
69
69
69
69
72
72
68
72
61
65
59
62
63
63
63
61
61
59
61
64
64
60
60
Soal:
Coba selidiki dengan cara seksama, apa memang terdapat kolerasi positif yang
menyakinkan (signifikan) antara sekor variabel X dan sekor variabel Y, dengan cara:
Samsudi - STATISTIKA
38
a. Merumuskan Hipotesis alternative
b. Merumuskan Hipotesa Nihilnya!
c. Melakukan perhitungan untuk memperoleh Angka Indeks Kolerasi “r” Product
Moment, dengan Tabel Nilai “r”!
d. Memberikan interpretasi terhadap rxy denagn menggunakan Tabel nilai “r”!
e. Menarik Kesimpulan.
7. Dalam suatu kegiatan penelitian, diperoleh data sebagaimana tertera dalam table
berikut:
Sekolah Asal dan Prestasi Tes SIPENMARU dari 1760 Calon
Prestasi Tes
Sekolah Asal:
Jumlah
SIPENMARU:
SLTA Negeri
SLTA Swasta
Lulus
270
470
740
Tidak Lulus
180
840
1020
Jumlah
450
1310
1760
Soal:
a. Rumuskan hipotesis alternatif dan hipotesis nihilnya!
b. Cari / Hitunglah Angka Indeks Korelasinya, dengan menggunakan Teknik Korelasi
Koefisien Phi.
c. Berikan interpretasi terhadap Phi dan kemukakan kesimpulannya
Samsudi - STATISTIKA
39
BAB VII
TEKNIK ANALISIS KOMPARASIONAL
Tujuan
Mahasiswa mampu menerapkan teknik Chi-Kuadrat dan t-score sebagai alat uji
hipotesis dalam teknik analisis komparasional.
Samsudi - STATISTIKA
40
7.1. Chi Kuadrad
Teknik analisis Chi-Kuadrat digunakan jika peneliti lebih berminat meneliti
frekuensi individu-individu yang termasuk dalam sesuatu kategori sifat atau ciri gejala
dengan jalan penghitungan atau counting. Chi-Kuadrat (baca Kai Kuadrat) adalah suatu
teknik statistika yang memungkinkan peneliti menilai perbedaan frekuensi yang nyata
diobservasi, dengan frekuensi yang diharapkan dalam kategori-kategori tertentu
sebagai akibat dari kesalahan sampling. Sebagai bagian dari statistika inferensial chi
kuadrad dapat digunakan untuk mengadakan estimasi maupun untuk pengetesan
hipotesis. Di bawah ini secara berturut-turut akan dibicarakan lebih dahulu Chi Kuadrat
untuk estimasi, kemudian disambung dengan Chi Kuadrat untuk pengetesan hipotesis.
7.1.1. Chi-Kuadrat Sebagai Alat untuk Estimasi
Jika kita ingin mengetahui sikap rakyat terhadap koedukasi (sekolah campuran
murid-murid puteri dan putersa). Untuk ini kita mengambil suatu sampel yang terdiri
dari 200 orang dan mengajukan pertanyaan kepada mereka untuk memperoleh pendapat
mereka. Kita misalkan jawaban mereka adalah 115 orang mengatakan setuju dan 85
orang mengatakan tidak setuju.
Dalam contoh di atas, kalau tidak ada sumber-sumber lain yang memberi
ketentuan, kita mengajukan hipotesis bahasan dalam populasi frekuensi dari mereka
yang setuju dan tidak setuju koedukasi terbagi rata (50% lawan 50%). Kita
menanyakan, mengapa kita peroleh perbandingan 115 dengan 85 antara mereka yang
setuju dan yang tidak setuju dari suatu sampel yang kita ambil secara random? Apakah
perbedaan itu hanya semata-mata disebabkan oleh kesalahan sampling, ataukah
memang dalam populasi terdapat perbedaan semacam itu?
Kalau kita mengharapkan frekuensi dari mereka yang setuju dan yang tidak
setuju terbagi rata, maka frekuensi yang diharapkan adalah yang setuju 100 orang
dan yang tidak setuju 100 orang, dalam sampel yang jumlahnya 200 orang itu.
Frekuensi yang diperoleh (disingkat fo) dan frekuensi yang diharapkan (disingkat fh)
dari mereka yang setuju dan yang tidak setuju dapat ditunjukkan dalam tabel sebagai
berikut:
TABEL 7.1
Samsudi - STATISTIKA
41
FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN
frekuensi
frekuensi
Sikap terhadap
Yang diperoleh
Yang diharapkan
Ke-edukasi
(fo)
(fh)
Setuju
115
100
Tidak setuju
85
100
Total :
200
200
Syarat yang perlu dipenuhi adalah jumlah fo harus sama dengan fh. Dalam tabel
di atas ketentuan ini telah kita indahkan, yaitu masing-masing fo = 200 dan fh = 200.
7.1.2. Rumus untuk Menghitung Chi-Kuadrat
Rumus umum Chi Kuadrat adalah sebagai berikut :
χ
2
=
∑
( fo
− fh )
fh
2
Dimana :
χ2
fo
fh
= Chi Kuadrat
= frekuensi yang diperoleh (diobservasu dalam)sampel
= frekuensi yang diharapkan dalam sampel sebagai
pencerminan dari frekuensi yang diharapkan dalam
populasi.
Tabel kerja persiapan perhitungan Chi Kuadrat sebagai berikut:
TABEL 7.2
TABEL KERJA PERHITUNGAN CHI KUADRAT
Sikap
Pro
tidak
setuju
Total :
fo
fh
115
85
100
100
200
200
fo-fh
(fo-fh)
+15
-15
225
225
0
-
2
(f
− fh )
fh
2
o
2,25
2,25
4,50
Dari angka-angka dalam table di atas, didapat nilai Chi Kuadrat:
( f o − f h )2 = 4 , 50
χ 2 = ∑
fh
7.1.3. Derajat Kebebasan untuk Chi-Kuadrat
Derajat kebebasan atau d.b untuk nilai-nilai χ2 tidak tergantung kepada jumlah
individu dalam sampel. Derajad kebebasan itu diperoleh dari kenyataan berapa
banyaknya kebebasan yang kita miliki dalam menetapkan isi petak-petak yang
diharapkan dalam tabel kita. Untuk memahami hal ini dapat dilihat tabel berikut:
Samsudi - STATISTIKA
42
Kategori
fO
fh
I
II
Jumlah :
a
b
c
(a+b)
d
(m+n)
Derajad kebebasan untuk bentuk tabel di atas adalah 1. Dengan d.b = 1 maka
untuk taraf signifikansi 5%, berlaku ketentuan jika χ O2 ≥ χ B2 5%, nilai Chi Kuadrat
yang kita peroleh, atau χ2 itu kita katakan signifikan; dan sebagai konsekuensinya
hipotesis (nihil) akan kita tolak. Sebaliknya jika χ o2 < χ b2 5% nilai χ2 itu kita katakan
nonsignifikan, dan berbagai konsekwensinya hipotesis (nihil) akan kita terima.
Nilai χ 02 = 4,50 sedang taraf signifiknsi 5% dengan d.b. = 1, nilai χ h2 = 3,841 .
Dengan demikian χ 02 itu signifikansi, karena ia sudah melebihi χ h2 yang kita pandang
sebagai bilangan χ2 maksimal sebagai akibat dari kesalahan sampling atas dasar taraf
signifikansi 5%. Konsekwensinya, jika kita yakin bahwa sarat sampel random telah kita
penuhi, maka kita tolak hipotesis nihil yang mengatakan bahwa separo dari populasi
setuju koedukasi dan separo lagi tidak setuju.
7.1.4. Chi-Kuadrat Sebagai Alat untuk Pengujian Hipotesis
Chi-Kuadrat juga dapat digunakan untuk menguji hipotesis, yakni untuk
menguji apakah perbedaan frekuensi yang diperoleh dari dua sampel (atau lebih)
merupakan perbedaan frekuensi yang hanya disebabkan oleh kesalahan sampling,
ataukah merupakan perbedaan yang signifikan. Di bawah ini diberikan contoh-contoh
tentang bagaimana menguji hipotesis perbedaan frekuensi yang signifikan atau tidak.
Contoh
Suatu penelitian dilakukan dengan tujuan untuk mengetahui apakah ada
hubungan atau tidak antara kualifikasi pendidikan (S1 dan SLTA) dengan cara
mengikuti berita-berita di media masa. Untuk ini diberikan daftar pertanyaan atau
angket kepada dua sampel, yaitu sampel tamatan sekolah tinggi dan sampel tamatan
sekolah menengah. Kepada mereka ditanyakan, apakah mereka mengikuti berita-berita
dengan perantaraan radio ataukah surat kabar. Dari 200 orang tamatan sekolah tinggi
yang ditanyai, 130 orang menjawab melalui “radio” sedang dari 100 orang tamatan
SMA ada 55 orang yang menjawab melalui “radio”. Data tersebut dapat dihimpun
dalam tabel kerja sebagai berikut:
TABEL 7.3
TABEL FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN
Sampel
Samsudi - STATISTIKA
Radio
Sumber berita
Surat Kabar
Total
43
Tamatan S1
Tamatan SLTA
Total
130
55
185
70
45
115
200
100
300
Hipotesis nihil untuk masalah di atas adalah: “tidak ada perbedaan yang
signifikan antara frekuensi sampel I (tamatan S1) dengan frekuensi sampel II (tamatan
SLTA) dalam memilih sumber-sumber berita. Kita lihat dalam tabel itu bahwa ada 185
orang dari 300 orang yang memilih radio sebagai sumber berita (atau dinyatakan dalam
per se n ada 61,67 %), dan ada 115 orang dari 300 orang yang memilih surat kabar (atau
dinyatakan dalam per se nada 38,33%). Persentase-persentase itulah yang kita gunakan
sebagai dasar menetapkan frekuensi yang kita harapkan bagi sampel tamatan sekolah
menengah atas ada 61,67% dari 100 orang, ada 61,67 orang. Atas dasar data tersebut
dibuat table kerja sebagai berikut:
TABEL 7.4
TABEL KERJA UNTUK MENGETES PERBEDAAN FREKUENSI
Sampel
Sekolah
Tinggi
Sekolah
Menengah
Atas
Total :
Sumber
Berita
Radio
Surat Kabar
Radio
Surat
Kabar
2
fo
fh
fo-fh
(fo-fh)
130
70
55
45
123,33
76,67
61,67
38,33
+6,67
-6,67
-6,67
+6,67
44,49
44,49
44,49
44,49
300
300,00
0,00
-
(f
− fh )
fh
0,36
0,58
0,72
1,16
2
o
2,82
Jadi nilai Chi Kuadrat yang kita peroleh adalah :
χ =
2
∑
( fO
− fh )
= 2 ,82
fh
2
Dari Tabel di atas 2x2 (dengan 2 baris dan 2 kolom semacam itu derajad
kebebasan diperoleh dari rumus d.b. = (b-1) (k-1) dalam mana d.b. = derajad kebebasan,
b = baris, dan k = kolom. Atau riilnya, untuk tiap-tiap tabel 2x2 d.b. nya = satu,
diperoleh dari (2-1) (2-1). Berdasarkan hasil Chi Kuadrat = 2,82 menunjukkan bahwa
baik atas dasar taraf signifikansi 5% maupun 1% perbedaan frekuensi yang diperoleh
itu tidaklah signifikan. Konsekwensinya adalah hipotesis nihil yang diajukan, yaitu
bahwa tidak ada perbedaan yang signifikan dalam frekuensi pilihan sumber-sumber
berita dari tamatan S1 dan tamatan SLTA diterima.
7.2. t-Score
Pada dasarnya t-score tidak lain adalah z-score hanya saja di sini kita tidak lagi
menghadapi distribusi angka kasar, melainkan distribusi perbedaan. Inilah sebabnya
Samsudi - STATISTIKA
44
mengapa yang dijadikan x bukan sesuatu angka kasar, tetapi angka perbedaan mean,
kedua sampel yang diteliti. Lengkapnya t-score itu adalah sebagai berikut :
t =
Dimana :
Mx
My
Mh
SDbM
Mx −M
y
−Mh
SD bM
= Mean dari sampel x
= Mean dari sampel y
= Mean hipotetik dari distribusi perbedaan mean
= Standard kesalahan perbedaan mean
Oleh karena Mh = 0, maka rumusnya mejadi:
t =
M
x
− M
y
SD bM
Sebagai contoh, data pada tabel 6.1, mean-mean yang kita peroleh adalah 25,89 dan
23,42 dengan SDbM = 1,75499. Jika kita mengisikan bilangan-bilangan itu ke dalam
rumus t- score, akan kita peroleh:
t=
M
x
− M
SD bM
y
=
25 ,89 − 23 , 42
2 , 47
=
= 1, 407
1, 75499
1, 75499
Jika kita menggunakan taraf kepercayaan atau taraf penerimaan 95% (lebih
sering disebut taraf signifikansi 5%), maka kita tidak mempunyai bukti-bukti untuk
menolak hipotesis “bahwa tidak ada perbedaan antara kecerdasan murid-murid putera
dan murid-murid puteri yang kita teliti”. Atau dengan perkataan lain boleh dinyatakan
bahwa berdasarkan bukti-bukti yang dikumpulkan ternyata bahwa antara kedua jenis
kelamin itu dengan taraf kepercayaan 95% tidak terdapat perbedaan dalam hal
kecerdasan sebagaimana ditunjukkan oleh hasil test kecerdasan.
7.2.1. t-Test Untuk Sampel-Sampel yang Berkorelasi
t-Test sering juga digunakan dalam eksperimen-eksperimen yang menggunakan
sampel-sampel yang berkorelasi (correlated samples). Yang dimaksud dengan sampelsampel berkorelasi adalah sampel-sampel yang sudah disamakan (di-matched) salah
satu variabel (mungkin juga dua tiga variabelnya atau lebih). Misalnya saja, koefisien
kecerdasan atau IQ lebih diketahui mempunyai pengaruh terhadap prestasi belajar.
Dalam eksperimen-eksperimen yang menyangkut prestasi belajar, misalnya tentang
Samsudi - STATISTIKA
45
pengaruh metode belajar, misalnya tentang pengaruh metode terhadap prestasi sesuatu
mata pelajaran, maka IQ anak-anak yang ditugaskan dalam kelompok eksperimen dan
kelompok kontrol disamakan (dianggap) lebih dahulu. Maksudnya agar jika ada
perbedaan-perbedaan prestasi belajar dari eksperimen itu, dapat disimpulkan bahwa
perbedaan-perbedaan tersebut semata-mata ditimbulkan oleh perbedaan metode-metode
yang dieksperimenkan, bukan perbedaan yang diakibatkan oleh perbedaan IQ dari anakanak yang ditugaskan dalam kelompok eksperimen dan kelompok kontrol.
Ada dua rumus yang dipersiapkan untuk meneliti signifikansi perbedaan mean
dari sampel-sampel yang berkorelasi. Kedua rumus ini akan memberikan hasil yang
sama. Cuma saja rumus yang satu, disebut rumus panjang atau Long method, melalui
jalan yang melingkar-lingkar, sedang rumus yang satunya lagi, dibuat rumus pendek
atau short method, melalui jalan yang langsung dan singkat. Kedua rumus itu berbunyi :
RUMUS PANJANG :
t=
Mk − Me
(SD
2
Mk
+ SD
2
Me
) − 2r (SD )(SD )
ke
Mk
Me
Di mana :
SDM2 k =
SDk2
Nk − 1
SDM2 e =
SDe2
Ne − 1
rke =
k = Kelompok Kontrol
∑ ke
(∑ k )(∑ e )
2
e = Kelompok eksperimen
2
RUMUS PENDEK :
t=
Mk − Me
∑b
2
N ( N − 1)
Untuk segera dapat diketahui penggunaan dari kedua rumus itu akan diberikan
contoh-contohnya. Sekedar catatan perlu diberikan lebih dahulu.
1. Rumus panjang, diperuntukan bagi penelitian eksperimental yang menggunakan
method subjects designs, yaitu eksperimen yang menggunakan kelompok
eksperimen dan kelompok control yang sudah disamakan subyek demi subyek
sebelum eksperimen dijalankan. Yang disamakan adalah satu variabel (atau
lebih) yang telah diketahui mempunyai pengaruh terhadap hasil eksperimen,
yaitu variabel diluar variabel atau faktor yang dieksperimenkan.
Samsudi - STATISTIKA
46
2. Rumus pendek, adalah rumus yang serba guna dan efisien. Rumus ini
dipersiapkan untuk menyelesaikan penelitian eksperimen yang menggunakan
matched subjects designs. Seperti yang disebutkan dalam angka (1) diatas
dengan cara yang lebih singkat dan efisien. Kecuali itu rumus ini juga
disediakan untuk menganalisa eksperimen yang menggunakan designs
treatments by subjecte. Ini adalah eksperimen yang menggunakan hanya satu
kelompok (one group experiment) yang sekaligus menjadi kelompok
eksperimen dan kelompok kontrol pada periode-periode eksperimen yang
berlainan.
Contoh Penggunaan Rumus Pendek
TABEL 7.5
TABEL PERSIAPAN UNTUK T-TEST SAMPEL-SAMPEL
YANG BERKORELASI DENGAN RUMUS PENDEK
Pasangan
Subyek
K-E
(1)
1 – 12
2 – 14
3 – 15
4 – 17
5 – 15
6 – 16
7 – 13
8 – 20
9 – 19
10 - 18
Total
MB =
∑B
N
− 4,0
=
10
= −0,4
Harus dicek :
∑B = ∑K − ∑E
K
E
K2
E2
KE
(2)
5,0
5,8
5,8
6,3
6,3
6,5
6,9
7,2
7,4
7,8
65,0
(3)
5,2
6,5
4,9
7,8
6,6
7,5
6,1
8,3
8,1
8,0
69,0
(4)
-0,2
-0,7
+0,9
-1,5
-0,3
-1,0
+0,8
-1,1
-0,7
-0,2
-4,0
(5)
+0,2
-0,3
+1,3
-1,1
+0,1
-0,6
+1,2
-0,7
-0,3
+0,2
0,0
- (6)
0,04
0,09
1,69
1,21
0,01
0,36
1,44
0,49
0,09
0,04
5,46
b = B - MB
Dan
∑ b = 0,0
Samsudi - STATISTIKA
47
Dimasukkan ke dalam rumus:
t=
Mk − Me
∑b
2
N ( N − 1)
=
6,5 − 6,9
=
5,46
10
6,4
0,4
=
= 1,624
0,0606 0,246
Selanjutnya pekerjaan-pekerjaan perhitungan lainnya sama sepenuhnya dengan
contoh yang diberikan sebelumnya, demikian juga interpretasi dari hasilnya.
Soal Latihan
1. Jelaskan pengertian yang tekandung dalam istikah “Teknik Analisa Komparasional”!
2. Apa yang dimaksud dengan “Teknik Analisa Komparasional Bivarian” dan “Taknik
Analisa Komparasional Multivarian”? Kemukkakan contohnya!
3. Jelaskan perbedaan pokok antara Tes “t” dan tes Kai Kuadrat sebagai Taknik analisa
Komparasional Bivariat!
4. Barilah penjelasan tentang prosedur yang perlu kita tempuh dalam rangka
memberikan interpretasi terhadap Kai kuadrat.
5. Dalam keadaan bagaimana sebuah Ho yang menyatakan tidak adanya perbedan yang
signifikan antara fo dan ft disetujui?
6. Buatlah sebuah ikhtisar tentang berbagai kegunaan Tes Kai Kuadrat dalam Praktek
kehidupan sehari hari, terutama dalam kegiatan penelitian di bidang pendidikan.
7. Data:
Diketahui:
N =25;
MD = 0,45;
S
DD = 0,83;
Soal :
a. Carilah “t”
b. Berikan interpretasi terhadap “to” dengan berkonsultasi Tabel Harga Kritik “t”,
pada taraf signifikansi 5%.
8. Data:
N2= 82;
Diketahui :
N1 = 65;
M1= 76,44; M2= 75,14;
SD1= 10,66; SD2= 12,59;
Soal:
a. Hitunglah “t”
b. Berikan interpretasi terhadap “to” denagn berkonsultasi pada table Harga Kritik
“t”, pada taraf signifikansi 5%.
9. Data:
N2 = 20
Diketahui :
N1 = 20
ΣX22= 160
ΣX12= 180
Σx1 = 24
Σx2 = 22
Samsudi - STATISTIKA
48
Soal:
a. Carilah “t” dengan menggunakan rumus dari fisher!
b. Berikan interpretasi terhadap “to” denagn berkonsultasi terhadap table Harga
Kritik “t” pada taraf signifikansi 5%.
10. Sekor Hasil Tes Matematika dari 40 orang siswa SMK sebelum diajar dengan
metode baru adalah sebagai berkut:
68
50
58
40
62
54
66
70
46
56
60
64
42
52
48
44
76
72
43
74
51
65
57
51
55
49
62
59
64
59
53
54
45
55
60
75
70
50
40
53
Sedangkan sekor sasil tes Matematika dari 40 orang siswa yang sama di atas,
setelah diajar dengan metode baru adalah sebagai berikut:
87
75
50
70
55
81
83
60
72
48
69
55
45
51
77
59
71
57
65
69
66
54
58
79
84
99
77
70
90
93
72
59
54
58
64
48
69
96
59
65
Soal:
Selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan Mean
hasil tes Matematika dikalangan 40 siswa SMK tersebut, antara sesudah dan sebelum
diajar dengan metode baru dengan cara:
a. Menemukan Ha dan Ho –nya lebih dahulu
b. Menguji kebenaran / kepalsuan hipotesa tersebut dengan membandingkan
besarnya to dan ttabel pada taraf signifikan 5%
c. Apa kesimpulan yang diperoleh?
11. Dalam suatu kegiatan yang dilaksanakan dengan tujuan untuk mengetahui
bagaimana pendapat para penonton televisi mengenai acara Dakwah yang
dituangkan dalam bentuk ceramah dan Sandiwara televisi, dalam penelitian mana
telah disiapkan 800 orang penonton televisi sebagai sempel penelitian, telah
berhasil dihimpun data jawaban yang mereka berikan kepada tim peneliti, sebagai
berikut:
Pendapat:
f
A. Siaran Dakwah melalui sandiwara televise lebih baik daripada 243
ceramah
B. Siaran Dakwah melalui ceramah lebih baik daripada sandiwara 235
televisi
C. Siaran Dakwah melalui Ceramah dan sandiwara televise sama
232
baiknya
D. Saya tidak dapat menemukakan pendapat
90
Soal:
Berdasarkan perimbangan bahwa pendapat para penonton televisi mengenai Siaran
Dakwah itu merupakan faktor determinan (faktor yang menentukan) yang perlu
dipertimbangkan dalam penyusunan program Siaran Dakwah lewat televisi itu, cobalah
Samsudi - STATISTIKA
49
selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan frekuansi
yang diibservasi dan frekuensi toritiknya, dengan cara:
a. Terlebih dahulu menyusun hipitesa alternative dan hipotera Nolnya.
b. Mengetes perbedan frekuensinya dengan menggunakan Teknik Analisis Kai
kuadrat.
c. Memberikan interpretasi terhadap kai kuadrat, dengan menggunakan signifikan
5%.
d. Kemukakan kesimpulannya
12. Sejumlah 300 oarang mahasiswa pada sebuah perguruan tinggi ditetapkan sebagai
sempel dalam rangka kegiatan penelitian yang berjudul “Komparasi Prestasi Studi
Mahasiswa Dalam hubungannya Dengan kegiatan Para Mahasiswa dalam
Organisasi-organisasi kemahasiswaan”. Mereka itu dibagi dalam kedua kelompok,
yaitu: 60 orang mahasiswa yang duduk dalam kepengurusan organisasi-organisasi
kemahasiswaan, dan 240 orang lainnya adalah mahasiswa yang tidak duduk dalam
kepengurusan organisasi kemahasiswaan. Dari kedua kelompok mahasiswa tersebut
berhasil dicatat hasil belajar mereka dalam ujian semester difakultas mereka masing
masing sebagai berikut: Dari sejumlah 60 orang mahasiswa yang menjadi pengurus
organisasi kemahasiswaan, 20 orang diantaranya lulus pada ujian utama; 25
diantaranya dinyatakan lulus dalm ujian ulangan, sedangkan sisanya yaitu 15 orang
dinyatakan gagal. Selanjutnya dari sejumlah 240 orang mahasiswa yang tiadak
menjadi pengurus organisasi kemahasiswaan, 80 orang diantaranya dinyatakan
lulus ujian utama, 120 orang lulus pada ujian utama dan 40 orang selebihnya
dinyatakan gagal dalam ujian tersebut.
Soal:
a. Rumuskan Hipotesis alternatifnya dan Hipotesis Nihilnya!
b. Ujilah Hipotesis tersebut dengan menggunakan Teknik analisis kai kadrat!
c. Berikan interpretasi terhadap Kai Kuadrat dengan menggunakan signifikan 5%.
d, Apa kesimpulan yang dapat dikemukakan?
13. Data:
Jenis Sekolah / sikap Baik
Cukup
Kurang
Total:
keagamaan
Sekolah Umum
100
140
60
300
Sekolah Teknik
40
90
50
180
Sekolah Guru
63
40
17
120
Total
203
270
127
600=N
Soal:
Dengan menggunakan Teknik Analisa Kai Kuadrat, Ujilah hipotesis nol yang
menyatakan bahwa diantara 600 orang siswa SLTA yang berbeda jenis sekolahnya
itu tidak dapat berbeda sikap keagamaan yang signifikan!
Samsudi - STATISTIKA
50
BAB VIII
ANALISIS VARIANSI
Tujuan
Mahasiswa memiliki pemahaman tentang teknik analisis variansi sebagai alat analisis
data dan uji hipotesis yang meliputi mean kuadrat, asumsi-asumsi dalam Anava, Anava
Klasifikasi Tunggal dan Anava Klasifikasi Ganda dan dapat menggunakan Anava
untuk menganalisis data penelitian.
Samsudi - STATISTIKA
51
8.1. Konsep Mean Kuadrat
Perlu diingat kembali apa yang disebut varian dalam pembicaraan tentang SD
(standar deviasi). Varians adalah SD kuadrad, yang diperoleh dengan rumus:
SD
2
=
∑
x2
N
Hanya saja dalam hubungan dengan pembicaraan kita sekarang ini kwalitas itu tidak
disebut varians, melainkan Mean KUADRAT, disingkat dari mean dari jumlah
KUADRAT, dan diberi simbul MK, dan diperoleh dengan rumus:
MK =
DK
d b
DK = jumlah KUADRAT,
d b = derajad kebebasan.
Dalam teknik Anava ini yang menjadi alat pengukuran variabilitas antar
kelompok adalah mean KUADRAT atar kelompok (disingkat dengan MKant), sedang
yang menjadi alat pengukuran variabilitas dalam kelompok adalah mean KUADRAT
dalam kelompok (disingkat dengan MK dal).
Hasil bagi dari kedua komponen ini, yaitu MKant dan MKdal, akan memjadi
petunjuk seberapa jauh jarak penyimpangan mean-mean kelompok kita itu dari mean
hipotetis (yaitu bahwa tidak ada perbedaan antara mean-mena variabel yang diselidiki)
sebagai akibat dari kesalahan sampling. Jadi sebenarnya yang kita cari adalah
menemukan MKant yang mewakili variabilitas dalam kelompok. Jika kedua MKdal yang
mewakili variabilitas dalam kelompok. Jika kedua MK itu sudah kita ketemukan, maka
perbandingan antara keduanya akan dapat digunakan sebagai dasar menarik kesimpulan
statistik tentang obyek yang sedang kita teliti.
Rumus umum untuk mencari MK, yaitu :
Samsudi - STATISTIKA
52
MK ant =
DK an t
db ant
MK dal =
DK dal
dbdal
dbdal = derajad kebebasan dalam kelompok, diperoleh dari dbtot dikurangi
dengan dbant sedang dbtot = N-1
dbant = derajad kebebasan antar kelompok, diperoleh dari jumlah kelompok
dikurangi satu, atau (m-1)
Sebagai contoh diperoleh data sebagai berikut:
dbant = 5 – 1
=4
N = 50
DKant = 19,72
dbdal = 50 – 1 – 4 = 45
m=5
DKdal = 254,30
Dengan mengisikan bilangan-bilangan itu ke dalam rumus MK dapat diperoleh:
MK ant =
DK ant 19,72
=
dbant
4
MKdal =
= 4 , 93
DKdal 254,30
=
dbdal
45
= 5 , 56
8.2. F – Ratio
Adapun yang dimaksud dengan F-ratio adalah angka-angka perbandingan antara
MKant dengan MKdal dan didefinisikan dengan persamaan sebagai berikut :
F =
MK
MK
ant
da l
Besarnya nilai-nilai F yang terjadi hanya 5% dan 1% dari seluruh kejadian dari samplesampel yang diambil secara random, sekiranya memang hipotesis nilai adalah benar.
Jika MKant adalah sedemikian besarnya, jauh melebihi MKdal sehingga perbandingan
kedua MK itu menunjukkan nilai yang menyamai atau melebihi nilai F dalam tabel
pada dasar taraf signifikansi 5 % dan 1%, maka kita menyimpulkan bahwa tidak
mungkin nilai F sebesar itu terjadi kalau hipotesis nihil dan mengatakan bahwa F yang
kita peroleh menunjukkan nilai yang signifikan atas dasar taraf signifikansi 5 % dan 1
%.
Misalkan hipotesis nihil yang kita ajukan dalam penelitian kita itu adalah: “tidak
ada perbedaan yang signifikan antara kelima kelompok pelajar-pelajar SMA dari
berbagai daerah dalam soal kecakapan atau pengetahuan kebudayaan” .
MKant yang kita peroleh adalah 4.93, dan MKdal-nya 5,56. Jika harga-harga MK
tersebut kita isikan ke dalam rumus F, maka:
Samsudi - STATISTIKA
53
MK ant
4 , 93
=
MK da l
5 , 56
= 0 , 873
F =
Mengkonsultasikan dengan Tabel F
Dari perhitungan di atas, dapatemukan bahwa:
F db
ant
; db dal =
MK
MK
ant
F 4; 45 = 0,873
dal
Untuk mengkosultasikan harga F diatas, dapat ditempuh dua cara.
MK yang lebih kecil adalah MKant = 4,93 Derajad kebebasan dari MK ini = 4.
kita cari db = 4 dalam kolom sebelah kiri, kit abaca kekanan sampai menyilang kolom
db = 45 sebagai db dari MK kita yang lebih besar. Karena ternyata tidak ada kolom db =
45, maka kita ambil saja suatu bilangan diantara db = 40 dan db = 50, yaitu bilanganbilangan 5,71 dan 5,70, jika kita gunakan taraf signifikansi 5 %, sedang bilanganbilangan diantara 5,71 dan 5,70 adalah 5,705, taraf signifikansi 5%, sedang bilanganbilangan pada baris bawah adalah bilangan-bilangan batas F pada taraf signifikansi 1%.
Karena itu jika kita gunakan taraf signifikansi 1%, bilangan batas yang kita cari adalah
bilangan diantara 13,74 dan 13,69, yaitu bilangan 13,715.
Dari pemeriksaan pada tabel itu ternyata bahwa F yang kita peroleh sebesar
0,873 berada jauh di bawah batas signifikansi 5%, apalagi sebagai konsekuensinya
hipotesis nihil yang kita ajukan sebelum penelitian kita terima. Kesimpulan kita akan
berbunyi kira-kira sebagai berikut:
“Bahwa menurut bahan-bahan yang dikumpulkan dalam penelitian itu diperoleh buktibukti antara pelajar-pelajar SMA dari berbagai daerah itu tidak terdapat perbedaan yang
signifikan mengenai pengetahuan kebudayaan”.
Tabel Ringkasan ANAVA
Hasil-hasil perhitungan analisis varians yang telah kita kerjakan berikutnya
dimasukkan ke dalam tabel berikut:
Tabel 8.1
Tabel Ringkasan Anava
Sumber
Variasi
SV
Kelompok
Pelajar
SMA
Dalam
Kelompok
Total
Mean
Jumlah
Derajad
F empiris
Kebebasan KUADRAT KUADRAT
FO
MK
DK
db
4
19,72
4,93
45
254,30
5,65
49
274,02
-
Samsudi - STATISTIKA
F teoritis
(hipotetis)
Ft
5%
1%
0,873
5,705
13,715
-
-
54
Kesimpulan : Karena FO = 0,873 < Ft5% = 5,705 maka HO diterima.
Adapun ringkasan rumus-rumus dalam table Anava:
Tabel 8.2
Tabel Ringkasan Anava dari bahan-bahan dalam tabel
Sumber
Variasi
SV
Kelompok
apa ?
( antar)
db
C–1
JK
∑
(∑ X )
2
nk
Dalam
Kelompok
(dalam)
N–C
∑X
Total
N-1
∑
(∑ X )
2
−
k
RJK
DK ant
C −1
tot
N
(∑ X )
−
2
2
MK
MK
DK dal
N −C
k
tot
FO
nk
(∑ X )
Ft
ant
5%
1%
?
?
-
-
dal
2
X 2 tot −
-
tot
N
-
F O ≥ F t ? % , maka HO ditolak
(2) Jika F O ≤ F t ? % , maka HO diterima
Pengujian
: (1) Jika
Kesimpulan
: (1) Ada perbedaan apa antara kelompok apa
(2) Tidak ada perbedaan apa antara kelompok apa
Dengan tabel ringkasan Anava yang tersedia itu, marilah kita kerjakan contoh
lain dibawah ini. Tabel 8.3ini memuat bahan hipotetis tentang sikap terhadap persoalan
“KLM” yang diperoleh dengan jalan angket. NIlai yang lebih besar menunjukkan sikap
yang lebih positip.
Tabel 8.3
Tabel distribusi sikap untuk contoh Anava
Kelompok I
Kelompok II
Kelompok III
Total
X1
68
63
58
2
X
1
4624
3969
3364
Samsudi - STATISTIKA
X2
78
69
58
2
X
2
6084
4761
3364
X3
94
82
73
2
X
X
X2
3
8836
6724
5329
240
214
189
19544
15454
12057
55
∑
(1)
DKtot =
∑X
2
∑
n1 = 10
X1
X
1
∑
2
∑X
2
X
2
n2 = 10
∑X
tot
−
(∑ X )
∑
3
n3 = 10
2
2
4489
4356
3844
3600
2916
2500
1024
43618
67
66
62
60
54
50
32
640
3249
2809
2704
2304
2116
1764
729
29884
57
53
52
48
46
42
27
530
2601
1681
1600
1156
729
400
324
20488
51
41
40
34
27
20
18
420
2
X
3
175
160
154
142
127
112
77
1590
∑
X tot
10339
8846
8148
7060
5761
4664
2077
993950
∑
X
2
tot
N = 30
(1 .590 )
2
= 93 .950 −
tot
N
30
2528100
30
= 93.950− 84270
= 93.950−
= 9.680.
(∑ X )
2
(2)
DKan t =
1
n1
(∑ X )
+
2
2
n2
(∑ X )
+
2
3
n3
(∑ X )
−
2
tot
N
2
2
2
2
(
420) (530) (640) (1.590)
=
+
+
+
10
10
= 86.690 − 84270
10
30
= 2.420
(3)
DKdal = DK tot − DK ant
= 9.680 − 2.420
= 7.260
(4)
MKant =
= 1.210
(5)
DK ant 2.420
=
m −1
3 −1
MKdal =
MK dal 7.260
=
N − m 30 − 3
= 268,90
(6)
Fm – 1; N – m =
Samsudi - STATISTIKA
MK ant 1.210
=
MK dal 268,9
56
= 4 , 50
Hasil-hasil perhitungan itu kemudian disusun dalam tabel ringkasan Anava
sebagai berikut :
Tabel 8.4
Tabel Ringkasan Anava dari bahan tabel
Sumber
Variasi
SV
Kelompok
“K”
Dalam
Kelompok
Total
db
DK
MK
2
2.420
1.210
27
7.260
268,9
29
9.680
-
FO
4,50
-
Ft
t.s.5%
3,35
t.s.1%
5,49
-
Signifikansi
Nonsignifi
Sig
Nonsig
-
Jadi, dengan taraf signifikansi 5% kita akan menolak hipotesis nihilnya yang
mengatakan bahwa tidak ada perbedaan sikap antara ketiga kelompok yang diselidiki.
Kita menolaknya disebabkan karena kita meragukan bahwa variabilitas antar kelompok
sebesar 4,50 itu semata-mata disebabkan karena kesalahan sampling.
Bagaimana halnya jika kita gunakan taraf sigibifikansi 1%?. Bilangan batas
signifikansi atau batas penolakan hipotesis nihil dengan taraf signifikansi 1% adalah
5,49. Dengan demikian hipotesis nihil itu kita terima. Karena batas penolaknnya masih
belum dilewati. F yang kita peroleh = 4,50 dan ini masih di bawah Ft = 5,49 sebagai
batas signifikansinya. Kita menerima hipotesis nihilnya karena jikalau kita
menggunakan dasar taraf signifikansi 1%, kita memandang deviasi-deviasi yang
besarnya terjadi 5 kali dalam 100 atau 4 kali dalam 100 kemungkinan, atau malahan 2
kali dalam 100 kemungkinan masih disebabkan karena kesalahan sampling. Hanya
deviasi-deviasi yang terjadi 1 kali diantara 100 kejadian yang kita pandang tidak
disebabkan oleh kesalahan sampling.
Asumsi-asumsi Dalam Analisis Variansi
Pengujian dengan F test ini juga menggunakan asumsi-asumsi atau landasanlandasan teori tertentu. Ada tiga macam asumsi yang perlu diindahkan dalam
penggunaan teknik Anava, yaitu
(1) Bahwa subyek-subyek atau individu-individu yang ditugaskan dalam sampelsampel penelitian harus diambil secara random secara terpisah satu sama lain dari
masing-masing populasinya.
Samsudi - STATISTIKA
57
(2) Bahwa distribusi gejala yang diselidiki dalam masing-masing populasi itu adalah
normal.
(3) Bahwa varians-varians atau SD2 dari masing-masinng populasi tidak menunjukkan
perbedaan yang signifikan satu sama lain.
Bagaimana memenuhi sarat-sarat yang ditentukan itu dapat dituturkan secara singkat
sebagai berikut :
(1) Random samples : dapat kita penuhi dengan cara yang sudah dibicarakan dalam
permulaan bab VII. Gunakan tabel bilangan random untuk mengambil random
clusters, random areas, atau random subjectsnya.
(2) Normal distributions: dapat kita penuhi melalui dua jalan. Pertama, atau kita
mengadakan pengetesan normalitas (test of normality) dengan rumus-rumus yang
sudah kita ketahui. Ini kita lakukan jika kita belum mempunyai bukti-bukti bahwa
gejala yang kita selidiki mengikuti cirri-ciri distribusi normal. Kedua, atau jika kita
telah mempunyai bukti-bukti bahwa varaibel yang kita selidiki telah mengikuti
distribusi normal, baik bukti ini kita peroleh dari penelitian-penelitian pendahuluan
maupun dari penelitian-penelitian orang lain yang mendahului, kita dapat
menggunakan bukti-bukti sebagai landasan untuk memenuhi sarat atau tuntutan
normalitas ini.
(3) Correlated variances : dapat kita penuhi dengan mengadakan pengetesan terhadap
varians-varians (test of variance) yang kita peroleh dari distribusi-distribusi yang
kita peroleh dari distribusi-distribusi yang kita selidiki. Rumus untuk ini adalah :
2
SD
F db Vb ; dbVk =
bs
2
SD
kt
Dalam mana db Vb = derajad kebebasan dari Varians yang lebih besar, db Vk = derajad
2
2
bs
kt
kebebasan dari varians yang lebih kecil, dan SD dan SD masing-masing adalah
varians yang lebih besar dan varians yang lebih kecil. Kongkritnya, dari bahan tabel 67
hal. 375 kita dapat mengetest variansnya seperti berikut :
Kelompok I
n = 10
∑ x = 135.
∑x2 = 1881
1881 1352
18825
SD 2 =
− 2 = 188,1 −
10
10
100
= 188,10 − 182,25
= 5,85
Kelompok II
n = 10
∑ x = 153.
∑x2 = 2385
2385 1532
23409
2
SD =
− 2 = 238,5 −
10
10
100
Samsudi - STATISTIKA
58
= 238,5 − 234,09
= 4,41
Dari perhitungan itu kita ketahui itu kita ketahui bahwa SD2 atau varians yang
lebih besar adalah varians dari kelompok I. Varians yang lebih besar ini kemudian kita
jadikan pembilang dalam test of variance kita.
5,85
= 1,33
4,41
F 9;9 =
Karena itu
Dengan melihat tabel pada derajad kebebasan 9 lawan 9 akan kita ketemukan
bahwa FO = 1,33 ini lebih kecil daripada F15% = 3,18. karena itu kita menyimpulkan
bahwa varians dari kelompok I dan kelompok II itu tidak berbeda secara signifikan, hal
mana berarti bahwa varians dari kedua kelompok itu dalam populasinya masing-masing
adalah tidak berbeda.
Analisa varians ternyata dapat digunakan untuk meneliti bahan-bahan yang
telah disusun ke dalam bermacam-macam distribusi. Di bawah ini diberikan contohcontoh penggunaan Anava pada (1) distribusi tunggal; (2) distribusi bergolong dan (3)
distribusi deskriptip. Penerapan itu akan dibaca secara berturut-turut.
8.3. Anava pada Distribusi Tunggal
Tabel di bawah ini menunjukkan distribusi tunggal dari hasil test psikologis
terhadap mahasiswa-mahasiswa yang baru ulai belajar mata pelajaran itu. Untuk tidak
menimbulkan kebingungan, perlu kiranya segera diberi keterangan tentang rumusrumus DK untuk bahan yang sudah distribusikan yang kelihatannya sepintas lalu
berbeda dengan rumus-rumus DK yang sudah kita pelajari. Pada dasarnya rumus-rumus
baru ini tidak ada bedanya dengan rumus-rumus yang terdahulu. Komponen f
dimasukkan ke dalam rumus-rumus baru ini disebabkan karena dalam distribusi
komponen f itu selalu ada. Jadinya,
(1)
DKtot = ∑ fX2tot
(2)
(∑ fX )
−
(3)
Nilai
X
tot
N
(∑ fX ) − (∑ fX )
=
2
DKant
2
2
1
n1
tot
N
(∑ fX ) − (∑ fX )
+ .........+
2
2
m
nm
tot
N
DK dal = DK tot − DK ant
Tabel 8.5
Distribusi hasil tes Potensi Akademik dari tiga kelompok mahasiswa
Kelompok 1
Kelompok II
Kelompok III
Total
2
fX 1
f
fX1
f
fXt fX t2
f
fX2 fX 22
f fX3 fX 32
Samsudi - STATISTIKA
59
4
22 242
2
11 121
1
11 121
1
11
5
10 100
1
20 200
2
20 200
2
10
10
27 243
3
36 324
4
27 243
3
9
19
56 448
7
56 448
7
40 320
5
8
25
35 245
5
77 539
11
63 441
9
7
20
48 288
8
30 180
5
42 252
7
6
15
25 125
5
20 100
4
30 150
6
5
11
80
20
5
64
16
4
32
8
2
4
10
27
9
3
27
9
3
36
12
4
3
6
12
6
3
8
4
2
4
2
1
2
5
1
1
1
1
1
1
3
3
3
1
3
0
0
2
0
0
0
0
0
1
0
Total 44 258 1802 44 280 2012 45 259 1811 133
Anava dari bahan tersebut dapat dikerjakan dengan cara-cara yang biasa :
797 2
635209
(1) DK tot = 5625 −
= 5625 −
= 5625 − 4776,01
133
133
44 454
50 500
90 810
152 1216
175 1225
120 720
75 375
44 176
90
30
24
12
5
5
0
0
797 5625
= 848 , 99
(2) DK ant =
2582 2802 2592 797 2
+
+
−
44
44
45
133
66564 78400 67081 635209
+
+
−
44
44
45
133
= 1512,82 + 1781,82 + 1490,69 − 4776,01 = 4785,33 − 4776,01
= 9,32
=
(3)
DKdal = 848,99 − 9,32 = 839,67
(4)
MKant =
9,32
= 4,66
2
(5)
MKdal =
839,67
= 6,46
130
(6) F 2;130 =
4,66
= 0,72
6, 46
db dari MK yang lebih besar adalah 130, sedang db dari MK yang lebih kecil
adalah 2. jika kit abaca tabel F1 dengan db 130 lawan 2 maka akan kita ketahui bahwa
batas penolakan hipotesis pada taraf signifikansi 5% adalah 19,49, dan pada taraf
signifikansi 1% adalah 99,49. Ternyata nilai F yang kita peroleh itu berada sangat jauh
di bawah batas signifikansi 1%. Dengan begitu maka hipotesis nihil yang kita ajukan,
kita terima. Kesimpulan kita adalah bahwa atas dasar bahan-bahan yang kita kumpulkan
sampai sekian jauh, antara kelompok signifikansi tentang pengetahuan psikologi
mereka.
Samsudi - STATISTIKA
60
Tabel Singkatan Anava dari pekerjaan analisa tersebut di atas dapat dilihat
pada tabel 8.6 di bawah ini.
Tabel 8.6
Tabel Ringkasan Anava dari bahan dalam table 8.5
Sumber
Variasi
Antar
Kelompok
Dalam
Kelompok
Total
db
DK
MK
2
9,32
4,66
13
839,67
6,46
132
848,99
-
Signifikansi
FO
Ft
0,72
t.s.5%
=19,49
Nonsig
-
-
-
ANAVA PADA DISTRIBUSI BERGOLONG
Distribusi bergolong yang tercantum dalam tabel 8.7 di bawah
ini
dipersiapkan untuk meneliti ada tidaknya perbedaan gaji guru-guru wanita dan pria.
Interval gaji diambil dari gaji rata-rata tiap-tiap bulannya.
Interval gaji
Kode
X
f
Rp.7000-7999
Rp.6000-6999
Rp.5000-5999
Rp.4000-4999
Rp.3000-3999
Rp.2000-2999
Rp.1000-1999
Total
6
5
4
3
2
1
0
-
4
8
12
15
8
3
1
51
Tabel 8.7
Tabel Distribusi Bergolong
Peria
Wanita
2
fX 1
fX 22
f
fX2
fX1
24
40
48
45
16
3
0
176
144
200
192
135
32
3
0
706
1
5
10
12
18
7
3
56
6
25
40
36
36
7
0
150
36
125
160
108
72
7
0
508
Total
f
fXt
fX t2
5
13
22
27
26
10
4
107
30
65
88
81
52
10
0
326
180
325
352
243
104
10
0
1214
Kode-kode digunakan dalam tabel itu disebabkan karena sungguhpun kita
dapat melakukan analisa dengan metode yang lazim, yaitu dengan menggunakan titiktitik tengah atau tanda-tanda kelas Rp 7.500,-, Rp 6.000,- dan seterusnya, kita akan
terlibat dalam mengKUADRATkan bilangan-bilangan besar. Dengan pengkodean itu
kita dapat menghemat sangat banyak waktu dan fikiran. Dari interval yang terendah
dimulai pengkodean dengan bilangan nol. Analisa variannya adalah :
106276
3262
= 1214 −
= 1214 − 993,23
107
107
= 220 , 77
(1) DK tot = 1214 −
Samsudi - STATISTIKA
61
(2) DK ant =
1762 1502 3262 30976 22500 106276
+
−
=
+
−
51
56
107
51
56
107
= 607 ,37 + 401,79 − 993,23 = 1009 ,16 − 993,23
= 15,93
(3)
DKdal = 220,77 −15,93 = 204,84
(4)
MKant =
(5)
MKdal =
(6)
15,93
= 15,93
1
204,84
= 1,95
105
F1;105 =
15,93
= 8,17
1,95
Dimasukkan dalam tabel ringkasan Anava :
Tabel 8.8
Ringkasan Anava dari bahan dalam tabel
Sumber
Variasi
db
DK
MK
Sekse
1
15,93
15,93
Dalam
105
204,84
1,95
Total
106
220,77
-
Signifikansi
FO
Ft
8,17
t.s.1%=6,90
Sig
-
-
-
db dari MK yang lebih besar = 1, dan db dari MK yang lebih kecil = 105.
Pemeriksaan pada tabel F menunjukkan bahwa dengan taraf signifikansi 5% dan 1 %
batas penolakan itu maka hipotesis nihilnya kita tolak. Kita menyimpulkan bahwa
berdasarkan bahan-bahan yang masuk ada perbedaan besarnya gaji guru-guru wanita
dna peria. Mean dari gaji peria = 176/51=3,45. sedang mean dari gaji wanita = 150/56 =
2,68. karena gaji peria ternyata lebih besar daripada wanita, dan perbedaan itu
signifikan, maka akhirnya kita menyimpulkan bahwa gaji adalah fungsi daripada jenis
kelamin, dan guru-guru peria mempunyai kecenderungan memperoleh gaji yang lebih
tinggi.
8.4. Analisis Variansi (ANAVA) Klasifikasi Ganda
Dalam bab VII kita telah membicarakan bagaimana mengetest hipotesis
tentang sesuatu variabel dari dua kelompok. Dalam bab XI kita telah maju satu langkah,
yaitu memperbincangkan cara mengetest hipotesis tentang sesuatu variabel dari tiga
kelompok atau lebih. Dalam bab ini kita maju satu langkah lagi. Kita ingin mengetahui
Samsudi - STATISTIKA
62
bagaimana mengetest hipotesis dari banyak kelompok yang tidak hanya menggunakan
satu klasifikasi, tetapi banyak klasifikasi. Mengadakan klasifikasi ganda ini bukan saja
mungkin dikerjakan dalam banyak penelitian, tetapi juga sangat berguna untuk
mendapatkan informasi yang lebih banyak dan lebih teliti. Kebenaran pernyataan
tersebut dapat dilihat dari contoh sebagai berikut :
Seorang insinyur mobil ingin meneliti lima macam merk sepeda motor untuk
menetapkan keadaan konsumsi bensin mereka. Dia mengambil dari tiap-tiap merk lima
buah sepeda motor dari model empat tahun yang lalu sampai model tahun ini. Semua
sepeda motor itu kemudian dijalankan dalam keadaan yang diawasi baik-baik dan
dicatat konsumsi bensinya tiap-tiap kilometernya. Kita misalkan hasil daripada test ini
adalah seperti berikut :
Tabel 8.9
Konsumsi bensin per km dari lima macam merk sepeda motor
M ERK
MODEL
TOTAL
A
B
C
D
E
112
18
24
22
22
26
Tahun 2008
105
20
20
20
21
24
Tahun 2007
94
16
19
19
18
22
Tahun 2006
80
15
13
17
15
20
Tahun 2005
67
12
18
11
12
14
Tahun 2004
Total
106
88
89
91
81
458
Dengan menggunakan Anava yang biasa kita dapata mengetest hipotesis nihil
: “Bahwa ada perbedaan konsumsi bensin antara kelima merk sepeda motor itu”.
Dengan Anava klasifikasi tunggal akan kita peroleh hasil-hasil sebagai berikut :
4582
2
2
2
(1) DK tot = 26 + 24 + ... + 12 −
= 393,44
25
1062 882 892 942 812 4582
(2) DK ant =
+
+
+
+
−
= 69,04
5
5
5
5
5
25
DKdal = 393,44− 69,04 = 324,40
69,04
= 17,26
(4) MK ant =
4
324,40
= 16,22
(5) MKdal =
20
(3)
(6) F 4;20 =
17 ,26
= 1,06
16,22
Hasil-hasil perhitungan itu kita masukkan ke dalam tabel ringkasan Anava
sebagai berikut :
Tabel 8.10
Samsudi - STATISTIKA
63
Ringkasan Anava dari bahan dalam tabel 9.5
Sumber
Variasi
db
DK
MK
Merk
4
60,04
17,26
Dalam
20
324,40
16,22
Total
24
393,44
-
Signifikansi
FO
Ft
1,06
t.s.5%=2,87
Non
-
-
-
Nilai F dengan derajad kebebasan 4 lawan 20 adalah tidak signifikan.
Konsekwensinya hipotesis nilai yang dikemukakan tidak dapat ditolak. Kelima merk
sepeda motor itu tidak menunjukkan perbedaan konsumsi bensin yang menyakinkan.
Data dalam tabel di atas dapat juga digunakan untuk menetapkan DK-DK dari
merk maupun model. Analisa varians untuk ini pada prinsipnya adalah sama seperti
yang telah kita pelajari. Beberapa dari pekerjaan kita di atas dapat kita ambil lagi untuk
analisa ini.
2
Perlu dicatat bahwa suku 458 dalam perhitungan-perhitungan DKmerk dan
25
DKmodel di atas kita sebut suku koreksi. Jumlah pembilang pada tiap-tiap pecahan yang
ditambahkan sebelum diKUADRATkan harus sama dengan pembilang dari suku
koreksi. Demikian juga jumlah pembagi pada tiap-tiap pecahan yang ditambahkan
sebelum diKUADRATkan dalam tiap-tiap menghitung DK haruslah sama dengan
pembagi dari suku koreksi. Catatan ini perlu diperhatikan agar kita meneliti kembali
jumlah-jumlah itu sebelum menghitung tiap-tiap DK.
Hasil Anava dari data tersebut yang memasukkan dua jenis klasifikasi yaitu
klasifikasi merk dan klasifikasi odel, ditunjukkan dalam tabel 8.11 di bawah ini. Dari
dua klasifikasi ini dapat perbedaan yang signifikan antara kenihilan yang aseli, yaitu
bahwa tidak ada perbedaan yang signifikan antara kelima macam merk dapat ditest
kembali. Hipotesis yang kedua ialah hipotesis nihil tentang tidak adanya perbedaan
yang signifikan antara kelima mode. Periksalah kembali test hipotesis pertama yang
sudah dikerjakan di muka. Hipotesis nihil itu diterima atas dasar klasifikasi tunggal
(periksa tabel 8.10). Persoalannya sekarang apakah kesimpulan itu masih dapat
dipertahankan jadi faktor model turut diperhitungkan?
Tabel 8.11
Tabel ringkasan Anava tentang konsumsi bensin sepeda motor
ditinjau dari segu merk dan model
Jumlah
Mean
Sumber
setujubabilitas
db
FO
Variasi
KUADRAT KUADRAT
Kejadian (p)x)
4,96
17,26
69,04
4
Merk
p < 1 % xx)
19,32
67,19
286,76
4
Model
p < 1% xx)
3,48
55,64
16
Dalam
Samsudi - STATISTIKA
64
Total
(5)
(6)
(7)
(8)
(9)
24
393,44
-
-
-
X) Diartikan juga proporsi kesalahan dari tiap-tiap penolakan hipotesis nihil.
XX) Lebih lazim ditulis dalam bentuk setujuporsi sebagai berikut P < 0,01
Baiklah pertanyaan ini kita jawab setelah kita menyelesaikan pekerjaan kita dalam
mengisi tabel ringkasan di atas.
60,04
MK merk =
= 17,26
4
288,76
MK mod el =
= 67,19
4
55,64
MK dal =
= 3,48
16
17,26
Untuk Merk : F4 ;16 =
= 4,96
3,84
67,19
Untuk Model : F 4;16 =
= 19,32
3,84
Pemeriksaan pada tabel F menunjukkan kepada kita bahwa dengan derajad
kebebasan 4 lawan 16 batas penolakan hipotesis nihilnya adalah 3,01 untuk taraf
signifikansi 5%, dan 4,77 untuk taraf signifikansi 1%.
Dengan bukti-bukti itu dapatlah kita menjawab pertanyaan yang baru
diajukan. Hipotesis nihil tentang perbedaan konsumsi bensin di berbagai merk itu jika
model atau tahun pembuatannya telah turut diperhitungkan, tidak lagi dapat
dipertahankan. Kita menyimpulkan bahwa kelima jenis merk sepeda motor yang
diselidiki berbeda konsumsi bensinya.
Jelaslah bahwa analisa varians dengan menggunakan kalsifikasi ganda
merupakan alat pengetesan hipotesis yang lebih peka. Hal ini disebabkan karena MKdal
yang digunakan untuk menjadi pembagi dalam mencari nilai F disini tidak lagi 16,22
seperti yang digunakan dalam tabel 78, melainkan hanya 3,48, sedang pembilangnya
dalam F-Ratio untuk merk itu, yaitu MKmerk’ tetap konstan. Memang penambahhan
klasifikasi biasanya menambah halusnya test hipotesis. Tambahan halusnya ini tentu
saja tergantung sekali kepada tambahan arti daripada klasifikasi itu.
Untuk menyelesaikan pengetesan hipotesis model ini cukup kiranya jika kita
menggunakan Anava klasifikasi tunggal.
) DK tot = 393,44
(2) DK mod el = 286,76
(3)
DKdal = 393,44− 286,76 = 106,68
(4)
MKmodel = 67,19
324 , 4
= 16 , 22
20
67,19
= 12,66
(6) F 4;20 =
5,33
(5) MK
dal
=
Samsudi - STATISTIKA
65
P < 0,01.
Dengan kenyataan itu kita tetap menolak hipotesis nihil dan menyimpulkan
bahwa perbedaan konsumsi bensin menurut tahun-tahun pembuatan adalah sangat
signifikan.
Soal Latihan
1.
Distribusi hasil tes Matematika terhadap tiga kelompok siswa disajikan sebagai
berikut:
Kelompok 1 Kelompok II Kelompok III Total
Nilai
Matematika f
f
f
f
4
2
1
1
80
5
1
2
2
79
10
3
4
3
78
19
7
7
5
77
25
5
11
9
76
20
8
5
7
75
15
5
4
6
72
11
5
4
2
68
10
3
3
4
66
6
3
2
1
62
5
1
1
3
61
3
2
0
1
60
Total
44
44
45
133
Ujilah pada taraf signifikansi 5%, apakah ada perbedaan secara signifikan nilai
matematika pada tiga kelompok tersebut. Buat/masukkan juga ke dalam tabel
ringkasan Anava.
2.
Data di bawah ini menunjukan distribusi interval gaji kelompok guru sekolah
(SMA, MA dan SMK).
Interval gaji (ribuan)
Rp.700-699
Rp.600-699
Rp.500-599
Rp.400-499
Rp.300-399
Rp.200-299
Samsudi - STATISTIKA
Kode
X
6
5
4
3
2
1
Guru SMA
f
4
8
12
15
8
3
Guru MA
f
1
5
10
12
18
7
Guru SMK
f
3
7
9
14
15
6
66
Rp.100-199
Total
0
-
1
51
3
56
2
56
Ujilah apakah ada perbedaan secara signifikan distribusi gaji tiga kelompok guru
tersebut, pada taraf signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan
Anava.
3. Data rata-rata suhu mesin pada lima macam merek sepeda motor (A, B, C, D, dan E),
masing-masing untuk tahun pembuatan/model yang berbeda (2004, 2005, 2006,
2007, dan 2008), disajikan sebagai berikut:
MODEL
Tahun 2004
Tahun 2005
Tahun 2006
Tahun 2007
Tahun 2008
Total
M ERK
A
B
85 86
84 85
84 84
82 82
82 81
C
85
84
83
81
80
D
85
83
83
81
80
E
86
83
82
81
80
TOTAL
Ujilah apakah ada perbedaan secara signifikan rata-rata panas mesin pada lima
merek motor yang berbeda dan model/tahun pembuatan yang berbeda, pada taraf
signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan Anava.
Samsudi - STATISTIKA
67
BAB IX
ANALISIS REGRESI
Tujuan
Mahasiswa memiliki pemahaman tentang analisis regresi klasifikasi tunggal dan ganda
dan mampu menggunakannya untuk menganalisis data penelitian.
Samsudi - STATISTIKA
68
Realitas tentang hubungan/keterkaitan antar ubahan dapat dikategorikan dalam
konteks ubahan yang satu menjadi penyebab dari ubahan lainnya. Pola hubungan seperti
ini disebut sebagai kausalitas, artinya ubahan yang satu merupakan predictor, sedangkan
ubahan yang lain sebagai kriterium.
Misalnya, apakah prestasi belajar anak dapat diprediksikan dari angka
kecerdasan dan perbendaharaan bahasa (kosakata); apakah produktivitas kerja
karyawan dapat diprediksikan dari hasil tes seleksi dan lamanya latihan dan sebagainya.
Dalam contoh ini prestasi belajar dan produktivitas kerja merupakan ubahan kriterium,
sedangkan angka kecerdasan, perbendaharaan bahasa, hasil tes seleksi, dan lamanya
latihan merupakan ubahan predictor.
Suatu ubahan dapat diramalkan dari ubahan lain apabila antara ubahan yang
diramalkan, disebut terikat / dependend, dan ubahan yang digunakan untuk
meramalkan, disebut bebas / Independend, terdapat korelasi yang signifikan. Misalnya,
jika antara tinggi badan dan berat badan pada umur-umur tertentu terdapat korelasi yang
signifikan, maka berat badan orang pada umur tersebut dapat diramalkan dari tinggi
badannya.
Korelasi antara ubahan kriterium dengan ubahan predictor dapat dilukiskan
dalam suatu garis. Garis ini disebut garis regresi. Garis regresi mungkin merupakan
garis lurus (linear), mungkin merupakan garis lengkung (parabolic, hiperbolik, dan
sebagainya). Dalam kesempatan ini hanya akan kita bicarakan garis regresi yang linear.
Suatu garis regresi dapat dinyatakan dalam persamaan matematik. Persamaan ini
disebut persamaan regresi. Untuk garis regresi linear dnegan satu ubahan predictor
persamaannya adalah :
Y = aX + K
dalam mana Y = kriterium; X = prediktor; a = bilangan koefisien prediktor ; dan K =
bilangan konstan.
Untuk garus regresi linear dengan dua ubahan predictor persamaan garisnya
adalah :
Y = a1 X 1 + a2 X 2 + K
dan untuk m ubahan prediktor persamaannya adalah :
Y = a1 X 1 + a2 X 2 + ....... + am X m + K
dalam mana
Y
= Kriterium
Samsudi - STATISTIKA
69
X1, X2, . . . . …, Xm = Prediktor 1, prediktor 2, prediktor ke- m
a1, a2, . . . . . . .. ., am = Koefisien prediktor 1, koefisien prediktor 2,. . . . .
. . . ., koefisien prediktor ke-m
K
= Bilangan konstan
untuk menemukan persamaan guru regresi tersebut harga-harga koefisien prediktor dan
bilangan konstantanya dapat dicari dari data yang diselidiki.
Mengenai tugas kedua dari pembicaraan analisis regresi, yaitu memberi dasar
untuk pembicaraan mengenai analisis kovariansi, akan kita bicarakan pada waktu kita
membicarakan analisis kovariansi.
9.1 Analisis Regresi Linear Satu Prediktor
Tugas pokok analisis regresi adalah :
1. Mencari korelasi antara kriterium dengan prediktor, R
2. Menguji apakah korelasi itu signifikan ataukah tidak, → tabel
3. Mencari persamaan garis regresi, F
4. Menemukan sumbangan relatif antara sesama prediktor, jika prediktornya lebih
dari satu.
Jika kita melukis garis regresi untuk meramalkan kriterium dari prediktor, tujuan
kita adalah ingin mendapatkan dasar ramalan yang menghasilkan kesalahan yang
sekecil-kecilnya. Tujuan itu dapat tercapai, jika dari serangkaian ramalan jumlah
kesalahan-kesalahan raalan itu sama dengan nol. Kesalahan ramalan ini disebut residu.
Maksud pernyataan ini akan dapat kita fahami dari contoh-contoh yang akan diberikan
nanti.
Contoh :
Misalkan suatu penelitian ingin memastikan apakah berat badan orang pada
kelompok umur tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu
dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai berikut :
Subyek
No.
1
2
3
4
5
6
7
8
9
10
Tinggi
(dalam cm)
X.
168
173
162
157
160
165
163
170
168
164
Berat
(dalam kg)
y
63
81
54
49
52
62
56
78
64
61
Korelasi antara prediktor X dengan kriterium Y dapat kita cari melalui teknik
korelasi momen tangkar dari Pearson, dengan rumus umum :
Samsudi - STATISTIKA
70
rxy =
∑ xy
(∑ x )(∑ y )
2
2
Telah kita ketahui bahwa :
( X )( Y )
∑ xy = ∑ XY − ∑ N ∑ ,
( X) ,
∑ x = ∑ X − ∑N , dan
( Y)
∑ y = ∑ Y − ∑N
2
2
2
2
2
Jika tekah kita lakukan komputasi terhadap data contoh hasil penelitian tersebut
(gunakan kalkulator yang ada fungsi statistiknya), akan kita temukan :
N
= 10
∑X
= 1.650
∑Y
= 620
∑XY = 102.732
∑X2 = 272.460
∑Y2 = 39.432
Dari itu
∑ xy = 102.732 −
(1.650)(620) = 432
10
1.6502
2
272
.
460
x
=
−
= 210
∑
10
6202
2
∑ y = 39.432 − 10 = 992
432
rxy =
= 0,946
(210)(992)
Untuk menguji apakah harga rxy = 0,946 itu signifikan apa tidak, kita dapat
berkonsultasi dengan tabel r – teoretik dengan dengan N = 10 atau derajat kebebasan db
= 10 – 2 (Catatan: ada tabel r = teoretik yang menggunakan N, ada juga yang
menggunakan db, Ambilah mana saja yang tersedia pada Anda). Dari tabel r – teoretik
dengan N = 10 (atau db = 8) akan kita ketemukan harga r-teoretik pada taraf
signifikansi 1% atau rt1% = 0,765. karena itu harga rxy sebesar 0,946 itu kita nyatakan
sangat signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y, yaitu
antara tinggi badan dan berat badan, sangat signifikan.
Dengan harga korelasi antara tinggi badan dan berat badan yang sangat
signifikan itu kita mempunyai landasan untuk meramalkan / mengestimasi berat badan
dari tinggi badan (sebenarnya boleh juga sebaliknya, kita dapat meramalkan tinggi
badan dari berat badan), dab karenanya kita dapat membuat garis regresi untuk prediksi
dengan rumus garis regresi untuk prediksi dengan rumus garis regresi satu-prediktor
yang sudah kita ketahui, yaitu :
Y = αX + K → Y = αx + bx → α = Koefisien prediktor
Samsudi - STATISTIKA
71
Untuk mengisi persamaan garis regresi itu harga koefisien prediktor (yaitu harga
a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan
K itu dapat kita ketemukan melalui dua jalan : (a) dengan metode skor kasar, dan (b)
dengan metode skor deviasi. Kedua metode ini akan menghasilkan harga-harga a dan K
yang sama. Nanti kita akan memilih salah satu dari dua metode itu berdasarkan
pertimbangan efisiensi.
Dengan metode skor kasar harga-harga a dan K dapat dicari dari persamaan :
(1 ) Σ XY = a Σ X
2
+ KΣX
( 2 ) Σ Y = a Σ X + NK
Jika data yang sudah kita ketahui kita masukkan ke dalam rumus-rumus itu
(1)
102.732 = 272.460 a + 1.650 K
(2)
620
= 1.650 a + 10 K
dengan penyelesaian persamaan secara simultan akan kita ketemukan (dengan membagi
persamaan I dengan 1.650 dan persamaan 2 dengan 10) :
(3)
62, 26 = 165,13 a + K
(4)
62
= 165 a + K
Subtitusi
(5)
0,26
= 0,13 a
(6)
62 = (165) (2) + K
K = - 268
Perlu dicatat bahwa dalam perhitungan terhadap data penelitian yang
sesungguhnya, ketelitian perhitungan harus diusahakan semaksimal mungkin, dengan
jumlah angka desimal yang lebih banyak, misalnya enam desimal atau delapan desimal.
Dalam contoh perhitungan di atas hanya digunakan dua desimal. Maka jika dalam
komputasi digunakan kalkulator, biarkanlah desimalnya mengambang (floating)
sehingga perhitungan-perhitungannya dapat membawa terus jumlah desimal sesuai
dengan kemampuan kalkulator tesebut. Misalnya, jika dalam perhitungan di atas
digunakan desimal yang menggambang sampai enam angka, hasilnya adalah a = 2,057
143, dan K = - 277, 428 595. Tentu saja perhitungan dengan enam desimal hasilnya
akan jauh lebih teliti daripada perhitungan dengan dua desimal.
Dengan harga a = 2 dan K = - 268, persamaan garis regresinya adalah :
Y = aX + K
Y = 2X − 268 → a = -268, b = 2
y = −268+ 2X
Dengan metode skor deviasi harga-harga a dan K dapat kita cari dari persamaan
y = ax
Dalam mana
y =Y −Y,
Samsudi - STATISTIKA
x = X − X,
dan
a=
Σ xy
Σx 2
72
Jika data yang sudah diketemukan dimasukkan ke dalam rumus tersebut :
Σ xy = 432
Σ x 2 = 210
432
a =
= 2 , 05
210
y = 2 , 05 x
Dari data yang dikumpulkan dapat dicari :
ΣY 620
ΣX 1.650
=
= 62
=
= 165
Y =
X =
10
10
N
N
Karena itu untuk persamaan garis regresi y = ax atau Y - Y = a ( X - X ) dapat
kita selesaikan:
Y − 62 = (2,05)( X − 165)
Y = 2,05 X − 338 , 25 + 62
Y = 2,05 X − 276 , 25
Dengan etode skor kasar kita menemukan persamaan garis regresinya Y = 2X –
268, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y
= 2,05 X – 276,25. Seharusnya dengan kedua metode itu kita tidak menemukan hasil
perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan
itu semata-mata disebabkan karena ketelitian perhitungan saja. Dengan jumlah desimal
yang mengambang sampai enam desimal, hasilnya adalah
Y = 2,057143 X − 277 ,428595
Baiklah kita coba dulu meramalkan berat badan dari persamaan garis regresi Y =
2X-268 seperti yang dihasilkan dengan perhitungan dengan metode skor kasar. Maka
untuk tinggi badan atau X tertentu, berat badannya atau Y-nya akan
Untuk X = 175
Y = 2(175)-268 = 82;
Untuk X = 174
Y = 2(174)-268 = 80;
Dan seterusnya . . . .
Untuk X = 150
Y = 2(150) – 268 = 32
Jika dari perhitungan-perhitungan itu kita buat suatu tabel berikut.
Tabel 9.1
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2 X – 268
Tinggi (cm)
Berat (kg)
Tinggi (cm)
Berat (kg)
Tinggi (cm)
Berat (kg)
X
Y
X
Y
X
Y
175
82
165
62
155
42
174
80
164
60
154
40
173
78
163
58
153
38
172
76
162
56
152
36
171
74
161
54
151
34
170
72
160
52
150
32
169
70
159
50
149
30
168
68
158
48
148
28
Samsudi - STATISTIKA
73
167
166
66
64
157
156
46
44
147
146
26
24
Bagaimana keadaannya jika kita menggunakan persamaan garis regresi Y = 2,05
X – 276,25 (seperti yang diperoleh dengan metode skor deviasi) dan persamaan garis
regresi Y = 2,057 143 X – 277,428 595 (yang diperoleh dengan ketelitian enam
desimal, baik dengan metode skor kasar ataupun skor deviasi)? Sambil
mendemontrasikan pentingnya ketelitian dalam perhitungan akan kita coba menyusun
tabel-tabel ramalan dengan persamaan garis regresi yang berbeda-beda itu.
X
Tabel. 9.2
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,05 X – 276,25
Y
X
Y
X
Y
175
174
173
172
171
82,5
80,5
78,4
76,4
74,3
165
164
163
162
161
62,0
60,0
57,9
55,9
53,8
155
154
153
152
151
41,3
39,5
37,4
35,4
33,3
170
169
168
167
166
72,3
70,2
68,2
66,1
64,1
160
159
158
157
156
51,8
49,7
47,7
45,6
43,6
150
149
148
147
146
31,3
29,2
27,2
25,1
23,1
Tabel 9.3
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,057 143X – 277,428 595
X
Y
X
Y
X
Y
175
174
173
172
171
82,6
80,5
78,5
76,4
74,3
165
164
163
162
161
62,0
59,9
57,9
55,8
53,8
155
154
153
152
151
41,4
39,4
37,3
35,3
33,2
170
169
168
167
166
72,3
70,2
68,2
66,1
64,1
160
159
158
157
156
51,7
49,7
47,6
45,5
43,5
150
149
148
147
146
31,1
29,1
27,0
25,0
22,9
Dari tiga tabel raalan yang telah kita susun itu tabel yang terakhir ini adalah
yang paling teliti, sedang tabel yang pertama merupakan tabel yang paling kurang teliti.
Ketelitian itu mungkin ada akibatnya dalam kesalahan ramalan atau residu. Ini dapat
kita uji dari perbandingan seperti di bawah ini.
Samsudi - STATISTIKA
74
9.2. Analisis Varians Garis Regresi
Sebelum kita melanjutkan pembicaraan mengenai analisis regresi dengan dua
prediktor atau lebih, ada baiknya kita membicarakan dulu apa yang sesungguhnya
disebut analisis regresi.
Jika suatu prediksi hanya menggunakan satu ubahan prediktor seperti contoh
ditas, pekerjaan “analisis regresi” seperti yang sudah kita kerjakan boleh dikatakan
selesai. Sebab besarnya korelasi antara prediktor dengan kriterium telah diketemukan,
uji signifikansinya sudah dijalankan; dan garis regresinya telah dibuat. Akan tetapi, jika
dalam prediksi digunakan beberapa prediktor, untuk menguji signifikansi garis
regresinya perlu dilakukan analisis variansi terhadap garis regresi tersebut. Apa yang
disebut analisis regresi sebenarnya adalah analisis variansi terhadap garis regresi,
dengan maksud untuk menguji signifikansi garis regresi yang bersangkutan. Dari
analisis regresi kita akan menghasilkan bilangan –F sebagaimana halnya jika kita
mengadakan analisis variansi. Untuk analisis regresi bilangan – F diperoleh dari rumus :
F reg =
RK
reg
RK
res
Dalam mana Freg = Harga bilangan – F untuk garis regresi;
RKreg = Rerata Kuadrat garis regresi; dan
RKres = Rerata Kuadrat residu.
Jadi bilangan –F regresi diperoleh dari membandingkan (nisbah) RK regresi dengan RK
residu. Makin besar harga RK residu akan makin kecil harga F regresi. RK residu RK
“error” memang mempunyai cirri semacam itu: dalam perhitungan nisbah – F harga
bilangan –F akan sangat ditentukan oleh harga RK “error” nya. Maka, dalam analisis
garis regresi, jika harga F - regresi sangat kecil dan tidak signifikan , maka garis
regresinya tidak akan memberikan landasan untuk prediksi secara efisien.
Walaupun analisis variansi garis regresi lebih efektif untuk menganalisis garis
regresi dengan beberapa prediktor, namun sebagai dasar pemahaman marilah kita coba
menganalisis data satu prediktor dalam contoh di depan.
Metode Skor Kasar :
Dari data yang telah dikomputasi kita ketahui :
∑Y
= 620
N
= 10
a
=2
∑Y2 = 39.432
∑XY = 102.732
K
= - 268
Dalam analisis variansi perhitungan yang paling banyak harus dilakukan adalah
perhitungan mengenai jumlah Kuadrat JK (Jumlah Kuadrat). Jika hasil perhitungan JK
kita masukkan dalam tabel ringkasan analisis varians, maka perhitungan rerata Kuadrat
RK dan F-nya tidak akan banyak menghadapi kesulitan. Tata kerja itu akan kita tempuh
juga dalam percobaan kita menerapkan rumus-rumus analisis variansi ini.
Samsudi - STATISTIKA
75
JKT = 39.432 −
6202
= 992
10
JKreg = 2(102.732) + (− 268)(620) −
6202
= 864
10
JKres = 992 − 864 = 128
dbT = 10 − 1 = 9
dbreg = 1
dbres = 9 − 1 = 8
Dengan Satu-Prediktor : (dengan skor kasar)
Sumber
Variasi
Regresi (reg)
db
JK
RK
1
(Σxy )2
JK reg
Σx 2
Residu (res)
N–2
Total T
(Σxy )
2
Σy 2 −
N–1
Σx
2
ΣY 2
Freg =
KRreg
KRres
;
dbreg
JK res
dbres
-
db = 1 lawan N-2
(dengan skor deviasi)
Sumber
Variasi
Regresi
(reg)
Residu (res)
Total ( T )
db
JK
1
(Σxy )2
Σx 2
N–2
2
(
Σxy )
Σy 2 −
N–1
ΣY 2
Samsudi - STATISTIKA
Σx 2
RK
JK reg
dbreg
JK res
dbres
-
Freg
RK reg
RK res
-
76
(dari rxy)
Sumber
Variasi
Regresi(reg)
Residu (res)
Total ( T )
db
JK
RK
(r )(Σ y )
(r )(Σ y )
1
2
N–2
N–1
2
2
2
ΣY
2
(1 − r )(Σ y )
2
(1 − r )(Σ y )
2
2
N − 2
-
2
Freg
(r )(N − 2)
2
1− r2
-
TABEL RINGKASAN
Sumber
Variasi
Regresi(reg)
Residu (res)
Total ( T )
db
JK
RK
1
8
9
864
128
992
864
10
-
Freg
54,00
p
< 0,01
-
-
Metode skor deviasi
Telah kita ketahui :
∑x2 = 210
∑y2 = 992
JKT = 992
JK reg
JK reg
∑xy = 432
N = 10
dbT = 10 − 1 = 9
4322
=
= 888,69
120
= 992 − 888,69 = 103,31
dbreg = 1
dbres = 9 − 1 = 8
TABEL RINGKASAN
Sumber
Variasi
Regresi(reg)
Residu (res)
Total ( T )
db
JK
RK
Freg
p
1
8
9
888,69
103,31
992
888,69
12,91
-
68,84
-
< 0,01
-
Melalui rxy :
Telah kita ketemukan :
r= 0,946
Samsudi - STATISTIKA
∑y2 = 992
N = 10
77
JKT = 992
dbT = 10 − 1 = 9
dbreg = 1
JK reg = (0,946) (992) = 887,76
2
JK
reg
= 992 − 887 , 26 = 1
dbres = 9 − 1 = 8
TABEL RINGKASAN
Sumber
Variasi
Regresi(reg)
Residu (res)
Total ( T )
db
JK
RK
Freg
p
1
8
9
887,76
104,24
992
887,76
13,03
-
68,13
-
< 0,01
-
Dari tiga perhitungan tersebut kita memperoleh harga F regresi yang berbedabeda : yang pertama F = 54,00; yang kedua F= 68,84; dan yang ketiga F = 68,13. Dua
harga F yabf terakhir boleh dikatakan sama, tetapi harga F dari perhitungan yang
pertama ternyata sangat rendah. Seharusnya, dengan metode manapun hasilnya akan
sama saja. Perbedaan itu disebabkan karena ketelitian perhitungan.
9.3. Analisis Regresi: Dua Prediktor
Prinsip-prinsip untuk memprediksi kriterium dari satu prediktor berlaku juga
untuk memprediksi kriterium dari dua prediktor atau lebih. Dengan sedikit memperluas
perhitungannya , akan kita coba bagaimana menyelesaikan anlaisis regresi dengan dua
prediktor lebih dahulu.
Persamaan skor regresi dua prediktor adalah :
Y = a1 X1 + a2 X 2 + K
Dalam skor deviasi persamaan itu dapat dituliskan
y = a1 x1 + a 2 x2
Oleh karena itu dengan kalkulator tangan metode skor deviasi jauh lebih efisien
daripada metode skor kasar, maka dalam contoh analisis di bawah ini akan digunakan
saja metode skor deviasi. Metode skor kasar dapat juga kita coba sebagian untuk
mengetahui sekedar cara-cara menghitungnya.
Untuk menyelesaikan perhitungan garis regresi y = a1 x1 + a 2 x 2 harga koefisisen
prediktor a1 dan a2 dapat kita cari dari persamaan simultan :
Contoh :
Misalkan seorang peneliti ingin memastikan apakah nilai Statistik Dasar (Y)
dapat diprediksikan dari nilai Pretes Aljabar (X1) dan nilai Indeks Prestasi SMA (X2),
apa tidak. Untuk itu peneliti tersebut misalkan telah mengumpulkan data sebagai
berikut:
Samsudi - STATISTIKA
78
Mhs.
No.
1
2
3
4
5
6
7
8
9
10
X1
X2
Y
57
93
79
26
69
3,00
2,85
3,20
2,49
3,07
27
34
27
24
35
24
76
61
82
29
2,38
3,74
2,62
2,53
3,17
18
33
39
35
25
Dengan kalkulator kita akan menghasilkan perhitungan
N
= 10
∑X 12 = 41.214
∑X1 = 596
∑X2 = 29,05
∑X 22 = 85,9537
∑Y
= 297
∑Y2 = 9.199
∑X1X2
= 1.765,99
∑X1Y = 18.787
∑X2Y = 867,75
Jika hasil perhitungan itu kita ubah dalam skor deviasi maka akan kita peroleh :
( X)
596
∑ = ∑ − ∑N = 41 .214 − 10 = 5 .692 , 4
( X )
29 , 05
∑ = ∑ − ∑ N = 85 ,9537 − 10 = 1,56345
( y)
297
∑ y = ∑ y − ∑N = 9 ,199 − 10 = 378 ,1
( X )( X )
(596)(29,05) = 34,61
∑ X X = ∑ X X − ∑ ∑ = 1.765,99 −
2
2
2
1
1
2
2
2
2
2
1
2
2
2
2
2
1
1
2
1
2
2
∑X Y = ∑X Y −
1
2
2
1
N
(∑ X 1 )(∑ Y )
10
=18.787 −
(596)(297 ) = 1.085,8
10
(29,05)(297 ) = 4,965
=867,75 −
∑ X 1Y = ∑ X 2Y −
N
10
Persamaan simultan untuk menentukan a1 dan a2 adalah :
∑x
(2). ∑ x
(1).
Samsudi - STATISTIKA
N
(∑ X 2 )(∑ Y )
1
y = a 1 Σ x 12 + a 2 Σ x 1 x 2
2
y = a1Σ x1 x 2 + a 2 ∑ x 22
79
Diisikan dan dikerjakan
(1).
(2).
(1)
(2)
(3)
1.085,8
= 53692,4 a1 + 34,61
a2
4,965 = 34,61 a1 + 1,563 45 a2
; 34, 61 = 31,372 435 71 = 164, 472 695 7 a1+ a2
; 1,56345 = 3,175 669 19 = 22, 136 940 74 a1+ a2
– (4)
= 28,196 766 52 = 142, 335 755 a1
28,19676652
a1 =
= 0,198100375
142,335755
(4) 3,17569919 = (22,13694074 )(0,198100375) + a2
= 4,385336261 + a2
a2 = 3,17566919 − 4,385336261 = −1,2095667071
Persamaan garis regresi dalam skor deviasi yang kita cari adalah :
Y = a1 x1 + a2 x2
(
Y = a (X
) (
− X ) + a (X
Y − Y = a1 X 1 − X 1 + a2 X 2 − X 2
1
1
1
2
2
− X2
)
)+ Y
Dari pekerjaan di muka dapat diketemukan :
596
= 59,6
X1 =
10
29,05
= 2,905
X2 =
10
297
= 29,7
Y=
10
a1 = 0,198100375
a2 = −1,209667071
Jadi,
Y = (0,198100375)( X 1 − 59,6 ) + (− 1,209667071)( X 2 − 2,905) + 29,7
= 0,198100375 X 1−11,80678235 − 1,209667071X 2 + 3,514082841 + 29,7
Y = 0,198100375 X 1 − 1,209667071X 2 + 21.40730049
Jika dibulatkan : Y = 0,2 X 1 − 1,2 X 2 + 21,4 → Y = a1 x1 − a2 x2 + K
Catatan : Pembulatan ini hanya untuk menggampangkan pencatatan
Untuk perhitungan-perhitungan (selanjutnya) masih baru
Digunakan bilangan yang belum dibulatkan.
Koefisien korelasi antara kriterium Y dengan prediktor X1 dan prediktor X2
dapat diperoleh dari rumus :
Samsudi - STATISTIKA
80
a 1Σ x1 y + a 2 Σ x 2 y
Σy 2
R y (1, 2 ) =
∑x1y
∑x2y
∑y2
RY(1,2) = Koefisien korelasi antara Y dengan X1 dan X2
a1 = Koefisien prediktor X1
a2 = Koefisien prediktor X2
= Jumlah setujuduk antara X1 dengan Y
= Jumlah setujuduk antara X2 dengan Y
= Jumlah Kuadrat kriterium Y
Jika hasil-hasil perhitungan di muka diisikan ke dalam rumus di atas :
(0,198100375 )(1 .085 ,8 ) + (− 1, 209667071 )(4,965 )
R y (1, 2 ) =
378 ,1
= 0,553005527 = 0,743643414
Jadi Ry(1,2) = 0,744
Dan R2y(1,2) = 0,553005527
Dalam perhitungan tersebut sekaligus dicari harga R2y(1,2) oleh karena dalam analisis
regresi nanti yang kita pakai adalah harga R2y(1,2)
Untuk menjawab pertanyaan, apakah harga Ry(1,2) = 0,744 itu signifikan apa
tidak, analisis regresi tidak lain adalah analisis regresi. Seperti sudah kita kenal, analisis
regresi tidak lain adalah analisis harga F si garis regresi. Dari analisis ini kita akan
menemukan harga F garis regresi, yang kemudian dapat kita uji apakah harga F itu
signifikan ataukah tidak.
Rumus F yang paling efisien, jika koefisien korelasi antara kriterium dengan
prediktor-prediktorny a telah diketemukan, adalah:
F reg
R 2 (N − m − 1)
=
m 1− R2
(
)
F reg = Harga F garis regresi
N
= Cacah kasus
m = Cacah prediktor
R
= Koefisien korelasi antara kriterium dengan prediktor-prediktor.
Derajat kebebasan atau db untuk menguji harga F itu adalah m lawan N – m – 1.
Diisikan :
F reg =
(0 ,553055527 )(10 − 2 − 1) = 4,330 < 4,74
2 (1 − 0 ,553005527 )
Dengan db = m lawan N-m-1 atau 2 lawan 7 harga Ft5% = 4,74 jadi, jika
demikian, harga Freg sebesar 4,330 itu tidak signifikan. Kita menyimpulkan, tidak ada
korelasi antara Y dengan X1 dan X, atau antara nilai statistika Dasar dengan nilai Pretest
Samsudi - STATISTIKA
81
Aljabar dan persen kita tidak berani menggunakan prediktor nilai Pretest Aljabar dan
nilai Indeks Prestasi SMA untuk memprediksi nilai Statistik Dasar.
Rumus F regresi yang baru disebutkan di atas diperoleh dari setujuses analisis
variasi garis regresi yang agak panjang. Keseluruhan setujuse situ dapat dilihat dalam
tabel rangkuman analisis regresi sebagai berikut :
TABEL RINGKASAN ANALISIS REGRESI
Sumber
Variasi
db
JK
R2
m
Regresi(reg)
Residu (res)
Total ( T )
(∑ y )
( )
(1− R2 )(Σy2 )
N-1
∑y2
)
R 2 Σy2
m
=
1 − R 2 Σy2
N − m −1
(
)(
)
R 2 Σy 2
m
1 − R 2 Σy 2
N − m −1
--
2
N-m-1
(
Freg
RK
(
)( )
R 2 (N − m − 1 )
=
m 1− R2
(
)
Jadi, jika seluruh proses analisis tersebut kita ikuti, maka :
(
)
JK reg = R 2 Σ Y 2 = (0 ,553005527
)(378 ,1) = 209 ,0913897
db reg = m = 2
JK
RK reg =
(
reg
db reg
=
)(
209 , 0913897
= 104 ,5456948
2
)
JK res = 1 − R 2 Σ Y 2 = (1 − 0,553005527 )(378 ,1) = 169 ,0086102
dbres = N − m − 1 = 10 − 2 − 1 = 7
RK res =
JK res 169 ,0086102
=
= 24 ,14408717
7
dbres
JadiFreg =
RK reg
RK res
=
104 ,5456948
= 4,330
24 ,14408717
Hasil analisis regresi tersebut kemudian dapat kita masukkan dalam tabel
ringkasan analisis sebagai berikut :
Samsudi - STATISTIKA
82
TABEL RINGKASAN ANALISIS REGRESI
Sumber
Variasi
db
Regresi(reg)
2
Residu (res)
7
Total ( T )
9
JK
RK
209,091 389 7
104,545 694 8
169,008 610 2
24, 144 087 17
378,1
----------
F = 4,330
Jika diinginkan mencari harga F regresi dengan rumus skor kasar, rumusnya
adalah :
2
⎡
⎤
( N − m − 1 )⎢ a1Σ X 1Y + a 2 Σ X 2Y + K Σ Y − (Σ Y ) ⎥
N ⎦
⎣
Freg =
2
m Σ Y − a1Σ x1 y − a 2 Σ X 2Y − K Σ Y
(
)
Untuk mengingat kembali data dan hasil-hasil perhitungan yang sudah kita
ketemukan :
N = 10
m=2
a1 = 0,198 100 375 a2 = 1,209 667 071 K = 21, 407 300 49
∑X2Y = 867,75
∑X1Y = 18.787
∑Y = 297
∑Y2 = 9.199
Dikerjakan
N – m – 1 = 10 – 2 – 1 = 7
a1∑X1Y = (0,198 100 375) (18.787) = 3.721,711 745
a2∑X2Y = (-1,209 667 071) (867,75) = - 1.049,688 6
K∑Y
= (21,407 300 49) (297)
= 6.375, 968 245
2
2
(ΣY ) = 297 = 8.820,9
N
10
Diisikan :
7 (3.721,711745 + −1.049 ,6886 + 6.357 ,968245 − 8.820 ,9 )
2(9.199 − 3.721,711745 − 1.049 ,6886 − 6.357 ,968245 )
1.463,63973
=
= 4,330
338,01722
Freg =
Rumus-rumus skor kasar untuk analisis regresi dapat dirangkum dalam tabel
seperti di bawah ini :
Samsudi - STATISTIKA
83
TABEL RINGKASAN ANALISIS REGRESI
Sumber
Variasi
Regresi(reg)
db
m
Residu (res)
N-m-1
Total ( T )
N-1
Jadi Freg
JK
RK
a1ΣX 1Y + a2 ΣX 2Y + KΣY −
(ΣY )2
JK reg
N
dbreg
ΣY 2 − a1Σx1 y − a2 ΣX 2Y − KΣY
ΣY
2
2
(
ΣY )
−
N
JK res
dbres
--
2
⎡
(
ΣY ) ⎤
(N − m − 1)⎢a1ΣX 1Y + a2ΣX 2Y + KΣY −
⎥
N ⎦
⎣
=
m ΣY 2 − a1Σx1 y − a2ΣX 2Y − K ΣY
(
)
Dikerjakan berikutnya :
JK reg = a1ΣX 1Y + a2ΣX 2Y + KΣY −
(ΣY )2
N
= 3.721,711745 + −1.049,6886 + 6.357,968245 − 8.820,9
= 209,09139
dbreg = m = 2
RK reg =
JK reg
dbreg
=
209,09138
= 104,545695
2
JK res = ΣY 2 − a1Σx1 y − a2ΣX 2Y − KΣY
= 9.199 − 3.721,711745 − −1.049,6886 − 6.357,968245
= 169,00861
dbres = N − m − 1 = 10 − 2 − 1 = 7
RK reg 169,00861
RK res =
=
= 24,14408714
7
RK res
RK reg
104,545695
=
= 4,330
Jadi Freg =
RK res 24,14408714
Sebagaimana biasa dari hasil analisis variansi garis regresi dibuatlah tabel ringkasan
analisis. Maka jika kita buat tabel ringkasan analisis regresi, hasilnya akan nampak
seperti tabel ringkasan analisis regresi seperti yang baru kita buat di muka.
Telah dikemukakan, apabila dalam mengerjakan analisis regresi kita hanya
mempunyai kalkulator tangan, cara yang paling efisien adalah menggunakan metode
Samsudi - STATISTIKA
84
skor deviasi. Karena itu untuk analisis-analisis berikutnya akan kita gunakan saja
metode skor deviasi, dan untuk metode skor kasar hanya akan dikemukakan rumusnya,
saja.
9.4. Analisis Regresi : m – Prediktor
Prinsip-prinsip analisis regresi dua prediktor berlaku sepenuhnya untuk analisis
regresi tiga prediktor, empat prediktor, lima prediktor dan seterusnya, jika dengan
sedikit perluasan. Hal tersebut dengan mudah kita fahami jika bandingkan rumusrumusnya untuk garis regresi maupun untuk koefisien korelasinya. Periksalah rumusrumus dibawah ini.
Persamaan Garis Regresi
Dua Prediktor :
Y = a1 x1 + a 2 x2 + K
Tiga Prediktor : Y = a1 x1 + a2 x2 + a3 x3 + K
Empat Prediktor : Y = a1x1 + a2 x2 + a3 x3 + a4 x4 + K
m – Prediktor
: Y = a1 x1 + ......am xm + K
Koefisien Korelasi
Dua Prediktor : R
y
(1 , 2 ) =
Tiga Prediktor : R
y
(1 , 2 ) =
Empat Prediktor : R y (1, 2 ) =
m – Prediktor
: R y (1 , 2 ) =
Samsudi - STATISTIKA
a1Σ x1 y + a 2 Σ x 2 y
Σy2
a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y
Σy 2
a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y + a 4 Σ x 4 y
Σy 2
a 1 Σ x 1 y + ....... + a m Σ x m y
Σy 2
85
Soal Latihan
1. Jika suatu penelitian ingin menguji apakah berat badan orang pada kelompok umur
tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu dikumpulkan data
tinggi badan dan berat badan sepuluh orang sebagai berikut :
Subyek
No.
1
2
3
4
5
6
7
8
9
10
Tinggi
(dalam cm)
X.
168
173
162
157
160
165
163
170
168
164
Berat
(dalam kg)
y
63
81
54
49
52
62
56
78
64
61
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.
2. Seorang peneliti akan menguji apakah nilai Praktik Kelistrikan Otomotif (X1) dan
Praktik Chasis (X2) berpengaruh terhadap nilai Praktik Trouble Shoting (Y)
mahasiswa Pendidikan Teknik Mesin. Untuk itu peneliti tersebut telah
mengumpulkan data sebagai berikut :
Mhs.
No.
X1
X2
Y
1
60
67
78
2
72
66
82
3
79
65
80
4
68
87
81
5
69
75
83
6
78
77
85
7
76
67
78
8
61
65
86
9
82
66
78
10
68
62
77
11
70
63
75
12
71
70
76
13
72
73
73
14
69
68
72
15
82
81
71
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.
Samsudi - STATISTIKA
86
DAFTAR PUSTAKA
Christensen, Larry B. 2001. Expeprimental Methodology. (Eighth Edition). Boston:
Allyn and Bacon.
Guilford, J.P; Fruchter, benjamin. 1985. Fundamental Statistics in Psychology and
Education. (Sixth Edition). Bogota: McGraw-Hill Book Co.
Hadi, Sutrisno. 1982. Statistik, Jilid 1, 2 dan 3. Yogyakarta: Fakultas Psikologi UGM
Hadi, Sutrisno. 1991. Analisis Regresi. Yogyakarta: Andi Offset
Mendenhall, William; Ott, Lyman; Larson, Ricahrd F. 1974. Statistics: a Tool for the
Social Sciences. California: Duxbury Press.
Sudijono, Anas. 1996. Pengantar Statitik Pendidikan. Jakarta: Rajawali
Sudjana. 1991. Desain dan Analisis Eksperimen. Edisi III. Bandung: Tarsito.
Sudjana. 1989. Statistika. Edisi ke 5. Bandung: Tarsito
Samsudi - STATISTIKA
87
Download