Prak statistika

advertisement
Politeknik Telkom
Praktikum Statistika
PRAKTIKUM STATISTIKA
POLITEKNIK TELKOM
BANDUNG
2008
i
MODUL 1
Politeknik Telkom
Praktikum Statistika
Dilarang menerbitkan kembali, menyebarluaskan atau menyimpan baik
sebagian maupun seluruh isi buku dalam bentuk dan dengan cara apapun
tanpa izin tertulis dari Politeknik Telkom.
Hak cipta dilindungi undang-undang @ Politeknik Telkom 2008
No part of this document may be copied, reproduced, printed, distributed, modified,
removed and amended in any form by any means without prior written
authorization of Telkom Polytechnic.
Copyright @ 2008 Telkom Polytechnic. All rights reserved
ii
MODUL 1
Politeknik Telkom
Praktikum Statistika
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.
Segala puji bagi Allah SWT karena dengan karunia-Nya courseware ini dapat
diselesaikan.
Atas nama Politeknik Telkom, kami sangat menghargai dan ingin
menyampaikan terima kasih kepada penulis, penerjemah, dan penyunting atas
kontribusi yang telah diberikan sehingga courseware ini dapat tersusun.
Kami mendorong para pengajar & mahasiswa untuk memberikan masukan
yang positif. Saran mereka akan menjadi bahan pertimbangan yang serius dan
banyak yang akan dimasukkan sebagai bahan perbaikan di edisi berikutnya.
Kami akan sangat menghargai apabila semua pihak dapat menyampaikan
pendapatnya melalui [email protected].
Semoga courseware ini dapat memberikan manfaat bagi seluruh Civitas
Akademika Politeknik Telkom dalam memahami materi perkuliahan di
Politeknik Telkom.
Wassalamu’alaikum Wr. Wb.
Bandung, Desember 2008
Christanto Triwibisono
Wakil Direktur I
Bidang Akademik & Pengembangan
iii
MODUL 1
Politeknik Telkom
Praktikum Statistika
DAFTAR ISI
KATA PENGANTAR .............................................................. iii
DAFTAR ISI ..............................................................................iv
1
PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL ................... 1-1
1.1 Menu-menu pada Minitab 15 ....................................... 1-2
1.2. Mengenal Data ............................................................. 1-14
1.2.1 Populasi dan sampel ................................................... 1-14
1.2.2 Skala pengukuran ....................................................... 1-15
1.3 Metode Sampling .......................................................... 1-17
1.4 Aplikasi dengan minitab ................................................ 1-19
2
STATISTIKA DESKRIPTIF ................................. 2-1
2.1 Ukuran Pemusatan........................................................... 2-2
2.2 Ukuran Penyebaran ......................................................... 2-2
2.5 Penyajian dalam Bentuk Grafik ........................................ 2-5
2.6 Aplikasi dengan minitab ................................................... 2-6
3
KENORMALAN DATA........................................ 3-1
3.1 Distribusi normal ............................................................. 3-2
3.2 Statistik uji kenormalan .................................................. 3-3
3.3 Aplikasi dengan minitab ................................................... 3-5
4
TRANSFORMASI DATA ..................................... 4-1
4.1 Transformasi untuk satu angkatan data ........................... 4-2
4.2 Transformasi untuk beberapa angkatan data (menyamakan
sebaran) ........................................................................ 4-3
4.3 Aplikasi Minitab............................................................. 4-5
5
UJI HIPOTESIS STATISTIK DAN PROPORSI 5-1
5.1 Hipotesis statistik ............................................................ 5-2
5.1.1 Pengujian hipotesis untuk satu nilai tengah ................. 5-3
5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah ....... 5-4
iv
MODUL 1
Politeknik Telkom
Praktikum Statistika
5.1.3 Aplikasi dengan minitab ................................................ 5-7
5.2 Uji proporsi .................................................................. 5-11
5.2.1 Uji terhadap satu nilai proporsi ................................. 5-11
5.2.2 Aplikasi dengan Minitab .............................................. 5-12
5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai
proporsi ...................................................................... 5-15
5.2.4 Aplikasi dengan Minitab .............................................. 5-15
5.2.5 Pengujian perbandingan dua proporsi ....................... 5-17
5.2.6 Aplikasi dengan Minitab .............................................. 5-18
6
ANALISIS VARIANSI .......................................... 6-1
6.1 Asumsi-asumsi pada analisis variansi ............................... 6-2
6.2 Uji Kesamaan Ragam ....................................................... 6-2
6.3 Tabel analisis variansi ....................................................... 6-3
7
REGRESI LINIER DAN NON-LINIER
SEDERHANA ........................................................ 7-1
7.1 Regresi ............................................................................. 7-2
7.1.1 Model untuk regresi linier sederhana ......................... 7-2
7.1.2 Model regresi non linier .............................................. 7-4
7.1.2.1 Model eksponensial .................................................. 7-4
7.1.2.2 Model geometrik (power ) ....................................... 7-4
DAFTAR PUSTAKA ..........................................................
v
MODUL 1
Politeknik Telkom
1
Praktikum Statistika
PENGENALAN MINITAB 15, DATA, DAN
TEKNIK PENGAMBILAN SAMPEL
Overview
Modul ini memberikan pengenalan singkat tentang software Minitab 15
kepada mahasiswa. Pengenalan tentang menu diberikan diawal, sehingga
diharapkan mahasiswa memiliki gambaran umum tentang penggunaan
software ini. Setelah dapat menjalankan software ini, mahasiswa akan
dikenalkan pada beberapa jenis data berdasarkan skala pengukurannya. Pada
tahap akhir, mahasiswa akan diajarkan tentang pengambilan sampel dari
populasi dengan menggunakan beberapa teknik sampling
Tujuan
1.
2.
3.
1-1
Mahasiswa mendapatkan gambaran singkat tentang software Minitab
Mahasiswa dapat membedakan data berdasarkan skala pengukurannnya
Mahasiswa dapat melakukan pengambilan data sampel berdasarkan data
populasi dengan menggunakan beberapa metode sampling
MODUL 1
Politeknik Telkom
1.1
Praktikum Statistika
Menu-menu pada Minitab 15
Pada software minitab, tampilannya ada 2, yaitu windows worksheet dan
windows session. Worksheet merupakan tempat untuk mengetikkan data dan
menampilkan hasil pengolahan data. Sedangkan session merupakan tempat
untuk menampilkan semua perintah-perintah (command-command) yang
telah kita lakukan dalam bentuk program dan hasil dari pengolahan data yang
tidak dapat ditampilkan pada worksheet. Adapun tampilan minitab sebagai
berikut :
Adapun menu-menu pada minitab 15 yaitu :
1. File
Pada menu file terdapat sub-sub menu antara lain :
- New : menampilkan worksheet baru
1-2
MODUL 1
Politeknik Telkom
1-3
Praktikum Statistika
-
Open project : menampilkan data yang telah disimpan pada file kita.
Di bawah open project, terdapat save projects, save projects as,
project description.
-
Open worksheet : menampilkan data yang telah disimpan dan
disediakan software minitab. Di bawah sub menu ini, terdapat save
worksheet, save worksheet as.
MODUL 1
Politeknik Telkom
-
Praktikum Statistika
Query database :
Open graph : membuka grafik yang telah disimpan
Other file : membuka data dari file lain
Print session window : mencetak tampilan pada session.
Print setup : mencetak dengan pengaturan tampilan pada worksheet
dan session.
- Exit : Keluar dari minitab
Adapun tampilan dari menu file sebagai berikut :
-
1-4
MODUL 1
Politeknik Telkom
2.
Edit
Sub-sub menu pada menu edit adalah :
-
1-5
Praktikum Statistika
undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi n)
redo : kembali ke pekerjaan ke- n+1 (bila kita diposisi n)
Clear cells : membersihkan data pada sel-sel worksheet
Delete cells : menghapus sel-sel
Copy cells : menyalin data pada sel
Cut cells : memotong sel (menyalin dan menghapus)
Worksheet link : memindahkan data yang telah disalin baik dari sel,
atau file minitab atau word, excel, dan lain-lain.
Select all cells : memilih atau menyorot semua data pada sel-sel
untuk pengolahan
Edit last dialog : mengedit dialog terakhir
Command line editor : digunakan untuk mengeksekusi perintah
secara cepat atau mengekseksekusi ulang atau mengedit perintah
yang digunakan pada sesi sebelumnya.
MODUL 1
Politeknik Telkom
3.
Data
Menu data berisi perintah-perintah menampilkan data. Sub-sub menu
yang terdapat pada menu data yaitu :
-
1-6
Praktikum Statistika
Subset worksheet : menampilkan sebagian worksheet
Split worksheet : membagi worksheet menjadi beberapa worksheet
Merge worksheet : menggabungkan beberapa worksheet
Sort : mengurutkan data (mengurutkan suatu kolom berdasarkan
kolom lainnya )
Rank : merangking data (membuat rangking suatu kolom)
Delete rows : menghapus baris
Erase variabels : menghapus variabel-variabel
Copy columns : mengkopi kolom
Stack/unstack : menggabung data pada kolom yang berbeda menjadi
satu kolom/ memisahkan data pada satu kolom menjadi beberapa
kolom berdasarkan kriteria tertentu
Code : mengkonversi data (numerik ke numerik, numerik ke teks
dsb)
Change data type : merubah tipe data
Extract from Date/Time : ekstrak data numerik ke text atau
sebaliknya
Concatenate : menggabung dua atau lebih kolom yang berisi data
text menjadi satu kolom, syarat penjang kolom sama.
Display data : menampilkan data
MODUL 1
Politeknik Telkom
4.
1-7
Praktikum Statistika
Calc (calculation)
Pada menu calc terdapat sub-sub menu :
- Calculator : untuk melakukan perhitungan (penjumlahan, perkalian,
pembagian, sinus, maksimum, eksponen, dan lain-lain)
- Column statistics : menghitung ukuran-ukuran statistik dari suatu
kolom
- Row statistics : menghitung ukuran-ukuran statistik dari suatu baris
- Standardize : menormalisasikan data
- Make patterned data : membuat suatu kolom(data) dengan pola
tertentu
- Make mesh data : Membuat sebuah fungsi dua dimensi seperti
permukaan berdasarkan pasangan nilai x dan y
- Make indicator variables : membuat variabel dummy untuk data
kualitatif
- Set base : menetapkan titik awal untuk pembangkitan data acak. Bila
kita tidak mengeset titik tersebut, maka titik tersebut akan
ditentukan oleh minitab.
- Random data : membangkitkan data acak dari berbagai distribusi
- Probability distributions : menghitung peluang dan distribusi
kumulatif peluang dan inversnya dari berbagai distribusi peluang.
- Matrices : merupakan sub menu untuk menghitung matriks dan
operasi-operasinya
Adapun tampilan menu calc adalah
MODUL 1
Politeknik Telkom
5.
1-8
Praktikum Statistika
Menu Stat
Sub-sub menu pada menu stat adalah :
- Fit interceps : mendefault intersep pada persamaan regresi
- Basic statistics : a) descriptiv statistics : menampilkan ukuran-ukuran
statistics, seperti mean, median, trimean, standart deviasi, kuartil,
maksimum dan minimum, b) uji hipotesis 1 sampel, 2 sampel , c)
correlation, d) covariance, e) normallity test
- Regression : mencari persamaan regresi serta analisisnya, baik
regresi linier maupun non linier untuk kuantitatif maupun kualitatif
- Anova : menganalisis perbedaan lebih dari dua populasi berdasarkan
nilai ragam
- DOE : membuat desain rancangan percobaan faktorial
- Control charts : membuat bagan-bagan kendali
- Quality tools : mengalisis data untuk pengendalian kualitas
- Reliability/survival : membuat plot untuk analisis kehandalan sistem
- Multivariate : menganalisis data banyak peubah
- Time series : menganalisis data deret waktu untuk peramalan
- Tables : membuat tabel kontingensi dan analisis korespondensi
- Nonparametrik : menganalisis data kualitatif tanpa asumsi distribusi
tertentu
- EDA (Eksploratory Data Analysis) : memahami dan mengalisis data
melalui diagram dahan daun, box plot, garis resisten, dll
- Power and sample size : digunakan untuk menghitung power
(peluang kita akan menolak H0 ketika ia salah), ukuran sampel,
perbedaan minimum (ditampilkan sebagai nilai proporsi alternatif)
pada uji satu proporsi.
MODUL 1
Politeknik Telkom
Praktikum Statistika
Tampilan menu stat adalah sebagai berikut :
6.
1-9
Menu Graph
Pada menu graph berisi sub-sub menu seperti pada tampilan di bawah
yang digunakan untuk membuat grafik-grafik seperti histogram, diagram
lingkaran, plot, countur, plot untuk data time series, box plot, diagram
dahan daun. Untuk grafik-grafik tertentu dapat ditampilkan dalam dua
dimensi maupun tiga dimensi.
MODUL 1
Politeknik Telkom
7.
Praktikum Statistika
Menu Editor
Berikut adalah sub-sub menu editor pada worksheet :
- Next column : memindahkan kursor ke kolom berikutnya
- Go to active cell : memindahkan kursor ke sell yang aktif
- Format column : memformat kolom dalam numerik, tanggal, text.
- Column : mengatur ukuran-ukuran kolom
- Formulas : menampilkan formula-formula ke kolom dan menghitung
formula secara otomatis.
- Worksheet : mengedit sel yang sedang aktif dan merubah arah
inputan
- Define custom list : mengurutkan data
- Clipboard setting : merubah setting untuk data hilang
1-10
MODUL 1
Politeknik Telkom
Praktikum Statistika
Adapun tampilan menu editor adalah :
Berikut adalah sub-sub menu pada menu editor session :
- Next command : memindahkan kursor ke command berikutnya
- Previous command : memindahkan kursor ke command sebelumnya
- Enable command language : menampilkan bahasa pemrograman yang
dieksekusi , MTB >
- Output editable : mengeset tampilan output hanya dapat di baca
- Find : mencari kata tertentu dalam lingkup session
- Replace : mencari kata tertentu dan menggantinya dengan kata lain
dalam lingkup session
- Apply Font : command font untuk memberlakukan pemilihan font
untuk I/O, title, command.
1-11
MODUL 1
Politeknik Telkom
8.
Praktikum Statistika
Tools
Adapun sub-submenu pada menu tools adalah
- Microsoft Calculator : Menampilkan menu calculator microsoft
- Notepad : Menampilkan notepad
- Windows Explorer : Menampilkan menu windows explorer
- Toolbars : Untuk men-setting tool – tool yang ingin ditampilkan atau
tidak
- Status Bar : Status bar terletak dibagian bawah layar dan
menampilkan pesan yang menjelaskan item menu dan toolbars yang
saat ini sedang aktif.
- Customize : Digunakan untuk mengedit/menambah/menampilkan
shortcut perintah (command), Toolbars, tool dan lain-lain pada
Minitab
- Options : Digunakan untuk merubah dan menyimpan settingan
standar untuk berbagai macam operasi
- Manage Profiles :Digunakan untuk membuat, menghapus,
mengaktifkan atau menonaktifkan satu atau beberapa profil termasuk
mengubah urutan nya.
- File Security :digunakan untuk melindungi file proyek dari pihak lain
1-12
MODUL 1
Politeknik Telkom
Praktikum Statistika
Tampilan menu tools adalah
9.
Menu Windows
Sub-sub menu pada menu windows digunakan untuk mengatur tampilan
dari windows minitab dan menyimpan data, session, grafik yang telah
dibuat untuk sementara, yaitu :
1-13
MODUL 1
Politeknik Telkom
Praktikum Statistika
10. Menu Help
Menu ini digunakan untuk membantu user, apabila terdapat kesulitan
waktu menggunakan minitab, baik masalah teori, maupun commandnya.
1.2. Mengenal Data
1.2.1 Populasi dan sampel
Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus
persen berhubungan dengan data. Data dalam bidang statistika merupakan
keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan
dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih
banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih
dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika
yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan
data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta
pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis.
Sedangkan data itu sendiri merupakan keterangan yang menggambarkan
kondisi saat itu.
Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan
2) data sekunder. Data primer adalah keteranngan atau informasi secara
1-14
MODUL 1
Politeknik Telkom
Praktikum Statistika
umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data
sekunder merupakan data yang diambil dari penelitian orang lain pada suatu
publikasi.
Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan
sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah
objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan
sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari
pengambilan sampel adalah :
1.
Waktu
Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat
dipilih sebagai alternatif pengambilan data.
2.
Biaya
Untuk penelitian mengenai suatu komponen yang harganya mahal, bila
pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar.
Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel.
3.
Populasi tidak pasti
Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang
orang berpenyakit flu burung, maka kita akan kesulitan menentukan
populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang
kena flu burung atau tidak. Sehingga pengambilan sampel perlu dilakukan
yaitu pasien flu burung pada suatu rumah sakit.
4.
Ketelitian
Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya
dan waktu penelitian terbatas, maka jumlah tenaga yang membantu
penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya
berpengaruh pada tingkat ketelitian.
1.2.2 Skala pengukuran
Skala pengukuran merupakan bagian yang paling mendekati pengukuran data
baik secara diskret maupun kontinu. Skala ini sangat penting, karena berkaitan
dengan pemilihan teknik analisis statistika yang sangat bergantung pada sifat
1-15
MODUL 1
Politeknik Telkom
Praktikum Statistika
data dan skala pengukuran yang digunakan. Ditinjau berdasarkan skala
pengukurannya, data dapat dibedakan menjadi beberapa kelompok, yaitu (
dari yang terendah sampai yang tertinggi ) :
a.
Skala Nominal
Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak
memiliki tingkatan. Satu – satunya operator matematika yang berlaku
adalah persamaan dan pertidaksamaan.
Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan
sebagainya.
b.
Skala Ordinal
Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja
belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan
lebih dari.
Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai
huruf, peserta kontes kecantikan, jenis komputer dan sebagainya.
c.
Skala Interval
Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang
masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan
adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap
Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu
30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang
lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya
( tidak ada).
Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0
bukan berarti tidak ada tahun.
d.
Skala Rasio
Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua
sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat
untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya
( tidak ada ).
Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya.
1-16
MODUL 1
Politeknik Telkom
Praktikum Statistika
Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan
analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki
skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan
tidak dapat ditentukan ukuran
ukuran statistik seperti mean, standard
deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa
seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus
ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih
lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan
statistika nonparametrik. Sedangkan data yang berskala interval atau Rasio
dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat
dilakukan pada data dengan kedua skala terakhir ini relatif sama.
1.3 Metode Sampling
Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling (metode
pengambilan sampel ) yaitu :
1. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 10, dengan menggunakan tabel random
(lampiran A) dapat ditentukan 10 angka yang akan menentukan nomor
unit populasi yang akan diambil.
Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal, dan dipilih arah
ke kanan (boleh ke atas,kiri atau bawah) maka nomor sampel secara
random yang diperoleh adalah
532, 115, 916, 239, 505, 956, 250, 961, 207, 868
Karena jumlah populasi = 200, maka angka – angka yang melebihi 200
akan dihilangkan digit ratusannya. Sehingga nomor sampel randomnya
menjadi
32, 115, 16, 39, 05, 56, 50, 61, 07, 68
Banyaknya digit bilangan random sebagai titik awal tergantung dari
banyaknya digit maksimal populasi.
1-17
MODUL 1
Politeknik Telkom
Praktikum Statistika
2. Random Berstrata ( berlapis )
Dalam metode ini, langkah pertama adalah populasi dikelompokkan
dalam beberapa kelompok agar lebih homogen, kemudian dari masing
masing
kelompok diambil sampel berukuran tertentu ( secara
proporsional ) secara acak seperti pada metode pertama.
3. Sistematik
Dalam metode ini pertama
tama populasi diberi nomor dari 1 sampai
N. Kemudian secara acak ditentukan sebuah nomor antara 1 sampai N
(misal k) dan dibuat suatu barisan aritmatika dengan suku awal k dengan
pertambahan tertentu sampai didapat n data. Bila suatu suku bernilai
lebih dari N maka suku tersebut harus dikurangi N atau kelipatannya.
Nilai penambahan adalah bilangan bulat sedemikian hingga nilainya dekat
dengan
N
dengan N : ukuran populasi dan n : ukuran sampel.
n
Contoh
Sebuah populasi berukuran 100 dan akan diambil sampel berukuran 15.
Misalkan bilangan acak pertama dipilih 70 agar merata maka
pertambahannya bisa dipilih sekitar 7. Hasil selengkapnya bisa dilihat pada
tabel berikut :
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1-18
Barisan
70
77
84
91
98
105
112
119
126
133
140
147
154
161
168
Sampel yg terpilih
70
77
84
91
98
5
12
19
26
33
40
47
54
61
68
MODUL 1
Politeknik Telkom
4.
Praktikum Statistika
Bergerombol ( cluster )
Pada metode ini teknik yang digunakan mirip dengan metode acak
sederhana hanya saja disini yang menjadi unit sampelnya adalah berupa
cluster cluster yang mana masing masing cluster berisi elemen
elemen yang yang lebih kecil. Yang menjadi pedoman untuk
menentukan cluster adalah bahwa cluster cluster tersebut memiliki
karakteristik yang hampir sama.
Contoh
Sebuah populasi berukuran 1000 tetapi dapat dikelompokan dalam
kluster kluster yang berukuran 10, jadi total klusternya adalah 100.
Misalkan dari 100 cluster tersebut akan diteliti sebanyak 6 cluster
maka dengan metode acak sederhana dapat ditentukan 6 kluster yang
terpilih. Unit unit sampel yang diteliti adalah keseluruhan unit
populasi atau sebagian unit yang terletak didalam 6 kluster terpilih
tersebut.
1.4 Aplikasi dengan minitab
Menentukan sampel dengan beberapa metode sampling
A. Acak sederhana
Pada metode ini, pertama kita tentukan populasi yang akan diambil
sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit
populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan
jumlah sampel sama dengan 20, dengan menggunakan tabel random dapat
ditentukan 20 angka yang akan menentukan nomor unit populasi yang
akan diambil.
1-19
MODUL 1
Politeknik Telkom
Praktikum Statistika
Adapun langkah-langkahnya adalah :
1.
2.
Pilih calc, make patterned Data kemudian Simple Set o Numbers
Isilah tabel yang keluar sesuai tabel berikut
Pada langkah ini merupakan proses pemberian nomor populasi
3.
Pilih calc,Random Data kemudian Sample From Columns
4.
Isilah tabel yang keluar sesuai tabel berikut ( proses ini merupakan
pengambilan sampel berukuran 20 secara acak ). Dalam langkah ini
kemungkinan setiap orang akan mendapatkan hasil yang berbeda.
1-20
MODUL 1
Politeknik Telkom
5.
Praktikum Statistika
Hasil yang keluar diatas merupakan nomor nomor unit populasi yang
akan diambil sebagai sampel (pada kolom sampel) yaitu :
Sampel
72
10
102
156
64
169
2
15
147
164
126
117
121
48
176
110
114
199
79
135
B. Random Berstrata (berlapis)
Misalkan dimiliki data populasi yang terdiri atas 60 mahasiswa jurusan
Teknik Telekomunikasi, 50 mahasiswa Teknik Informatika dan 40
mahasiswa Teknik Industri. Bila ingin diambil sampel sebanyak 20
mahasiswa secara sistematis maka dilakukan dengan langkah – langkah
berikut .
1-21
MODUL 1
Politeknik Telkom
1.
2.
Praktikum Statistika
Buat nomor 1 sampai 60 untuk mahasiswa Teknik Telekomunikasi, 1
sampai 50 untuk Teknik Informatika dan 1 sampai 40 untuk Teknik
Industri.
Hitung jumlah sampel untuk masing – masing jurusan.
Teknik Telekomunikasi
60
n1
x 20 8
60 50 40
Teknik Informatika
50
n2
x 20 6
60 50 40
Teknik Industri
40
n3
x 20 6
60 50 40
3.
Buat patterned data sebanyak 60,50 dan 40 seperti pada langkah
sebelumnya kemudian simpan(Store samples in) dalam kolom yang
terpisah(C3,C4 dan C5).
4.
Lakukan pengambilan secara acak untuk masing – masing
jurusan(patterned data) seperti pada pengambilan sampel acak sederhana
dengan ketentuan 8 berasal dari jurusan Teknik Telekomunikasi(C3), 6
dari jurusan Informatika(C4) dan 6 orang dari jurusan Teknik
Industri(C5).
C. Sistematis
Misalkan dimiliki populasi sebanyak 200 dan akan diambil sampel sebanyak 30,
maka langkah – langkahnya adalah sebagai berikut
1.
Tentukan salah satu nilai sebagai titik awal misalkan 50.
2.
Nilai pertambahan
3.
Buat patterned data pada file baru dengan nilai pertambahan (in step of)
= 7, nilai awal(From first value) = 50 dan nilai akhir (To last value) =
260.
1-22
200
30
7
MODUL 1
Politeknik Telkom
4.
Praktikum Statistika
Ambil 30 nomor sampel yang pertama, hasilnya adalah
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1-23
Barisan
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
204
211
218
225
232
239
246
253
Sampel yg terpilih
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
162
169
176
183
190
197
04
11
18
25
32
39
46
53
MODUL 1
Politeknik Telkom
Praktikum Statistika
D. Bergerombol
Misalkan akan diteliti kualitas suatu minuman mineral botol yang dikemas
dalam kotak. Jumlah kotak keseluruhan adalah 100 kotak dimana masing –
masing kotak berisi 10 botol dan sampel yang diinginkan adalah 50 botol.
Alternatif yang dapat dilakukan antara lain dari 100 kotak diambil 5 kotak
secara acak kemudian semua botol dalam kotak tersebut diteliti. Alternatif
lain yang dapat dipilih dari 100 kotak tersebut dipilih 10 kotak acak kemudian
dari 10 kotak tersebut dipilih 5 botol secara acak. Misalkan alternatif kedua
yang dipilih :
1. Beri nomor 1 sampai 100 semua kotak yang dimiliki.
2. Buat patterned data pada file baru sebanyak 100 seperti pada langkah
sebelumnya kemudian simpan dalam kolom yang tertentu(C1)
3. Ambil 10 sampel secara acak berdasarkan kolom C1 simpan pada C2.
4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak yang terpilih.
5. Buat patterned data pada file baru sebanyak 10 seperti pada langkah
sebelumnya kemudian simpan dalam kolom C3
6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan pada C4,
ulangi sampai 10X dan simpan dalam kolom yang berbeda.
7. Semua nomor sampel yang terpilih pada masing – masing kotak
merupakan unit sampel yang akan diteliti.
Latihan
1.
Tentukan sampel berukuran 30 dari populasi dengan ukuan 300
2.
Tentukan sampel berukuran 30 yang diambil dari populasi yang
dikelompokkan dalam 4 kelompok dengan ukuran 25,50,75 dan 100
3.
Tentukan sampel berukuran 20 yang diambil dari populasi berukuran
200 dengan metode sistematik
4.
Suatu populasi berukuran 500 dan dikelompokkan dalam 25 kluster.
Bila nomor populasi 1 20 masuk dalam kluster 1, nomor populasi
21
40 masuk dalam kluster 2 dst. Bila dari 25 kluster tersebut
diambil 5 secara acak, tentukan nomor nomor populasi mana yang
akan masuk dalam sampel !
1-24
MODUL 1
Politeknik Telkom
Praktikum Statistika
2
STATISTIKA DESKRIPTIF
Overview
Modul ini memberikan panduan secara singkat tentang teknik penyajian dan
analisis data secara deskriptif. Pada tahap awal, mahasiswa dikenalkan serta
diajarkan menampilkan pada beberapa ukuran statistik seperti ukuran
pemusatan, ukuran penyebaran dan ukuran letak dengan menggunakan
software minitab. Ukuran – ukuran ini adalah ukuran – ukuran sering yang
digunakan dalam penyajian data secara deskriptif. Pada tahap selanjutnya
mahasiswa akan diajarkan cara menyajikan data dalam bentuk tabel frekuensi
dan juga dalam graph seperti : histogram, box plot dan diagram dahan daun
beserta analisa hasilnya
Tujuan
1.
2.
3.
2-1
Mahasiswa dapat menentukan beberapa ukuran pemusatan dan
penyebaran data
Mahasiswa dapat membuat tabel distribusi frekuensi
Mahasiswa dapat menyajikan data dalam bentuk histogram, box plot dan
diagram dahan daun
MODUL 2
Politeknik Telkom
Praktikum Statistika
2.1 Ukuran Pemusatan
Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain
mean, median, dan modus.
Mean adalah rata rata dari data dan dinotasikan dengan x atau , di
mana x menyatakan rata rata sampel dan
menyatakan rata rata
populasi. Secara umum mean memiliki rumusan sebagai berikut :
x
xi
, n banyaknya sampel
n
xi
, N banyaknya populasi
N
Median adalah nilai yang membagi suatu gugus data yang telah terurut
menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai
median terdapat 50% data. Cara menentukan median sebagai berikut :
Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar,
maka
untuk
n
ganjil
median
Xn
2
median
1
Xn
2
2
Xn
2
1
1
dan
untuk
n
genap
.
Modus yaitu nilai yang paling sering muncul dalam suatu gugus data
Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran
pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah
suatu gugus data, walaupun ada beberapa kasus yang membuat nilai tengah
menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim.
2.2 Ukuran Penyebaran
Beberapa ukuran penyebaran antara lain :
Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum
dengan nilai minimum.
2-2
MODUL 2
Politeknik Telkom
Praktikum Statistika
Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap
x . Variansi merupakan ukuran penyebaran yang sering digunakan dalam
statistika inferensia. Variansi dinotasikan S2 untuk sampel dan 2 untuk
populasi. Variansi memiliki rumusan sebagai berikut :
S2
xi
n 1
xi
x
2
, di mana n banyaknya sampel
2
, di mana N banyayknya populasi
N
Simpangan baku merupakan akar dari variansi.
2
2.3 Ukuran Letak
Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian
yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data
terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat
bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh
desil, persentil dll.
2.4 Distribusi Frekuensi
Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada
tabel tersebut menampilkan ciri ciri penting sejumlah data yang diperoleh
dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari
masing masing kelas dihitung banyaknya pengamatan yang masuk.
Langkah-langkah membuat tabel frekuensi :
1.
2.
3.
4.
2-3
Menentukan banyaknya kelas dengan kaidah Sturges yaitu N 2 k 1 ,
dimana k 1 3.3 log N . Banyaknya kelas sebaiknya antara 5 sampai 15.
Menentukan interval kelas (KI)
range
KI
k
KI sebaiknya kelipatan 5.
Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih.
Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat
histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas
(batas bawah kikurangi setengah dan batas atas di tambah setengah)
MODUL 2
Politeknik Telkom
Praktikum Statistika
Bila data disajikan sebagai data kelompok, maka ukuran pemusatan,
penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai
berikut :
- Ukuran pemusatan
n
Mean : x
i 1
n
f i xi
i 1
fi
xi = titik tengan kelas, f i = frekuensi kelas
x
Median : ~
1 f
2 t
Bb
f sm
fm
p
Bb = batas bawah kelas median
f t = frekuensi total
f m = frekuensi kelas median p = interval kelas
f sm = frekuensi kumulatif sebelum median
Modus : xˆ
Bb
a
a b
p
a f m f am
b
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus
f bm = frekuensi sesudah kelas modus
fm
f bm
Ukuran penyebaran
-
n
n
S2
2-4
p2
i 1
f i ci
2
n
2
i 1
f i ci
n n 1
MODUL 2
Politeknik Telkom
Praktikum Statistika
Ukuran letak
Kuarti ( Qi , Q2 , Q3 )
-
Qi
Bb
i f
4 t
f sp
fp
p , i 1, 2, 3
f p = frekuensi pada kelas kuartil ke-i
f sp = frekuensi sebelum kuarti
Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk
mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi
kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol, sedangkan
dua kelas di bawah dan di atasnya diberi kode negatif dan positif.
2.5 Penyajian dalam Bentuk Grafik
Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya
memiliki skala interval atau rasio, maka histogram dapat digunakan untuk
menyajikan data.
Box plot merupakan bentuk penyajian data yang hanya menggunakan
beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum,
Q1, median, Q3, nilai maksimum. Pada box plot dapat juga ditentukan
adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang
apabila dibandingkan dengan nilai data yang lain tidak konsisten. Pencilan
dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar).
Untuk menentukan pencilan digunakan rumusan sebagai berikut :
Pagar dalam (p)
p1 Q1 1.5 Q3 Q1
p 2 Q3 1.5 Q3 Q1
Pagar luar (P)
P1 Q1 2 Q3 Q1
P2 Q3 2 Q3 Q1
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara
pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di
luar pagar luar.
2-5
MODUL 2
Politeknik Telkom
Praktikum Statistika
Diagram dahan daun adalah salah satu teknik penyajian data yang
menggunakan data asli secara langsung. Pada dasarnya dalam diagram
dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun,
dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom
daun.
Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data,
apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa
x ~
x
kemencengan digunakan metode Pearson yaitu
. Jika
0 , data
S
menceng ke kiri dan
0 , data menceng ke kanan.
2.6 Aplikasi dengan minitab
Data adalah data penjualan voucher telepon di lima kota provinsi Jawa barat :
Bulan
1
2
3
4
5
6
7
8
9
10
11
12
2-6
Bandung
42
45
51
61
69
76
78
78
72
62
51
44
Sukabumi
8
14
25
43
54
64
71
69
58
47
29
16
Garut
32
33
41
52
62
72
77
75
68
58
47
35
Tasik
56
60
58
62
63
68
69
71
69
67
61
58
Bogor
51
58
57
67
81
88
94
93
85
74
61
55
MODUL 2
Politeknik Telkom
Praktikum Statistika
Langkah-langkah menggunakan software minitab 15 adalah :
1. Ketikkan atau copy data tersebut pada worksheet minitab
2.
2-7
Pilih menu stat, kemudian basic statistics, lalu klik summary graphics
MODUL 2
Politeknik Telkom
Praktikum Statistika
3.
Pada kotak dialog, isi kolom tempat data pada variables, lalu klik OK
4.
Hasil yang diperoleh adalah sebagai berikut :
2-8
MODUL 2
Politeknik Telkom
2-9
Praktikum Statistika
MODUL 2
Politeknik Telkom
Praktikum Statistika
Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan
voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi
terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap
bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan
terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan
pertama. (Lakukan pengolahan data penjualan voucher di kota Bogor dan
analisis)
2-10
MODUL 2
Politeknik Telkom
Praktikum Statistika
Latihan
1. Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan
baker adalah:
15.7 16.2 18.2 16.3 17.9 18.1 16.8
17.6 18.1 16.7 16.7 16.0 17.4 17.0
18.6 17.1 14.1 17.5 17.0 17.6 15.6
16.0 17.7 16.1 18.6 15.2 17.1 19.5
17.0 16.9 16.9 16.7 17.3 16.3 17.3
17.0 15.6 15.6 17.9 16.0 17.7 18.2
14.7 17.1 15.2 17.0 17.8 16.1 18.2
16.5 17.7 18.8 14.6 16.5 16.6 15.6
14.9 17.5 16.1 18.5 15.8 16.9 17.3
17.1 15.9 17.1 17.1 16.4 15.6 16.3
2.
a.
Buatlah diagram dahan daun
b.
Buat tabel distribusi frekuensi dan histogramnya
c.
Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat
box plotnya
d.
Kesimpulan apa yang bisa dinyatakan dari data tersebut ,
berdasarkan a, b, c.
e.
Berapa persenkah jarak dari mobil tersebut yang kurang dari 15
mil/gallon, antara 15 dan 18 mil/gallon, dan lebih dari 18 mil/gallon.
Suatu penelitian dilakukan untuk mengetahui waktu respon sirkuit yang
digunakan pada kalkulator elektronik. Data yang diperoleh sebagai
berikut :
25
22
15
20
23
30
28
22
17
19
33
18
23
31
27
22
25
19
20
15
28
25
24
16
19
a. Buat box plot dari data tersebut
b. Buat tabel distribusi frekuensi dan histogram
c. Analisis data tersebut dari hasil a dan b
2-11
MODUL 2
Politeknik Telkom
3.
Praktikum Statistika
Ketikan data score toefl dari 100 mahasiswa berikut pada kolom minitab
356
423
420
450
458
400
386
520
500
390
475
465
476
475
513
400
476
482
346
400
510
500
460
469
436
400
320
480
479
480
400
500
360
520
348
365
470
473
500
428
345
560
513
426
490
475
518
360
400
436
463
523
500
500
520
500
518
476
482
345
400
456
450
476
475
500
518
346
420
463
460
400
515
375
445
426
450
455
456
468
480
500
400
427
480
368
350
423
446
465
525
468
465
475
525
342
386
346
420
423
Buat diagram dahan daun, tabel distribusi frekuensi, histogram, lalu beri
kesimpulan
2-12
MODUL 2
Politeknik Telkom
Praktikum Statistika
3
KENORMALAN DATA
Overview
1.
Modul ini memberikan pengenalan singkat tentang karakteristik data
yang berdistribusi normal dan pengujian kenormalan data. Karakteristik
data
berdistribusi normal menyatakan gambaran dari data yang
berdistribusi normal ditinjau secara matematis. Karakteristik data belum
bisa digunakan dalam penentuan kenormalan data. Untuk menentukan
kenormalan data, dapat digunakan beberapa uji kenormalan. Modul ini
menyajikan 3 buah uji kenormalan yang dapat digunakan untuk menguji
kenormalan suatu data dengan ukuran statistik yang berbeda – beda
yaitu Statistik Shapiro Wilk W, Statistik Anderson Darling dan
Statistik Kolmogorov Smirnov.
Tujuan
1.
2.
3-1
Mahasiswa mengenal tentang data berdistribusi normal
Mahasiswa dapat menguji kenormalan data
MODUL 3
Politeknik Telkom
Praktikum Statistika
3.1 Distribusi normal
Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik
dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng
pada gambar dibawah ini. Suatu peubah acak X yang distribusinya berbentuk
lonceng, dinamakan peubah acak normal. Persamaan matematika dari
distribusi peluang peubah acak normal kontinu bergantung pada dua
parameter yaitu
(rataan) dan
(simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh :
1
f x
e
1 x
2
2
2
–
<X< .
x
Sifat-sifat distribusi normal :
1.
f x dx 1
2. f x 0 ,
3. lim f x
x
x
0 dan lim f x
0
x
f
x
4. f x
5. Nilai maksimum dari f terjadi pada x
6. Titik belok dari f terjadi pada x
3-2
MODUL 3
Politeknik Telkom
Praktikum Statistika
Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah
dibawah kurva diantara dua koordinat x x1 dan x x 2 sama dengan
peluang peubah acak X antara x x1 dan x x 2 . Hal tersebut dapat
digambarkan sebagai berikut :
x2
x1
P( x1
X
x2 ) =
x2
n( x ; , ) dx
x1
1
2
x2
e
x
1 x
2
2
dx
x1
= Luas daerah yang diarsir
Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka
dibuat table luas kurva normal sehingga akan memudahkan dalam
penggunaannya.
3.2 Statistik uji kenormalan
Dalam statistika parametrik, distribusi normal mendasari beberapa uji
statistik. Misal statistik t student, Fisher, Khai Square, dll. Sehingga dalam
pengolahan data statistik, biasanya diasumsikan data berasal dari populasi yang
berdistribusi normal. Ada dua cara untuk melihat kenormalan data yaitu
secara visual dan dengan uji statistik. Secara visual dengan menggunakan
histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya
dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi
normal.
3-3
MODUL 3
Politeknik Telkom
Praktikum Statistika
Ada beberapa statistik uji kenormalan data antara lain :
1. Statistik Shapiro Wilk W
Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik
ini merupakan rasio antara dua penduga ragam. Statistik ujinya
dinamakan statistik W. Statistik W ini mengukur straightness dari plot
quantil quantilnya. Bila nilai dari W 1, maka data dikatakan normal.
2.
Statistik Anderson Darling
Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954.
Statistik Anderson Darling berdasarkan pada fungsi distribusi empirik.
Statistik ujinya dinamakan statistik yang merupakan kuadrat dari selisih
antara luas histogram dengan luas daerah di bawah kurva normal. Bila
nilai P value
, maka data berdistribusi normal. Biasanya digunakan
untuk data berukuran besar.
3.
Statistik Kolmogorov Smirnov
Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan
pada maksimum perbedaan antara dua distribusi, yaitu distribusi normal
dengan distribusi data yang diamati. Biasanya digunakan untuk data
berukuran 30. Bila nilai P value
, maka data berdistribusi normal.
3-4
MODUL 3
Politeknik Telkom
Praktikum Statistika
3.3 Aplikasi dengan minitab
Contoh 1
Langkah-langkah
1. Data adalah data produksi minyak bumi dalam periode waktu 14 bulan
dari 9 lokasi sumur pengeboran. Ketikan data ini pada kolom di minitab
Smr
Smr
Smr
Smr
Smr Smr
Smr
Smr
Smr
56
59
66
68
70
77
99
144
163
1
507
677
633
503
477
636
402
464
309
2
468
763
661
573
498
672
365
504
463
3
500
738
420
571
466
597
582
501
390
4
498
608
425
534
588
597
351
526
413
5
449
433
451
414
589
521
585
414
393
6
513
460
345
575
547
576
622
471
581
7
558
485
377
635
499
568
685
527
590
8
486
552
455
443
503
485
736
508
486
9
478
605
361
445
495
489
614
560
531
10
426
575
345
448
519
443
234
557
537
11
493
553
531
450
482
426
243
222
553
12
555
548
521
468
545
464
351
502
517
13
542
457
360
501
489
428
414
601
430
14
510
356
442
443
392
455
378
575
531
t
3-5
MODUL 3
Politeknik Telkom
Praktikum Statistika
2.
Pilih menu stat, kemudian pilih basic statistik, lalu normality test
3.
Setelah muncul kotak dialog berikut, Ketik C1 pada isian variable, lalu
klik pilihan tests for normality (asumsi
0.05 )
3-6
MODUL 3
Politeknik Telkom
Praktikum Statistika
Output masing-masing pilihan sebagai berikut :
Shapiro Wilk
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
W-test for Normality
R:
0.9938
P-Value (approx): > 0.1000
Pada gambar terlihat bahwa nilai statistik W = 0.9938 1, dengan pendekatan
nilai P value > 0.1, maka dapat dikatakan bahwa data berdistribusi normal.
3-7
MODUL 3
Politeknik Telkom
Praktikum Statistika
Statistik Anderson Darling
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
Anderson-Darling Normality Test
A-Squared: 0.346
P-Value: 0.478
Dengan menggunakan statistik ini diperoleh nilai P value = 0.478, nilai ini
lebih besar dari pada nilai = 0.05.
3-8
MODUL 3
Politeknik Telkom
Praktikum Statistika
Statistik Kolmogorov smirnov
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
200
300
400
500
600
700
produksi
Average: 498.310
StDev: 96.5048
N: 126
Kolmogorov-Smirnov Normality Test
D+: 0.036 D-: 0.050 D : 0.050
Approximate P-Value > 0.15
Pada gambar terlihat bahwa pendekatan nilai P value > 0.15, nilai ini lebih
besar dari pada nilai = 0.05.
Dari ketiga output di atas, terlihat bahwa untuk ukuran data besar, statistik
Anderson Darling lebih powerfull.
3-9
MODUL 3
Politeknik Telkom
Praktikum Statistika
Contoh 2
1. Buka software minitab kemudian pilih menu calc , Random Data
kemudian binomial. Pada langkah ini kita akan membangkitkan data yang
berdistribusi binomial. Pada box
yang keluar isilah sesuai isian berikut ini kemudian ok
2.
Data yang sudah dipeoleh ini kita anggap sebagai data populasi. Dari data
populasi ini selanjutnya akan kita ambil beberapa sampel berukuran 5, 10
dan 20 untuk selanjutnya akan dibandingkan variansi dari rataan
sampelnya. Dari menu utama pilih calc , Random Data kemudian
sample from column . Isilah box yang keluar seperti isian berikut
3-10
MODUL 3
Politeknik Telkom
3.
4.
Praktikum Statistika
Ulangi langkah 2 sebanyak 5x untuk masing masing ukuran sampel, jadi
akan terdapat 5 sampel berukuran 5, 5 sampel ukuran 10 dan 5 sampel
ukuran 20
Dari setiap sampel hitunglah rata
ratanya kemudian untuk setiap
ukuran sampel hitunglah rata
rata dan variansinya. Anda bisa
menggunakan software lain untuk menghitung rata rata dan variansinya
misalnya microsoft Excel .Mungkin hasil yang keluar ini bisa berbeda
dengan hasil perhitungan anda
no sampel ukuran 5 ukuran 10
1
39.6
41.4
2
42.6
40.9
3
40
37.7
4
37
42.8
5
42
38.8
rata2
40.24
40.32
variansi
4.908
4.207
Ukuran 20
40.45
40.7
42.85
41.85
40.5
41.27
1.10575
Dari hasil diatas terlihat rata rata semua sampel mendekati rata rata
populasi yaitu =np = 40, tetapi untuk ukuran n = 20 variansinya adalah
yang terkecil, ini juga dapat dilihat dari rataan sampel dari no 1 sampai 5
yang hanya berbeda tipis. Ini menunjukkan dengan pengambilan sampel
yang makin besar keakuratan pendugaannya akan semakin tinggi.
5.
Pada pembuktian distribusi rataan sampel, langkah – langkahnya
sebenarnya tidak jauh berbeda dengan 4 langkah sebelumnya hanya saja
dalam hal ini diperlukan jumlah pengacakan yang jauh lebih banyak
daripada 4 langkah sebelumnya. Untuk itu akan digunakan progam matlab
untuk membantu meyelesaikan masalah ini.
3-11
MODUL 3
Politeknik Telkom
6.
Praktikum Statistika
Bila dilakukan dengan software matlab, akan keluar tampilan berikut
Pada program tersebut, pada baris ketiga angka 500 menyatakan jumlah
pengacakan Pada baris 4, perintah random (0,1,100,1) menyatakan
perintah pengambilan sampel dari populasi yang memiliki mean 0,
simpangan baku 1, sampel berukuran 100 dari 1 populasi.
Pada baris 6 dan 7 mengandung arti pendefisian variabel Y sebagai sampel
acak pertama yang berukuran 100.
Pada baris 9, mean sampel 1,2,…500 dihitung
Dan pada baris 12, dibuat histogram dari mean sampel hasil perhitungan
pada baris 9
7.
8.
Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan angka 5. Jalankan
program ini dengan memilih debug kemudian run and save ( Dalam
langkah ini kita berusaha mengambil sampel acak berukuran 5). Simpanlah
output gambar/ histogram yang keluar dengan file tersendiri. Ulangi
langkah ini dengan mengganti angka 10, 20 dan 30.
Dari keempat histogram yang keluar tersebut, analisa apakah keempat
histogram sudah berbentuk kurva normal baku dengan mean 0 dan
simpangan baku 1? apakah ada pengaruh ukuran sampel? jelaskan!
3-12
MODUL 3
Politeknik Telkom
Praktikum Statistika
Latihan
1. Data seperti contoh no. 1, kemudian dilakukan pengacakan 15 kali dan
diambil sampel ukuran 10, 20, 30. Buat histogram dengan kurva
normalnya dan uji kenormalannya.
2.
Bangkitkan data dari komputer, kemudian lakukan pengacakan 20 kali,
dari data berdistribusi normal, poisson dengan rata-rata 2, binomial
dengan p = 0.6 dan n = 15. Buatlah histogramnya.
3-13
MODUL 3
Politeknik Telkom
Praktikum Statistika
4
TRANSFORMASI DATA
Overview
Modul ini memberikan panduan untuk melakukan tranformasi data baik
untuk satu angkatan data maupun beberapa angkatan data. Transformasi
terhadap satu angkatan data biasanya dilakukan agar asumsi data berdistribusi
normal terpenuhi, sedangkan transformasi untuk beberapa data biasanya
dilakukan agar asumsi ragam sama pada beberapa angkatan data terpenuhi.
Tes kenormalan kemudian juga dilakukan untuk melihat apakah transformasi
yang dilakukan sudah tepat.
Tujuan
1.
2.
4-1
Dapat melakukan transformasi data dengan menggunakan Tangga
Transformasi Tukey untuk melihat bagaimana bentuk distribusi data
setelah dilakukan transformasi
Dapat memilih transformasi yang tepat untuk me-normalkan data
MODUL 4
Politeknik Telkom
Praktikum Statistika
4.1 Transformasi untuk satu angkatan data
Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan
di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data
yang berdistribusi Normal dengan mean dapat digambarkan seperti grafik
berikut
Bila dilihat, data yang berdistribusi Normal akan simetris terhadap
dan
sebagaian besar data akan mengelompok di tengah. Dalam kenyataannya
seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi
normal tetapi berbentuk menjulur ke kanan seperti gambar berikut
Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada
gambar berikut :
Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu
dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk
satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data.
4-2
MODUL 4
Politeknik Telkom
Praktikum Statistika
Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi
Tukey yang digambarkan sebagai berikut :
1
x2
1
x
Kuat
log x
sedang
MENJULUR KE KIRI
x
lemah
x2
x
x3
lemah
SIMETRIS
sedang
10 x
kuat
MENJULUR KE KANAN
Tangga transformasi ini dapat diartikan sebagai berikut :
Transformasi 10 x akan membuat bentuk distribusi data menjadi menjulur
1
kekanan secara kuat, sedangkan transformasi
akan membuat bentuk
x2
distribusi data menjadi menjulur kekiri secara kuat. Sebagai contoh bila kita
memiliki data yang menjulur kekanan secara lemah maka kita dapat
transformasi x agar data menjadi Normal, sebaliknya bila data menjulur
kekanan secara sedang maka transformasi x3 agar data menjadi Normal.
Penentuan bahwa suatu data menjulur secara lemah,sedang atau kuat besifat
subyektif sehingga akan lebih baik bila digunakan beberapa transformasi
sekaligus
kemudian baru dibandingkan hasilnya. Penentuan apakah hasil
transformasi sudah Normal atau tidak adalah melalui uji kenormalan
4.2 Transformasi untuk beberapa angkatan data
(menyamakan sebaran)
Ketika dimiliki beberapa angkatan data, maka biasanya ingin dilakukan
pembandingan antara angkatan satu dengan angkatan lainnya. Proses
membandingkan ini lebih mudah bila semua angkatan data memiliki
Bentuk distribusi baku
Sebaran data yang sama
4-3
MODUL 4
Politeknik Telkom
Praktikum Statistika
Bila kedua syarat diatas sudah dipenuhi, maka untuk membandingkan angkatan
angkatan tersebut, cukup dibandingkan masing
masing tarafnya ( nilai
Median ) saja. Untuk menyamakan sebaran semua angkatan ( membuat
sebaran hampir sama), digunakan transformasi seperti pada tangga
transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing
masing angkatan diukur dengan dQ = Q3 Q1 yaitu simpangan kuartil.
Penentuan transformasi yang tepat dilakukan dengan prosedur berikut
1.
Hitung taraf dari setiap angkatan
2.
Hitung sebaran dari setiap angkatan
3.
Tentukan Taraf terbesar (TA), Taraf terkecil (TB), Sebaran yang
berseuaian dengan TA (= SA) dan Sebaran yang berseuaian dengan TB
(= SB) dari seluruh angkatan
4.
Hitung koefisien arah b yang memiliki rumus
b
log( S A ) log( S B )
log( T A ) log( TB )
Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel
berikut
Nilai
b Transformasi yang
Keterangan
(disekitar)
dipilih
Makin kecil b
> makin besar k
Negatif
xk
(k : bulat)
0,5
1
1,5
2
x
Log x
1
x
1
x
4-4
2
MODUL 4
Politeknik Telkom
4.3
Praktikum Statistika
Aplikasi Minitab
Berikut ini contoh data (tabel data transformasi) yang menjulur ke kanan
yang digambarkan dengan histogram.
Tabel data transformasi
7.2
2.3
1.8
5.9
17.3
2.0
4.8
10.9
3.4
4.4
9.6
7.5
1.7
4.6
3.4
2.1
1.5
3.7
5.3
4.1
9.1
5.7
0.9
1.9
2.3
1.
4-5
5.6
14.3
3.0
2.5
3.8
1.7
5.5
3.7
2.9
4.6
4.8
8.3
5.8
2.8
6.3
3.1
7.6
5.5
8.0
3.5
1.7
11.4
6.5
1.7
2.1
9.7
2.6
15.3
8.3
2.4
1.9
3.6
4.9
9.3
3.4
10.4
4.0
3.8
4.9
1.5
4.8
4.4
2.9
6.4
0.5
2.1
8.1
3.6
11.9
5.2
2.9
6.8
1.8
3.4
6.9
8.8
6.5
1.9
3.6
3.4
3.7
2.4
13.7
15.3
1.3
4.9
12.0
2.3
3.2
5.9
3.0
3.7
3.6
2.4
2.9
Buat file baru : file transformasi, kemudian simpan data diatas pada
kolom c1
MODUL 4
Politeknik Telkom
2.
Praktikum Statistika
Buat histogramnya
Histogram menjulur ke kanan
Frequency
20
10
0
0
10
20
jlrkanan
3.
Lakukan tes kenormalan data terhadap data C1
Dari hasil uji Anderson-Darling (lihat modul kenormalan data)
,didapatkan p-value = 0.000 ini berarti secara kuat disimpulkan bahwa
data tidak berdistribusi Normal.
4.
Lakukan transformasi x terhadap C1, simpan datanya pada C2. Buat
Histogram berdasarkan data C2, diperoleh
Histogram Transformasi dg akar x
Frequency
15
10
5
0
0.5
1.5
2.5
3.5
4.5
akar x
4-6
MODUL 4
Politeknik Telkom
Praktikum Statistika
5.
Lakukan tes kenormalan data terhadap data C2
Dari Dari hasil uji Anderson-Darling,didapatkan p-value = 0.001 ini
berarti disimpulkan bahwa data juga tidak berdistribusi Normal.
6.
Lakukan transformasi Log x terhadap C1, simpan datanya pada C3.
Histogram berdasarkan data C3, diperoleh
Histogram Transformasi dg log
Frequency
15
10
5
0
0.0
0.5
1.0
log x
7.
Lakukan tes kenormalan data terhadap data C3
Dari hasil uji Anderson-Darling,didapatkan p-value = 0.849 ini berarti
secara kuat disimpulkan bahwa data berdistribusi Normal.
Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya
x bentuk data
menjulur kekanan secara sedang, dengan transformasi
menjadi menjulur ke kanan secara lemah, sedangkan dengan transformasi Log
x data menjadi Normal. Nantinya yang diolah dengan statistik adalah data Log
x bukan data aslinya.
Sebagai eksperimen lainnya, lakukan tranformasi x2 atau x3 , simpan datanya
pada C4, C5 kemudian buat histogram dan lakukan tes kenormalan maka
4-7
MODUL 4
Politeknik Telkom
Praktikum Statistika
diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan
dari histogram berikut.
Histogram of hasil transformasi x2
35
30
Frequency
25
20
15
10
5
0
0
100
200
300
transf x
Histogram of transformasi x3
80
70
Frequency
60
50
40
30
20
10
0
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
transf x
4-8
MODUL 4
Politeknik Telkom
Praktikum Statistika
Latihan
Periksa distribusi data berikut, bila belum simetris, lakukan transformasi yang
tepat seperti pada langkah – langkah praktikum diatas
605
575
553
548
457
356
445
448
450
468
501
443
489
443
426
464
428
455
552
443
485
4-9
507
468
500
498
449
513
558
486
478
426
493
555
542
510
677
763
738
608
433
460
485
633
661
420
425
451
345
377
455
361
345
531
521
360
442
503
573
571
534
414
575
635
477
498
466
588
589
547
499
503
495
519
482
545
489
392
636
672
597
597
521
576
568
MODUL 4
Politeknik Telkom
5
Praktikum Statistika
UJI HIPOTESIS STATISTIK DAN
PROPORSI
Overview
Modul ini memberikan panduan untuk melakukan uji hipotesis terhadap nilai
tengah dan proporsi. Uji hipotesis terhadap nilai tengah meliputi uji terhadap
terhadap satu nilai tengah maupun perbandingan antara dua nilai tengah,
sedangkan uji proporsi meliputi uji satu proporsi dan perbandingan dua
proporsi. Semua uji hipotesis yang dilakukan berdasarkan beberapa asumsi
yaitu ragam diketahui maupun ragam tidak diketahui.
Tujuan
1.
2.
3.
4.
5-1
Mahasiswa memahami tentang uji hipotesis statistik
Mahasiswa memahami tentang uji satu nilai tengah dengan
diketahui
atau tidak dan dapat menerapkannya
Mahasiswa memahami tentang uji selisih nilai tengah dari dua sampel
dengan diketahui atau tidak dan dapat menerapkannya
Mahasiswa memahami tentang uji proporsi satu dan dua proporsi
MODUL 5
Politeknik Telkom
Praktikum Statistika
5.1 Hipotesis statistik
Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia.
Hipotesis statistik yaitu suatu anggapan atau pernyataan yang mungkin benar
atau tidak mengenai satu populasi atau lebih. Suatu hipotesis dianggap benar
atau salah, tidak bias diketahui dengan pasti kecuali dilakukan pemeriksaan
terhadap seluruh populasi. Tetapi hal tersebut tidak efisien. Untuk mengatasi
hal tersebut dilakukan pengambilan sampel secara acak.
Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis
yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar
dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan
bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang
dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan
ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan
mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut
hipotesis alternatif.
Prosedur pengambilan kesimpulan kadang kadang dapat membawa pada
kesimpulan yang salah. Dalam pengujian hipotesis statistik, ada dua jenis
kesalahan yaitu:
a. Kesalahan jenis pertama (galat jenis I)
Yaitu penolakan hipotesis nol, padahal hipotesis nol benar. Peluang galat
jenis I disebut taraf nyata yang dinotasikan dengan . Biasanya taraf nyata
disebut dengan ukuran wilayah kritis.
b.
Kesalahan jenis kedua (galat jenis II)
Yaitu penerimaan hipotesis nol, padahal hipotesis nol salah. Peluang galat
jenis II dinotasikan dengan . Nilai dari tidak mungkin dihitung, kecuali
bila hipotesis alternatifnya lebih spesifik.
Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :
Hipotesis alternatif yang bersifat dua arah
H0 : = 0
H1 :
0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yang
letaknya pada masing masing ekor dari sebaran statistik ujinya.
5-2
MODUL 5
Politeknik Telkom
Hipotesi alternatif yang bersifat satu arah
a) H0 :
atau
b) H0 :
0
H1 : > 0
H1 :
Praktikum Statistika
<
0
0
Wilayah kritis untuk a) terletak seluruhnya di ekor sebelah kanan dari
sebaran statistik ujinya. Sedangkan untuk b) sebaliknya.
Dalam menentukan keputusan akhir untuk menerima atau menolak H0 ,
didasarkan pada wilayah kritis dengan p value yang mendukung keberartian
suatu uji dalam bentuk peluang. P value adalah taraf keberartian terkecil,
sehingga nilai suatu uji statistik yang diamati masih berarti.Bila p value
,
maka H0 ditolak.
Prosedur pengujian hipotesis dapat mengikuti langkah langkah berikut :
1. Merancang hipotesis nol dan hipotesis alternatif
2. Menguji kenormalan
3. Memilih taraf keberartian
4. Menguji kesamaan ragam
5. Menentukan dan menghitung nilai statistik uji yang sesuai
6. Menentukan daerah kritis dan membuat keputusan apakah menerima
atau menolak H0 (di mana pengambilan keputusan dapat didasarkan pada
tiga hal yaitu nilai kristis dari statistik uji, selang kepercayaan, atau
p value)
7. Membuat kesimpulan akhir mengenai sampel yang diambil
5.1.1 Pengujian hipotesis untuk satu nilai tengah
X1, X2, …, Xn merupakan peubah acak yang menyebar secara normal dengan
nilai tengah tidak diketahui. Perumusan hipotesinya sebagai berikut :
H0 : = 0
atau
H0 :
atau
H0 :
0
0
H1 :
H
:
>
H1 : < 0
0
1
0
Pengujian hipotesis terhadap nilai tengah ada dua asumsi :
1. Ragam diketahui
Uji hipotesis untuk rata rata x, di mana hipotesis nol menyebar normal
dengan nilai tengah 0 dan simpangan baku rata rata populasi / n,
statistik ujinya adalah :
5-3
MODUL 5
Politeknik Telkom
Z
Praktikum Statistika
x
0
n
Kriteria penolakan terhadap hipotesis nol ditampilkan dalam tabel berikut
:
NO Hipotesis Alternatif Kriteria penolakan
H0 ditolak pada saat Z Z /2 atau Z
1
H1 :
0
Z1 /2
2
H1 : > 0
H0 ditolak pada saat Z Z1
3
H1 : < 0
H0 ditolak pada saat Z Z
2.
Ragam tidak diketahui
Bila ragam tidak diketahui, maka statistik ujinya adalah t student, di mana
ragam populasi diduga oleh ragam sampel. Statistik ujinya didefinisikan
sebagai berikut
x
0
t
s
n
Adapun
berikut
NO
1
2
3
kriteria penolakan terhadap hipotesis nol dijelaskan pada tabel
Hipotesis Alternatif
H1 :
0
H1 : > 0
H1 : < 0
Kriteria penolakan
H0 ditolak saat t t /2, n 1 atau t
H0 ditolak pada saat t t1 , n 1
H0 ditolak pada saat t t , n 1
t1
/2, n 1
5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah
X1, X2, …, Xn dan Y1, Y2, …, Yn merupakan dua peubah acak yang saling
bebas dan menyebar secara normal dengan nilai tengah x dan y, simpangan
baku x dan y. Perumusan hipotesinya sebagai berikut :
H0 : x
H0 : x
H0 : x
y = 0 atau
y
0 atau
y
0
H1 : x
H
:
>
H
:
<
y
0
1
x
y
0
1
x
y
0
5-4
MODUL 5
Politeknik Telkom
Praktikum Statistika
Di mana 0 adalah suatu konstanta bernilai positif atau nol yang menunjukkan
selisih antara dua nilai tengah yang tidak diketahui.seperti pada pengujian
hipotesis untuk satu nilai tengah, ada dua asumsi yaitu :
1. Ragam diketahui
Statistik uji didefinisikan sebagai berikut
x y
0
Z
2
x
2
y
nx
ny
Kriteria penolakan terhadap hipotesis nol adalah :
2.
NO
Hipotesis Alternatif
1
H1 :
2
3
H1 :
H1 :
x
y
x
y
x
y
0
>
<
0
0
Kriteria penolakan
H0 ditolak pada saat Z Z
Z1 /2
H0 ditolak pada saat Z Z1
H0 ditolak pada saat Z Z
/2
atau Z
Ragam tidak diketahui
Bila ragam tidak diketahui, maka sebelum dilakukan pengujian hipotesis
terlebih dahulu dilakukan pengujian terhadap ragam. Pengujian tersebut
dilakukan untuk menduga apakah ragam kedua sampel sama atau tidak.
Hipotesisnya adalah sebagai berikut : H0 : x = y H1 : x
y
Sedangkan statistik ujinya adalah statistik uji Fisher yaitu F
2
S maks
2
S min
.
Bila didapatkan bahwa F
F( , (nx 1, ny 1)), maka H0 ditolak, artinya
ragam kedua sampel tidak sama. Sehingga derajat bebas yang akan
digunakan dalam statistik ujinya adalah
5-5
MODUL 5
Politeknik Telkom
Praktikum Statistika
2
S y2
S x2
nx
ny
v
S x2
2
2
S y2
ny
nx
nx 1
ny 1
Statistik uji pengujian hipotesis terhadap selisih antara dua nilai tengah
untuk ragam berbeda adalah
x y
0
t
2
2
Sx S y
nx
ny
Sedangkan untuk ragam sama, dalam statistik ujinya menggunakan ragam
gabungan, yaitu :
n x 1 S x2
2
S gab
n y 1 S y2
nx n y 2
dimana statistik ujinya adalah
x
t
S gab
y
0
1
nx
1
ny
.
Kriteria penolakan terhadap hipotesis nol adalah :
5-6
NO
Hipotesis Alternatif
Kriteria penolakan
1
H1 :
x
y
2
H1 :
x
y
>
0
H0 ditolak pada saat t
t1
3
H1 :
x
y <
0
H0 ditolak pada saat t
t ,m
H0 ditolak pada saat t
0
t1
t /2, m atau t
/2, m
,m
MODUL 5
Politeknik Telkom
5.1.3
Praktikum Statistika
Aplikasi dengan minitab
Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari
teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk
telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa
telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini
banyak operator selular menggunakan teknologi berbasis CDMA, antara lain
Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8
dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna
produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut adalah
datanya :
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Fren
55
42
45
71
83
47
75
48
60
69
85
54
31
25
30
Flexi
60
33
39
61
40
94
71
61
77
64
65
70
80
61
50
Esia
37
60
35
61
31
56
65
78
59
27
30
45
38
25
35
Langkah-langkah pengolahan dengan menggunakan minitab 15 :
1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan
uji dua ragam (ragam sama atau berbeda) dengan cara pilih menu stat,
lalu basic statistics, kemudian dua ragam, maka akan muncul kotak
dialog seperti di bawah kemudian ketikkan kolom data pada isian sampel,
klik option atau storage bila perlu, lalu OK
5-7
MODUL 5
Politeknik Telkom
3.
Praktikum Statistika
Hasil yang diperoleh sebagai berikut :
Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam kedua
sampel sama, karena Pvalue = 0.582 > 0.05
5-8
MODUL 5
Politeknik Telkom
Praktikum Statistika
4.
Pengujian hipotesis, dilakukan dengan cara pilih stat, basic statistics,
kemudian pilih 2-sample t, kemudian isi kotak dialog
5.
Hasil yang diperoleh adalah sebagai berikut :
Two-sample T for Fren vs Flexi
N Mean StDev SE Mean
Fren 15 54.7 19.0
4.9
Flexi 15 61.7 16.3
4.2
Difference = mu (Fren) - mu (Flexi)
Estimate for difference: -7.07
95% CI for difference: (-20.31, 6.18)
T-Test of difference = 0 (vs not =):
T-Value =-1.09 P-Value = 0.284 DF = 28
Both use Pooled StDev = 17.7062
5-9
MODUL 5
Politeknik Telkom
Praktikum Statistika
Boxplot of Fren, Flexi
100
90
80
Data
70
60
50
40
30
20
Fren
Flexi
Untuk menolak atau menerima Ho dapat dilihat dari 3 hal yaitu :
- Karena selang kepercayaan untuk selisih nilai tengah adalah
20.31, 6.18 , sehingga nol termasuk di selang tersebut, maka Ho
diterima
- Pvalue = 0.284 > 0.05, maka Ho diterima
- Nilai kritis (t hitung = -1.09 > t tabel) maka Ho diterima
Karena Ho diterima, maka dapat disimpulkan bahwa rata-rata jumlah
pengguna produk fren dan flexi di 15 kecamatan kota Bandung sama. Hal
itu dimungkinkan dua produk tersebut masing-masing mempunyai
kelebihan dan kekurangan, sehingga konsumen akan memilih produk yang
sesuai dengan kebutuhannya.
6.
Untuk latihan, lakukan langkah dan analisis yang sama untuk fren vs esia,
flexi vs esia.
5-10
MODUL 5
Politeknik Telkom
Praktikum Statistika
5.2 Uji proporsi
Proporsi menyatakan perbandingan “banyaknya sukses” terhadap total
pengamatan. Bila x menyatakan banyaknya sukses dari n ulangan, maka nilai
x
proporsi p dihitung dengan rumus : p
.Uji proporsi dapat dilakukan
n
terhadap satu nilai proporsi atau perbandingan beberapa nilai proporsi.
Asumsi yang digunakan adalah proporsi berdistribusi binomial.
5.2.1 Uji terhadap satu nilai proporsi
Hipotesis yang digunakan untuk uji satu nilai proporsi dengan taraf antara
lain berbentuk :
a. H 0 : p p0
H1 : p p0
Wilayah kritik: x a dimana a adalah bilangan bulat terbesar yang bersifat
a
PX
a
b x; n; p0
x 0
b x; n; p0 : Distribusi Binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”
b.
H 0 : p p0
H1 : p p0
Wilayah kritik x
a dimana a adalah bilangan bulat terkecil yang bersifat
n
PX
a
b x; n; p0
x a
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”
5-11
MODUL 5
Politeknik Telkom
Praktikum Statistika
c.
H 0 : p p0
H1 : p p0
Wilayah kritik x a atau x a dimana a adalah bilangan bulat terkecil
untuk x a atau bilangan bulat terbesar untuk x a yang bersifat
a
PX
a
b x; n; p0
x 0
2
atau P X
n
a
b x; n; p0
x a
2
b x; n; p0 : binomial dengan parameter n dan p0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses”
Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka tolak H0.
5.2.2
Aplikasi dengan Minitab
Contoh
Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota A sudah
terpasang AC. Dari 15 yang rumah yang diamati, ternyata hanya 8 rumah yang
telah terpasang AC. Benarkah pernyataan tersebut ?
Langkah – langkah
1. Karena yang ingin disimpulkan adalah proporsi rumah terpasang AC =
70% atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,7
H 1 : p 0,7
Taraf = 5% = 0,05
5-12
MODUL 5
Politeknik Telkom
2.
Pilih menu Basis Statistic , 1 Proportion
3.
Isilah kotak dialog dengan isian berikut
5-13
Praktikum Statistika
MODUL 5
Politeknik Telkom
Praktikum Statistika
Number of event = 8, menyatakan banyaknya kejadian sukses
Number of trial = 15, menyatakan banyaknya sampel yang diambil
Hypothesized proportion =0,7 menyatakan nilai dari H0
4.
Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis
yang akan dipilih
5.
Hasilnya adalah sebagai berikut :
Test and CI for One Proportion
Test of p = 0.7 vs p not = 0.7
Sample
1
X
8
N
15
Sample p
0.533333
95% CI
(0.265861, 0.787333)
Exact
P-Value
0.258
Karena nilai P-value=0.258 >0.05, maka H0 tidak ditolak. Data tidak
cukup kuat untuk menolak pernyataan bahwa 70% rumah terpasang AC.
5-14
MODUL 5
Politeknik Telkom
Praktikum Statistika
5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai
proporsi
Pada pengujian satu nilai proporsi, ada situasi dimana tabel binomial sulit
untuk digunakan, misalkan untuk nilai n yang sangat besar(kecuali dengan
bantuan komputer). Salah satu pendekatan yang bisa digunakan adalah dengan
melakukan transformasi ke bentuk normal baku. Parameter
dan
2
ditaksir
npq .
dengan rumus :
np0 dan
Statistik uji yang digunakan adalah
2
z
x np0
np0 q0
n : banyaknya eksperimen/ulangan
p0 : peluang “sukses” / proporsi
2
Z berdistribusi normal baku dengan
1 . Wilayah kritiknya
0 dan
menjadi
bila uji hipotesisnya H1 : p p0
z Z
bila uji hipotesisnya H1 : p p0
z Z1
bila uji hipotesisnya H1 : p p0
z Z atau z Z1
2
2
5.2.4 Aplikasi dengan Minitab
Contoh
Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah
obat baru diuji terhadap 100 pasien, 70 orang sembuh sehingga tingkat
keefektifannya 70%. Apakah obat baru tersebut bisa dikatakan lebih efektif
dari obat lama?
5-15
MODUL 5
Politeknik Telkom
Praktikum Statistika
Langkah – langkah
1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60%
atau tidak, maka uji hipotesis yang dipilih adalah
H 0 : p 0,6
H 1 : p 0,6
Taraf = 5% = 0,05
2. Langkah – langkah yang dilakukan untuk uji hipotesis ini mirip dengan uji
hipotesis tanpa menggunakan pendekatan normal. Perbedaannya adalah
ketika memilih kotak option kita memilih check list “use test and interval
test based on normal distribution” seperti berikut ini
5-16
MODUL 5
Politeknik Telkom
3.
Praktikum Statistika
Hasilnya adalah sebagai berikut :
Test and CI for One Proportion
Test of p = 0.6 vs p > 0.6
95% Lower
Sample
1
X
70
N
100
Sample p
0.700000
Bound
0.624623
Z-Value
2.04
P-Value
0.021
Using the normal approximation.
Berarti nilai z masuk dalam wilayah kritik karena P-value= 0,021 < 0,05.
Jadi dapat disimpulkan bahwa tingkat keefektifan obat baru lebih tinggi
dari obat lama.
5.2.5 Pengujian perbandingan dua proporsi
Pengujian terhadap proporsi tidak hanya bisa dilakukan terhadap satu nilai
proporsi. Bila kita sedang meneliti dua buah proporsi, maka kedua proporsi
tersebut dapat diperbandingkan yaitu berdasarkan sebaran selisih
proporsinya. Selisih proporsi ini kemudian ditransformasi kebentuk normal
baku dengan rumus z yaitu :
pˆ 1 pˆ 2
z
1
pˆ qˆ 1
n1
n2
Dimana
x1
x2
x1 x 2
qˆ 1 pˆ
pˆ 1
pˆ 2
pˆ
n2
n1 n2
n1
x1
x2
n1
n2
5-17
:
:
:
:
Banyaknya sukses kategori 1
Banyaknya sukses kategori 2
Banyaknya ulangan/sampel kategori 1
Banyaknya ulangan/sampel kategori 2
MODUL 5
Politeknik Telkom
Praktikum Statistika
Hipotesisnya
H 0 : p1 p2
Wilayah kritiknya sama seperti pendekatan normal baku untuk pengujian
terhadap satu nilai proporsi yaitu :
z Z bila uji hipotesisnya H1 : p p0
z Z bila uji hipotesisnya H1 : p p0
z Z atau z Z bila uji hipotesisnya H1 : p p0
2
5.2.6
2
Aplikasi dengan Minitab
Contoh
Suatu penelitian dilakukan untuk melihat apakah proporsi lulusan smu
kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih
tinggi daripada proporsi lulusan smu kabupaten Bandung(p2) yang akan
melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil,
diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan
melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang
akan melanjutkan ke PT.
5-18
MODUL 5
Politeknik Telkom
Praktikum Statistika
Langkah – langkah
1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya
Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi
2.
daripada proporsi lulusan smu kabupaten Bandung(p2), maka uji hipotesis
yang dipilih adalah
H 0 : p1 p2 atau H 0 : p1 p 2 0
H 1 : p1 p 2 atau H 0 : p1 p 2 0
Taraf = 5% = 0,025  selang kepercayaan = 97,5 %
Pilih menu Basis Statistic , 2 Proportion
5-19
MODUL 5
Politeknik Telkom
3.
Praktikum Statistika
Isilah kotak dialog dengan isian berikut
Number of event menyatakan banyaknya kejadian sukses (siswa yang
melanjutkan ke PT). First : kodya, Second : kabupaten
Number of trial , menyatakan banyaknya sampel yang diambil
4.
Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis
yang akan dipilih
5-20
MODUL 5
Politeknik Telkom
5.
Praktikum Statistika
Hasilnya adalah sebagai berikut :
Test and CI for Two Proportions
Sample
1
2
X
120
240
N
200
500
Sample p
0.600000
0.480000
Difference = p (1) - p (2)
Estimate for difference: 0.12
97.5% lower bound for difference:
Test for difference = 0 (vs > 0):
0.0392076
Z = 2.91 P-Value = 0.002
Fisher's exact test: P-Value = 0.003
Karena nilai P-value =0.002 <0.025, maka H0 tidak ditolak. Proporsi
lulusan siswa SMA kodya yang melanjutkan ke PT lebih tinggi daripada
lulusan siswa SMA kabupaten
Latihan
1. Suatu penelitian diadakan untuk mengetahui apakah rata-rata banyaknya
panggilan tiap 2 jam yang diterima oleh swicthboard pada dua wartel
sama atau tidak. Berikut adalah rata-rata banyaknya panggilan dari dua
wartel tiap 2 jam selama 15 hari
H
1
2
3
4
5
6
7
8
W1
20
10
12
6
12
8
22
13
W2
10
10
23
6
8
6
15
12
W1
10
8
9
15
20
15
10
10
W2
11
5
10
18
8
6
12
12
a. Buatlah hipotesisnya
b. Uji dan buat kesimpulannya
5-21
MODUL 5
Politeknik Telkom
1.
Praktikum Statistika
Suatu sampel acak berukuran 20 diambil dari nilai UTS matakuliah
Statistika dari mahasiswa 01. 02, dan 03 Penelitian tersebut dimaksudkan
untuk membandingkan kemampuan akademik antara mahasiswa kelas 01.
02, dan 03, berdasarkan uji selisih nilai tengah antara dua sampel. Adapun
datanya sebagai berikut :
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Nilai UTS 01
43
75
43
78
60
76
60
63
60
53
60
25
50
40
50
65
70
65
75
5
Nilai UTS 02
92
47
56
74
79
28
71
68
69
80
63
86
65
99
59
65
78
66
66
96
Nilai UTS 03
63
83
44
37
34
53
53
60
42
36
37
50
72
52
65
73
58
81
15
63
a. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 01 dengan 02
Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 01
Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 02
b. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 02 dengan 03
Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 02
Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 03
5-22
MODUL 5
Politeknik Telkom
Praktikum Statistika
3. Lakukan uji proporsi pada data-data berikut, yaitu :
2) Data miskonsepsi siswa dengan model konstruktivis terhadap suatu
mata pelajaran
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
5-23
PRA TEST
8
7
10
10
11
12
16
15
17
17
16
17
18
18
18
19
20
19
23
20
18
21
22
22
20
18
21
19
23
21
25
25
23
26
25
POST TEST
15
15
21
15
21
25
21
22
10
21
23
25
25
12
20
25
26
20
27
26
27
20
25
25
26
27
28
29
29
29
29
29
29
30
30
JENIS
P
P
L
P
L
L
P
P
P
L
P
L
P
L
L
L
L
L
P
P
L
P
P
P
L
L
P
L
L
P
P
P
L
P
L
MODUL 5
Politeknik Telkom
Praktikum Statistika
6
ANALISIS VARIANSI
Overview
Analisis variansi ini merupakan alternatif lain bagi pengujian nilai tengah selain
menggunakan uji-t. Salah satu perbedaan utama antara analisis variansi
dengan uji-t adalah kemampuan uji untuk membandingkan beberapa angkatan
data secara serempak. Pada analisis variansi yang lebih kompleks (banyak
faktor), nilai tengah bisa berasal dari beberapa faktor. Modul ini memberikan
penjelasan mengenai analisis satu faktor saja.
Tujuan
1.
2.
3.
6-1
Mahasiswa memahami tentang konsep analisis variansi dan asumsiasumsinya
Mahasiswa dapat membuat tabel analisis variansi untuk
membandingkan nilai tengah beberapa angkatan data secara
serempak
Mahasiswa dapat membuat kesimpulan yang tepat terkait dengan uji
hipotesis yang dibuat
MODUL 6
Politeknik Telkom
6.1
Praktikum Statistika
Asumsi-asumsi pada analisis variansi
Pada modul IV, telah dibahas masalah kenormalan data. Hal tersebut
merupakan landasan yang penting pada tahap pengujian hipotesis dan analisis
variansi. Hal mendasar pada analisis variansi adalah membandingkan lebih dari
dua populasi berdasarkan pada lebih dari dua buah angkatan data. Asumsiasumsi yang diperlukan pada analisis variansi adalah :
1. Setiap angkatan data berasal dari populasi yang berdistribusi normal.
2. Setiap populasi memiliki variansi yang sama.
3. data yang satu dengan yang lainnya merupakan pengamatan yang saling
bebas.
Dalam prakteknya asumsi-asumsi tersebut tidak dituntut terlalu ketat, yaitu :
1. Mengenai kenormalan data, bila distribusinya cukup dekat ke normal,
maka asumsi tersebut sudah dipenuhi
2. Mengenai kesamaan variansi, bila nilai variansi terbesar < 3 x variansi
terkecil, maka hal tersebut tidak sudah cukup
3. Mengenai kebebasan antar pengamatan, dapat dilakukan dengan metode
pengambilan sampel secara acak.
6.2
Uji Kesamaan Ragam
Hipotesis kesamaan ragam :
H0 :
2
1
=
2
2
= .... =
2
n
H1 : ragam-ragam tersebut tidak semuanya sama
Ada dua kasus pada uji bartlett :
a. Ukuran sampel sama
S12
b
6-2
n1 1
S 22
n2 1
.......... S k2
nk 1
1
N k
S g2
MODUL 6
Politeknik Telkom
Praktikum Statistika
k
( ni
S g2
adalah ragam gabungan yaitu
S g2
1) S i2
i 1
N
k
S i2 adalah ragam masing-masing sampel
Bila b
bk ( ; n) , maka H0 ditolak pada taraf nyata
b. Ukuran sampel tidak sama
Pada kasus ini, bila b
bk ( ; n1 , n2 , ..., nk ) , maka H0 ditolak pada taraf
nyata . Dalam hal ini,
n1 bk ( ; n1 )
bk ( ; n1 , n 2 , ..., n k )
6.3
n 2 bk ( ; n1 ) ... n k bk ( ; n1 )
N
Tabel analisis variansi
Berdasarkan asumsi-asumsi di atas, maka terdapat hubungan bahwa variansi
hasil penggabungan dari semua angkatan data terdiri atas rata-rata variansi
setiap angkatan dan variansi daris semua rata-rata angkatan. Misalkan akan
dibandingkan m buah angkatan data, maka hubungan tersebut dapat
dinyatakan sebagai :
m
N 1 S2
N
m
ni
1 S i2
m 1 V
i 1
JKT
JKD
di mana
JKT = Jumlah Kuadrat Total
JKD = Jumlah Kuadrat Dalam angkatan
JKA = Jumlah Kuadrat Antar angkatan
V
1
JKA
2
m
Xi
X
m 1i 1
ni = banyaknya data dalam angkatan ke-i
V = variansi dari semua rata-rata angkatan
6-3
MODUL 6
Politeknik Telkom
Praktikum Statistika
N = Total data penggabungan semua angkatan
S2 = variansi gabungan
S i2 = variansi angkatan ke-i
X i = rata-rata angkatan ke-i
X = rata-rata gabungan
N – 1 = derajat kebebasan total
N – m = derajat kebebasan dalam angkatan
m – 1 = derajat kebebasan antar angkatan
Misal diketahui data setiap angkatan sebagai berikut :
Angkatan ke-1 Angkatan ke-2 ......... Angkatan ke-m
X11
X21
......... Xm1
X12
X22
........ Xm2
:
:
:
X1n1
X2n2
........ Xmnm
Untuk menghitung JKT, JKD, dan JKA digunakan rumusan sebagai berikut :
2
ni
m
2
ni
JKD
j 1
X ij
i 1 j 1
2
X ij
m
i 1 j 1
2
ni
JKT
m
2
ni
X ij
i 1 j 1
2
ni
X ij
ni
i 1
m
m
j 1
JKA
ni
i 1
ni
6-4
X ij
m
X ij
i 1 j 1
MODUL 6
Politeknik Telkom
Praktikum Statistika
Untuk membandingkan m populasi berdasarkan m buah angkatan data, dan
berdasarkan asumsi-asumsi analisis variansi, maka hipotesis nol dan hipotesis
alternatifnya didefinisikan sebagai berikut :
H0 : 1 = 2 = ..... = m
H1 : paling sedikit ada satu pasangan (i, j) sehingga i ≠ j
Sedangkan statistik uji yang digunakan adalah statistik Fisher yang didefinisikan
JKA
RKA
m 1
sebagai
. Kemudian nilai F hasil perhitungan
F
JKD
RKD
N m
debandingkan dengan nilai F dari tabel, yaitu F , (m-1), (N-m). Bila Fhit
F , (m-1), (N-m), maka H0 ditolak, sehingga paling sedikit ada satu pasangan
(i, j) sehingga i ≠ j.
Tabel analisis variansi dapat ditampilkan sebagai berikut :
Sumber
Jumlah Kuadrat Derajat
Rata-rata
Variansi
bebas
Kuadrat
Antar
JKA
m–1
RKA
angkatan
Dalam
JKD
N–m
RKD
angkatan
Total
JKT = JKA + N – 1
JKD
6.4
Fhit
RKA/RKD
Aplikasi dengan minitab
Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari
teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk
telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa
telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini
banyak operator selular menggunakan teknologi berbasis CDMA, antara lain
Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8
dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna
produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung.
6-5
MODUL 6
Politeknik Telkom
Praktikum Statistika
Berikut adalah datanya :
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Fren
55
42
45
71
83
47
75
48
60
69
85
54
31
25
30
Flexi
60
33
39
61
40
94
71
61
77
64
65
70
80
61
50
Esia
37
60
35
61
31
56
65
78
59
27
30
45
38
25
35
Langkah-langkah pengolahan dengan menggunakan minitab 15 :
1. Simpan data tersebut pada worksheet minitab
2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan
uji kesamaan ragam dengan cara pilih menu stat, lalu ANOVA,
kemudian test for equal variances, maka akan muncul kotak dialog
seperti di bawah kemudian ketikkan kolom data pada isian response dan
kolom subcript pada factor, klik option atau storage bila perlu, lalu OK
(catatan kolom harus di stack dulu, pada menu data)
6-6
MODUL 6
Politeknik Telkom
3.
Praktikum Statistika
Hasil yang diperoleh sebagai berikut :
Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam ketiga
sampel sama, karena Pvalue = 0.811 > 0.05
6-7
MODUL 6
Politeknik Telkom
Praktikum Statistika
4.
Pengujian hipotesis, dilakukan dengan cara pilih Stat, ANOVA,
kemudian pilih 2-sample t, kemudian isi kotak dialog
5.
Hasil yang diperoleh adalah sebagai berikut :
Test for Equal Variances: C4 versus C5
One-way ANOVA: Fren, Flexi, Esia
Source DF SS MS F
P
Factor 2 1996 998 3.35 0.045
Error 42 12520 298
Total 44 14516
S = 17.27 R-Sq = 13.75% R-Sq(adj) = 9.64%
6-8
MODUL 6
Politeknik Telkom
Praktikum Statistika
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ----+---------+---------+---------+----Fren 15 54.67 18.98
(--------*--------)
Flexi 15 61.73 16.33
(--------*--------)
Esia 15 45.47 16.35 (--------*--------)
----+---------+---------+---------+----40
50
60
70
Pooled StDev = 17.27
Boxplot of Fren, Flexi, Esia
100
90
80
Data
70
60
50
40
30
20
Fren
Flexi
Esia
Untuk menolak atau menerima Ho dapat dilihat dari 2 hal yaitu :
- Pvalue = 0.045 < 0.05, maka Ho ditolak
- Nilai kritis (F hitung = 3.35 > F tabel) maka Ho ditolak
Karena Ho ditolak, maka dapat disimpulkan bahwa rata-rata jumlah
pengguna produk fren, flexi dan esia di 15 kecamatan kota Bandung
berbeda. Hal itu dimungkinkan satu atau dua dari tiga produk tersebut
6-9
MODUL 6
Politeknik Telkom
Praktikum Statistika
ada yang mempunyai kelebihan, sehingga konsumen akan cenderung
memilih produk tersebut.
Latihan
1. Berikut adalah data pengunjung dari lima warnet dalam waktu 1 minggu.
Warnet/hr
A
B
C
D
E
1
10
18
12
15
20
2
20
15
25
15
10
3
25
10
30
20
8
4
8
26
35
10
9
5
35
25
9
25
35
6
20
30
10
20
35
7
20
30
10
25
15
Lakukan pengujian apakah rata-rata pengunjung dari lima warnet dalam
waktu satu minggu sama atau tidak, dengan taraf nyata 0.05 dan 0.01.
2.
Berikut adalah data penjualan dari lima merk Laptop yang dijual di BEC
dari 8 pusat penjualan selama satu bulan.
Merk/ Toko I
II
III IV V
Accer
6
10 8 12 5
Toshiba
4
3
9 10 2
Compac
15 10 8 12 10
IBM
5
3
6 8
2
HP
4
3
6 10 3
Dengan menggunakan analisis ragam dan taraf nyata 0.05, uji apakah ratarata penjualan dari kelima merk laptop di BEC sama, dengan
menggunakan hipotesis seperti pada dasar teori di atas.
6-10
MODUL 6
Politeknik Telkom
3.
Praktikum Statistika
Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan TI angkatan
2006
ST
TI
IF
426.667 450.000 453.333
520.000 506.667 480.000
216.667 456.667 550.000
290.000 576.667 460.000
410.000 360.000 403.333
400.000 500.000 380.000
370.000 430.000 443.333
490.000 413.333 216.667
343.333 386.667 450.000
390.000 363.333 453.333
373.333 433.333 216.667
430.000 543.333 463.333
456.667 350.000 430.000
580.000 436.667 363.333
410.000 386.667 430.000
436.667 350.000 216.667
423.333 416.667 473.333
413.333 410.000 403.333
396.667 386.667 406.667
430.000 366.667 413.333
410.000 406.667 446.667
430.000 543.333 416.667
510.000 426.667 416.667
216.667 363.333 443.333
420.000 383.333 540.000
420.000 380.000 473.333
483.333 413.333 413.333
370.000 383.333 520.000
433.333 216.667 510.000
476.667 420.000 420.000
Lakukan analisis ragam dengan taraf nyata 0.05 pada data tersebut.
Kemudian uji apakah rata-rata nilai toefl mahasiswa dari tiga juruan sama
ataukah berbeda.
6-11
MODUL 6
Politeknik Telkom
Praktikum Statistika
7 REGRESI LINIER DAN NON-LINIER
SEDERHANA
Overview
Dalam sebuah penelitian, sering kita memiliki data yang berpasangan (X,Y).
Data tersebut bisa jadi diperoleh dari sebuah percobaan terhadap peubah X
sedangkan respon yang terjadi dicatat sebagai peubah Y. Hal menarik yang
bisa disimpulkan dari data yang berpasangan adalah tingkat keeratan
hubungan antara X dan Y serta bentuk hubungan fungsionalnya. Modul ini
memberikan panduan langkah – langkah kepada mahasiswa dalam
menentukan hubungan antara dua peubah X,Y yang paling tepat, langkah –
langkah pengujian koefisien regresi beserta penentuan tingkat keeratannya.
Tujuan
1.
2.
3.
7-1
Mahasiswa dapat membuat model regresi linier maupun non-linier
sederhana dari data berpasangan (X,Y).
Mahasiswa dapat memahami keterkaitan antara model linier dan model
non-linier.
Mahasiswa dapat menentukan model regresi yang terbaik berdasarkan
pengujian terhadap koefisien regresi dan nilai R2
MODUL 7
Politeknik Telkom
Praktikum Statistika
7.1 Regresi
Suatu permasalahan penelitian biasanya dapat dijelaskan oleh dua atau lebih
variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling
berhubungan tersebut membentuk suatu persamaan matematis yang dapat
digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai
variabel yang lain. Dalam statistika, hubungan fungsional antara variabel tak
bebas ( dinotasikan Y ) dengan variabel bebas ( dinotasikan X ) disebut
regresi antara Y dan X. Persamaan regresi yang akan dibahas pada bab ini
persamaan linier sederhana, persamaan non-linier yang dibangkitkan dari
persamaan linier yaitu eksponensial dan geometrik.
7.1.1
Model untuk regresi linier sederhana
Bentuk umum :
y
x
y : variabel takbebas
x : variabel bebas
: error yang terjadi pada eksperimen
Nilai selalu berubah ubah pada setiap x jadi sulit untuk ditebak, model ini
kemudian diduga oleh ŷ a b x dengan metode kuadrat terkecil yaitu
meminimumkan jumlah kuadrat error (
terkecil didapatkan nilai untuk a dan b
xy
y b x dan b
a
x
2
ŷ 2 ). Dari metode kuadrat
yi
x
n
x
y
2
n
Untuk melihat seberapa baik model regresi yang diperoleh, dapat dilihat
melalui nilai koefisien korelasi determinasi R2 yang memiliki nilai 0 sampai 1
dan memiliki rumus
R
7-2
2
JKR
JKT
yˆ
y
y
y
2
2
MODUL 7
Politeknik Telkom
Praktikum Statistika
Selain menggunakan R2, untuk mengetahui kelayakan suatu model regresi yang
telah diperoleh yang digunakan menduga hubungan antara variabel X dengan
variabel Y, dilakukan dengan pengujian terhadap koefisien-koefisien regresi
yaitu :
1.
Pengujian koefisien regresi secara serentak
Hipotesis :
- H0 : a = b = 0
- H1 : paling tidak terdapat satu koefisien tidak sama dengan nol
Tabel analisis ragam untuk uji koefisien regresi secara serentak
Sumber
Derajat Jumlah Kuadrat
Kuadrat
Fhitung
keragaman
bebas
Tengah
Regresi
p
KT reg
JK reg
bt X tY n Y 2
p
Galat
n-p-1
Total
n-1
Sisa
JK galat
n
t
Y Y
nY
p 1
2
Statistik uji untuk penolakan H0 adalah : Fhit
2.
KT galat
F
p, n p 1
Pengujian koefisien regresi secara individu
Hipotesis :
- H0 : bp = 0
- H1 : bp ≠ 0
bp
Statistik uji yang digunakan : t hit
Se b p
Kriteria penolakan H0 adalah
t hit
tn
p 1
Arti penolakan terhadap H0 adalah variabel bebas berpengaruh nyata
terhadap variabel tak bebas Y (untuk H0 : b1 = 0), sehingga model regresi
linier dikatakan layak.
7-3
MODUL 7
Politeknik Telkom
Praktikum Statistika
7.1.2 Model regresi non linier
7.1.2.1 Model eksponensial
Bentuk umum regresi model eksponensial adalah
tersebut diduga dengan ŷ
langkah langkah berikut :
-
-
. Model
ab x .Nilai a dan b diperoleh dengan cara
y
Dengan melogaritmakan persamaan
log y
x
y
ab x , diperoleh
log a x log b c dx
Model tersebut berubah menjadi model linier, sehingga nilai c dan d
didapatkan dari rumusan model linier yaitu
c
x log y
log y d x dan d
x2
x
log y
n
2
x
n
d
c
dimana a 10 dan b 10
7.1.2.2 Model geometrik (power )
Regresi model geometrik mempunyai bentuk umum
Pendugaan model tersebut adalah
cara sebagai berikut :
-
x
.
ax .Nilai a dan b diperoleh dengan
y axb , diperoleh
log a b log x c b log x
Dengan melogaritmakan persamaan
log y
7-4
y
y
b
MODUL 7
Politeknik Telkom
-
Praktikum Statistika
Nilai c dan d bisa didapatkan dari rumusan model linier yaitu
c
log y b log x dan b
log x log y
(log x) 2
log x
n
log x
log y
2
n
dimana a 10
c
7.1.3
Aplikasi dengan minitab
Regresi Linier
Berikut adalah data produksi pulsa tingkat nasional (106)
Tahun
1998
1999
2000
2001
2002
2003
2004
2005
2006
Pulsa
35451
37221
40905
45875
50260
56852
59981
67230
70020
a. Gambarkan diagram pencar
b. Tentukan persamaan regresinya
c. Hitung korelasinya
d. berapakah produksi pulsa pada tahun 2007
Langkah-langkah :
1. Ketik data tersebut pada kolom C1(X) dan C2(Y)
2.
7-5
Membuat diagram pencar dengan cara: pilih menu graph, lalu pilih
scatter plot, klik with regression. Setelah muncul kotak dialog, ketik
kolom yang sesuai untuk variabel Y dan X, dan atur skala, dan lain-lain,
kemudian OK
MODUL 7
Politeknik Telkom
Praktikum Statistika
Outputnya sebagai berikut :
Scatterplot of Pulsa vs Tahun
70000
Pulsa
60000
50000
40000
30000
0
7-6
1
2
3
4
5
Tahun
6
7
8
9
MODUL 7
Politeknik Telkom
3.
Praktikum Statistika
Pilih menu stat, kemudian basic statistics, lalu correlation. Setelah
muncul kotak dialog berikut, isi kotak variabel dengan kolom tempat X
dan Y, kalau ingin menyimpan matriknya klik store matrix, bila tidak,
langsung klik OK
Hasilnya adalah Correlation of X and Y = 0.994, Pvalue = 0.00
Karena korelasi antara X dan Y nilainya mendekati 1, maka antara tahun
dengan produksi pulsa terdapat hubungan linier, sehingga dapat dianalisis
dengan regresi linier.
7-7
MODUL 7
Politeknik Telkom
4.
Praktikum Statistika
Pilih menu stat, kemudian regression, lalu regression. Setelah muncul
kotak dialog, pada kotak respon ketik kolom tempat Y, dan predictor
dengan kolom tempat X, kemudian OK
Hasil yang diperoleh adalah :
Regression Analysis: Pulsa versus Tahun
The regression equation is
Pulsa = 28413 + 4624 Tahun
Predictor Coef SE Coef
T
P
Constant 28413 1066 26.66 0.000
Tahun
4623.9 189.4 24.41 0.000
S = 1467.20 R-Sq = 98.8% R-Sq(adj) = 98.7%
7-8
MODUL 7
Politeknik Telkom
Praktikum Statistika
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 1282808577 1282808577 595.91 0.000
Residual Error 7 15068810 2152687
Total
8 1297877388
Unusual Observations
Obs Tahun Pulsa Fit
SE Fit Residual St Resid
1 1.00 35451 33037 902
2414
2.09R
R denotes an observation with a large standardized residual.
Dari hasil yang diperoleh tersebut, dapat diketahui bahwa tiap tahun
peningkatan produksi pulsa linier. Hal tersebut dapat dilihat dari uji
koefisien regresi, semua koefisien, nilai P value nya nol (P value yang
dihitung dari T). Dari segi kelayakan model regresi dapat dilihat dari nilai
R2 = 98.8% dan pada analisis variansi, nilai P value juga nol. Sehingga
dengan menggunakan model regresi di atas, dapat diprediksi produksi
pulsa tingkat nasional pada tahun 2007 adalah 74653 (106).
7-9
MODUL 7
Politeknik Telkom
Praktikum Statistika
Regresi Non Linier
Berikut ini merupakan contoh dari regresi non linear, diketahui bahwa data
penjualan suatu produk dari mulai diproduksi sampai produk tersebut
berumur 24 bulan (2 tahun).
Bulan ke1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Keuntungan
(dalam ribuan rupiah)
150
270
480
750
1350
2310
3625
5390
9950
15510
26500
40350
77510
111950
165300
311600
627480
804250
1540980
2314250
3923250
6010500
12334230
15975210
Dari data diatas, kita akan mencoba memprediksi keuntungan perusahaan
saat produksi berlangsung selama 3 tahun (36 bulan).
7-10
MODUL 7
Politeknik Telkom
Praktikum Statistika
Seperti yang telah diketahui sebelumnya, kita dapat membuat diagram pencar
(scater plot) dengan mintab, yaitu :
Plot bulan vs keuntungan
18000000
16000000
14000000
keuntungan
12000000
10000000
8000000
6000000
4000000
2000000
0
0
5
10
15
20
25
bulan
Jelas bahwa regresi linear kurang baik untuk diterapkan. Melihat bentuk
diagram pencar diatas kita akan mencoba mendekatinya dengan fungsi non
b
x
linear yaitu y ab atau y ax . Untuk menentukan persamaan regresi
yang terbaik antara dua model tersebut dapat dilihat dari nilai R2.
7-11
MODUL 7
Politeknik Telkom
Praktikum Statistika
Langkah – langkah dengan Minitab
1.
Pilih stat, kemudian Regression dan Fitted Line Plot
2.
Isi kotak dialog dan optionpnya seperti berikut,
7-12
MODUL 7
Politeknik Telkom
Untuk model geometrik
Praktikum Statistika
y
Untuk model eksponensial y
7-13
axb isi seperti ini
ab x isi seperti ini
MODUL 7
Politeknik Telkom
3.
Praktikum Statistika
Hasilnya adalah sebagai berikut
Untuk model geometrik
axb
y
The regression equation is
ylog = 0.798 + 3.98 xlog
Predictor
Constant
xlog
S = 0.5848
Coef
0.7983
3.9751
StDev
0.3558
0.3381
R-Sq = 86.3%
Untuk model eksponensial y
T
P
2.24 0.035
11.76 0.000
R-Sq(adj) = 85.6%
ab x
The regression equation is
ylog = 2.01 + 0.218 x
Predictor
Coef
Constant 2.01111
x
0.218240
S = 0.03676
4.
StDev
0.01549
0.001084
R-Sq = 99.9%
T
P
129.83 0.000
201.31 0.000
R-Sq(adj) = 99.9%
Kedua model, berdasarkan uji T cukup layak digunakan, tetapi
berdasarkan nilai R2 masing – masing model, maka diperoleh
kesimpulan bahwa model eksponensial lebih baik daripada model
geometric.
Jadi persamaan regresi nonlinier yang terbaik adalah
log y 2.01 0.218x
x
5.
x
Atau bila dituliskan dalam y ab menjadi y 102,33 1,652
Bila dihitung keuntungan pada akhir tahun ke-3 (bulan ke 36) maka
diperoleh hasil
y
7-14
102,33 1,652 36
7.22.10117 ribu.
MODUL 7
Politeknik Telkom
Praktikum Statistika
Latihan
1. Berikut adalah pengaruh temperatur pada proses deodorizing terhadap
warna suatu produk :
Temperatur (X)
Warna (Y)
460
0.3
450
0.3
440
0.4
430
0.4
420
0.6
410
0.5
450
0.5
440
0.6
430
0.6
420
0.6
410
0.7
400
0.6
420
0.6
410
0.6
400
0.6
a. tentukan model regresi linier Y = a + b X
b. Hitung korelasi antara Y dan X
2. Seorang distributor ingin mengetahui hubungan antara biaya pemasangan
iklan per minggu dengan hasil penjualannya, datanya sebagai berikut :
Biaya iklan ($) Penjualan ($)
40
385
20
400
25
395
20
365
30
475
50
440
40
490
20
420
50
560
40
525
25
480
50
510
7-15
MODUL 7
Politeknik Telkom
Praktikum Statistika
a. Buat diagram pencar
b. Tentukan persamaan garis regresi yang terbaik untuk meramalkan
penjualan mingguan berdasarkan biaya iklan
3.
Berikut adalah data tentang pengaruh antara nilai ujian pertama dengan
nilai ujian kedua :
Nilai ujian pertama (X) Nilai ujian kedua (Y)
4.1
2.1
2.2
1.5
2.7
1.7
6.0
2.5
8.5
3.0
4.1
2.1
9.0
3.2
8.0
2.8
7.5
2.5
8.5
3.0
9.3
2.8
9.5
3.0
7.4
1.7
a. Gambarkan diagram pencar
b. Tentukan persamaan regresi linier dan non-liniernya
c. Hitung korelasinya dan tentukan regresi yang terbaik
d. berapakah nilai ujian kedua, jika nilai ujian pertama 6.4
7-16
MODUL 7
Politeknik Telkom
Praktikum Statistika
DAFTAR PUSTAKA
1.
Devore J. L., 1991, Probability and Statistics for Engineering in The
Sciences, third edition, Pacific Grove California.
2.
Erickson, B. H., dan Nosanchuk, T. A., 1993, Memahami Data,
Terjemahan : R. K. Sembiring, LP3ES, Jakarta.
3.
Djauhari, M., Catatan Kuliah, ITB, Bandung.
4.
Minitab Inc, 1994, MINITAB Reference Manual 10 for Windows ,
Minitab Inc, New York.
5.
Walpole, R. E., 1997, Pengantar Statistika, Edisi ke-3, Penerbit PT
Gramedia Pustaka Utama, Jakarta.
6.
Hines William M. W., and Montgomery D. C., 1990, Probability and
Statistics in Engineering and Management Science, third edition, Jhon
Wiley & Sons, New York.
Download