Politeknik Telkom Praktikum Statistika PRAKTIKUM STATISTIKA POLITEKNIK TELKOM BANDUNG 2008 i MODUL 1 Politeknik Telkom Praktikum Statistika Dilarang menerbitkan kembali, menyebarluaskan atau menyimpan baik sebagian maupun seluruh isi buku dalam bentuk dan dengan cara apapun tanpa izin tertulis dari Politeknik Telkom. Hak cipta dilindungi undang-undang @ Politeknik Telkom 2008 No part of this document may be copied, reproduced, printed, distributed, modified, removed and amended in any form by any means without prior written authorization of Telkom Polytechnic. Copyright @ 2008 Telkom Polytechnic. All rights reserved ii MODUL 1 Politeknik Telkom Praktikum Statistika KATA PENGANTAR Assalamu’alaikum Wr. Wb. Segala puji bagi Allah SWT karena dengan karunia-Nya courseware ini dapat diselesaikan. Atas nama Politeknik Telkom, kami sangat menghargai dan ingin menyampaikan terima kasih kepada penulis, penerjemah, dan penyunting atas kontribusi yang telah diberikan sehingga courseware ini dapat tersusun. Kami mendorong para pengajar & mahasiswa untuk memberikan masukan yang positif. Saran mereka akan menjadi bahan pertimbangan yang serius dan banyak yang akan dimasukkan sebagai bahan perbaikan di edisi berikutnya. Kami akan sangat menghargai apabila semua pihak dapat menyampaikan pendapatnya melalui [email protected]. Semoga courseware ini dapat memberikan manfaat bagi seluruh Civitas Akademika Politeknik Telkom dalam memahami materi perkuliahan di Politeknik Telkom. Wassalamu’alaikum Wr. Wb. Bandung, Desember 2008 Christanto Triwibisono Wakil Direktur I Bidang Akademik & Pengembangan iii MODUL 1 Politeknik Telkom Praktikum Statistika DAFTAR ISI KATA PENGANTAR .............................................................. iii DAFTAR ISI ..............................................................................iv 1 PENGENALAN MINITAB 15, DATA, DAN TEKNIK PENGAMBILAN SAMPEL ................... 1-1 1.1 Menu-menu pada Minitab 15 ....................................... 1-2 1.2. Mengenal Data ............................................................. 1-14 1.2.1 Populasi dan sampel ................................................... 1-14 1.2.2 Skala pengukuran ....................................................... 1-15 1.3 Metode Sampling .......................................................... 1-17 1.4 Aplikasi dengan minitab ................................................ 1-19 2 STATISTIKA DESKRIPTIF ................................. 2-1 2.1 Ukuran Pemusatan........................................................... 2-2 2.2 Ukuran Penyebaran ......................................................... 2-2 2.5 Penyajian dalam Bentuk Grafik ........................................ 2-5 2.6 Aplikasi dengan minitab ................................................... 2-6 3 KENORMALAN DATA........................................ 3-1 3.1 Distribusi normal ............................................................. 3-2 3.2 Statistik uji kenormalan .................................................. 3-3 3.3 Aplikasi dengan minitab ................................................... 3-5 4 TRANSFORMASI DATA ..................................... 4-1 4.1 Transformasi untuk satu angkatan data ........................... 4-2 4.2 Transformasi untuk beberapa angkatan data (menyamakan sebaran) ........................................................................ 4-3 4.3 Aplikasi Minitab............................................................. 4-5 5 UJI HIPOTESIS STATISTIK DAN PROPORSI 5-1 5.1 Hipotesis statistik ............................................................ 5-2 5.1.1 Pengujian hipotesis untuk satu nilai tengah ................. 5-3 5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah ....... 5-4 iv MODUL 1 Politeknik Telkom Praktikum Statistika 5.1.3 Aplikasi dengan minitab ................................................ 5-7 5.2 Uji proporsi .................................................................. 5-11 5.2.1 Uji terhadap satu nilai proporsi ................................. 5-11 5.2.2 Aplikasi dengan Minitab .............................................. 5-12 5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai proporsi ...................................................................... 5-15 5.2.4 Aplikasi dengan Minitab .............................................. 5-15 5.2.5 Pengujian perbandingan dua proporsi ....................... 5-17 5.2.6 Aplikasi dengan Minitab .............................................. 5-18 6 ANALISIS VARIANSI .......................................... 6-1 6.1 Asumsi-asumsi pada analisis variansi ............................... 6-2 6.2 Uji Kesamaan Ragam ....................................................... 6-2 6.3 Tabel analisis variansi ....................................................... 6-3 7 REGRESI LINIER DAN NON-LINIER SEDERHANA ........................................................ 7-1 7.1 Regresi ............................................................................. 7-2 7.1.1 Model untuk regresi linier sederhana ......................... 7-2 7.1.2 Model regresi non linier .............................................. 7-4 7.1.2.1 Model eksponensial .................................................. 7-4 7.1.2.2 Model geometrik (power ) ....................................... 7-4 DAFTAR PUSTAKA .......................................................... v MODUL 1 Politeknik Telkom 1 Praktikum Statistika PENGENALAN MINITAB 15, DATA, DAN TEKNIK PENGAMBILAN SAMPEL Overview Modul ini memberikan pengenalan singkat tentang software Minitab 15 kepada mahasiswa. Pengenalan tentang menu diberikan diawal, sehingga diharapkan mahasiswa memiliki gambaran umum tentang penggunaan software ini. Setelah dapat menjalankan software ini, mahasiswa akan dikenalkan pada beberapa jenis data berdasarkan skala pengukurannya. Pada tahap akhir, mahasiswa akan diajarkan tentang pengambilan sampel dari populasi dengan menggunakan beberapa teknik sampling Tujuan 1. 2. 3. 1-1 Mahasiswa mendapatkan gambaran singkat tentang software Minitab Mahasiswa dapat membedakan data berdasarkan skala pengukurannnya Mahasiswa dapat melakukan pengambilan data sampel berdasarkan data populasi dengan menggunakan beberapa metode sampling MODUL 1 Politeknik Telkom 1.1 Praktikum Statistika Menu-menu pada Minitab 15 Pada software minitab, tampilannya ada 2, yaitu windows worksheet dan windows session. Worksheet merupakan tempat untuk mengetikkan data dan menampilkan hasil pengolahan data. Sedangkan session merupakan tempat untuk menampilkan semua perintah-perintah (command-command) yang telah kita lakukan dalam bentuk program dan hasil dari pengolahan data yang tidak dapat ditampilkan pada worksheet. Adapun tampilan minitab sebagai berikut : Adapun menu-menu pada minitab 15 yaitu : 1. File Pada menu file terdapat sub-sub menu antara lain : - New : menampilkan worksheet baru 1-2 MODUL 1 Politeknik Telkom 1-3 Praktikum Statistika - Open project : menampilkan data yang telah disimpan pada file kita. Di bawah open project, terdapat save projects, save projects as, project description. - Open worksheet : menampilkan data yang telah disimpan dan disediakan software minitab. Di bawah sub menu ini, terdapat save worksheet, save worksheet as. MODUL 1 Politeknik Telkom - Praktikum Statistika Query database : Open graph : membuka grafik yang telah disimpan Other file : membuka data dari file lain Print session window : mencetak tampilan pada session. Print setup : mencetak dengan pengaturan tampilan pada worksheet dan session. - Exit : Keluar dari minitab Adapun tampilan dari menu file sebagai berikut : - 1-4 MODUL 1 Politeknik Telkom 2. Edit Sub-sub menu pada menu edit adalah : - 1-5 Praktikum Statistika undo : kembali ke pekerjaan ke- n-1 (bila kita diposisi n) redo : kembali ke pekerjaan ke- n+1 (bila kita diposisi n) Clear cells : membersihkan data pada sel-sel worksheet Delete cells : menghapus sel-sel Copy cells : menyalin data pada sel Cut cells : memotong sel (menyalin dan menghapus) Worksheet link : memindahkan data yang telah disalin baik dari sel, atau file minitab atau word, excel, dan lain-lain. Select all cells : memilih atau menyorot semua data pada sel-sel untuk pengolahan Edit last dialog : mengedit dialog terakhir Command line editor : digunakan untuk mengeksekusi perintah secara cepat atau mengekseksekusi ulang atau mengedit perintah yang digunakan pada sesi sebelumnya. MODUL 1 Politeknik Telkom 3. Data Menu data berisi perintah-perintah menampilkan data. Sub-sub menu yang terdapat pada menu data yaitu : - 1-6 Praktikum Statistika Subset worksheet : menampilkan sebagian worksheet Split worksheet : membagi worksheet menjadi beberapa worksheet Merge worksheet : menggabungkan beberapa worksheet Sort : mengurutkan data (mengurutkan suatu kolom berdasarkan kolom lainnya ) Rank : merangking data (membuat rangking suatu kolom) Delete rows : menghapus baris Erase variabels : menghapus variabel-variabel Copy columns : mengkopi kolom Stack/unstack : menggabung data pada kolom yang berbeda menjadi satu kolom/ memisahkan data pada satu kolom menjadi beberapa kolom berdasarkan kriteria tertentu Code : mengkonversi data (numerik ke numerik, numerik ke teks dsb) Change data type : merubah tipe data Extract from Date/Time : ekstrak data numerik ke text atau sebaliknya Concatenate : menggabung dua atau lebih kolom yang berisi data text menjadi satu kolom, syarat penjang kolom sama. Display data : menampilkan data MODUL 1 Politeknik Telkom 4. 1-7 Praktikum Statistika Calc (calculation) Pada menu calc terdapat sub-sub menu : - Calculator : untuk melakukan perhitungan (penjumlahan, perkalian, pembagian, sinus, maksimum, eksponen, dan lain-lain) - Column statistics : menghitung ukuran-ukuran statistik dari suatu kolom - Row statistics : menghitung ukuran-ukuran statistik dari suatu baris - Standardize : menormalisasikan data - Make patterned data : membuat suatu kolom(data) dengan pola tertentu - Make mesh data : Membuat sebuah fungsi dua dimensi seperti permukaan berdasarkan pasangan nilai x dan y - Make indicator variables : membuat variabel dummy untuk data kualitatif - Set base : menetapkan titik awal untuk pembangkitan data acak. Bila kita tidak mengeset titik tersebut, maka titik tersebut akan ditentukan oleh minitab. - Random data : membangkitkan data acak dari berbagai distribusi - Probability distributions : menghitung peluang dan distribusi kumulatif peluang dan inversnya dari berbagai distribusi peluang. - Matrices : merupakan sub menu untuk menghitung matriks dan operasi-operasinya Adapun tampilan menu calc adalah MODUL 1 Politeknik Telkom 5. 1-8 Praktikum Statistika Menu Stat Sub-sub menu pada menu stat adalah : - Fit interceps : mendefault intersep pada persamaan regresi - Basic statistics : a) descriptiv statistics : menampilkan ukuran-ukuran statistics, seperti mean, median, trimean, standart deviasi, kuartil, maksimum dan minimum, b) uji hipotesis 1 sampel, 2 sampel , c) correlation, d) covariance, e) normallity test - Regression : mencari persamaan regresi serta analisisnya, baik regresi linier maupun non linier untuk kuantitatif maupun kualitatif - Anova : menganalisis perbedaan lebih dari dua populasi berdasarkan nilai ragam - DOE : membuat desain rancangan percobaan faktorial - Control charts : membuat bagan-bagan kendali - Quality tools : mengalisis data untuk pengendalian kualitas - Reliability/survival : membuat plot untuk analisis kehandalan sistem - Multivariate : menganalisis data banyak peubah - Time series : menganalisis data deret waktu untuk peramalan - Tables : membuat tabel kontingensi dan analisis korespondensi - Nonparametrik : menganalisis data kualitatif tanpa asumsi distribusi tertentu - EDA (Eksploratory Data Analysis) : memahami dan mengalisis data melalui diagram dahan daun, box plot, garis resisten, dll - Power and sample size : digunakan untuk menghitung power (peluang kita akan menolak H0 ketika ia salah), ukuran sampel, perbedaan minimum (ditampilkan sebagai nilai proporsi alternatif) pada uji satu proporsi. MODUL 1 Politeknik Telkom Praktikum Statistika Tampilan menu stat adalah sebagai berikut : 6. 1-9 Menu Graph Pada menu graph berisi sub-sub menu seperti pada tampilan di bawah yang digunakan untuk membuat grafik-grafik seperti histogram, diagram lingkaran, plot, countur, plot untuk data time series, box plot, diagram dahan daun. Untuk grafik-grafik tertentu dapat ditampilkan dalam dua dimensi maupun tiga dimensi. MODUL 1 Politeknik Telkom 7. Praktikum Statistika Menu Editor Berikut adalah sub-sub menu editor pada worksheet : - Next column : memindahkan kursor ke kolom berikutnya - Go to active cell : memindahkan kursor ke sell yang aktif - Format column : memformat kolom dalam numerik, tanggal, text. - Column : mengatur ukuran-ukuran kolom - Formulas : menampilkan formula-formula ke kolom dan menghitung formula secara otomatis. - Worksheet : mengedit sel yang sedang aktif dan merubah arah inputan - Define custom list : mengurutkan data - Clipboard setting : merubah setting untuk data hilang 1-10 MODUL 1 Politeknik Telkom Praktikum Statistika Adapun tampilan menu editor adalah : Berikut adalah sub-sub menu pada menu editor session : - Next command : memindahkan kursor ke command berikutnya - Previous command : memindahkan kursor ke command sebelumnya - Enable command language : menampilkan bahasa pemrograman yang dieksekusi , MTB > - Output editable : mengeset tampilan output hanya dapat di baca - Find : mencari kata tertentu dalam lingkup session - Replace : mencari kata tertentu dan menggantinya dengan kata lain dalam lingkup session - Apply Font : command font untuk memberlakukan pemilihan font untuk I/O, title, command. 1-11 MODUL 1 Politeknik Telkom 8. Praktikum Statistika Tools Adapun sub-submenu pada menu tools adalah - Microsoft Calculator : Menampilkan menu calculator microsoft - Notepad : Menampilkan notepad - Windows Explorer : Menampilkan menu windows explorer - Toolbars : Untuk men-setting tool – tool yang ingin ditampilkan atau tidak - Status Bar : Status bar terletak dibagian bawah layar dan menampilkan pesan yang menjelaskan item menu dan toolbars yang saat ini sedang aktif. - Customize : Digunakan untuk mengedit/menambah/menampilkan shortcut perintah (command), Toolbars, tool dan lain-lain pada Minitab - Options : Digunakan untuk merubah dan menyimpan settingan standar untuk berbagai macam operasi - Manage Profiles :Digunakan untuk membuat, menghapus, mengaktifkan atau menonaktifkan satu atau beberapa profil termasuk mengubah urutan nya. - File Security :digunakan untuk melindungi file proyek dari pihak lain 1-12 MODUL 1 Politeknik Telkom Praktikum Statistika Tampilan menu tools adalah 9. Menu Windows Sub-sub menu pada menu windows digunakan untuk mengatur tampilan dari windows minitab dan menyimpan data, session, grafik yang telah dibuat untuk sementara, yaitu : 1-13 MODUL 1 Politeknik Telkom Praktikum Statistika 10. Menu Help Menu ini digunakan untuk membantu user, apabila terdapat kesulitan waktu menggunakan minitab, baik masalah teori, maupun commandnya. 1.2. Mengenal Data 1.2.1 Populasi dan sampel Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus persen berhubungan dengan data. Data dalam bidang statistika merupakan keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis. Sedangkan data itu sendiri merupakan keterangan yang menggambarkan kondisi saat itu. Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan 2) data sekunder. Data primer adalah keteranngan atau informasi secara 1-14 MODUL 1 Politeknik Telkom Praktikum Statistika umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data sekunder merupakan data yang diambil dari penelitian orang lain pada suatu publikasi. Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari pengambilan sampel adalah : 1. Waktu Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat dipilih sebagai alternatif pengambilan data. 2. Biaya Untuk penelitian mengenai suatu komponen yang harganya mahal, bila pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar. Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel. 3. Populasi tidak pasti Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang orang berpenyakit flu burung, maka kita akan kesulitan menentukan populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang kena flu burung atau tidak. Sehingga pengambilan sampel perlu dilakukan yaitu pasien flu burung pada suatu rumah sakit. 4. Ketelitian Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya dan waktu penelitian terbatas, maka jumlah tenaga yang membantu penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya berpengaruh pada tingkat ketelitian. 1.2.2 Skala pengukuran Skala pengukuran merupakan bagian yang paling mendekati pengukuran data baik secara diskret maupun kontinu. Skala ini sangat penting, karena berkaitan dengan pemilihan teknik analisis statistika yang sangat bergantung pada sifat 1-15 MODUL 1 Politeknik Telkom Praktikum Statistika data dan skala pengukuran yang digunakan. Ditinjau berdasarkan skala pengukurannya, data dapat dibedakan menjadi beberapa kelompok, yaitu ( dari yang terendah sampai yang tertinggi ) : a. Skala Nominal Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak memiliki tingkatan. Satu – satunya operator matematika yang berlaku adalah persamaan dan pertidaksamaan. Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan sebagainya. b. Skala Ordinal Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan lebih dari. Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai huruf, peserta kontes kecantikan, jenis komputer dan sebagainya. c. Skala Interval Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu 30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya ( tidak ada). Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0 bukan berarti tidak ada tahun. d. Skala Rasio Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya ( tidak ada ). Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya. 1-16 MODUL 1 Politeknik Telkom Praktikum Statistika Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan tidak dapat ditentukan ukuran ukuran statistik seperti mean, standard deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan statistika nonparametrik. Sedangkan data yang berskala interval atau Rasio dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat dilakukan pada data dengan kedua skala terakhir ini relatif sama. 1.3 Metode Sampling Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling (metode pengambilan sampel ) yaitu : 1. Acak sederhana Pada metode ini, pertama kita tentukan populasi yang akan diambil sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan jumlah sampel sama dengan 10, dengan menggunakan tabel random (lampiran A) dapat ditentukan 10 angka yang akan menentukan nomor unit populasi yang akan diambil. Misalkan dipilih baris 5 kolom 4,5 dan 6 sebagai titik awal, dan dipilih arah ke kanan (boleh ke atas,kiri atau bawah) maka nomor sampel secara random yang diperoleh adalah 532, 115, 916, 239, 505, 956, 250, 961, 207, 868 Karena jumlah populasi = 200, maka angka – angka yang melebihi 200 akan dihilangkan digit ratusannya. Sehingga nomor sampel randomnya menjadi 32, 115, 16, 39, 05, 56, 50, 61, 07, 68 Banyaknya digit bilangan random sebagai titik awal tergantung dari banyaknya digit maksimal populasi. 1-17 MODUL 1 Politeknik Telkom Praktikum Statistika 2. Random Berstrata ( berlapis ) Dalam metode ini, langkah pertama adalah populasi dikelompokkan dalam beberapa kelompok agar lebih homogen, kemudian dari masing masing kelompok diambil sampel berukuran tertentu ( secara proporsional ) secara acak seperti pada metode pertama. 3. Sistematik Dalam metode ini pertama tama populasi diberi nomor dari 1 sampai N. Kemudian secara acak ditentukan sebuah nomor antara 1 sampai N (misal k) dan dibuat suatu barisan aritmatika dengan suku awal k dengan pertambahan tertentu sampai didapat n data. Bila suatu suku bernilai lebih dari N maka suku tersebut harus dikurangi N atau kelipatannya. Nilai penambahan adalah bilangan bulat sedemikian hingga nilainya dekat dengan N dengan N : ukuran populasi dan n : ukuran sampel. n Contoh Sebuah populasi berukuran 100 dan akan diambil sampel berukuran 15. Misalkan bilangan acak pertama dipilih 70 agar merata maka pertambahannya bisa dipilih sekitar 7. Hasil selengkapnya bisa dilihat pada tabel berikut : No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1-18 Barisan 70 77 84 91 98 105 112 119 126 133 140 147 154 161 168 Sampel yg terpilih 70 77 84 91 98 5 12 19 26 33 40 47 54 61 68 MODUL 1 Politeknik Telkom 4. Praktikum Statistika Bergerombol ( cluster ) Pada metode ini teknik yang digunakan mirip dengan metode acak sederhana hanya saja disini yang menjadi unit sampelnya adalah berupa cluster cluster yang mana masing masing cluster berisi elemen elemen yang yang lebih kecil. Yang menjadi pedoman untuk menentukan cluster adalah bahwa cluster cluster tersebut memiliki karakteristik yang hampir sama. Contoh Sebuah populasi berukuran 1000 tetapi dapat dikelompokan dalam kluster kluster yang berukuran 10, jadi total klusternya adalah 100. Misalkan dari 100 cluster tersebut akan diteliti sebanyak 6 cluster maka dengan metode acak sederhana dapat ditentukan 6 kluster yang terpilih. Unit unit sampel yang diteliti adalah keseluruhan unit populasi atau sebagian unit yang terletak didalam 6 kluster terpilih tersebut. 1.4 Aplikasi dengan minitab Menentukan sampel dengan beberapa metode sampling A. Acak sederhana Pada metode ini, pertama kita tentukan populasi yang akan diambil sampelnya. Misalkan jumlah populasi = 200, maka untuk setiap unit populasi tersebut diberikan nomor dari 1 sampai 200. Bila diinginkan jumlah sampel sama dengan 20, dengan menggunakan tabel random dapat ditentukan 20 angka yang akan menentukan nomor unit populasi yang akan diambil. 1-19 MODUL 1 Politeknik Telkom Praktikum Statistika Adapun langkah-langkahnya adalah : 1. 2. Pilih calc, make patterned Data kemudian Simple Set o Numbers Isilah tabel yang keluar sesuai tabel berikut Pada langkah ini merupakan proses pemberian nomor populasi 3. Pilih calc,Random Data kemudian Sample From Columns 4. Isilah tabel yang keluar sesuai tabel berikut ( proses ini merupakan pengambilan sampel berukuran 20 secara acak ). Dalam langkah ini kemungkinan setiap orang akan mendapatkan hasil yang berbeda. 1-20 MODUL 1 Politeknik Telkom 5. Praktikum Statistika Hasil yang keluar diatas merupakan nomor nomor unit populasi yang akan diambil sebagai sampel (pada kolom sampel) yaitu : Sampel 72 10 102 156 64 169 2 15 147 164 126 117 121 48 176 110 114 199 79 135 B. Random Berstrata (berlapis) Misalkan dimiliki data populasi yang terdiri atas 60 mahasiswa jurusan Teknik Telekomunikasi, 50 mahasiswa Teknik Informatika dan 40 mahasiswa Teknik Industri. Bila ingin diambil sampel sebanyak 20 mahasiswa secara sistematis maka dilakukan dengan langkah – langkah berikut . 1-21 MODUL 1 Politeknik Telkom 1. 2. Praktikum Statistika Buat nomor 1 sampai 60 untuk mahasiswa Teknik Telekomunikasi, 1 sampai 50 untuk Teknik Informatika dan 1 sampai 40 untuk Teknik Industri. Hitung jumlah sampel untuk masing – masing jurusan. Teknik Telekomunikasi 60 n1 x 20 8 60 50 40 Teknik Informatika 50 n2 x 20 6 60 50 40 Teknik Industri 40 n3 x 20 6 60 50 40 3. Buat patterned data sebanyak 60,50 dan 40 seperti pada langkah sebelumnya kemudian simpan(Store samples in) dalam kolom yang terpisah(C3,C4 dan C5). 4. Lakukan pengambilan secara acak untuk masing – masing jurusan(patterned data) seperti pada pengambilan sampel acak sederhana dengan ketentuan 8 berasal dari jurusan Teknik Telekomunikasi(C3), 6 dari jurusan Informatika(C4) dan 6 orang dari jurusan Teknik Industri(C5). C. Sistematis Misalkan dimiliki populasi sebanyak 200 dan akan diambil sampel sebanyak 30, maka langkah – langkahnya adalah sebagai berikut 1. Tentukan salah satu nilai sebagai titik awal misalkan 50. 2. Nilai pertambahan 3. Buat patterned data pada file baru dengan nilai pertambahan (in step of) = 7, nilai awal(From first value) = 50 dan nilai akhir (To last value) = 260. 1-22 200 30 7 MODUL 1 Politeknik Telkom 4. Praktikum Statistika Ambil 30 nomor sampel yang pertama, hasilnya adalah No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 1-23 Barisan 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148 155 162 169 176 183 190 197 204 211 218 225 232 239 246 253 Sampel yg terpilih 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148 155 162 169 176 183 190 197 04 11 18 25 32 39 46 53 MODUL 1 Politeknik Telkom Praktikum Statistika D. Bergerombol Misalkan akan diteliti kualitas suatu minuman mineral botol yang dikemas dalam kotak. Jumlah kotak keseluruhan adalah 100 kotak dimana masing – masing kotak berisi 10 botol dan sampel yang diinginkan adalah 50 botol. Alternatif yang dapat dilakukan antara lain dari 100 kotak diambil 5 kotak secara acak kemudian semua botol dalam kotak tersebut diteliti. Alternatif lain yang dapat dipilih dari 100 kotak tersebut dipilih 10 kotak acak kemudian dari 10 kotak tersebut dipilih 5 botol secara acak. Misalkan alternatif kedua yang dipilih : 1. Beri nomor 1 sampai 100 semua kotak yang dimiliki. 2. Buat patterned data pada file baru sebanyak 100 seperti pada langkah sebelumnya kemudian simpan dalam kolom yang tertentu(C1) 3. Ambil 10 sampel secara acak berdasarkan kolom C1 simpan pada C2. 4. Beri nomor 1 sampai 10 pada seluruh botol untuk 10 kotak yang terpilih. 5. Buat patterned data pada file baru sebanyak 10 seperti pada langkah sebelumnya kemudian simpan dalam kolom C3 6. Ambil 5 sampel secara acak berdasarkan kolom C3 simpan pada C4, ulangi sampai 10X dan simpan dalam kolom yang berbeda. 7. Semua nomor sampel yang terpilih pada masing – masing kotak merupakan unit sampel yang akan diteliti. Latihan 1. Tentukan sampel berukuran 30 dari populasi dengan ukuan 300 2. Tentukan sampel berukuran 30 yang diambil dari populasi yang dikelompokkan dalam 4 kelompok dengan ukuran 25,50,75 dan 100 3. Tentukan sampel berukuran 20 yang diambil dari populasi berukuran 200 dengan metode sistematik 4. Suatu populasi berukuran 500 dan dikelompokkan dalam 25 kluster. Bila nomor populasi 1 20 masuk dalam kluster 1, nomor populasi 21 40 masuk dalam kluster 2 dst. Bila dari 25 kluster tersebut diambil 5 secara acak, tentukan nomor nomor populasi mana yang akan masuk dalam sampel ! 1-24 MODUL 1 Politeknik Telkom Praktikum Statistika 2 STATISTIKA DESKRIPTIF Overview Modul ini memberikan panduan secara singkat tentang teknik penyajian dan analisis data secara deskriptif. Pada tahap awal, mahasiswa dikenalkan serta diajarkan menampilkan pada beberapa ukuran statistik seperti ukuran pemusatan, ukuran penyebaran dan ukuran letak dengan menggunakan software minitab. Ukuran – ukuran ini adalah ukuran – ukuran sering yang digunakan dalam penyajian data secara deskriptif. Pada tahap selanjutnya mahasiswa akan diajarkan cara menyajikan data dalam bentuk tabel frekuensi dan juga dalam graph seperti : histogram, box plot dan diagram dahan daun beserta analisa hasilnya Tujuan 1. 2. 3. 2-1 Mahasiswa dapat menentukan beberapa ukuran pemusatan dan penyebaran data Mahasiswa dapat membuat tabel distribusi frekuensi Mahasiswa dapat menyajikan data dalam bentuk histogram, box plot dan diagram dahan daun MODUL 2 Politeknik Telkom Praktikum Statistika 2.1 Ukuran Pemusatan Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain mean, median, dan modus. Mean adalah rata rata dari data dan dinotasikan dengan x atau , di mana x menyatakan rata rata sampel dan menyatakan rata rata populasi. Secara umum mean memiliki rumusan sebagai berikut : x xi , n banyaknya sampel n xi , N banyaknya populasi N Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50% data. Cara menentukan median sebagai berikut : Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar, maka untuk n ganjil median Xn 2 median 1 Xn 2 2 Xn 2 1 1 dan untuk n genap . Modus yaitu nilai yang paling sering muncul dalam suatu gugus data Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada beberapa kasus yang membuat nilai tengah menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim. 2.2 Ukuran Penyebaran Beberapa ukuran penyebaran antara lain : Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum dengan nilai minimum. 2-2 MODUL 2 Politeknik Telkom Praktikum Statistika Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap x . Variansi merupakan ukuran penyebaran yang sering digunakan dalam statistika inferensia. Variansi dinotasikan S2 untuk sampel dan 2 untuk populasi. Variansi memiliki rumusan sebagai berikut : S2 xi n 1 xi x 2 , di mana n banyaknya sampel 2 , di mana N banyayknya populasi N Simpangan baku merupakan akar dari variansi. 2 2.3 Ukuran Letak Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh desil, persentil dll. 2.4 Distribusi Frekuensi Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada tabel tersebut menampilkan ciri ciri penting sejumlah data yang diperoleh dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari masing masing kelas dihitung banyaknya pengamatan yang masuk. Langkah-langkah membuat tabel frekuensi : 1. 2. 3. 4. 2-3 Menentukan banyaknya kelas dengan kaidah Sturges yaitu N 2 k 1 , dimana k 1 3.3 log N . Banyaknya kelas sebaiknya antara 5 sampai 15. Menentukan interval kelas (KI) range KI k KI sebaiknya kelipatan 5. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas (batas bawah kikurangi setengah dan batas atas di tambah setengah) MODUL 2 Politeknik Telkom Praktikum Statistika Bila data disajikan sebagai data kelompok, maka ukuran pemusatan, penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai berikut : - Ukuran pemusatan n Mean : x i 1 n f i xi i 1 fi xi = titik tengan kelas, f i = frekuensi kelas x Median : ~ 1 f 2 t Bb f sm fm p Bb = batas bawah kelas median f t = frekuensi total f m = frekuensi kelas median p = interval kelas f sm = frekuensi kumulatif sebelum median Modus : xˆ Bb a a b p a f m f am b f m = frekuensi kelas modus f am = frekuensi sebelum kelas modus f bm = frekuensi sesudah kelas modus fm f bm Ukuran penyebaran - n n S2 2-4 p2 i 1 f i ci 2 n 2 i 1 f i ci n n 1 MODUL 2 Politeknik Telkom Praktikum Statistika Ukuran letak Kuarti ( Qi , Q2 , Q3 ) - Qi Bb i f 4 t f sp fp p , i 1, 2, 3 f p = frekuensi pada kelas kuartil ke-i f sp = frekuensi sebelum kuarti Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol, sedangkan dua kelas di bawah dan di atasnya diberi kode negatif dan positif. 2.5 Penyajian dalam Bentuk Grafik Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya memiliki skala interval atau rasio, maka histogram dapat digunakan untuk menyajikan data. Box plot merupakan bentuk penyajian data yang hanya menggunakan beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum, Q1, median, Q3, nilai maksimum. Pada box plot dapat juga ditentukan adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang apabila dibandingkan dengan nilai data yang lain tidak konsisten. Pencilan dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar). Untuk menentukan pencilan digunakan rumusan sebagai berikut : Pagar dalam (p) p1 Q1 1.5 Q3 Q1 p 2 Q3 1.5 Q3 Q1 Pagar luar (P) P1 Q1 2 Q3 Q1 P2 Q3 2 Q3 Q1 Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di luar pagar luar. 2-5 MODUL 2 Politeknik Telkom Praktikum Statistika Diagram dahan daun adalah salah satu teknik penyajian data yang menggunakan data asli secara langsung. Pada dasarnya dalam diagram dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun, dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom daun. Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data, apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa x ~ x kemencengan digunakan metode Pearson yaitu . Jika 0 , data S menceng ke kiri dan 0 , data menceng ke kanan. 2.6 Aplikasi dengan minitab Data adalah data penjualan voucher telepon di lima kota provinsi Jawa barat : Bulan 1 2 3 4 5 6 7 8 9 10 11 12 2-6 Bandung 42 45 51 61 69 76 78 78 72 62 51 44 Sukabumi 8 14 25 43 54 64 71 69 58 47 29 16 Garut 32 33 41 52 62 72 77 75 68 58 47 35 Tasik 56 60 58 62 63 68 69 71 69 67 61 58 Bogor 51 58 57 67 81 88 94 93 85 74 61 55 MODUL 2 Politeknik Telkom Praktikum Statistika Langkah-langkah menggunakan software minitab 15 adalah : 1. Ketikkan atau copy data tersebut pada worksheet minitab 2. 2-7 Pilih menu stat, kemudian basic statistics, lalu klik summary graphics MODUL 2 Politeknik Telkom Praktikum Statistika 3. Pada kotak dialog, isi kolom tempat data pada variables, lalu klik OK 4. Hasil yang diperoleh adalah sebagai berikut : 2-8 MODUL 2 Politeknik Telkom 2-9 Praktikum Statistika MODUL 2 Politeknik Telkom Praktikum Statistika Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan pertama. (Lakukan pengolahan data penjualan voucher di kota Bogor dan analisis) 2-10 MODUL 2 Politeknik Telkom Praktikum Statistika Latihan 1. Jarak (mil) yang ditempuh oleh suatu tipe kendaraan per gallon bahan baker adalah: 15.7 16.2 18.2 16.3 17.9 18.1 16.8 17.6 18.1 16.7 16.7 16.0 17.4 17.0 18.6 17.1 14.1 17.5 17.0 17.6 15.6 16.0 17.7 16.1 18.6 15.2 17.1 19.5 17.0 16.9 16.9 16.7 17.3 16.3 17.3 17.0 15.6 15.6 17.9 16.0 17.7 18.2 14.7 17.1 15.2 17.0 17.8 16.1 18.2 16.5 17.7 18.8 14.6 16.5 16.6 15.6 14.9 17.5 16.1 18.5 15.8 16.9 17.3 17.1 15.9 17.1 17.1 16.4 15.6 16.3 2. a. Buatlah diagram dahan daun b. Buat tabel distribusi frekuensi dan histogramnya c. Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat box plotnya d. Kesimpulan apa yang bisa dinyatakan dari data tersebut , berdasarkan a, b, c. e. Berapa persenkah jarak dari mobil tersebut yang kurang dari 15 mil/gallon, antara 15 dan 18 mil/gallon, dan lebih dari 18 mil/gallon. Suatu penelitian dilakukan untuk mengetahui waktu respon sirkuit yang digunakan pada kalkulator elektronik. Data yang diperoleh sebagai berikut : 25 22 15 20 23 30 28 22 17 19 33 18 23 31 27 22 25 19 20 15 28 25 24 16 19 a. Buat box plot dari data tersebut b. Buat tabel distribusi frekuensi dan histogram c. Analisis data tersebut dari hasil a dan b 2-11 MODUL 2 Politeknik Telkom 3. Praktikum Statistika Ketikan data score toefl dari 100 mahasiswa berikut pada kolom minitab 356 423 420 450 458 400 386 520 500 390 475 465 476 475 513 400 476 482 346 400 510 500 460 469 436 400 320 480 479 480 400 500 360 520 348 365 470 473 500 428 345 560 513 426 490 475 518 360 400 436 463 523 500 500 520 500 518 476 482 345 400 456 450 476 475 500 518 346 420 463 460 400 515 375 445 426 450 455 456 468 480 500 400 427 480 368 350 423 446 465 525 468 465 475 525 342 386 346 420 423 Buat diagram dahan daun, tabel distribusi frekuensi, histogram, lalu beri kesimpulan 2-12 MODUL 2 Politeknik Telkom Praktikum Statistika 3 KENORMALAN DATA Overview 1. Modul ini memberikan pengenalan singkat tentang karakteristik data yang berdistribusi normal dan pengujian kenormalan data. Karakteristik data berdistribusi normal menyatakan gambaran dari data yang berdistribusi normal ditinjau secara matematis. Karakteristik data belum bisa digunakan dalam penentuan kenormalan data. Untuk menentukan kenormalan data, dapat digunakan beberapa uji kenormalan. Modul ini menyajikan 3 buah uji kenormalan yang dapat digunakan untuk menguji kenormalan suatu data dengan ukuran statistik yang berbeda – beda yaitu Statistik Shapiro Wilk W, Statistik Anderson Darling dan Statistik Kolmogorov Smirnov. Tujuan 1. 2. 3-1 Mahasiswa mengenal tentang data berdistribusi normal Mahasiswa dapat menguji kenormalan data MODUL 3 Politeknik Telkom Praktikum Statistika 3.1 Distribusi normal Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng pada gambar dibawah ini. Suatu peubah acak X yang distribusinya berbentuk lonceng, dinamakan peubah acak normal. Persamaan matematika dari distribusi peluang peubah acak normal kontinu bergantung pada dua parameter yaitu (rataan) dan (simpangan baku). Dengan demikian fungsi densitas X dapat dinyatakan oleh : 1 f x e 1 x 2 2 2 – <X< . x Sifat-sifat distribusi normal : 1. f x dx 1 2. f x 0 , 3. lim f x x x 0 dan lim f x 0 x f x 4. f x 5. Nilai maksimum dari f terjadi pada x 6. Titik belok dari f terjadi pada x 3-2 MODUL 3 Politeknik Telkom Praktikum Statistika Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah dibawah kurva diantara dua koordinat x x1 dan x x 2 sama dengan peluang peubah acak X antara x x1 dan x x 2 . Hal tersebut dapat digambarkan sebagai berikut : x2 x1 P( x1 X x2 ) = x2 n( x ; , ) dx x1 1 2 x2 e x 1 x 2 2 dx x1 = Luas daerah yang diarsir Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka dibuat table luas kurva normal sehingga akan memudahkan dalam penggunaannya. 3.2 Statistik uji kenormalan Dalam statistika parametrik, distribusi normal mendasari beberapa uji statistik. Misal statistik t student, Fisher, Khai Square, dll. Sehingga dalam pengolahan data statistik, biasanya diasumsikan data berasal dari populasi yang berdistribusi normal. Ada dua cara untuk melihat kenormalan data yaitu secara visual dan dengan uji statistik. Secara visual dengan menggunakan histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi normal. 3-3 MODUL 3 Politeknik Telkom Praktikum Statistika Ada beberapa statistik uji kenormalan data antara lain : 1. Statistik Shapiro Wilk W Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik ini merupakan rasio antara dua penduga ragam. Statistik ujinya dinamakan statistik W. Statistik W ini mengukur straightness dari plot quantil quantilnya. Bila nilai dari W 1, maka data dikatakan normal. 2. Statistik Anderson Darling Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954. Statistik Anderson Darling berdasarkan pada fungsi distribusi empirik. Statistik ujinya dinamakan statistik yang merupakan kuadrat dari selisih antara luas histogram dengan luas daerah di bawah kurva normal. Bila nilai P value , maka data berdistribusi normal. Biasanya digunakan untuk data berukuran besar. 3. Statistik Kolmogorov Smirnov Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan pada maksimum perbedaan antara dua distribusi, yaitu distribusi normal dengan distribusi data yang diamati. Biasanya digunakan untuk data berukuran 30. Bila nilai P value , maka data berdistribusi normal. 3-4 MODUL 3 Politeknik Telkom Praktikum Statistika 3.3 Aplikasi dengan minitab Contoh 1 Langkah-langkah 1. Data adalah data produksi minyak bumi dalam periode waktu 14 bulan dari 9 lokasi sumur pengeboran. Ketikan data ini pada kolom di minitab Smr Smr Smr Smr Smr Smr Smr Smr Smr 56 59 66 68 70 77 99 144 163 1 507 677 633 503 477 636 402 464 309 2 468 763 661 573 498 672 365 504 463 3 500 738 420 571 466 597 582 501 390 4 498 608 425 534 588 597 351 526 413 5 449 433 451 414 589 521 585 414 393 6 513 460 345 575 547 576 622 471 581 7 558 485 377 635 499 568 685 527 590 8 486 552 455 443 503 485 736 508 486 9 478 605 361 445 495 489 614 560 531 10 426 575 345 448 519 443 234 557 537 11 493 553 531 450 482 426 243 222 553 12 555 548 521 468 545 464 351 502 517 13 542 457 360 501 489 428 414 601 430 14 510 356 442 443 392 455 378 575 531 t 3-5 MODUL 3 Politeknik Telkom Praktikum Statistika 2. Pilih menu stat, kemudian pilih basic statistik, lalu normality test 3. Setelah muncul kotak dialog berikut, Ketik C1 pada isian variable, lalu klik pilihan tests for normality (asumsi 0.05 ) 3-6 MODUL 3 Politeknik Telkom Praktikum Statistika Output masing-masing pilihan sebagai berikut : Shapiro Wilk Normal Probability Plot .999 .99 Probability .95 .80 .50 .20 .05 .01 .001 200 300 400 500 600 700 produksi Average: 498.310 StDev: 96.5048 N: 126 W-test for Normality R: 0.9938 P-Value (approx): > 0.1000 Pada gambar terlihat bahwa nilai statistik W = 0.9938 1, dengan pendekatan nilai P value > 0.1, maka dapat dikatakan bahwa data berdistribusi normal. 3-7 MODUL 3 Politeknik Telkom Praktikum Statistika Statistik Anderson Darling Normal Probability Plot .999 .99 Probability .95 .80 .50 .20 .05 .01 .001 200 300 400 500 600 700 produksi Average: 498.310 StDev: 96.5048 N: 126 Anderson-Darling Normality Test A-Squared: 0.346 P-Value: 0.478 Dengan menggunakan statistik ini diperoleh nilai P value = 0.478, nilai ini lebih besar dari pada nilai = 0.05. 3-8 MODUL 3 Politeknik Telkom Praktikum Statistika Statistik Kolmogorov smirnov Normal Probability Plot .999 .99 Probability .95 .80 .50 .20 .05 .01 .001 200 300 400 500 600 700 produksi Average: 498.310 StDev: 96.5048 N: 126 Kolmogorov-Smirnov Normality Test D+: 0.036 D-: 0.050 D : 0.050 Approximate P-Value > 0.15 Pada gambar terlihat bahwa pendekatan nilai P value > 0.15, nilai ini lebih besar dari pada nilai = 0.05. Dari ketiga output di atas, terlihat bahwa untuk ukuran data besar, statistik Anderson Darling lebih powerfull. 3-9 MODUL 3 Politeknik Telkom Praktikum Statistika Contoh 2 1. Buka software minitab kemudian pilih menu calc , Random Data kemudian binomial. Pada langkah ini kita akan membangkitkan data yang berdistribusi binomial. Pada box yang keluar isilah sesuai isian berikut ini kemudian ok 2. Data yang sudah dipeoleh ini kita anggap sebagai data populasi. Dari data populasi ini selanjutnya akan kita ambil beberapa sampel berukuran 5, 10 dan 20 untuk selanjutnya akan dibandingkan variansi dari rataan sampelnya. Dari menu utama pilih calc , Random Data kemudian sample from column . Isilah box yang keluar seperti isian berikut 3-10 MODUL 3 Politeknik Telkom 3. 4. Praktikum Statistika Ulangi langkah 2 sebanyak 5x untuk masing masing ukuran sampel, jadi akan terdapat 5 sampel berukuran 5, 5 sampel ukuran 10 dan 5 sampel ukuran 20 Dari setiap sampel hitunglah rata ratanya kemudian untuk setiap ukuran sampel hitunglah rata rata dan variansinya. Anda bisa menggunakan software lain untuk menghitung rata rata dan variansinya misalnya microsoft Excel .Mungkin hasil yang keluar ini bisa berbeda dengan hasil perhitungan anda no sampel ukuran 5 ukuran 10 1 39.6 41.4 2 42.6 40.9 3 40 37.7 4 37 42.8 5 42 38.8 rata2 40.24 40.32 variansi 4.908 4.207 Ukuran 20 40.45 40.7 42.85 41.85 40.5 41.27 1.10575 Dari hasil diatas terlihat rata rata semua sampel mendekati rata rata populasi yaitu =np = 40, tetapi untuk ukuran n = 20 variansinya adalah yang terkecil, ini juga dapat dilihat dari rataan sampel dari no 1 sampai 5 yang hanya berbeda tipis. Ini menunjukkan dengan pengambilan sampel yang makin besar keakuratan pendugaannya akan semakin tinggi. 5. Pada pembuktian distribusi rataan sampel, langkah – langkahnya sebenarnya tidak jauh berbeda dengan 4 langkah sebelumnya hanya saja dalam hal ini diperlukan jumlah pengacakan yang jauh lebih banyak daripada 4 langkah sebelumnya. Untuk itu akan digunakan progam matlab untuk membantu meyelesaikan masalah ini. 3-11 MODUL 3 Politeknik Telkom 6. Praktikum Statistika Bila dilakukan dengan software matlab, akan keluar tampilan berikut Pada program tersebut, pada baris ketiga angka 500 menyatakan jumlah pengacakan Pada baris 4, perintah random (0,1,100,1) menyatakan perintah pengambilan sampel dari populasi yang memiliki mean 0, simpangan baku 1, sampel berukuran 100 dari 1 populasi. Pada baris 6 dan 7 mengandung arti pendefisian variabel Y sebagai sampel acak pertama yang berukuran 100. Pada baris 9, mean sampel 1,2,…500 dihitung Dan pada baris 12, dibuat histogram dari mean sampel hasil perhitungan pada baris 9 7. 8. Sekarang ubahlah angka 100 pada baris 4 dan 6 dengan angka 5. Jalankan program ini dengan memilih debug kemudian run and save ( Dalam langkah ini kita berusaha mengambil sampel acak berukuran 5). Simpanlah output gambar/ histogram yang keluar dengan file tersendiri. Ulangi langkah ini dengan mengganti angka 10, 20 dan 30. Dari keempat histogram yang keluar tersebut, analisa apakah keempat histogram sudah berbentuk kurva normal baku dengan mean 0 dan simpangan baku 1? apakah ada pengaruh ukuran sampel? jelaskan! 3-12 MODUL 3 Politeknik Telkom Praktikum Statistika Latihan 1. Data seperti contoh no. 1, kemudian dilakukan pengacakan 15 kali dan diambil sampel ukuran 10, 20, 30. Buat histogram dengan kurva normalnya dan uji kenormalannya. 2. Bangkitkan data dari komputer, kemudian lakukan pengacakan 20 kali, dari data berdistribusi normal, poisson dengan rata-rata 2, binomial dengan p = 0.6 dan n = 15. Buatlah histogramnya. 3-13 MODUL 3 Politeknik Telkom Praktikum Statistika 4 TRANSFORMASI DATA Overview Modul ini memberikan panduan untuk melakukan tranformasi data baik untuk satu angkatan data maupun beberapa angkatan data. Transformasi terhadap satu angkatan data biasanya dilakukan agar asumsi data berdistribusi normal terpenuhi, sedangkan transformasi untuk beberapa data biasanya dilakukan agar asumsi ragam sama pada beberapa angkatan data terpenuhi. Tes kenormalan kemudian juga dilakukan untuk melihat apakah transformasi yang dilakukan sudah tepat. Tujuan 1. 2. 4-1 Dapat melakukan transformasi data dengan menggunakan Tangga Transformasi Tukey untuk melihat bagaimana bentuk distribusi data setelah dilakukan transformasi Dapat memilih transformasi yang tepat untuk me-normalkan data MODUL 4 Politeknik Telkom Praktikum Statistika 4.1 Transformasi untuk satu angkatan data Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data yang berdistribusi Normal dengan mean dapat digambarkan seperti grafik berikut Bila dilihat, data yang berdistribusi Normal akan simetris terhadap dan sebagaian besar data akan mengelompok di tengah. Dalam kenyataannya seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan seperti gambar berikut Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada gambar berikut : Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data. 4-2 MODUL 4 Politeknik Telkom Praktikum Statistika Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut : 1 x2 1 x Kuat log x sedang MENJULUR KE KIRI x lemah x2 x x3 lemah SIMETRIS sedang 10 x kuat MENJULUR KE KANAN Tangga transformasi ini dapat diartikan sebagai berikut : Transformasi 10 x akan membuat bentuk distribusi data menjadi menjulur 1 kekanan secara kuat, sedangkan transformasi akan membuat bentuk x2 distribusi data menjadi menjulur kekiri secara kuat. Sebagai contoh bila kita memiliki data yang menjulur kekanan secara lemah maka kita dapat transformasi x agar data menjadi Normal, sebaliknya bila data menjulur kekanan secara sedang maka transformasi x3 agar data menjadi Normal. Penentuan bahwa suatu data menjulur secara lemah,sedang atau kuat besifat subyektif sehingga akan lebih baik bila digunakan beberapa transformasi sekaligus kemudian baru dibandingkan hasilnya. Penentuan apakah hasil transformasi sudah Normal atau tidak adalah melalui uji kenormalan 4.2 Transformasi untuk beberapa angkatan data (menyamakan sebaran) Ketika dimiliki beberapa angkatan data, maka biasanya ingin dilakukan pembandingan antara angkatan satu dengan angkatan lainnya. Proses membandingkan ini lebih mudah bila semua angkatan data memiliki Bentuk distribusi baku Sebaran data yang sama 4-3 MODUL 4 Politeknik Telkom Praktikum Statistika Bila kedua syarat diatas sudah dipenuhi, maka untuk membandingkan angkatan angkatan tersebut, cukup dibandingkan masing masing tarafnya ( nilai Median ) saja. Untuk menyamakan sebaran semua angkatan ( membuat sebaran hampir sama), digunakan transformasi seperti pada tangga transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing masing angkatan diukur dengan dQ = Q3 Q1 yaitu simpangan kuartil. Penentuan transformasi yang tepat dilakukan dengan prosedur berikut 1. Hitung taraf dari setiap angkatan 2. Hitung sebaran dari setiap angkatan 3. Tentukan Taraf terbesar (TA), Taraf terkecil (TB), Sebaran yang berseuaian dengan TA (= SA) dan Sebaran yang berseuaian dengan TB (= SB) dari seluruh angkatan 4. Hitung koefisien arah b yang memiliki rumus b log( S A ) log( S B ) log( T A ) log( TB ) Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel berikut Nilai b Transformasi yang Keterangan (disekitar) dipilih Makin kecil b > makin besar k Negatif xk (k : bulat) 0,5 1 1,5 2 x Log x 1 x 1 x 4-4 2 MODUL 4 Politeknik Telkom 4.3 Praktikum Statistika Aplikasi Minitab Berikut ini contoh data (tabel data transformasi) yang menjulur ke kanan yang digambarkan dengan histogram. Tabel data transformasi 7.2 2.3 1.8 5.9 17.3 2.0 4.8 10.9 3.4 4.4 9.6 7.5 1.7 4.6 3.4 2.1 1.5 3.7 5.3 4.1 9.1 5.7 0.9 1.9 2.3 1. 4-5 5.6 14.3 3.0 2.5 3.8 1.7 5.5 3.7 2.9 4.6 4.8 8.3 5.8 2.8 6.3 3.1 7.6 5.5 8.0 3.5 1.7 11.4 6.5 1.7 2.1 9.7 2.6 15.3 8.3 2.4 1.9 3.6 4.9 9.3 3.4 10.4 4.0 3.8 4.9 1.5 4.8 4.4 2.9 6.4 0.5 2.1 8.1 3.6 11.9 5.2 2.9 6.8 1.8 3.4 6.9 8.8 6.5 1.9 3.6 3.4 3.7 2.4 13.7 15.3 1.3 4.9 12.0 2.3 3.2 5.9 3.0 3.7 3.6 2.4 2.9 Buat file baru : file transformasi, kemudian simpan data diatas pada kolom c1 MODUL 4 Politeknik Telkom 2. Praktikum Statistika Buat histogramnya Histogram menjulur ke kanan Frequency 20 10 0 0 10 20 jlrkanan 3. Lakukan tes kenormalan data terhadap data C1 Dari hasil uji Anderson-Darling (lihat modul kenormalan data) ,didapatkan p-value = 0.000 ini berarti secara kuat disimpulkan bahwa data tidak berdistribusi Normal. 4. Lakukan transformasi x terhadap C1, simpan datanya pada C2. Buat Histogram berdasarkan data C2, diperoleh Histogram Transformasi dg akar x Frequency 15 10 5 0 0.5 1.5 2.5 3.5 4.5 akar x 4-6 MODUL 4 Politeknik Telkom Praktikum Statistika 5. Lakukan tes kenormalan data terhadap data C2 Dari Dari hasil uji Anderson-Darling,didapatkan p-value = 0.001 ini berarti disimpulkan bahwa data juga tidak berdistribusi Normal. 6. Lakukan transformasi Log x terhadap C1, simpan datanya pada C3. Histogram berdasarkan data C3, diperoleh Histogram Transformasi dg log Frequency 15 10 5 0 0.0 0.5 1.0 log x 7. Lakukan tes kenormalan data terhadap data C3 Dari hasil uji Anderson-Darling,didapatkan p-value = 0.849 ini berarti secara kuat disimpulkan bahwa data berdistribusi Normal. Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya x bentuk data menjulur kekanan secara sedang, dengan transformasi menjadi menjulur ke kanan secara lemah, sedangkan dengan transformasi Log x data menjadi Normal. Nantinya yang diolah dengan statistik adalah data Log x bukan data aslinya. Sebagai eksperimen lainnya, lakukan tranformasi x2 atau x3 , simpan datanya pada C4, C5 kemudian buat histogram dan lakukan tes kenormalan maka 4-7 MODUL 4 Politeknik Telkom Praktikum Statistika diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan dari histogram berikut. Histogram of hasil transformasi x2 35 30 Frequency 25 20 15 10 5 0 0 100 200 300 transf x Histogram of transformasi x3 80 70 Frequency 60 50 40 30 20 10 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 transf x 4-8 MODUL 4 Politeknik Telkom Praktikum Statistika Latihan Periksa distribusi data berikut, bila belum simetris, lakukan transformasi yang tepat seperti pada langkah – langkah praktikum diatas 605 575 553 548 457 356 445 448 450 468 501 443 489 443 426 464 428 455 552 443 485 4-9 507 468 500 498 449 513 558 486 478 426 493 555 542 510 677 763 738 608 433 460 485 633 661 420 425 451 345 377 455 361 345 531 521 360 442 503 573 571 534 414 575 635 477 498 466 588 589 547 499 503 495 519 482 545 489 392 636 672 597 597 521 576 568 MODUL 4 Politeknik Telkom 5 Praktikum Statistika UJI HIPOTESIS STATISTIK DAN PROPORSI Overview Modul ini memberikan panduan untuk melakukan uji hipotesis terhadap nilai tengah dan proporsi. Uji hipotesis terhadap nilai tengah meliputi uji terhadap terhadap satu nilai tengah maupun perbandingan antara dua nilai tengah, sedangkan uji proporsi meliputi uji satu proporsi dan perbandingan dua proporsi. Semua uji hipotesis yang dilakukan berdasarkan beberapa asumsi yaitu ragam diketahui maupun ragam tidak diketahui. Tujuan 1. 2. 3. 4. 5-1 Mahasiswa memahami tentang uji hipotesis statistik Mahasiswa memahami tentang uji satu nilai tengah dengan diketahui atau tidak dan dapat menerapkannya Mahasiswa memahami tentang uji selisih nilai tengah dari dua sampel dengan diketahui atau tidak dan dapat menerapkannya Mahasiswa memahami tentang uji proporsi satu dan dua proporsi MODUL 5 Politeknik Telkom Praktikum Statistika 5.1 Hipotesis statistik Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia. Hipotesis statistik yaitu suatu anggapan atau pernyataan yang mungkin benar atau tidak mengenai satu populasi atau lebih. Suatu hipotesis dianggap benar atau salah, tidak bias diketahui dengan pasti kecuali dilakukan pemeriksaan terhadap seluruh populasi. Tetapi hal tersebut tidak efisien. Untuk mengatasi hal tersebut dilakukan pengambilan sampel secara acak. Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut hipotesis alternatif. Prosedur pengambilan kesimpulan kadang kadang dapat membawa pada kesimpulan yang salah. Dalam pengujian hipotesis statistik, ada dua jenis kesalahan yaitu: a. Kesalahan jenis pertama (galat jenis I) Yaitu penolakan hipotesis nol, padahal hipotesis nol benar. Peluang galat jenis I disebut taraf nyata yang dinotasikan dengan . Biasanya taraf nyata disebut dengan ukuran wilayah kritis. b. Kesalahan jenis kedua (galat jenis II) Yaitu penerimaan hipotesis nol, padahal hipotesis nol salah. Peluang galat jenis II dinotasikan dengan . Nilai dari tidak mungkin dihitung, kecuali bila hipotesis alternatifnya lebih spesifik. Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu : Hipotesis alternatif yang bersifat dua arah H0 : = 0 H1 : 0 Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yang letaknya pada masing masing ekor dari sebaran statistik ujinya. 5-2 MODUL 5 Politeknik Telkom Hipotesi alternatif yang bersifat satu arah a) H0 : atau b) H0 : 0 H1 : > 0 H1 : Praktikum Statistika < 0 0 Wilayah kritis untuk a) terletak seluruhnya di ekor sebelah kanan dari sebaran statistik ujinya. Sedangkan untuk b) sebaliknya. Dalam menentukan keputusan akhir untuk menerima atau menolak H0 , didasarkan pada wilayah kritis dengan p value yang mendukung keberartian suatu uji dalam bentuk peluang. P value adalah taraf keberartian terkecil, sehingga nilai suatu uji statistik yang diamati masih berarti.Bila p value , maka H0 ditolak. Prosedur pengujian hipotesis dapat mengikuti langkah langkah berikut : 1. Merancang hipotesis nol dan hipotesis alternatif 2. Menguji kenormalan 3. Memilih taraf keberartian 4. Menguji kesamaan ragam 5. Menentukan dan menghitung nilai statistik uji yang sesuai 6. Menentukan daerah kritis dan membuat keputusan apakah menerima atau menolak H0 (di mana pengambilan keputusan dapat didasarkan pada tiga hal yaitu nilai kristis dari statistik uji, selang kepercayaan, atau p value) 7. Membuat kesimpulan akhir mengenai sampel yang diambil 5.1.1 Pengujian hipotesis untuk satu nilai tengah X1, X2, …, Xn merupakan peubah acak yang menyebar secara normal dengan nilai tengah tidak diketahui. Perumusan hipotesinya sebagai berikut : H0 : = 0 atau H0 : atau H0 : 0 0 H1 : H : > H1 : < 0 0 1 0 Pengujian hipotesis terhadap nilai tengah ada dua asumsi : 1. Ragam diketahui Uji hipotesis untuk rata rata x, di mana hipotesis nol menyebar normal dengan nilai tengah 0 dan simpangan baku rata rata populasi / n, statistik ujinya adalah : 5-3 MODUL 5 Politeknik Telkom Z Praktikum Statistika x 0 n Kriteria penolakan terhadap hipotesis nol ditampilkan dalam tabel berikut : NO Hipotesis Alternatif Kriteria penolakan H0 ditolak pada saat Z Z /2 atau Z 1 H1 : 0 Z1 /2 2 H1 : > 0 H0 ditolak pada saat Z Z1 3 H1 : < 0 H0 ditolak pada saat Z Z 2. Ragam tidak diketahui Bila ragam tidak diketahui, maka statistik ujinya adalah t student, di mana ragam populasi diduga oleh ragam sampel. Statistik ujinya didefinisikan sebagai berikut x 0 t s n Adapun berikut NO 1 2 3 kriteria penolakan terhadap hipotesis nol dijelaskan pada tabel Hipotesis Alternatif H1 : 0 H1 : > 0 H1 : < 0 Kriteria penolakan H0 ditolak saat t t /2, n 1 atau t H0 ditolak pada saat t t1 , n 1 H0 ditolak pada saat t t , n 1 t1 /2, n 1 5.1.2 Pengujian hipotesis untuk selisih dua nilai tengah X1, X2, …, Xn dan Y1, Y2, …, Yn merupakan dua peubah acak yang saling bebas dan menyebar secara normal dengan nilai tengah x dan y, simpangan baku x dan y. Perumusan hipotesinya sebagai berikut : H0 : x H0 : x H0 : x y = 0 atau y 0 atau y 0 H1 : x H : > H : < y 0 1 x y 0 1 x y 0 5-4 MODUL 5 Politeknik Telkom Praktikum Statistika Di mana 0 adalah suatu konstanta bernilai positif atau nol yang menunjukkan selisih antara dua nilai tengah yang tidak diketahui.seperti pada pengujian hipotesis untuk satu nilai tengah, ada dua asumsi yaitu : 1. Ragam diketahui Statistik uji didefinisikan sebagai berikut x y 0 Z 2 x 2 y nx ny Kriteria penolakan terhadap hipotesis nol adalah : 2. NO Hipotesis Alternatif 1 H1 : 2 3 H1 : H1 : x y x y x y 0 > < 0 0 Kriteria penolakan H0 ditolak pada saat Z Z Z1 /2 H0 ditolak pada saat Z Z1 H0 ditolak pada saat Z Z /2 atau Z Ragam tidak diketahui Bila ragam tidak diketahui, maka sebelum dilakukan pengujian hipotesis terlebih dahulu dilakukan pengujian terhadap ragam. Pengujian tersebut dilakukan untuk menduga apakah ragam kedua sampel sama atau tidak. Hipotesisnya adalah sebagai berikut : H0 : x = y H1 : x y Sedangkan statistik ujinya adalah statistik uji Fisher yaitu F 2 S maks 2 S min . Bila didapatkan bahwa F F( , (nx 1, ny 1)), maka H0 ditolak, artinya ragam kedua sampel tidak sama. Sehingga derajat bebas yang akan digunakan dalam statistik ujinya adalah 5-5 MODUL 5 Politeknik Telkom Praktikum Statistika 2 S y2 S x2 nx ny v S x2 2 2 S y2 ny nx nx 1 ny 1 Statistik uji pengujian hipotesis terhadap selisih antara dua nilai tengah untuk ragam berbeda adalah x y 0 t 2 2 Sx S y nx ny Sedangkan untuk ragam sama, dalam statistik ujinya menggunakan ragam gabungan, yaitu : n x 1 S x2 2 S gab n y 1 S y2 nx n y 2 dimana statistik ujinya adalah x t S gab y 0 1 nx 1 ny . Kriteria penolakan terhadap hipotesis nol adalah : 5-6 NO Hipotesis Alternatif Kriteria penolakan 1 H1 : x y 2 H1 : x y > 0 H0 ditolak pada saat t t1 3 H1 : x y < 0 H0 ditolak pada saat t t ,m H0 ditolak pada saat t 0 t1 t /2, m atau t /2, m ,m MODUL 5 Politeknik Telkom 5.1.3 Praktikum Statistika Aplikasi dengan minitab Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini banyak operator selular menggunakan teknologi berbasis CDMA, antara lain Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8 dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung. Berikut adalah datanya : NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Fren 55 42 45 71 83 47 75 48 60 69 85 54 31 25 30 Flexi 60 33 39 61 40 94 71 61 77 64 65 70 80 61 50 Esia 37 60 35 61 31 56 65 78 59 27 30 45 38 25 35 Langkah-langkah pengolahan dengan menggunakan minitab 15 : 1. Simpan data tersebut pada worksheet minitab 2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan uji dua ragam (ragam sama atau berbeda) dengan cara pilih menu stat, lalu basic statistics, kemudian dua ragam, maka akan muncul kotak dialog seperti di bawah kemudian ketikkan kolom data pada isian sampel, klik option atau storage bila perlu, lalu OK 5-7 MODUL 5 Politeknik Telkom 3. Praktikum Statistika Hasil yang diperoleh sebagai berikut : Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam kedua sampel sama, karena Pvalue = 0.582 > 0.05 5-8 MODUL 5 Politeknik Telkom Praktikum Statistika 4. Pengujian hipotesis, dilakukan dengan cara pilih stat, basic statistics, kemudian pilih 2-sample t, kemudian isi kotak dialog 5. Hasil yang diperoleh adalah sebagai berikut : Two-sample T for Fren vs Flexi N Mean StDev SE Mean Fren 15 54.7 19.0 4.9 Flexi 15 61.7 16.3 4.2 Difference = mu (Fren) - mu (Flexi) Estimate for difference: -7.07 95% CI for difference: (-20.31, 6.18) T-Test of difference = 0 (vs not =): T-Value =-1.09 P-Value = 0.284 DF = 28 Both use Pooled StDev = 17.7062 5-9 MODUL 5 Politeknik Telkom Praktikum Statistika Boxplot of Fren, Flexi 100 90 80 Data 70 60 50 40 30 20 Fren Flexi Untuk menolak atau menerima Ho dapat dilihat dari 3 hal yaitu : - Karena selang kepercayaan untuk selisih nilai tengah adalah 20.31, 6.18 , sehingga nol termasuk di selang tersebut, maka Ho diterima - Pvalue = 0.284 > 0.05, maka Ho diterima - Nilai kritis (t hitung = -1.09 > t tabel) maka Ho diterima Karena Ho diterima, maka dapat disimpulkan bahwa rata-rata jumlah pengguna produk fren dan flexi di 15 kecamatan kota Bandung sama. Hal itu dimungkinkan dua produk tersebut masing-masing mempunyai kelebihan dan kekurangan, sehingga konsumen akan memilih produk yang sesuai dengan kebutuhannya. 6. Untuk latihan, lakukan langkah dan analisis yang sama untuk fren vs esia, flexi vs esia. 5-10 MODUL 5 Politeknik Telkom Praktikum Statistika 5.2 Uji proporsi Proporsi menyatakan perbandingan “banyaknya sukses” terhadap total pengamatan. Bila x menyatakan banyaknya sukses dari n ulangan, maka nilai x proporsi p dihitung dengan rumus : p .Uji proporsi dapat dilakukan n terhadap satu nilai proporsi atau perbandingan beberapa nilai proporsi. Asumsi yang digunakan adalah proporsi berdistribusi binomial. 5.2.1 Uji terhadap satu nilai proporsi Hipotesis yang digunakan untuk uji satu nilai proporsi dengan taraf antara lain berbentuk : a. H 0 : p p0 H1 : p p0 Wilayah kritik: x a dimana a adalah bilangan bulat terbesar yang bersifat a PX a b x; n; p0 x 0 b x; n; p0 : Distribusi Binomial dengan parameter n dan p0 n : banyaknya eksperimen/ulangan p0 : peluang “sukses” b. H 0 : p p0 H1 : p p0 Wilayah kritik x a dimana a adalah bilangan bulat terkecil yang bersifat n PX a b x; n; p0 x a b x; n; p0 : binomial dengan parameter n dan p0 n : banyaknya eksperimen/ulangan p0 : peluang “sukses” 5-11 MODUL 5 Politeknik Telkom Praktikum Statistika c. H 0 : p p0 H1 : p p0 Wilayah kritik x a atau x a dimana a adalah bilangan bulat terkecil untuk x a atau bilangan bulat terbesar untuk x a yang bersifat a PX a b x; n; p0 x 0 2 atau P X n a b x; n; p0 x a 2 b x; n; p0 : binomial dengan parameter n dan p0 n : banyaknya eksperimen/ulangan p0 : peluang “sukses” Bila dari hasil perhitungan, nilai berada diwilayah kritik, maka tolak H0. 5.2.2 Aplikasi dengan Minitab Contoh Dimiliki suatu pernyataan bahwa 70% rumah yang ada di kota A sudah terpasang AC. Dari 15 yang rumah yang diamati, ternyata hanya 8 rumah yang telah terpasang AC. Benarkah pernyataan tersebut ? Langkah – langkah 1. Karena yang ingin disimpulkan adalah proporsi rumah terpasang AC = 70% atau tidak, maka uji hipotesis yang dipilih adalah H 0 : p 0,7 H 1 : p 0,7 Taraf = 5% = 0,05 5-12 MODUL 5 Politeknik Telkom 2. Pilih menu Basis Statistic , 1 Proportion 3. Isilah kotak dialog dengan isian berikut 5-13 Praktikum Statistika MODUL 5 Politeknik Telkom Praktikum Statistika Number of event = 8, menyatakan banyaknya kejadian sukses Number of trial = 15, menyatakan banyaknya sampel yang diambil Hypothesized proportion =0,7 menyatakan nilai dari H0 4. Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis yang akan dipilih 5. Hasilnya adalah sebagai berikut : Test and CI for One Proportion Test of p = 0.7 vs p not = 0.7 Sample 1 X 8 N 15 Sample p 0.533333 95% CI (0.265861, 0.787333) Exact P-Value 0.258 Karena nilai P-value=0.258 >0.05, maka H0 tidak ditolak. Data tidak cukup kuat untuk menolak pernyataan bahwa 70% rumah terpasang AC. 5-14 MODUL 5 Politeknik Telkom Praktikum Statistika 5.2.3 Pendekatan normal baku untuk uji terhadap satu nilai proporsi Pada pengujian satu nilai proporsi, ada situasi dimana tabel binomial sulit untuk digunakan, misalkan untuk nilai n yang sangat besar(kecuali dengan bantuan komputer). Salah satu pendekatan yang bisa digunakan adalah dengan melakukan transformasi ke bentuk normal baku. Parameter dan 2 ditaksir npq . dengan rumus : np0 dan Statistik uji yang digunakan adalah 2 z x np0 np0 q0 n : banyaknya eksperimen/ulangan p0 : peluang “sukses” / proporsi 2 Z berdistribusi normal baku dengan 1 . Wilayah kritiknya 0 dan menjadi bila uji hipotesisnya H1 : p p0 z Z bila uji hipotesisnya H1 : p p0 z Z1 bila uji hipotesisnya H1 : p p0 z Z atau z Z1 2 2 5.2.4 Aplikasi dengan Minitab Contoh Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah obat baru diuji terhadap 100 pasien, 70 orang sembuh sehingga tingkat keefektifannya 70%. Apakah obat baru tersebut bisa dikatakan lebih efektif dari obat lama? 5-15 MODUL 5 Politeknik Telkom Praktikum Statistika Langkah – langkah 1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60% atau tidak, maka uji hipotesis yang dipilih adalah H 0 : p 0,6 H 1 : p 0,6 Taraf = 5% = 0,05 2. Langkah – langkah yang dilakukan untuk uji hipotesis ini mirip dengan uji hipotesis tanpa menggunakan pendekatan normal. Perbedaannya adalah ketika memilih kotak option kita memilih check list “use test and interval test based on normal distribution” seperti berikut ini 5-16 MODUL 5 Politeknik Telkom 3. Praktikum Statistika Hasilnya adalah sebagai berikut : Test and CI for One Proportion Test of p = 0.6 vs p > 0.6 95% Lower Sample 1 X 70 N 100 Sample p 0.700000 Bound 0.624623 Z-Value 2.04 P-Value 0.021 Using the normal approximation. Berarti nilai z masuk dalam wilayah kritik karena P-value= 0,021 < 0,05. Jadi dapat disimpulkan bahwa tingkat keefektifan obat baru lebih tinggi dari obat lama. 5.2.5 Pengujian perbandingan dua proporsi Pengujian terhadap proporsi tidak hanya bisa dilakukan terhadap satu nilai proporsi. Bila kita sedang meneliti dua buah proporsi, maka kedua proporsi tersebut dapat diperbandingkan yaitu berdasarkan sebaran selisih proporsinya. Selisih proporsi ini kemudian ditransformasi kebentuk normal baku dengan rumus z yaitu : pˆ 1 pˆ 2 z 1 pˆ qˆ 1 n1 n2 Dimana x1 x2 x1 x 2 qˆ 1 pˆ pˆ 1 pˆ 2 pˆ n2 n1 n2 n1 x1 x2 n1 n2 5-17 : : : : Banyaknya sukses kategori 1 Banyaknya sukses kategori 2 Banyaknya ulangan/sampel kategori 1 Banyaknya ulangan/sampel kategori 2 MODUL 5 Politeknik Telkom Praktikum Statistika Hipotesisnya H 0 : p1 p2 Wilayah kritiknya sama seperti pendekatan normal baku untuk pengujian terhadap satu nilai proporsi yaitu : z Z bila uji hipotesisnya H1 : p p0 z Z bila uji hipotesisnya H1 : p p0 z Z atau z Z bila uji hipotesisnya H1 : p p0 2 5.2.6 2 Aplikasi dengan Minitab Contoh Suatu penelitian dilakukan untuk melihat apakah proporsi lulusan smu kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu kabupaten Bandung(p2) yang akan melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil, diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang akan melanjutkan ke PT. 5-18 MODUL 5 Politeknik Telkom Praktikum Statistika Langkah – langkah 1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya Bandung(p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi 2. daripada proporsi lulusan smu kabupaten Bandung(p2), maka uji hipotesis yang dipilih adalah H 0 : p1 p2 atau H 0 : p1 p 2 0 H 1 : p1 p 2 atau H 0 : p1 p 2 0 Taraf = 5% = 0,025 selang kepercayaan = 97,5 % Pilih menu Basis Statistic , 2 Proportion 5-19 MODUL 5 Politeknik Telkom 3. Praktikum Statistika Isilah kotak dialog dengan isian berikut Number of event menyatakan banyaknya kejadian sukses (siswa yang melanjutkan ke PT). First : kodya, Second : kabupaten Number of trial , menyatakan banyaknya sampel yang diambil 4. Klik option untuk menentukan tingkat signifikan ( ) dan jenis hipotesis yang akan dipilih 5-20 MODUL 5 Politeknik Telkom 5. Praktikum Statistika Hasilnya adalah sebagai berikut : Test and CI for Two Proportions Sample 1 2 X 120 240 N 200 500 Sample p 0.600000 0.480000 Difference = p (1) - p (2) Estimate for difference: 0.12 97.5% lower bound for difference: Test for difference = 0 (vs > 0): 0.0392076 Z = 2.91 P-Value = 0.002 Fisher's exact test: P-Value = 0.003 Karena nilai P-value =0.002 <0.025, maka H0 tidak ditolak. Proporsi lulusan siswa SMA kodya yang melanjutkan ke PT lebih tinggi daripada lulusan siswa SMA kabupaten Latihan 1. Suatu penelitian diadakan untuk mengetahui apakah rata-rata banyaknya panggilan tiap 2 jam yang diterima oleh swicthboard pada dua wartel sama atau tidak. Berikut adalah rata-rata banyaknya panggilan dari dua wartel tiap 2 jam selama 15 hari H 1 2 3 4 5 6 7 8 W1 20 10 12 6 12 8 22 13 W2 10 10 23 6 8 6 15 12 W1 10 8 9 15 20 15 10 10 W2 11 5 10 18 8 6 12 12 a. Buatlah hipotesisnya b. Uji dan buat kesimpulannya 5-21 MODUL 5 Politeknik Telkom 1. Praktikum Statistika Suatu sampel acak berukuran 20 diambil dari nilai UTS matakuliah Statistika dari mahasiswa 01. 02, dan 03 Penelitian tersebut dimaksudkan untuk membandingkan kemampuan akademik antara mahasiswa kelas 01. 02, dan 03, berdasarkan uji selisih nilai tengah antara dua sampel. Adapun datanya sebagai berikut : NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Nilai UTS 01 43 75 43 78 60 76 60 63 60 53 60 25 50 40 50 65 70 65 75 5 Nilai UTS 02 92 47 56 74 79 28 71 68 69 80 63 86 65 99 59 65 78 66 66 96 Nilai UTS 03 63 83 44 37 34 53 53 60 42 36 37 50 72 52 65 73 58 81 15 63 a. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 01 dengan 02 Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 01 Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 02 b. Pengujian selisih nilai tengah antara nilai UTS mahasiswa 02 dengan 03 Misal X adalah peubah acak yang menyatakan nilai UTS mahasiswa 02 Misal Y adalah peubah acak yang menyatakan nilai UTS mahasiswa 03 5-22 MODUL 5 Politeknik Telkom Praktikum Statistika 3. Lakukan uji proporsi pada data-data berikut, yaitu : 2) Data miskonsepsi siswa dengan model konstruktivis terhadap suatu mata pelajaran NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 5-23 PRA TEST 8 7 10 10 11 12 16 15 17 17 16 17 18 18 18 19 20 19 23 20 18 21 22 22 20 18 21 19 23 21 25 25 23 26 25 POST TEST 15 15 21 15 21 25 21 22 10 21 23 25 25 12 20 25 26 20 27 26 27 20 25 25 26 27 28 29 29 29 29 29 29 30 30 JENIS P P L P L L P P P L P L P L L L L L P P L P P P L L P L L P P P L P L MODUL 5 Politeknik Telkom Praktikum Statistika 6 ANALISIS VARIANSI Overview Analisis variansi ini merupakan alternatif lain bagi pengujian nilai tengah selain menggunakan uji-t. Salah satu perbedaan utama antara analisis variansi dengan uji-t adalah kemampuan uji untuk membandingkan beberapa angkatan data secara serempak. Pada analisis variansi yang lebih kompleks (banyak faktor), nilai tengah bisa berasal dari beberapa faktor. Modul ini memberikan penjelasan mengenai analisis satu faktor saja. Tujuan 1. 2. 3. 6-1 Mahasiswa memahami tentang konsep analisis variansi dan asumsiasumsinya Mahasiswa dapat membuat tabel analisis variansi untuk membandingkan nilai tengah beberapa angkatan data secara serempak Mahasiswa dapat membuat kesimpulan yang tepat terkait dengan uji hipotesis yang dibuat MODUL 6 Politeknik Telkom 6.1 Praktikum Statistika Asumsi-asumsi pada analisis variansi Pada modul IV, telah dibahas masalah kenormalan data. Hal tersebut merupakan landasan yang penting pada tahap pengujian hipotesis dan analisis variansi. Hal mendasar pada analisis variansi adalah membandingkan lebih dari dua populasi berdasarkan pada lebih dari dua buah angkatan data. Asumsiasumsi yang diperlukan pada analisis variansi adalah : 1. Setiap angkatan data berasal dari populasi yang berdistribusi normal. 2. Setiap populasi memiliki variansi yang sama. 3. data yang satu dengan yang lainnya merupakan pengamatan yang saling bebas. Dalam prakteknya asumsi-asumsi tersebut tidak dituntut terlalu ketat, yaitu : 1. Mengenai kenormalan data, bila distribusinya cukup dekat ke normal, maka asumsi tersebut sudah dipenuhi 2. Mengenai kesamaan variansi, bila nilai variansi terbesar < 3 x variansi terkecil, maka hal tersebut tidak sudah cukup 3. Mengenai kebebasan antar pengamatan, dapat dilakukan dengan metode pengambilan sampel secara acak. 6.2 Uji Kesamaan Ragam Hipotesis kesamaan ragam : H0 : 2 1 = 2 2 = .... = 2 n H1 : ragam-ragam tersebut tidak semuanya sama Ada dua kasus pada uji bartlett : a. Ukuran sampel sama S12 b 6-2 n1 1 S 22 n2 1 .......... S k2 nk 1 1 N k S g2 MODUL 6 Politeknik Telkom Praktikum Statistika k ( ni S g2 adalah ragam gabungan yaitu S g2 1) S i2 i 1 N k S i2 adalah ragam masing-masing sampel Bila b bk ( ; n) , maka H0 ditolak pada taraf nyata b. Ukuran sampel tidak sama Pada kasus ini, bila b bk ( ; n1 , n2 , ..., nk ) , maka H0 ditolak pada taraf nyata . Dalam hal ini, n1 bk ( ; n1 ) bk ( ; n1 , n 2 , ..., n k ) 6.3 n 2 bk ( ; n1 ) ... n k bk ( ; n1 ) N Tabel analisis variansi Berdasarkan asumsi-asumsi di atas, maka terdapat hubungan bahwa variansi hasil penggabungan dari semua angkatan data terdiri atas rata-rata variansi setiap angkatan dan variansi daris semua rata-rata angkatan. Misalkan akan dibandingkan m buah angkatan data, maka hubungan tersebut dapat dinyatakan sebagai : m N 1 S2 N m ni 1 S i2 m 1 V i 1 JKT JKD di mana JKT = Jumlah Kuadrat Total JKD = Jumlah Kuadrat Dalam angkatan JKA = Jumlah Kuadrat Antar angkatan V 1 JKA 2 m Xi X m 1i 1 ni = banyaknya data dalam angkatan ke-i V = variansi dari semua rata-rata angkatan 6-3 MODUL 6 Politeknik Telkom Praktikum Statistika N = Total data penggabungan semua angkatan S2 = variansi gabungan S i2 = variansi angkatan ke-i X i = rata-rata angkatan ke-i X = rata-rata gabungan N – 1 = derajat kebebasan total N – m = derajat kebebasan dalam angkatan m – 1 = derajat kebebasan antar angkatan Misal diketahui data setiap angkatan sebagai berikut : Angkatan ke-1 Angkatan ke-2 ......... Angkatan ke-m X11 X21 ......... Xm1 X12 X22 ........ Xm2 : : : X1n1 X2n2 ........ Xmnm Untuk menghitung JKT, JKD, dan JKA digunakan rumusan sebagai berikut : 2 ni m 2 ni JKD j 1 X ij i 1 j 1 2 X ij m i 1 j 1 2 ni JKT m 2 ni X ij i 1 j 1 2 ni X ij ni i 1 m m j 1 JKA ni i 1 ni 6-4 X ij m X ij i 1 j 1 MODUL 6 Politeknik Telkom Praktikum Statistika Untuk membandingkan m populasi berdasarkan m buah angkatan data, dan berdasarkan asumsi-asumsi analisis variansi, maka hipotesis nol dan hipotesis alternatifnya didefinisikan sebagai berikut : H0 : 1 = 2 = ..... = m H1 : paling sedikit ada satu pasangan (i, j) sehingga i ≠ j Sedangkan statistik uji yang digunakan adalah statistik Fisher yang didefinisikan JKA RKA m 1 sebagai . Kemudian nilai F hasil perhitungan F JKD RKD N m debandingkan dengan nilai F dari tabel, yaitu F , (m-1), (N-m). Bila Fhit F , (m-1), (N-m), maka H0 ditolak, sehingga paling sedikit ada satu pasangan (i, j) sehingga i ≠ j. Tabel analisis variansi dapat ditampilkan sebagai berikut : Sumber Jumlah Kuadrat Derajat Rata-rata Variansi bebas Kuadrat Antar JKA m–1 RKA angkatan Dalam JKD N–m RKD angkatan Total JKT = JKA + N – 1 JKD 6.4 Fhit RKA/RKD Aplikasi dengan minitab Teknologi telekomunikasi di Indonesia berkembang sangat pesat, mulai dari teknologi berbasis AMPS, GSM, dan CDMA. Kehadiran produk telekomunikasi berbasis CDMA, merupakan alternatif bagi pengguna jasa telekomunikasi untuk memilih yang kualitasnya terbaik dan termurah. Saat ini banyak operator selular menggunakan teknologi berbasis CDMA, antara lain Bakrie Telecom dengan produknya esia, Telkom dengan flexi, dan Mobile-8 dengan fren. Suatu penelitian dilakukan untuk mengetahui rata-rata pengguna produk esia, flexi, dan fren dari 15 kecamatan di kota Bandung. 6-5 MODUL 6 Politeknik Telkom Praktikum Statistika Berikut adalah datanya : NO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Fren 55 42 45 71 83 47 75 48 60 69 85 54 31 25 30 Flexi 60 33 39 61 40 94 71 61 77 64 65 70 80 61 50 Esia 37 60 35 61 31 56 65 78 59 27 30 45 38 25 35 Langkah-langkah pengolahan dengan menggunakan minitab 15 : 1. Simpan data tersebut pada worksheet minitab 2. Kemudian uji kenormalan data, bila data sudah normal, maka dilakukan uji kesamaan ragam dengan cara pilih menu stat, lalu ANOVA, kemudian test for equal variances, maka akan muncul kotak dialog seperti di bawah kemudian ketikkan kolom data pada isian response dan kolom subcript pada factor, klik option atau storage bila perlu, lalu OK (catatan kolom harus di stack dulu, pada menu data) 6-6 MODUL 6 Politeknik Telkom 3. Praktikum Statistika Hasil yang diperoleh sebagai berikut : Dari hasil yang diperoleh di atas, dapat diketahui bahwa ragam ketiga sampel sama, karena Pvalue = 0.811 > 0.05 6-7 MODUL 6 Politeknik Telkom Praktikum Statistika 4. Pengujian hipotesis, dilakukan dengan cara pilih Stat, ANOVA, kemudian pilih 2-sample t, kemudian isi kotak dialog 5. Hasil yang diperoleh adalah sebagai berikut : Test for Equal Variances: C4 versus C5 One-way ANOVA: Fren, Flexi, Esia Source DF SS MS F P Factor 2 1996 998 3.35 0.045 Error 42 12520 298 Total 44 14516 S = 17.27 R-Sq = 13.75% R-Sq(adj) = 9.64% 6-8 MODUL 6 Politeknik Telkom Praktikum Statistika Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----Fren 15 54.67 18.98 (--------*--------) Flexi 15 61.73 16.33 (--------*--------) Esia 15 45.47 16.35 (--------*--------) ----+---------+---------+---------+----40 50 60 70 Pooled StDev = 17.27 Boxplot of Fren, Flexi, Esia 100 90 80 Data 70 60 50 40 30 20 Fren Flexi Esia Untuk menolak atau menerima Ho dapat dilihat dari 2 hal yaitu : - Pvalue = 0.045 < 0.05, maka Ho ditolak - Nilai kritis (F hitung = 3.35 > F tabel) maka Ho ditolak Karena Ho ditolak, maka dapat disimpulkan bahwa rata-rata jumlah pengguna produk fren, flexi dan esia di 15 kecamatan kota Bandung berbeda. Hal itu dimungkinkan satu atau dua dari tiga produk tersebut 6-9 MODUL 6 Politeknik Telkom Praktikum Statistika ada yang mempunyai kelebihan, sehingga konsumen akan cenderung memilih produk tersebut. Latihan 1. Berikut adalah data pengunjung dari lima warnet dalam waktu 1 minggu. Warnet/hr A B C D E 1 10 18 12 15 20 2 20 15 25 15 10 3 25 10 30 20 8 4 8 26 35 10 9 5 35 25 9 25 35 6 20 30 10 20 35 7 20 30 10 25 15 Lakukan pengujian apakah rata-rata pengunjung dari lima warnet dalam waktu satu minggu sama atau tidak, dengan taraf nyata 0.05 dan 0.01. 2. Berikut adalah data penjualan dari lima merk Laptop yang dijual di BEC dari 8 pusat penjualan selama satu bulan. Merk/ Toko I II III IV V Accer 6 10 8 12 5 Toshiba 4 3 9 10 2 Compac 15 10 8 12 10 IBM 5 3 6 8 2 HP 4 3 6 10 3 Dengan menggunakan analisis ragam dan taraf nyata 0.05, uji apakah ratarata penjualan dari kelima merk laptop di BEC sama, dengan menggunakan hipotesis seperti pada dasar teori di atas. 6-10 MODUL 6 Politeknik Telkom 3. Praktikum Statistika Berikut adalah data nilai toefl tiga jurusan yaitu TE, IF, dan TI angkatan 2006 ST TI IF 426.667 450.000 453.333 520.000 506.667 480.000 216.667 456.667 550.000 290.000 576.667 460.000 410.000 360.000 403.333 400.000 500.000 380.000 370.000 430.000 443.333 490.000 413.333 216.667 343.333 386.667 450.000 390.000 363.333 453.333 373.333 433.333 216.667 430.000 543.333 463.333 456.667 350.000 430.000 580.000 436.667 363.333 410.000 386.667 430.000 436.667 350.000 216.667 423.333 416.667 473.333 413.333 410.000 403.333 396.667 386.667 406.667 430.000 366.667 413.333 410.000 406.667 446.667 430.000 543.333 416.667 510.000 426.667 416.667 216.667 363.333 443.333 420.000 383.333 540.000 420.000 380.000 473.333 483.333 413.333 413.333 370.000 383.333 520.000 433.333 216.667 510.000 476.667 420.000 420.000 Lakukan analisis ragam dengan taraf nyata 0.05 pada data tersebut. Kemudian uji apakah rata-rata nilai toefl mahasiswa dari tiga juruan sama ataukah berbeda. 6-11 MODUL 6 Politeknik Telkom Praktikum Statistika 7 REGRESI LINIER DAN NON-LINIER SEDERHANA Overview Dalam sebuah penelitian, sering kita memiliki data yang berpasangan (X,Y). Data tersebut bisa jadi diperoleh dari sebuah percobaan terhadap peubah X sedangkan respon yang terjadi dicatat sebagai peubah Y. Hal menarik yang bisa disimpulkan dari data yang berpasangan adalah tingkat keeratan hubungan antara X dan Y serta bentuk hubungan fungsionalnya. Modul ini memberikan panduan langkah – langkah kepada mahasiswa dalam menentukan hubungan antara dua peubah X,Y yang paling tepat, langkah – langkah pengujian koefisien regresi beserta penentuan tingkat keeratannya. Tujuan 1. 2. 3. 7-1 Mahasiswa dapat membuat model regresi linier maupun non-linier sederhana dari data berpasangan (X,Y). Mahasiswa dapat memahami keterkaitan antara model linier dan model non-linier. Mahasiswa dapat menentukan model regresi yang terbaik berdasarkan pengujian terhadap koefisien regresi dan nilai R2 MODUL 7 Politeknik Telkom Praktikum Statistika 7.1 Regresi Suatu permasalahan penelitian biasanya dapat dijelaskan oleh dua atau lebih variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling berhubungan tersebut membentuk suatu persamaan matematis yang dapat digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai variabel yang lain. Dalam statistika, hubungan fungsional antara variabel tak bebas ( dinotasikan Y ) dengan variabel bebas ( dinotasikan X ) disebut regresi antara Y dan X. Persamaan regresi yang akan dibahas pada bab ini persamaan linier sederhana, persamaan non-linier yang dibangkitkan dari persamaan linier yaitu eksponensial dan geometrik. 7.1.1 Model untuk regresi linier sederhana Bentuk umum : y x y : variabel takbebas x : variabel bebas : error yang terjadi pada eksperimen Nilai selalu berubah ubah pada setiap x jadi sulit untuk ditebak, model ini kemudian diduga oleh ŷ a b x dengan metode kuadrat terkecil yaitu meminimumkan jumlah kuadrat error ( terkecil didapatkan nilai untuk a dan b xy y b x dan b a x 2 ŷ 2 ). Dari metode kuadrat yi x n x y 2 n Untuk melihat seberapa baik model regresi yang diperoleh, dapat dilihat melalui nilai koefisien korelasi determinasi R2 yang memiliki nilai 0 sampai 1 dan memiliki rumus R 7-2 2 JKR JKT yˆ y y y 2 2 MODUL 7 Politeknik Telkom Praktikum Statistika Selain menggunakan R2, untuk mengetahui kelayakan suatu model regresi yang telah diperoleh yang digunakan menduga hubungan antara variabel X dengan variabel Y, dilakukan dengan pengujian terhadap koefisien-koefisien regresi yaitu : 1. Pengujian koefisien regresi secara serentak Hipotesis : - H0 : a = b = 0 - H1 : paling tidak terdapat satu koefisien tidak sama dengan nol Tabel analisis ragam untuk uji koefisien regresi secara serentak Sumber Derajat Jumlah Kuadrat Kuadrat Fhitung keragaman bebas Tengah Regresi p KT reg JK reg bt X tY n Y 2 p Galat n-p-1 Total n-1 Sisa JK galat n t Y Y nY p 1 2 Statistik uji untuk penolakan H0 adalah : Fhit 2. KT galat F p, n p 1 Pengujian koefisien regresi secara individu Hipotesis : - H0 : bp = 0 - H1 : bp ≠ 0 bp Statistik uji yang digunakan : t hit Se b p Kriteria penolakan H0 adalah t hit tn p 1 Arti penolakan terhadap H0 adalah variabel bebas berpengaruh nyata terhadap variabel tak bebas Y (untuk H0 : b1 = 0), sehingga model regresi linier dikatakan layak. 7-3 MODUL 7 Politeknik Telkom Praktikum Statistika 7.1.2 Model regresi non linier 7.1.2.1 Model eksponensial Bentuk umum regresi model eksponensial adalah tersebut diduga dengan ŷ langkah langkah berikut : - - . Model ab x .Nilai a dan b diperoleh dengan cara y Dengan melogaritmakan persamaan log y x y ab x , diperoleh log a x log b c dx Model tersebut berubah menjadi model linier, sehingga nilai c dan d didapatkan dari rumusan model linier yaitu c x log y log y d x dan d x2 x log y n 2 x n d c dimana a 10 dan b 10 7.1.2.2 Model geometrik (power ) Regresi model geometrik mempunyai bentuk umum Pendugaan model tersebut adalah cara sebagai berikut : - x . ax .Nilai a dan b diperoleh dengan y axb , diperoleh log a b log x c b log x Dengan melogaritmakan persamaan log y 7-4 y y b MODUL 7 Politeknik Telkom - Praktikum Statistika Nilai c dan d bisa didapatkan dari rumusan model linier yaitu c log y b log x dan b log x log y (log x) 2 log x n log x log y 2 n dimana a 10 c 7.1.3 Aplikasi dengan minitab Regresi Linier Berikut adalah data produksi pulsa tingkat nasional (106) Tahun 1998 1999 2000 2001 2002 2003 2004 2005 2006 Pulsa 35451 37221 40905 45875 50260 56852 59981 67230 70020 a. Gambarkan diagram pencar b. Tentukan persamaan regresinya c. Hitung korelasinya d. berapakah produksi pulsa pada tahun 2007 Langkah-langkah : 1. Ketik data tersebut pada kolom C1(X) dan C2(Y) 2. 7-5 Membuat diagram pencar dengan cara: pilih menu graph, lalu pilih scatter plot, klik with regression. Setelah muncul kotak dialog, ketik kolom yang sesuai untuk variabel Y dan X, dan atur skala, dan lain-lain, kemudian OK MODUL 7 Politeknik Telkom Praktikum Statistika Outputnya sebagai berikut : Scatterplot of Pulsa vs Tahun 70000 Pulsa 60000 50000 40000 30000 0 7-6 1 2 3 4 5 Tahun 6 7 8 9 MODUL 7 Politeknik Telkom 3. Praktikum Statistika Pilih menu stat, kemudian basic statistics, lalu correlation. Setelah muncul kotak dialog berikut, isi kotak variabel dengan kolom tempat X dan Y, kalau ingin menyimpan matriknya klik store matrix, bila tidak, langsung klik OK Hasilnya adalah Correlation of X and Y = 0.994, Pvalue = 0.00 Karena korelasi antara X dan Y nilainya mendekati 1, maka antara tahun dengan produksi pulsa terdapat hubungan linier, sehingga dapat dianalisis dengan regresi linier. 7-7 MODUL 7 Politeknik Telkom 4. Praktikum Statistika Pilih menu stat, kemudian regression, lalu regression. Setelah muncul kotak dialog, pada kotak respon ketik kolom tempat Y, dan predictor dengan kolom tempat X, kemudian OK Hasil yang diperoleh adalah : Regression Analysis: Pulsa versus Tahun The regression equation is Pulsa = 28413 + 4624 Tahun Predictor Coef SE Coef T P Constant 28413 1066 26.66 0.000 Tahun 4623.9 189.4 24.41 0.000 S = 1467.20 R-Sq = 98.8% R-Sq(adj) = 98.7% 7-8 MODUL 7 Politeknik Telkom Praktikum Statistika Analysis of Variance Source DF SS MS F P Regression 1 1282808577 1282808577 595.91 0.000 Residual Error 7 15068810 2152687 Total 8 1297877388 Unusual Observations Obs Tahun Pulsa Fit SE Fit Residual St Resid 1 1.00 35451 33037 902 2414 2.09R R denotes an observation with a large standardized residual. Dari hasil yang diperoleh tersebut, dapat diketahui bahwa tiap tahun peningkatan produksi pulsa linier. Hal tersebut dapat dilihat dari uji koefisien regresi, semua koefisien, nilai P value nya nol (P value yang dihitung dari T). Dari segi kelayakan model regresi dapat dilihat dari nilai R2 = 98.8% dan pada analisis variansi, nilai P value juga nol. Sehingga dengan menggunakan model regresi di atas, dapat diprediksi produksi pulsa tingkat nasional pada tahun 2007 adalah 74653 (106). 7-9 MODUL 7 Politeknik Telkom Praktikum Statistika Regresi Non Linier Berikut ini merupakan contoh dari regresi non linear, diketahui bahwa data penjualan suatu produk dari mulai diproduksi sampai produk tersebut berumur 24 bulan (2 tahun). Bulan ke1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Keuntungan (dalam ribuan rupiah) 150 270 480 750 1350 2310 3625 5390 9950 15510 26500 40350 77510 111950 165300 311600 627480 804250 1540980 2314250 3923250 6010500 12334230 15975210 Dari data diatas, kita akan mencoba memprediksi keuntungan perusahaan saat produksi berlangsung selama 3 tahun (36 bulan). 7-10 MODUL 7 Politeknik Telkom Praktikum Statistika Seperti yang telah diketahui sebelumnya, kita dapat membuat diagram pencar (scater plot) dengan mintab, yaitu : Plot bulan vs keuntungan 18000000 16000000 14000000 keuntungan 12000000 10000000 8000000 6000000 4000000 2000000 0 0 5 10 15 20 25 bulan Jelas bahwa regresi linear kurang baik untuk diterapkan. Melihat bentuk diagram pencar diatas kita akan mencoba mendekatinya dengan fungsi non b x linear yaitu y ab atau y ax . Untuk menentukan persamaan regresi yang terbaik antara dua model tersebut dapat dilihat dari nilai R2. 7-11 MODUL 7 Politeknik Telkom Praktikum Statistika Langkah – langkah dengan Minitab 1. Pilih stat, kemudian Regression dan Fitted Line Plot 2. Isi kotak dialog dan optionpnya seperti berikut, 7-12 MODUL 7 Politeknik Telkom Untuk model geometrik Praktikum Statistika y Untuk model eksponensial y 7-13 axb isi seperti ini ab x isi seperti ini MODUL 7 Politeknik Telkom 3. Praktikum Statistika Hasilnya adalah sebagai berikut Untuk model geometrik axb y The regression equation is ylog = 0.798 + 3.98 xlog Predictor Constant xlog S = 0.5848 Coef 0.7983 3.9751 StDev 0.3558 0.3381 R-Sq = 86.3% Untuk model eksponensial y T P 2.24 0.035 11.76 0.000 R-Sq(adj) = 85.6% ab x The regression equation is ylog = 2.01 + 0.218 x Predictor Coef Constant 2.01111 x 0.218240 S = 0.03676 4. StDev 0.01549 0.001084 R-Sq = 99.9% T P 129.83 0.000 201.31 0.000 R-Sq(adj) = 99.9% Kedua model, berdasarkan uji T cukup layak digunakan, tetapi berdasarkan nilai R2 masing – masing model, maka diperoleh kesimpulan bahwa model eksponensial lebih baik daripada model geometric. Jadi persamaan regresi nonlinier yang terbaik adalah log y 2.01 0.218x x 5. x Atau bila dituliskan dalam y ab menjadi y 102,33 1,652 Bila dihitung keuntungan pada akhir tahun ke-3 (bulan ke 36) maka diperoleh hasil y 7-14 102,33 1,652 36 7.22.10117 ribu. MODUL 7 Politeknik Telkom Praktikum Statistika Latihan 1. Berikut adalah pengaruh temperatur pada proses deodorizing terhadap warna suatu produk : Temperatur (X) Warna (Y) 460 0.3 450 0.3 440 0.4 430 0.4 420 0.6 410 0.5 450 0.5 440 0.6 430 0.6 420 0.6 410 0.7 400 0.6 420 0.6 410 0.6 400 0.6 a. tentukan model regresi linier Y = a + b X b. Hitung korelasi antara Y dan X 2. Seorang distributor ingin mengetahui hubungan antara biaya pemasangan iklan per minggu dengan hasil penjualannya, datanya sebagai berikut : Biaya iklan ($) Penjualan ($) 40 385 20 400 25 395 20 365 30 475 50 440 40 490 20 420 50 560 40 525 25 480 50 510 7-15 MODUL 7 Politeknik Telkom Praktikum Statistika a. Buat diagram pencar b. Tentukan persamaan garis regresi yang terbaik untuk meramalkan penjualan mingguan berdasarkan biaya iklan 3. Berikut adalah data tentang pengaruh antara nilai ujian pertama dengan nilai ujian kedua : Nilai ujian pertama (X) Nilai ujian kedua (Y) 4.1 2.1 2.2 1.5 2.7 1.7 6.0 2.5 8.5 3.0 4.1 2.1 9.0 3.2 8.0 2.8 7.5 2.5 8.5 3.0 9.3 2.8 9.5 3.0 7.4 1.7 a. Gambarkan diagram pencar b. Tentukan persamaan regresi linier dan non-liniernya c. Hitung korelasinya dan tentukan regresi yang terbaik d. berapakah nilai ujian kedua, jika nilai ujian pertama 6.4 7-16 MODUL 7 Politeknik Telkom Praktikum Statistika DAFTAR PUSTAKA 1. Devore J. L., 1991, Probability and Statistics for Engineering in The Sciences, third edition, Pacific Grove California. 2. Erickson, B. H., dan Nosanchuk, T. A., 1993, Memahami Data, Terjemahan : R. K. Sembiring, LP3ES, Jakarta. 3. Djauhari, M., Catatan Kuliah, ITB, Bandung. 4. Minitab Inc, 1994, MINITAB Reference Manual 10 for Windows , Minitab Inc, New York. 5. Walpole, R. E., 1997, Pengantar Statistika, Edisi ke-3, Penerbit PT Gramedia Pustaka Utama, Jakarta. 6. Hines William M. W., and Montgomery D. C., 1990, Probability and Statistics in Engineering and Management Science, third edition, Jhon Wiley & Sons, New York.