Catatan Kuliah MA2082 BIOSTATISTIKA “Orang Biologi Tidak Anti Statistika” disusun oleh Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2011 Tentang MA2082 Biostatistika A. Bentuk perkuliahan: 1. Tatap muka di kelas 2. Praktikum di Lab. Statistika dan Komputasi B. Jadwal kuliah: 1. Tatap muka di kelas: • Selasa; 9-10.15; R.9132 • Kamis; 9-10.15; R.9136 Catatan: Jadwal khusus untuk Minggu-1, Minggu-2 dan Ujian 2. Praktikum: dimulai Minggu-z (cek modul praktikum!) C. Silabus: • Statistika deskriptif (1 minggu) • Peluang (1 minggu) • Peubah acak dan distribusi (diskrit dan kontinu) (2 minggu) • Penaksiran (2 minggu) • Uji hipotesis (1 sampel) untuk mean dan proporsi (2 minggu) • Uji hipotesis 2 sampel (1 minggu) • Analisis variansi (1 minggu) • Analisis data kategorikal (1 minggu) • Analisis regresi (1 minggu) D. Buku teks: Bernard Rosner, 2006, Fundamentals of Biostatistics, 6th ed. E. Penilaian: 1. Ujian 1,2,3 (80%) : 23 Agustus 2011 (20%), 11 Oktober 2011 (30%), 29 November 2011 (30%). 2. PR, Kuis (10%) 3. Praktikum (15%) MA2082 BioStat. i K. Syuhada, PhD. Matriks kegiatan perkuliahan Table 1: Materi kuliah MA2082 Biostatistika. Minggu1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 MA2082 BioStat. Materi Keterangan Statistika deskriptif Penjelasan kuliah Peluang Ujian 1 23 Agustus 2011 Distribusi Diskrit Tabel statistik Distribusi Kontinu Penaksiran Penaksiran Ujian 2 11 Oktober 2011 Uji Hipotesis (1 sampel) Uji Hipotesis (1 sampel) Uji Hipotesis (2 sampel) Analisis Variansi Analisis Data Kategorikal Analisis Regresi Ujian 3 29 November 2011 ii K. Syuhada, PhD. Daftar Isi 1 Statistika Deskriptif 1.1 Pendahuluan . . . . . . . . . . . . . . . . . 1.2 Data, Jenis Data, Memahami Data . . 1.3 Ukuran Pusat/Lokasi dan Penyebaran 1.4 Mengamati Observasi Luar . . . . . . . . 1.5 Data Kelompok . . . . . . . . . . . . . . . 1.6 Memahami Grafik . . . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 3 5 6 6 BAB 1 Statistika Deskriptif Silabus: Jenis data, ukuran pusat/lokasi, ukuran penyebaran, koefisien variasi, observasi luar, data kelompok, grafik Tujuan: 1. Membedakan jenis data dan memahami data 2. Menghitung dan memaknai ukuran lokasi/pusat 3. Membedakan variansi dan koefisien variasi 4. Mengamati observasi luar 5. Memahami data kelompok 6. Membuat dan menafsirkan grafik 1.1 Pendahuluan • Statistika dan Biostatistika: apa, untuk apa? • Statistik versus Statistika • Manfaat BioStatistika Statistika adalah ilmu yang digunakan untuk mengumpulkan, mengorganisasi, melakukan inferensi dan menafsirkan data. Secara singkat, statistika adalah ilmu/pekerjaan untuk meyimpulkan tentang suatu fenomena pada populasi menggunakan sampel. 1 1.2 Data, Jenis Data, Memahami Data Data adalah hasil observasi tunggal (datum) yang didapat baik secara langsung (observasi/survey, praktikum) ataupun tidak langsung (buku, koran, internet) Jenis data: • Nominal (jenis kelamin, golongan darah) • Ordinal (tingkat kecemasan, tingkat nyeri) • Rasio/interval (denyut nadi, tekanan darah) Contoh/ilustrasi dan interpretasi: 1. Berat badan bayi: Table 1.1: Data sampel berat badan bayi (di AS) baru lahir. Bayi1 2 3 4 5 BB 3265 3260 3245 3484 4146 Bayi6 7 8 9 10 BB 3323 3649 3200 3031 2069 Bayi11 12 13 14 15 BB 2581 2841 3609 2838 3541 Bayi16 17 18 19 20 BB 2759 3248 3314 3101 2834 2. Jumlah darah putih (×1000) pasien-pasien di RS: 0 357889 1 02 2 3 5 3. Dapatkah anda mencari dan menafsirkan data berbentuk grafik? 4. Dapatkah anda mencari data yang bersifat kategorikal? MA2082 BioStat. 2 K. Syuhada, PhD. 1.3 Ukuran Pusat/Lokasi dan Penyebaran • Ukuran lokasi: Mean (aritmetik), Median, Modus • Ukuran Penyebaran: Jangkauan, Variansi, Kuartil • Variansi versus Koefisien Variasi Misalkan data sampel adalah x1 , x2 , . . . , xn , dimana xi menyatakan titik sampel ke-i. Sampel diatas diperoleh dari populasi dan kita ingin melakukan inferensi untuk populasi dengan memanfaatkan sampel. Langkah pertama adalah meringkas data untuk kemudian menghitung MEAN, MEDIAN dan MODUS (selanjutnya disebut ukuran lokasi atau pusat). Mean (aritmetik) didefinisikan sebagai ∑n xi x̄ = i=1 n Sifat-sifat mean (a) Untuk suatu konstanta k, n ∑ k xi = · · · i=1 (b) Jika yi = xi + k maka ȳ = x̄ + k. Buktikan! (c) Jika yi = k xi maka ȳ = · · · . Median atau median sampel seringkali dikatakan sebagai nilai tengah. Dengan demikian, menghitung median haruslah dilakukan pada data yang sudah diurutkan. Definisi median adalah (a) Observasi ke-((n + 1)/2), (n ganjil), atau (b) Nilai tengah dari observasi ke-(n/2) dan ke-((n/2) + 1), (n genap) MA2082 BioStat. 3 K. Syuhada, PhD. Diskusi: Bagaimana (perbandingan) nilai mean dan median untuk data yang (i) simetrik, (ii) menceng ke kanan, (iii) menceng ke kiri? Modus atau Mode adalah ukuran pusat yang menyatakan nilai observasi yang paling sering muncul. Menentukan modus dapat dilakukan pada data tanpa diurutkan (meskipun lebih mudah apabila diurutkan lebih dahulu). LATIHAN: Tentukan ukuran lokasi/pusat dari contoh data diatas. Ukuran penyebaran menyatakan seberapa jauh data menyebar dari mean. Misalkan kita memiliki dua data sampel. Kedua sampel memiliki mean yang sama, namun memiliki penyebaran data yang berbeda. Beberapa ukuran penyebaran antara lain: 1. Jangkaun (Range): R = xmaks − xmin 2. Variansi atau variansi sampel: ∑n 2 2 i=1 (xi − x̄) s = n−1 Catatan: Deviasi standar atau simpangan baku adalah akar kuadrat dari variansi. 3. Kuantil atau persentil: Sifat-sifat variansi: Diketahui data sampel x1 , . . . , xn memiliki variansi s2x . Jika data sampel (a) yi = xi + k, (b) yi = k xi , untuk suatu konstanta k, maka s2y = . . . LATIHAN: Tentukan ukuran penyebaran dari contoh data diatas. MA2082 BioStat. 4 K. Syuhada, PhD. Variansi versus Koefisien Variasi Kita dapat menghitung suatu ukuran yang mengaitkan ukuran penyebaran (deviasi standar) dengan ukuran lokasi (mean), yaitu koefisien variasi (coefficient of variation - CV): CV = 100% × (s/x̄) yang tidak dipengaruhi unit ukuran yang dipakai. CV bermanfaat untuk membandingkan variabilitas beberapa sampel yang berbeda relatif terhadap nilai mean-nya. Dapat pula kita membanding CV dari beberapa variabel. LATIHAN: Table 1.2: Faktor risiko kardiovaskular pada anak. n Mean s CV(%) Tinggi (cm) 364 142.6 0.31 Berat (kg) 365 39.5 0.77 Tekanan darah (mm Hg) 337 104 4.97 Kolesterol (mg/dL) 395 160.4 3.44 1.4 Mengamati Observasi Luar Observasi luar atau outlier adalah nilai/observasi yang “menyimpang” dari nilai-nilai/observasi yang lain. Observasi luar dapat ditentukan/dihitung dengan melihat apakah ada nilai/observasi yang LEBIH BESAR dari K3 + 1.5 (K3 − K1 ) atau LEBIH KECIL dari K1 − 1.5 (K3 − K1 ). Dalam praktiknya, observasi luar dapat menyatakan sesuatu yang baik/jelek. Misalnya, seseorang dengan tingkat kecerdasan (IQ) yang sangat tinggi (jauh diatas rata-rata alias observasi luar) adalah baik. Seringkali observasi luar diabaikan dalam analisis data meskipun sesungguhnya cara ini tidaklah tepat. Mendeteksi observasi luar adalah sesuatu yang sangat menantang dalam statistika. MA2082 BioStat. 5 K. Syuhada, PhD. LATIHAN: Adakah observasi luar pada contoh data diatas? 1.5 Data Kelompok Pandang data berikut: Ukuran sampel tersebut terlalu besar sehingga menampilkan data apa adanya menjadi tidak efisien. Dengan demikian, data sampel dapat dikelompokkan. Pengelompokkan ini dapat pula terjadi (harus dilakukan) karena tingkat keakuratan data yang diambil tidak dapat diperoleh dengan baik. 1.6 Memahami Grafik Beberapa tampilan visual (baca: grafik) untuk data adalah diagram bar, diagram batang dan daun (stem-and-leaf plot). TUGAS: Carilah data (dengan ukuran sampel besar) dan lakukan analisis data, khususnya pengelompokan data dan interpretasi grafik. (DIKUMPULKAN HARI SELASA 16 AGUSTUS 2011 PUKUL 09.00) MA2082 BioStat. 6 K. Syuhada, PhD.