MA2082 BIOSTATISTIKA - FMIPA Personal Blogs

advertisement
Catatan Kuliah
MA2082 BIOSTATISTIKA
“Orang Biologi Tidak Anti Statistika”
disusun oleh
Khreshna I.A. Syuhada, MSc. PhD.
Kelompok Keilmuan STATISTIKA - FMIPA
Institut Teknologi Bandung
2011
Tentang MA2082 Biostatistika
A. Bentuk perkuliahan:
1. Tatap muka di kelas
2. Praktikum di Lab. Statistika dan Komputasi
B. Jadwal kuliah:
1. Tatap muka di kelas:
• Selasa; 9-10.15; R.9132
• Kamis; 9-10.15; R.9136
Catatan: Jadwal khusus untuk Minggu-1, Minggu-2 dan Ujian
2. Praktikum: dimulai Minggu-z (cek modul praktikum!)
C. Silabus:
• Statistika deskriptif (1 minggu)
• Peluang (1 minggu)
• Peubah acak dan distribusi (diskrit dan kontinu) (2 minggu)
• Penaksiran (2 minggu)
• Uji hipotesis (1 sampel) untuk mean dan proporsi (2 minggu)
• Uji hipotesis 2 sampel (1 minggu)
• Analisis variansi (1 minggu)
• Analisis data kategorikal (1 minggu)
• Analisis regresi (1 minggu)
D. Buku teks:
Bernard Rosner, 2006, Fundamentals of Biostatistics, 6th ed.
E. Penilaian:
1. Ujian 1,2,3 (80%) :
23 Agustus 2011 (20%),
11 Oktober 2011 (30%),
29 November 2011 (30%).
2. PR, Kuis (10%)
3. Praktikum (15%)
MA2082 BioStat.
i
K. Syuhada, PhD.
Matriks kegiatan perkuliahan
Table 1: Materi kuliah MA2082 Biostatistika.
Minggu1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
MA2082 BioStat.
Materi
Keterangan
Statistika deskriptif
Penjelasan kuliah
Peluang
Ujian 1
23 Agustus 2011
Distribusi Diskrit
Tabel statistik
Distribusi Kontinu
Penaksiran
Penaksiran
Ujian 2
11 Oktober 2011
Uji Hipotesis (1 sampel)
Uji Hipotesis (1 sampel)
Uji Hipotesis (2 sampel)
Analisis Variansi
Analisis Data Kategorikal
Analisis Regresi
Ujian 3
29 November 2011
ii
K. Syuhada, PhD.
Daftar Isi
1 Statistika Deskriptif
1.1 Pendahuluan . . . . . . . . . . . . . . . . .
1.2 Data, Jenis Data, Memahami Data . .
1.3 Ukuran Pusat/Lokasi dan Penyebaran
1.4 Mengamati Observasi Luar . . . . . . . .
1.5 Data Kelompok . . . . . . . . . . . . . . .
1.6 Memahami Grafik . . . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
3
5
6
6
BAB 1
Statistika Deskriptif
Silabus: Jenis data, ukuran pusat/lokasi, ukuran penyebaran, koefisien variasi,
observasi luar, data kelompok, grafik
Tujuan:
1. Membedakan jenis data dan memahami data
2. Menghitung dan memaknai ukuran lokasi/pusat
3. Membedakan variansi dan koefisien variasi
4. Mengamati observasi luar
5. Memahami data kelompok
6. Membuat dan menafsirkan grafik
1.1
Pendahuluan
• Statistika dan Biostatistika: apa, untuk apa?
• Statistik versus Statistika
• Manfaat BioStatistika
Statistika adalah ilmu yang digunakan untuk mengumpulkan, mengorganisasi,
melakukan inferensi dan menafsirkan data. Secara singkat, statistika adalah
ilmu/pekerjaan untuk meyimpulkan tentang suatu fenomena pada populasi
menggunakan sampel.
1
1.2
Data, Jenis Data, Memahami Data
Data adalah hasil observasi tunggal (datum) yang didapat baik secara langsung
(observasi/survey, praktikum) ataupun tidak langsung (buku, koran, internet)
Jenis data:
• Nominal (jenis kelamin, golongan darah)
• Ordinal (tingkat kecemasan, tingkat nyeri)
• Rasio/interval (denyut nadi, tekanan darah)
Contoh/ilustrasi dan interpretasi:
1. Berat badan bayi:
Table 1.1: Data sampel berat badan bayi (di AS) baru lahir.
Bayi1
2
3
4
5
BB
3265
3260
3245
3484
4146
Bayi6
7
8
9
10
BB
3323
3649
3200
3031
2069
Bayi11
12
13
14
15
BB
2581
2841
3609
2838
3541
Bayi16
17
18
19
20
BB
2759
3248
3314
3101
2834
2. Jumlah darah putih (×1000) pasien-pasien di RS:
0 357889
1 02
2
3 5
3. Dapatkah anda mencari dan menafsirkan data berbentuk grafik?
4. Dapatkah anda mencari data yang bersifat kategorikal?
MA2082 BioStat.
2
K. Syuhada, PhD.
1.3
Ukuran Pusat/Lokasi dan Penyebaran
• Ukuran lokasi: Mean (aritmetik), Median, Modus
• Ukuran Penyebaran: Jangkauan, Variansi, Kuartil
• Variansi versus Koefisien Variasi
Misalkan data sampel adalah
x1 , x2 , . . . , xn ,
dimana xi menyatakan titik sampel ke-i. Sampel diatas diperoleh dari populasi dan kita ingin melakukan inferensi untuk populasi dengan memanfaatkan
sampel. Langkah pertama adalah meringkas data untuk kemudian menghitung MEAN, MEDIAN dan MODUS (selanjutnya disebut ukuran lokasi atau
pusat).
Mean (aritmetik) didefinisikan sebagai
∑n
xi
x̄ = i=1
n
Sifat-sifat mean
(a) Untuk suatu konstanta k,
n
∑
k xi = · · ·
i=1
(b) Jika yi = xi + k maka ȳ = x̄ + k. Buktikan!
(c) Jika yi = k xi maka ȳ = · · · .
Median atau median sampel seringkali dikatakan sebagai nilai tengah. Dengan demikian, menghitung median haruslah dilakukan pada data yang sudah
diurutkan. Definisi median adalah
(a) Observasi ke-((n + 1)/2), (n ganjil), atau
(b) Nilai tengah dari observasi ke-(n/2) dan ke-((n/2) + 1), (n genap)
MA2082 BioStat.
3
K. Syuhada, PhD.
Diskusi: Bagaimana (perbandingan) nilai mean dan median untuk data yang
(i) simetrik, (ii) menceng ke kanan, (iii) menceng ke kiri?
Modus atau Mode adalah ukuran pusat yang menyatakan nilai observasi yang
paling sering muncul. Menentukan modus dapat dilakukan pada data tanpa
diurutkan (meskipun lebih mudah apabila diurutkan lebih dahulu).
LATIHAN:
Tentukan ukuran lokasi/pusat dari contoh data diatas.
Ukuran penyebaran menyatakan seberapa jauh data menyebar dari mean. Misalkan kita memiliki dua data sampel. Kedua sampel memiliki mean yang sama,
namun memiliki penyebaran data yang berbeda. Beberapa ukuran penyebaran
antara lain:
1. Jangkaun (Range):
R = xmaks − xmin
2. Variansi atau variansi sampel:
∑n
2
2
i=1 (xi − x̄)
s =
n−1
Catatan:
Deviasi standar atau simpangan baku adalah akar kuadrat dari variansi.
3. Kuantil atau persentil:
Sifat-sifat variansi:
Diketahui data sampel x1 , . . . , xn memiliki variansi s2x . Jika data sampel
(a) yi = xi + k,
(b) yi = k xi ,
untuk suatu konstanta k, maka
s2y = . . .
LATIHAN:
Tentukan ukuran penyebaran dari contoh data diatas.
MA2082 BioStat.
4
K. Syuhada, PhD.
Variansi versus Koefisien Variasi
Kita dapat menghitung suatu ukuran yang mengaitkan ukuran penyebaran
(deviasi standar) dengan ukuran lokasi (mean), yaitu koefisien variasi (coefficient of variation - CV):
CV = 100% × (s/x̄)
yang tidak dipengaruhi unit ukuran yang dipakai. CV bermanfaat untuk membandingkan variabilitas beberapa sampel yang berbeda relatif terhadap nilai
mean-nya. Dapat pula kita membanding CV dari beberapa variabel.
LATIHAN:
Table 1.2: Faktor risiko kardiovaskular pada anak.
n Mean
s
CV(%)
Tinggi (cm)
364 142.6 0.31
Berat (kg)
365 39.5 0.77
Tekanan darah (mm Hg) 337 104 4.97
Kolesterol (mg/dL)
395 160.4 3.44
1.4
Mengamati Observasi Luar
Observasi luar atau outlier adalah nilai/observasi yang “menyimpang” dari
nilai-nilai/observasi yang lain. Observasi luar dapat ditentukan/dihitung dengan melihat apakah ada nilai/observasi yang LEBIH BESAR dari
K3 + 1.5 (K3 − K1 )
atau LEBIH KECIL dari
K1 − 1.5 (K3 − K1 ).
Dalam praktiknya, observasi luar dapat menyatakan sesuatu yang baik/jelek.
Misalnya, seseorang dengan tingkat kecerdasan (IQ) yang sangat tinggi (jauh
diatas rata-rata alias observasi luar) adalah baik. Seringkali observasi luar
diabaikan dalam analisis data meskipun sesungguhnya cara ini tidaklah tepat.
Mendeteksi observasi luar adalah sesuatu yang sangat menantang dalam statistika.
MA2082 BioStat.
5
K. Syuhada, PhD.
LATIHAN:
Adakah observasi luar pada contoh data diatas?
1.5
Data Kelompok
Pandang data berikut:
Ukuran sampel tersebut terlalu besar sehingga menampilkan data apa adanya
menjadi tidak efisien. Dengan demikian, data sampel dapat dikelompokkan.
Pengelompokkan ini dapat pula terjadi (harus dilakukan) karena tingkat keakuratan data yang diambil tidak dapat diperoleh dengan baik.
1.6
Memahami Grafik
Beberapa tampilan visual (baca: grafik) untuk data adalah diagram bar, diagram batang dan daun (stem-and-leaf plot).
TUGAS:
Carilah data (dengan ukuran sampel besar) dan lakukan analisis data, khususnya pengelompokan data dan interpretasi grafik.
(DIKUMPULKAN HARI SELASA 16 AGUSTUS 2011 PUKUL 09.00)
MA2082 BioStat.
6
K. Syuhada, PhD.
Download