STATISTIKA-Pengantar Pertemuan Bahan 1 Statistika Deskriptif; Ukuran Pemusatan dan Penyebaran Statistika; Frekuensi data Dasar-dasar teori peluang; Peluang bersyarat dan teorema bayes Konsep sampling dan Populasi; Nilai Ekspektasi ratarata, varian, dan kovarian Distribusi Teoritis Diskrit; Binom, hipergeometri, poisson 2 3 4 5 6 7 Distribusi Teoritis Kontinu; Normal, Nilai Z, Normal Baku, membaca tabel distribusi teoritis kontinu Pendugaan Selang Kepercayaan Satu Sampel; z, t, dan proporsi UTS STATISTIKA-Pengantar Pertemuan Bahan 8 Pendugaan Selang Kepercayaan Dua Sampel; z, t, proporsi, chi-square Konsep Hipotesis; Pengujian Hipotesis Satu Sampel; z, t, dan proporsi Pengujian Hipotesis Lebih dari Satu Sampel; z, t, dan proporsi Konsep korelasi dan Skala Ukur Data Korelasi Kendall, Spearman, Pearson, dan Asosiasi KhiKuadrat Regresi Linier Sederhana untuk peramalan Aplikasi Korelasi dan Regresi Linier Sederhada di bid. Ekonomi UAS 9 10 11 12 13 14 STATISTIKA-Definisi Statistika Apakah Statistika itu? Seni mengumpulkan, mengolah, dan mengintepretasikan data menjadi informasi yang berguna untuk pengambilan keputusan Berdasarkan kedalaman pengolahan data/analisis, Statistika dibedakan menjadi 2; yaitu: ● ● Statistika Deskriptif: metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Statistika Inferensi: mencakup semua metode yang berhubungan dengan analisis data untuk kemudian sampai pada peramalan atau penarikan kesimpulan keseluruhan gugus data induknya. STATISTIKA-Istilah-istilah umum ● ● ● Populasi Keseluruhan pengamatan yang menjadi perhatian si peneliti. Sampel atau Contoh Suatu himpunan bagian dari populasi. Sampel acak sederhana Suatu sampel acak sederhana n pengamatan adalah suatu contoh acak sederhana yang dipilih dengan suatu cara tertentu, sehingga tiap himpunan bagian yang berukuran n dari populasi tersebut memiliki peluang terpilih yang sama. Parameter Sembarang nilai yang menjelaskan ciri-ciri populasi. ● Statistik Sembarang nilai yang menjelaskan ciri-ciri sampel. ● STATISTIKA-Ukuran Pemusatan Apakah Ukuran Pemusatan itu? (center of measurement) Sembarang ukuran yang menunjukkan pusat dari suatu gugus data yang umumnya telah diurutkan. Misalnya: mean atau nilai rata-rata, median, dan modus STATISTIKA-Mean Apakah mean atau nilai rata-rata? Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk mendapatkan gambaran umum tentang pusat dari suatu gugus data. ● Mean untuk Populasi N Mean untuk Sampel n ∑x µ = i =1 N ● ∑x i Contoh: x = i =1 n X i = {1,3,4,7,5} n ∑x x = i =1 n i x + x + x + x4 + …+ xn 1+ 3 + 4 + 7 + 5 = 1 2 3 = =4 n 5 i STATISTIKA-Median Apakah median itu? Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk mendapatkan gambaran umum tentang pusat dari suatu gugus data; secara khusus untuk data berskala ukur nominal dan ordinal. Langkah-langkah Menghitung median... 1. Urutkan data 2. Kalau n ganjil, maka nilai mediannya adalah nilai pengamatan yang tepat membagi gugus data menjadi dua bagian yang sama besar. Kalau n genap, maka nilai mediannya adalah rata-rata dua nilai pengamatan yang paling tengah. STATISTIKA-Median Contoh: Berapakah median dari suatu gugus data X i ={ 1, -2, 8, 2, 2, 5}? Langkah 1: Urutkan data -2, 1, 2, 2, 5, 8 Langkah 2: n genap X3 X4 x Me 2 2 2 2 STATISTIKA-Modus Apakah Modus itu? Adalah nilai yang paling sering muncul dari suatu gugus data. Jadi nilai modus adalah nilai yang memiliki frekuensi yang paling besar dari suatu gugus data. Contoh: X i = {−2,1,2,2,5,5,5,8} Nilai -2 1 2 5 Frekuensi 1 1 2 3 Karena nilai 5 memiliki frekuensi yang paling besar, maka: Mo 5 STATISTIKA-Ukuran Penyebaran Apakah ukuran penyebaran/dispersion of measurement itu? Adalah suatu nilai yang menunjukkan keberagaman nilai dari suatu gugus data. Misalnya: range/wilayah, standar deviasi/simpangan baku, varian/ragam STATISTIKA-Range/Wilayah Apakah Range/Wilayah itu? Adalah suatu nilai yang menunjukkan beda antara nilai terbesar dengan nilai terkecil dari suatu gugus data. Rumus: Range = NilaiTerbesar − NilaiTerkecil Contoh: X i = {−2,1,2,2,5,5,5,8} Range = 8 − (−2) = 10 STATISTIKA-Standar Deviasi/Simpangan Baku Apakah Standar Deviasi itu? Adalah suatu nilai yang menunjukkan rata-rata, beda nilai-nilai dari suatu gugus data terhadap mean-nya. ● St.Dev untuk Populasi =N 2 ( ) − Σii= X µ i 1 σ= N ● St.Dev untuk Sampel s= Σ i= n i=1 (X −x n −1 i ) 2 STATISTIKA-Standar Deviasi/Simpangan Baku Contoh: X i = {−2,1,2,2,5,5,5,8} Carilah standar deviasi dari data di atas! Ingat untuk mendapatkan St.Dev, maka diperlukan mean-nya! x = 3.25 s= (− 2 − 3.25)2 + (1 − 3.25)2 + (2 − 3.25)2 +…+ (8 − 3.25)2 7 7 7 7 = 3.105 STATISTIKA-Varian/Ragam Apakah varian/ragam itu? Adalah kuadrat dari nilai standar deviasi. ● Varian untuk Populasi σ2 = ● =N 2 ( ) − Σ ii= X µ i 1 N Varian untuk Sampel ( ) 2 i= n 2 Σ i=1 X i − x s = n −1 Jadi jika S=3.105, maka variannya adalah S 2 = 3.1052 = 9.641 STATISTIKA-Menggunakan Kalkulator ● ● Menghitung mean dengan kalkulator 1. Masuk ke mode SD: Tekan Shift Mode SD 2. Masukkan keseluruhan gugus data: Tekan -2 1 DT DT 3. Tekan x Menghitung St.Dev dengan kalkulator 1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean. 2. Tekan x n 1 8 DT STATISTIKA-Hal lainnya mengenai Ukuran Penyebaran Nilai Z atau nilai baku... Adalah nilai pembakuan yang menyatakan jarak suatu pengamatan x dari mean dalam satuan standar deviasi. ● ● Nilai Z untuk jika nilai-nilai parameter populasi diketahui x−µ z= σ Nilai Z untuk jika nilai-nilai parameter populasi tidak diketahui z= x−x s STATISTIKA-Contoh Nilai Z Carilah nilai Z dari X=-2 pada gugus data X = x−µ x−x z= = σ s i {−2,1,2,2,5,5,5,8}! −2 − 3.25 = = −1.69 3.105 Tanda negatif menyatakan, nilai -2 ada di sebelah kiri mean dari gugus data, angka 1,69 menunjukkan jarak nilai -2 dari mean dalam satuan standar deviasi. Dalil Chebyshev: 1 Sekurang-kurangnya 1 − bagian data, k2 terletak dalam k standar deviasi dari nilai tengahnya. STATISTIKA-Ukuran Fraksional Apakah Ukuran Fraksional itu? (fractional measurement) Sembarang ukuran yang membagi data menjadi fraksi-fraksi yang sama range-nya. Misalnya: kuartil, desil, persentil Ada lebih dari 1 cara untuk mencari kuartil, desil, dan persentil. Namun semuanya memiliki satu filosofi: membagi data menjadi fraksi-fraksi yang memiliki anggota gugus data yang kira-kira hampir sama banyaknya STATISTIKA-Contoh Rumus Kuartil Kuartil membagi data menjadi empat fraksi. Q1 Q2 Langkah mencari kuartil: 1. cari posisi kuartil tersebut: i pQi = x(n + 1) 4 2. cari nilainya berdasarkan rumus: Qi = jx⏐X pQ − X pQ +1⏐+ X pQ i i i ⏐ ⏐ Q3 STATISTIKA-Contoh Carilah kuartil ke-3 dari gugus data ini: X i = {−2,1,2,2,5, 8,8} Langkah mencari kuartil: 1. cari posisi kuartil tersebut: 3 pQ3 = x8 = 6.00 4 2. cari nilainya berdasarkan rumus: Q3 = 0.00 x⏐X pQ − X pQ +1⏐+ X pQ = 0.00 x|8 − 8|+ 8 = 8 3 ⏐ 3 3 ⏐ STATISTIKA-Ingatkah Saudara? Apakah yang dimaksud center of measurement, dispersion measurement, dan fractional measurement? Ukuran apa yang paling sering digunakan? Mean dan Standar Deviasi. Bagaimana dengan fractional measurement? The Pareto principle (also known as the 80-20 rule, the law of the vital few and the principle of factor sparsity) states that, for many events, 80% of the effects comes from 20% of the causes. STATISTIKA-Ingatkah Saudara? PARETO PRINCIPLE: Business management thinker Joseph M. Juran suggested the principle and named it after Italian economist Vilfredo Pareto, who observed that 80% of income in Italy went to 20% of the population. It is a common rule of thumb in business; e.g., "80% of your sales comes from 20% of your clients." (Hukum 80/20) Thomas Stanley, Ph.D. dan William D. Dunks, Ph.D. sering menggunakan ukuran fraksional untuk menggambarkan perilaku masyarakat Amerika. STATISTIKA-Ingatkah Saudara? BAGAIMANA HUKUM 80/20 DILAHIRKAN? (Sebuah Ilustrasi) Vilfredo Pareto, mengumpulkan data pendapatan orang-orang di Italia. Data-data yang didapatkannya diurutkan. Setelah berulang kali mengulang pengumpulan data, dia mendapati bahwa orang-orang yang menempati posisi data lebih besar atau sama dengan 80 (persentil ke-80 dan seterusnya) ternyata memiliki total pendapatan 80% dari seluruh orang-orang dalam pengamatannya. 80% data; 20% total pendapatan 20% data; 80% total pendapatan persentil ke-80 S={ 0,1; 0,9; 1; 1; 1; 1; 1; 2; 16; 16} STATISTIKA-Ingatkah Saudara? Cobalah menghitung mean dan standar deviasi-nya! X={2, 3, 1} Y={3, 1, 4, 10, 2} Z={1, 45, 28, 2, -10, 35, 29, 50, 98, 100, -35, 18, 1, 1, 5, -9, 10, 7, 4, 19, 3, 12, 5, 10, 19, 20, 32, 67, 8, 9, 12, -1, 0, 2} STATISTIKA-Menggunakan Kalkulator ● ● Menghitung mean dengan kalkulator 1. Masuk ke mode SD: Tekan Shift Mode SD 2. Masukkan keseluruhan gugus data: Tekan -2 1 DT DT 3. Tekan x Menghitung St.Dev dengan kalkulator 1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean. 2. Tekan x n 1 8 DT STATISTIKA-Tabel Frekuensi Sederhana Tabel Frekuensi Sederhana adalah tabel frekuensi yang terdiri dari kolom-kolom nilai (xi) dan frekuensi (fi). Contoh: Nilai xi -2 1 2 5 8 Frekuensi fi 1 1 2 1 1 Tabel di atas, sama dengan bentuk gugus data sbb: X = {− 2,1,2,2,5, 8} i Pertanyaan yang sering muncul adalah… Bagaimana menghitung nilai mean dan st. dev dari data pada tabel frekuensi sederhana STATISTIKA-Tabel Frekuensi Sederhana (Cont’d) Contoh: Nilai Frekuensi = {− 2,1,2,2,5, 8} i xi fi -2 1 1 1 2 2 5 1 8 1 Cara menghitung mean-nya dengan rumus dasar: x = X ∑ x −2 1 2 2 5 8 x= + + + + + 6 6 6 6 6 6 1 (− 2 + 1 + 2 + 2 + 5 + 8) 6 1 = (1.(−2) + 1.(1) + 2(2) + 1(5) + 1(8) ) 6 1 x= ( x1) + f ( x2) + K + f ( xk ) f 1 2 k 6 = ( ) i=n i =1 i n Sehingga, RUMUSnya menjadi: 1 i =k x = ∑i =1 n f x i i STATISTIKA-Tabel Frekuensi Sederhana (Cont’d) Contoh: Nilai xi -2 1 2 5 8 Frekuensi fi 1 1 2 1 1 X = {− 2,1,2,2,5, 8} i RUMUS St. Dev untuk tabel frekuensi sederhana menjadi: s= ( ∑ f xi − x i =k i =1 i n −1 ) 2 Cobalah menghitung nilai St. Dev dengan rumus di atas, bandingkan dengan rumus St. Dev pada pertemuan ke-1! STATISTIKA-Tabel Frekuensi untuk Data Berkelompok 6 Langkah Menyusun Tabel Frekuensi untuk Data Berkelompok: 1. Tentukan banyaknya selang kelas: (saran: bsk=1+3,3 log n) 2. Tentukan range datanya 3. Bagi range dengan banyaknya selang kelas 4. Tentukan limit kelas dan batas kelas Ingat batas kelas selalu ± 0,5 digit terakhir limit kelas. 5. Tentukan titik tengah tiap selang kelas: ttk=(batas atas+batas bawah)/2 6. Tentukan frekuensi masing-masing kelas STATISTIKA-Tabel Frekuensi untuk Data Berkelompok Sensus Tahun 1980 Kelompok Umur/ Age Group (1) 0-4 5-9 10 - 14 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 +70 Jumlah/ Total (4) 241655 234916 216003 238054 240501 192932 131065 123921 109978 82086 74411 47917 36340 20137 27611 Dengan mengeluarkan selang kelas +70 dapatkah anda menghitung mean dan standar deviasi usia penduduk kota Surabaya tahun 1980? (petunjuknya: gunakan rumus untuk tabel frekuensi sederhana tetapi ganti Xi dengan titik tengah kelas) STATISTIKA-Istilah Penting pada Himpunan Ruang Contoh adalah himpunan semua kemungkinan hasil dari suatu percobaan. Dilambangkan dengan huruf S. Kejadian adalah himpunan bagian dari ruang contoh. Terbagi atas dua jenis yaitu Kejadian Sederhana (anggota himpunannya tunggal) dan Kejadian Majemuk (gabungan beberapa kejadian sederhana). Ruang Nol/Himpunan Kosong adalah himpunan bagian dari ruang contoh yang tidak memiliki satu anggota pun. Dilambangkan dengan ø Ilustrasi Matematis: φ ⊂ K .Sederhana ⊂ K .Majemuk ⊂ RuangContoh STATISTIKA-Istilah Penting pada Himpunan (Cont’d) Bagaimana mendaftarkan anggota dari ruang contoh? Ada beberapa cara yang populer; antara lain: Diagram Venn, dan Diagram Pohon Bagaimana jika anggota ruang contoh sangat banyak? Dapat menggunakan Notasi Pembentuk Himpunan Contoh: Kasus nilai yang muncul dari pelemparan sebuah mata dadu. STATISTIKA-Istilah Penting pada Himpunan (Cont’d) HIMPUNAN-HIMPUNAN yang mungkin terbentuk adalah: S = {1,2,3,4,5,6} A = {1,3,5} B = {2,4,6} C = {2,3,5} D = {2} E = {} Notasi Pembangun Himpunan S={x|x adalah semua nilai mata dadu yang mungkin} A={x|x adalah mata dadu dengan nilai ganjil} B={x|x adalah mata dadu dengan nilai genap} C={x|x adalah mata dadu dengan nilai prima} D={x|x adalah mata dadu dengan nilai genap sekaligus prima} E={x|x adalah mata dadu dengan nilai …} Buatlah Diagram Venn nya! STATISTIKA-Pengolahan Kejadian BEBERAPA ISTILAH PENTING DALAM PENGOLAHAN KEJADIAN: Irisan: irisan kejadian A dan B dilambangkan dengan A ∩ B ; adalah kejadian yang terdiri atas semua unsur persekutuan kejadian A dan B. Saling Asing/Disjoint: disjoin antara kejadian A dan B dilambangkan dengan A ∩ B = φ ; adalah kejadian di mana kejadian A dan B tidak punya unsur persekutuan. Paduan/Union: union kejadian A dan B dilambangkan dengan kejadian yang mencakup semua unsur kejadian A dan B. A ∪ B ; adalah Komplemen: komplemen A dilambangkan dengan A’; adalah himpunan semua anggota S yang bukan anggota A. STATISTIKA-Mencacah Titik Contoh Apakah Titik Contoh itu? Titik Contoh adalah kejadian sederhana yang mungkin disusun dari anggota ruang contoh. Ada beberapa operasi perhitungan/pencacahan pada titik contoh; yaitu: Kaidah Penggandaan, Kaidah Permutasi, dan Kaidah Kombinasi STATISTIKA-Kaidah Penggandaan Apa yang kaidah penggandaan katakan? Jika suatu operasi dapat dilakukan dengan n1 cara dan operasi kedua dapat dilakukan dengan n2 cara, maka kedua operasi tersebut dapat dilakukan dengan n1x n2 cara. Rumus: Untuk 2 operasi: n1 x n2 Untuk k operasi: n1 x n2 x … x nk STATISTIKA-Kaidah Penggandaan (Cont’d) Contoh: Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 1 jenis saham dan 1 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan 8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan investasinya? Jawabannya: n1= banyaknya jenis saham di bursa= 45 n2= banyaknya jenis mata uang= 8 Banyaknya pilihan investasi= n1x n2= 45x 8 = 360 pilihan STATISTIKA-Permutasi Apakah yang dimaksud permutasi? Permutasi adalah susunan yang dapat dibentuk oleh sebagian atau keseluruhan kumpulan benda dengan urutan yang diperhatikan. Urutan yang diperhatikan? Jika susunan A, B dianggap berbeda dengan B,A maka urutan diperhatikan. Dalil-Dalil Permutasi: 1. Banyaknya permutasi n benda yang berbeda adalah n! 2. Banyaknya permutasi r benda dari n benda yang berbeda adalah n Pr = n! (n − r )! STATISTIKA-Permutasi (Cont’d) Dalil-Dalil Permutasi: 3. Banyaknya permutasi n benda yang berbeda yang disusun dalam suatu lingkaran adalah (n-1)! 4. Banyaknya permutasi yang berbeda dari n benda yang n1 di antaranya berjenis pertama, n2 berjenis kedua, …, nk berjenis ke-k adalah n! n Pr = n1!n2 !...nk ! STATISTIKA-Kombinasi Apa yang dimaksud dengan Kombinasi? Kombinasi adalah susunan banyaknya cara mengambil r benda dari n benda tanpa memperhatikan urutannya. RUMUS: n! n Cr = r!(n − r )! STATISTIKA-Permutasi atau Kombinasi? Contoh: Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 3 jenis saham dan 2 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan 8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan paket investasinya? Perpaduan antara Kombinasi dan … Kaidah Penggandaan STATISTIKA-Peluang Suatu Kejadian Apa yang dimaksud dengan Peluang? Peluang suatu kejadian A adalah jumlah peluang semua titik contoh di dalam A. Ingat: 0 ≤ P ( A) ≤ 1 P (φ ) = 0 P( S ) = 1 RUMUS: n P ( A) = N n = banyaknya titik contoh dalam kejadian A N = banyaknya titik contoh dalam ruang contoh STATISTIKA-Kaidah Penjumlahan Hal yang perlu diperhatikan: 1. Bila A dan B adalah dua kejadian sembarang, maka: P( A ∪ B) = P( A) + P( B) − P( A ∩ B) 2. Bila A dan B adalah dua kejadian yang saling asing, maka: P( A ∪ B) = P( A) + P( B) STATISTIKA-Peluang Bersyarat Dalam suatu kasus, mungkin saja kita mendapati bahwa kita mengetahui sejumlah informasi awal. Dengan menggunakan informasi awal tersebut, kita dapat memperkirakan peluang suatu kejadian dengan lebih akurat. Peluang suatu kejadian terjadi, jika peluang kejadian yang lain diketahui disebut sebagai PELUANG BERSYARAT. Peluang bersyarat B, bila A diketahui dilambangkan dengan P(B|A) sbb: P( A ∩ B) P( B | A) = P( A) Catatan: P(A)>0 STATISTIKA-Peluang Bersyarat_Contoh Soal SOAL: Pak Kris menginvestasikan uangnya ke 2 saham yang berbeda. Peluang saham A meningkat nilainya dalam sebulan ke depan adalah 10% dan peluang saham B meningkat nilainya dalam sebulan ke depan adalah 15%. Jika bulan berikutnya Pak Kris mendapat informasi bahwa harga saham turun, berapa peluangnya bahwa harga saham A yang turun? JAWABAN: Umpamakan Pak Kris membeli 100 saham A dan 100 saham B. Naik A B Total Turun 10 15 25 Total 90 100 85 100 175 200 STATISTIKA-Peluang Bersyarat_Contoh Soal JAWABAN: P(turun ∩ A) P ( A | turun) = P(turun) 90 18 200 = = 175 35 200 Jadi peluang saham A turun nilainya adalah 18/35 STATISTIKA-Peluang Bersyarat_Contoh Soal SOAL: Sirkuit Donington Park di Inggris memiliki tipikal cuaca yang unik. Untuk menentukan setting motoGP yang tepat, tim Ducati memiliki data bahwa peluang dua hari berturut-turut hujan adalah 30%, sedangkan peluang dua hari berturut-turut cerah adalah 40%. Peluang mix, hari ini cerah besok hujan adalah 15% demikian juga dengan peluang hari ini hujan besok cerah adalah 15%. Jika dalam babak kualifikasi cerah, berapakah peluangnya dalam balapan besok hari juga cerah? JAWABAN: Hari ini Hujan Cerah Hujan 30 15 Besok Hari Cerah 15 40 Total 45 55 Total 45 55 100 STATISTIKA-Peluang Bersyarat_Hal Lainnya Bila dua kejadian bebas, maka: P ( B | A) = P ( B) P ( A | B ) = P ( A) Kaidah Penggandaan: 1. Bila dalam suatu percobaan kejadian A dan B dapat terjadi sekaligus, maka: P ( A ∩ B) = P( A) P( B | A) 2. Bila Kejadian A dan B bebas; maka: P ( A ∩ B) = P( A) P ( B) STATISTIKA-Konsep Sampling dan Populasi A A A A A A A A A A A A A POPULASI SAMPEL POPULASI adalah keseluruhan pengamatan yang menjadi perhatian si peneliti. SAMPEL adalah suatu himpunan bagian dari populasi. STATISTIKA-Konsep Sampling dan Populasi MENGAPA STATISTIKA MENGGUNAKAN STATISTIK DARI SAMPEL UNTUK MENDUGA PARAMETER POPULASI? Trade-off antara keterbatasan waktu, sumber daya, dan biaya dengan akurasi hasil penelitian. Less Accuracy Low Resources High Accuracy High Resources STATISTIKA-Konsep Sampling dan Populasi Cobalah menghitung nilai mean dari gugus data populasi berikut: 51,5514; 49,0151; 48,8834; 44,3441; 48,2312; 46.2880; 46,0068; 53,6238; 50,3008; 49,6371 Secara acak pilihlah sampel berukuran 3, 5, 7, dan 9 dari gugus data populasi di atas dan hitunglah nilai mean-nya. Bandingkan! Less Accuracy Low Resources High Accuracy High Resources STATISTIKA-Konsep Sampling dan Populasi TEKNIK SAMPLING: Probability Sampling Non-Probability Sampling 1. Simple Random Sampling 1. Convenience Sampling 2. Stratified Random Sampling 2. Judgmental Sampling 3. Cluster Random Sampling 3. Quota Sampling 4. Systematic Random Sampling 4. Snowball Sampling STATISTIKA-Nilai Harapan untuk Parameter NILAI HARAPAN (Expected Value) Expected Value dari sebuah variabel (peubah acak) adalah jumlah dari peluang semua kemungkinan yang ada di dalam percobaan atau himpunan kejadian dikalikan dengan nilainya. DEFINISI MATEMATIS: E ( x) = ∫ X .dP Ω untuk diskrit: E ( x ) = ∑i x i untuk kontinu: b p i E ( x) = ∫ x. f ( x).dx a Catatan: Definisi diskrit dan kontinu akan dijelaskan pada pertemuan selanjutnya. STATISTIKA-Mean Variabel MISAL: Ruang Contoh untuk pelemparan 2 uang logam, sbb: S={AA, AG, GA, GG} Jika dilakukan 16 kali pelemparan ternyata banyaknya muncul sisi gambar (Xi) sbb: xi fi Maka: 0 4 1 7 2 5 (0).(4) + (1).(7) + (2).(5) x= 16 = (0).(4 / 16) + (1).(7 / 16) + (2).(5 / 16) = 1,06 E ( x ) = ∑i x i p i STATISTIKA-Mean Variabel Mean Variabel x yang memiliki nilai yang sama dengan expected value E(x). Adalah suatu perhitungan mean populasi menggunakan frekuensi relatif Variabel Diskrit X: xi P(X=x) x1 f(x1) x2 f(x2) … … xn f(xn) Maka nilai expected value untuk X adalah: n µ = E( X ) = ∑ xi . f ( xi) i =1 Variabel Kontinun X: µ = E( X ) = ∑ xi . f ( xi) ∞ i =1 µ = E( X ) = ∫ x. f ( x).dx −∞ Terjadi jika X bilangan riil. STATISTIKA-Mean Variabel Bagaimana untuk variabel g(X)? Variabel Diskrit g(X): n µ = E( X ) = ∑ g( xi). f ( xi) i =1 Variabel Kontinu g(X): ∞ µ = E( X ) = ∫ g( xi). f ( xi).dg( xi) −∞ STATISTIKA-Varian Variabel Varian Variabel X Varian dari 16 kali pelemparan mata uang tersebut adalah: (0 − 1,06) 2 .(4) + (1 − 1,06) 2 .(7) + (2 − 1,06) 2 .(5) σ = 16 = 0,5639 2 Secara Umum Variabel X memiliki varian Diskrit: 2 n σ 2 = E ( X − µ ) = ∑ ( X − µ ) . f ( x) 2 i =1 Rumus Hitung bagi varian X: σ 2 = E( X 2 ) − µ 2 Kontinu: σ 2 = E ( X − µ )2 = ∞ 2 ∫ ( X − µ ) . f ( x).dx −∞ Bagaimana dengan varian dari g(X)? STATISTIKA-Kovarian Variabel Kovarian Variabel X dan Y adalah: σ xy = E (( x − µ x )( y − µ y ) ) Diskrit: n σ xy = ∑ ( xi − µ x )( yi − µ y ). f ( x). f ( y ) i =1 Kontinu σ xy = ∞ ∞ ∫ ∫ (x − µ i x )( yi − µ y ). f ( x). f ( y ).dx.dy − ∞− ∞ Catatan: Semakin kecil nilai kovarian antara variabel x dan y, maka semakin besar independensi antara kedua variabel tersebut. STATISTIKA-Sifat-sifat mean dan varian Sifat-sifat Bila a dan b adalah konstanta: µ ax +b = aµ + b Nilai tengah jumlah atau selisih dua atau lebih peubah acak µ x± y = µ x ± µ y Nilai tengah hasil kali dua variabel µ xy = µ x .µ y Ragam jika b konstan σ x2+b = σ x2 = σ 2 Ragam jika a konstan σ ax2 = a 2σ x2 = a 2σ 2 Jika X dan Y independen maka: σ x2+ y = σ x2 + σ y2 STATISTIKA - VARIABEL: Peluang Diskrit VARIABEL ATAU PEUBAH ACAK: Suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. RUANG CONTOH DIBAGI MENJADI DUA: 1. Diskrit Jumlah titik contoh TERHINGGA, merupakan hasil membilang. contoh: tingkat preferensi yang dikodekan menjadi angka 1, 2, 3, 4, atau 5 2. Kontinu Jumlah titik contoh TAK TERHINGGA, merupakan hasil mengukur. contoh: tinggi seseorang yang diukur dalam satuan centimeter (174,74cm) STATISTIKA - VARIABEL: Variabel Diskrit ILUSTRASI: tinggi badan Dikrit: Kontinu: 150cm 180cm STATISTIKA - VARIABEL: Variabel Diskrit DISTRIBUSI PELUANG: Untuk menghitung nilai peluang tertentu selain menggunakan cara mendaftarkan atau membuat diagram. Ada bentuk-bentuk peluang khusus, yang nilainya dapat dicari dengan rumus tertentu. Distribusi peluang adalah fungsi yang digunakan untuk menghitung nilai peluang dari suatu bentuk peluang-peluang tertentu. Contoh: Banyaknya gambar yang muncul dari 3 kali pelemparan 1 mata uang. (banyaknya gambar yang muncul dari 1 kali pelemparan 3 mata uang) Distribusi Peluang BENTUK PELUANG x P(X=x) 0 1/8 1 3/8 2 3/8 3 1/8 x = banyaknya sisi gambar yang muncul ⎛ 3⎞ ⎜⎜ ⎟⎟ x f ( x) = ⎝ ⎠ 8 ; x = 0, 1, 2, 3 x = banyaknya sisi gambar yang muncul STATISTIKA - VARIABEL: Variabel Diskrit BEBERAPA DISTRIBUSI PELUANG DISKRIT YG POPULER: Binominal; Hipergeometrik; Poisson DISTRIBUSI BINOMINAL Ciri-ciri: 1. Percobaan terdiri atas n ulangan 2. Digolongkan menjadi sukses dan gagal 3. Nilai peluang untuk setiap ulangan tidak berubah 4. Pengulangan bersifat bebas RUMUS: ⎛n⎞ b( x; n, p ) = ⎜⎜ ⎟⎟ p x q n − x ⎝ x⎠ Arti Notasi n = banyaknya ulangan x = banyaknya sukses p = peluang sukses q =(1-p) =peluang gagal STATISTIKA - VARIABEL: Variabel Diskrit CONTOH SOAL: Dari data di masa lalu, peluang nilai saham A naik dalam tahun tertentu adalah 35%; Jika Pak Mudahman membeli saham untuk investasi selama 10 tahun. Berapa peluang nilai sahamnya tidak mengalami kenaikan sama sekali di tiap tahunnya? Jawaban: p =35% x =0 b(0;10,0.35) =0.013 n =10 STATISTIKA - VARIABEL: Variabel Diskrit DISTRIBUSI HIPERGEOMETRIK Ciri-ciri: 1. Suatu percobaan yang terdiri atas contoh acak atau random sampel berukuran n diambil dari populasi berukuran N 2. Dengan k dari N benda diklasifikasikan sebagai berhasil dan N-k benda sebagai gagal. RUMUS: ⎛ k ⎞⎛ N − k ⎞ ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ x n−x ⎠ h( x; N , n, k ) = ⎝ ⎠⎝ ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n⎠ Arti Notasi k = banyaknya semesta sukses x = banyaknya sukses N = banyaknya semesta n = banyaknya percobaan STATISTIKA - VARIABEL: Variabel Diskrit CONTOH SOAL: Sebuah perusahaan reksadana menginvestasikan dananya pada beberapa saham. Berdasarkan pengalaman di masa lalu dari 45 saham aktif dipasarkan di pasar modal biasanya hanya 5 saham yang berkinerja positif di akhir tahun (asumsi 5 saham yang berkinerja positif ini random). Jika perusahaan tersebut memiliki kebijakan untuk selalu memecah investasinya ke dalam 3 saham. Berapa peluangnya semua sahamnya berkinerja negatif? Jawaban: k =5 N =45 n =3 h(0;45,3,5) =0,696 x=0 STATISTIKA - VARIABEL: Variabel Diskrit DISTRIBUSI POISSON Ciri-ciri: 1. Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu tertentu atau wilayah, tidak tergantung pada banyaknya hasil percobaan pada selang waktu atau wilayah yang berbeda. 2. Peluang terjadinya satu hasil percobaan selama selang waktu yang singkat atau dalam wilayah yang kecil, sebanding dengan panjang selang waktu atau besarnya wilayah tersebut 3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat atau wilayah yang kecil dapat diabaikan. (Distribusi Poisson selalu berkenaan dengan peluang selang waktu atau wilayah) RUMUS: e−µ µ x p ( x; µ ) = x! Arti Notasi e =bilangan natural =2.718… x =banyaknya sukses µ =mean populasi (sbg pendekatan binominal jika p sangat kecil; µ=np) STATISTIKA - VARIABEL: Variabel Diskrit CONTOH SOAL: Pasar modal mempublikasikan bahwa setiap hari dari 45 saham yang aktif dipasarkan, ada 10 saham yang tidak bergerak nilainya. Jika pada suatu hari Pak Mudahman sedang mengamati pasar modal, berapa peluang Pak Mudahman mendapatkan ada 8 saham yang tidak mengalami pergerakan? Jawaban: µ =10 x =8 p(8;10) =0.113 STATISTIKA - VARIABEL: Peluang Kontinu Distribusi Peluang Kontinu: Peluang variabel random kontinu bernilai tepat di suatu titik adalah nol. P( X = a) = 0 Perhatikan bahwa jika x kontinu, maka: P ( a < X ≤ b) = P ( a < X < b) + P ( X = b) = P ( a < X < b) + 0 STATISTIKA - VARIABEL: Peluang Kontinu Fungsi Kepekatan Peluang: Fungsi f disebut fungsi kepekatan peluang bagi variabel random kontinu X bila luas daerah di bawah kurva dan di atas sumbu x sama dengan 1, dan bila luas antara a dan b dibawah kurva menyatakan peluang X untuk x=a sampai x=b. Maka: P( - ~ < X < + ~ )=1 P( a < X < b )<1 STATISTIKA - VARIABEL: Peluang Kontinu Sebaran Normal/Gauss Bentuk Grafis Lonceng x µ Rumus Kurva Normal: n( x; µ , σ ) = 1 2πσ 2 e 1 ⎛ x−µ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 STATISTIKA - VARIABEL: Peluang Kontinu Ilustrasi Grafis: Kurva Normal dengan µ1<µ2; σ1=σ2 σ1 σ2 µ1 µ2 Kurva Normal dengan µ1=µ2; σ1<σ2 σ1 σ2 µ1=µ2 STATISTIKA - VARIABEL: Peluang Kontinu Ilustrasi Grafis: Kurva Normal dengan µ1<µ2; σ1<σ2 σ1 σ2 µ1 µ2 Kesimpulan dari Ilustrasi Grafik • Semakin kecil σ semakin tinggi puncak dari kurva normal • Semakin besar µ semakin ke kanan posisi dari kurva normal STATISTIKA - VARIABEL: Peluang Kontinu Sifat Kurva Normal: 1. Fungsi mencapai maksimum jika Me=µ 2. Kurva setangkup pada suatu garis tegak yang melewati µ P(− ~ < x) = P( x < + ~) = 0.5 3. Kurva asimptotik terhadap sumbu datar 4. Luas kurva adalah 1. P(− ~ < x < + ~) = 1 STATISTIKA - VARIABEL: Peluang Kontinu Luas daerah di bawah kurva normal: Dibakukan sebagai distribusi normal baku. Distribusi Normal Baku: Adalah distribusi variabel random normal dengan nilai tengah nol dan ragam bernilai satu. (normal baku; n(x;0,1)) Rumus Pembakuan: z= x−µ σ Ilustrasi Grafik: z1 z2 STATISTIKA - VARIABEL: Peluang Kontinu Hampiran distribusi normal terhadap: A. Distribusi Binominal Bila X adalah suatu sampel random binominal dengan mean µ=np dan varian σ2=npq; maka untuk n Æ ~ berlaku: Z = x − np npq B. Distribusi Penarikan Sampel Distribusi penarikan sampel adalah distribusi peluang suatu statistik mengikuti dalil limit pusat. DALIL LIMIT PUSAT Bila sampel random berukuran n ditarik dari suatu populasi tak hingga atau besar dengan mean µ dan varian σ2, maka mean sampel x akan menyebar menghampiri distribusi normal dengan mean µ x = µ dan standar deviasi σ x = σ / n Z = x − µ σ / n STATISTIKA - VARIABEL: Peluang Kontinu Dalil limit pusat juga berlaku jika: Sampel random berukuran n diambil dari populasi berhingga berukuran N dengan pemulihan. Bagaimana jika sampel berukuran kecil (n<30)? Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel n<30 dan atau σ tidak diketahui. Koreksi bias ini dinamakan distribusi t. STATISTIKA - VARIABEL: Peluang Kontinu Distribusi t (ditemukan oleh W.S. Gosset – student t) Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel n<30 dan atau σ tidak diketahui. Koreksi bias ini dinamakan distribusi t. Distribusi t. Bila x dan s2 adalah mean dan varians dari suatu sampel random berukuran n uang diambil dari suatu populasi normal dengan mean µ dan σ2; maka: x−µ t= s/ n Dimana, t merupakan variabel yang terdistribusi sesuai distribusi t dengan derajat bebas (v=n-1). STATISTIKA - VARIABEL: Peluang Kontinu Ilustrasi grafis untuk distribusi t: •Kurva distribusi t untuk v= 2, 5, dan ~ v= ~ v= 5 v= 2 •Kurva distribusi t adalah setangkup α t1- α 0 α tα STATISTIKA - VARIABEL: Peluang Kontinu Distribusi F: Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random. Statistik F: s12 / σ 12 f = 2 2 s2 / σ 2 Dengan derajat bebas (degree of freedom) v1=n1-1; v2=n2-1 Ingat. Jika fα(v1,v2) untuk fα dengan v1 dan v2 derajat bebas maka:: f1−α ( v1 , v 2 ) = 1 ILUSTRASI DISTRIBUSI F f α ( v1 , v 2 ) f0.01(3, 8) = 7,59 f0.05(5, 11) = 3,20 0 α STATISTIKA – Parameter Estimator Pendugaan parameter atau parameter estimation adalah metode statistika yang digunakan untuk menduga parameter menggunakan statistik. Beberapa alasan untuk melakukan estimasi: 1. Keterbatasan waktu 2. Keterbatasan tenaga; dan 3. Keterbatasan biaya Statistika menggunakan data yang berasal dari sampel untuk menduga parameter dari populasi. STATISTIKA – Parameter Estimator Apa yang dimaksud dengan estimator? Menurut Yitnosumarto (1990), estimator adalah suatu nilai variabel dari statistik yang mungkin untuk sebuah parameter. Apa yang dimaksud dengan nilai duga/estimation value? Menurut Yitnosumarto (1990), estimation value adalah nilai dari estimator yang didapat dengan menganalisis data dari suatu sampel. Contoh: Mean dari Ujian Akhir Nasional adalah 5,11 dan Varian sebesar 1,89. STATISTIKA – Parameter Estimator Point Estimator/Penduga Titik: Pada point estimator, estimation value yang dihasilkan hanya berupa titik pada suatu garis bilangan. Misal: X=x1, x2, x3, …, xn Jika peluang x1 hingga xn untuk terpilih adalah sama, maka: ∑ x i=n x= i =1 i n … yang adalah point estimator dari mean populasi. STATISTIKA – Parameter Estimator Sifat-sifat Parameter Estimator: 1. Unbias Estimator (tidak berbias) Estimator haruslah mampu mendekati nilai sebenarnya dari parameter yang diduga. 2. Efisien Memiliki varian yang efisien. ) V (Θ1 ) ) < 1; Varian pertama, lebih efisien dibanding varian yang kedua V (Θ 2 ) 3. Konsisten Jika selisih antara estimator dan parameter selalu mendekati nol, maka suatu estimator memiliki sifat konsisten. STATISTIKA – Parameter Estimator Interval Estimator: Point estimator tidak memberikan informasi yang cukup mengenai parameter populasi, karena nilainya tergantung pada data dari sampel yang diambil. Selanjutnya dikembangkan Interval Estimator dan Interval Estimation Value. Catatan: Interval Estimator disebut sebagai Confidence Interval. Contoh Notasi Estimasi: b1 < Θ < b2 P(b1 < Θ < b2 ) = (1 − α ) Significance Level Confidence Interval STATISTIKA – Selang Kepercayaan Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang akan digunakan? 1. Identifikasi banyaknya populasi 2. Identifikasi parameter apa yang ditanyakan pada populasi 3. Identifikasi banyaknya sampel yang diambil STATISTIKA – Selang Kepercayaan Confidence Interval untuk satu populasi, parameter mean µ, banyak sampel n>=30 atau standar deviasi-nya σ diketahui. Ilustrasi grafis untuk CI: (mengikuti distribusi normal) α/2 α/2 CI=1-α Bentuk Confidence Interval: P( x − zα / 2 σ n < µ < x + zα / 2 σ n ) = 1−α STATISTIKA – Selang Kepercayaan Confidence Interval untuk satu populasi, parameter mean µ, banyak sampel n<30 dan atau standar deviasi-nya σ tidak diketahui. Ilustrasi grafis untuk CI: (mengikuti distribusi t) V=? α/2 α/2 CI=1-α Bentuk Confidence Interval: P( x − tα / 2,v s s < µ < x + tα / 2,v ) = 1−α n n STATISTIKA – Selang Kepercayaan Confidence Interval untuk satu populasi, parameter proporsi p, banyak sampel n>=30. Ilustrasi grafis untuk CI: (mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal) α/2 α/2 CI=1-α Bentuk Confidence Interval: ) P( p − zα / 2 )) pq ) < p < p + zα / 2 n )) pq ) = 1−α n STATISTIKA – Selang Kepercayaan Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang akan digunakan? 1. Identifikasi banyaknya populasi 2. Identifikasi parameter apa yang ditanyakan pada populasi 3. Identifikasi banyaknya sampel yang diambil Jika CI untuk satu populasi digunakan untuk menguji: apakah BESARnya ukuran-ukuran pada sampel sama dengan nilai tertentu pada populasi, Maka CI untuk dua populasi digunakan untuk menguji: apakah BEDA ukuran-ukuran pada sampel sama dengan nilai tertentu pada populasi. STATISTIKA – Selang Kepercayaan Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak sampel n>=30 atau standar deviasi-nya σ1 dan σ2 diketahui. Ilustrasi grafis untuk CI: (mengikuti distribusi normal) α/2 α/2 CI=1-α Bentuk Confidence Interval: P(( x1 − x2 ) − zα / 2 (σ 12 / n1 ) + (σ 22 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + zα / 2 (σ 12 / n1 ) + (σ 22 / n2 ) ) = 1 − α STATISTIKA – Selang Kepercayaan Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak sampel n<30 atau standar deviasi-nya σ1 dan σ2 tidak diketahui; tetapi σ1=σ2 Ilustrasi grafis untuk CI: (mengikuti distribusi t) V=? α/2 α/2 CI=1-α Bentuk Confidence Interval: P(( x1 − x2 ) − tα / 2,v .s p (1 / n1 ) + (1 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + tα / 2,v .s p (1 / n1 ) + (1 / n2 ) ) = 1 − α (n1 − 1) s12 + (n2 − 1) s22 Hal lain yang perlu diketahui: s = n1 + n2 − 2 2 p v = n1 + n2 − 2 STATISTIKA – Selang Kepercayaan Confidence Interval untuk dua populasi, parameter mean µ1-µ2, banyak sampel n<30 atau standar deviasi-nya σ1 dan σ2 tidak diketahui; tetapi σ1≠σ2 Ilustrasi grafis untuk CI: (mengikuti distribusi t) α/2 V=? α/2 CI=1-α Bentuk Confidence Interval: P(( x1 − x2 ) − tα / 2,v ( s12 / n1 ) + ( s22 / n2 ) < µ1 − µ 2 < ( x1 − x2 ) + tα / 2,v . ( s12 / n1 ) + ( s22 / n2 ) ) = 1 − α ( s12 / n1 + s22 / n2 ) 2 Hal lain yang perlu diketahui: v = 2 ( s1 / n1 ) 2 ( s22 / n2 ) 2 v selalu dibulatkan ke atas + n1 − 1 n2 − 1 STATISTIKA – Selang Kepercayaan Bagaimana saya dapat mengetahui apakah σ1=σ2 atau σ1≠σ2 ? Bandingkanlah varian-nya sbb: Ingat!!! Distribusi F: Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random. Statistik F: s12 f = 2 ~ Fα ,v1 ,v2 s2 Dengan derajat bebas (degree of freedom) v1=n1-1; v2=n2-1 Jika f<F, maka σ1=σ2, Jika f>F, maka σ1≠σ2 STATISTIKA – Selang Kepercayaan Confidence Interval untuk data berpasangan, parameter mean µd Kata kunci: sebelum-sesudah, satu unit pengamatan diamati dua kali. Ilustrasi grafis untuk CI: (mengikuti distribusi t) α/2 V=? α/2 CI=1-α Bentuk Confidence Interval: P( xd − tα / 2,v .sd / n < µ d < xd + tα / 2,v .sd / n = 1 − α STATISTIKA – Selang Kepercayaan Confidence Interval untuk dua populasi, parameter proporsi p1-p2, banyak sampel n>=30. Ilustrasi grafis untuk CI: (mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal) α/2 α/2 CI=1-α Bentuk Confidence Interval: ) ) P(( p1 − p2 ) − zα / 2 )) ) ) p1q1 p2 q2 ) ) + < p1 − p2 < ( p1 − p2 ) + zα / 2 n1 n2 )) ) ) p1q1 p2 q2 + ) = 1−α n1 n2 STATISTIKA – PENGUJIAN HIPOTESIS “Sering kali untuk menarik suatu kesimpulan kita tidak mungkin meneliti keseluruhan populasi karena kendala waktu, tenaga, dan biaya. Statistika memberikan solusi untuk penarikan kesimpulan menggunakan data-data yang kita dapatkan dari sampel. Penarikan kesimpulan secara demikian dinamakan pengujian hipotesis” STATISTIKA – PENGUJIAN HIPOTESIS Hipotesis Statistik: Pernyataan atau dugaan mengenai ciri-ciri atau sifat dari satu atau lebih populasi Catatan: benar atau salahnya suatu hipotesis tidak penah diketahui kecuali kita memeriksa seluruh populasi. Ada 2 Macam Hipotesis: Hipotesis Nol: Hipotesis yang dirumuskan dengan harapan akan ditolak. Hipotesi Alternatif: Hipotesis yang dirumuskan dengan harapan akan diterima STATISTIKA – PENGUJIAN HIPOTESIS Mengapa harus dilakukan PENGUJIAN HIPOTESIS? Untuk mendapatkan cukup fakta yang dapat membantu kita menilai derajat kebenaran suatu hipotesis. KENYATAAN DUGAAN H0 benar H1 benar H0 benar ok α H1 benar β ok Power of Test (Kekuatan Uji) = 1 - β STATISTIKA – PENGUJIAN HIPOTESIS Ilustrasi Grafis untuk α dan β: µ1 µ2 =β =α Catatan: Peluang β tidak mungkin dihitung kecuali kita memiliki hipotesis alternatif yang spesifik. (ditandai dengan “ = “) STATISTIKA – PENGUJIAN HIPOTESIS Contoh perhitungan α dan β: Seorang meneliti vaksin influensa jenis baru. Jika 25% penerima vaksin masih memiliki ketahanan terhadap influensa lebih dari 2 tahun, maka vaksin tersebut dinyatakan lebih baik dari vaksin yang lama. Data yang didapatkan (9 dari 20 penerima vaksin masih memiliki ketahanan terhadap influensa lebih dari 2 tahun) Hipotesis: H0: p = 25% H1: p > 25% STATISTIKA – PENGUJIAN HIPOTESIS Perhitungan α: α = P(error jenis 1) = P(X>=9 jika p=25%) = 20 ∑ b( x;20;0.25) x =9 8 = 1 − ∑ b( x;20;0.25) x =0 = 0,0409 Perhitungan β: jika p=50% β = P(error jenis 2) = P(X<9 jika p=50%) 8 Catatan: Untuk memperkecil α dan β maka n harus diperbesar = ∑ b( x;20;0.25) x =0 = 0,2517 STATISTIKA – PENGUJIAN HIPOTESIS Uji 1 arah (one tail test) dan uji 2 arah (two tail test): Bersifat 1 arah: H0: Ө = Ө0 atau H1: Ө > Ө0 H0: Ө = Ө0 H1: Ө < Ө0 α α Bersifat 2 arah: H0: Ө = Ө0 H1: Ө ≠ Ө0 α/2 α/2 STATISTIKA – PENGUJIAN HIPOTESIS Contoh kasus: Bersifat 1 arah: Perusahaan rokok menyatakan bahwa kadar nikotin rokoknya TIDAK MELEBIHI 2,5 mg Bersifat 2 arah: Perusahan rokok menyatakan bahwa kadar nikotin rokoknya ADALAH 2,5 mg Sifat 1 arah dan 2 arah, ditentukan dari kejelasan ARAH PERNYATAAN. Sifat 1 arah; TIDAK LEBIH, KURANG DARI, LEBIH DARI Sifat 2 arah; ADALAH, SAMA DENGAN STATISTIKA – PENGUJIAN HIPOTESIS Uji Hipotesis: 6 Langkah Menguji Statistik: 1. Nyatakan hipotesis nol-nya H0 bahwa Ө = Ө0 2. Pilihlah hipotesis alternatif H1 yang sesuai diantara Ө > Ө0, Ө < Ө0, atau Ө ≠ Ө0 3. Tentukan taraf nyata (significance) 4. Pilih statistik uji (statistical test) yang sesuai dan tentukan wilayah kritiknya 5. Hitung nilai statistik uji berdasarkan data pada contoh 6. KEPUTUSAN: Tolak H0 bila nilai uji statistik tersebut jatuh pada wilayah kritik. Saya akan membantu anda!!! Setiap kali anda diminta untuk menduga suatu hipotesis; tanyakanlah Hal-hal berikut!!! Pendugaan Hipotesis Mean 1 Populasi Varian 2 Populasi 1 Populasi 2 Populasi Proporsi 1 Populasi 2 Populasi Saya akan membantu anda!!! Jika bertanya tentang Mean??? Mean 1 Populasi n>=30, atau σ diketahui Nilainya; Rumus 1 n<30; dan σ tidak diketahui Nilainya; Rumus 2 2 Populasi Tidak Berpasangan Berpasangan; Rumus 6 Saya akan membantu anda!!! Jika bertanya tentang Mean 2 Populasi Tidak Berpasangan??? Tidak Berpasangan n<30; n>=30; atau σ1 dan σ2 diketahui nilainya; Rumus 3 n<30; atau σ1 dan σ2 tidak diketahui nilainya; σ1=σ2; Rumus 4 atau σ1 dan σ2 tidak diketahui nilainya; σ1≠σ2; Rumus 5 Saya akan membantu anda!!! Jika bertanya tentang Varians??? Varians 1 Populasi; Rumus 7 2 Populasi; Rumus 8 Jika bertanya tentang Proporsi??? Proporsi 1 Populasi; Rumus 9 2 Populasi; Rumus 10 STATISTIKA – TABEL STATISTIK UJI Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI SATU POPULASI: H0 µ= µ0 RUMUS 1 µ= µ0 RUMUS 2 KRITERIA n>=30; atau σ diketahui nilainya n<30; dan σ nilainya tidak diketahui RUMUS uji z : x − µ0 z= σ/ n uji t : x − µ0 t= s/ n STATISTIKA – TABEL STATISTIK UJI Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI DUA POPULASI: H0 µ1-µ2=d0 RUMUS 3 µ1-µ2=d0 RUMUS 4 KRITERIA n>=30; atau σ1 dan σ2 diketahui nilainya RUMUS uji z : z= n<30; atau σ1 dan σ2 diketahui tidak nilainya; σ1=σ2 ( x1 − x 2 ) − d 0 (σ 12 / n1 ) + (σ 22 / n2 ) uji t : t= ( x1 − x 2 ) − d 0 s p (1 / n1 ) + (1 / n2 ) (n1 − 1) s12 + (n2 − 1) s22 s = n1 + n2 − 2 2 p v = n1 + n2 − 2 STATISTIKA – TABEL STATISTIK UJI Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI DUA POPULASI: H0 µ1-µ2=d0 RUMUS 5 KRITERIA n<30; atau σ1 dan σ2 diketahui tidak nilainya; σ1≠σ2 RUMUS uji t : t= ( x1 − x 2 ) − d 0 ( s12 / n1 ) + ( s22 / n2 ) ( s12 / n1 + s22 / n2 ) 2 v= 2 ( s1 / n1 ) 2 ( s22 / n2 ) 2 + n1 − 1 n2 − 1 µd=d0 RUMUS 6 pengamatan berpasangan uji t : t= d − d0 sd / n STATISTIKA – TABEL STATISTIK UJI Tabel pengujian HIPOTESIS untuk Varian H0 σ2= σ02 KRITERIA Tidak ada RUMUS 7 σ12= σ22 RUMUS 8 RUMUS uji χ 2 : χ = 2 Jika s1>s2 gunakan rumus 1. Jika s1<s2 gunakan rumus 2 (n − 1) s 2 σ 2 0 ; v = n −1 uji F : (rumus 1) s12 (v , v ) F= 2; 1 2 s2 uji F : (rumus 2) s22 F = 2 ; (v2 , v1 ) s1 STATISTIKA – TABEL STATISTIK UJI Tabel pengujian HIPOTESIS untuk Proporsi H0 p= p0 KRITERIA n>=30 RUMUS 10 uji z : z= RUMUS 9 p1-p2= d0 RUMUS n>=30 x − np0 np0 q0 uji z : ( pˆ − pˆ 2 ) − ( p1 − p2 ) z= 1 pˆ qˆ[(1 / n1 ) + (1 / n2 )] STATISTIKA – CONTOH PENGUJIAN Halaman 344 no. 6 Jaringan restoran MacBurger mengklaim bahwa rata-rata waktu tunggu pelanggan adalah 3 menit dengan standar deviasi populasi 1 menit. Departemen quality assurance menemukan bahwa dari 50 pelanggan di cabang Warren Road MacBurger memiliki rata-rata waktu tunggu 2,75. Dengan taraf nyata (level of significance) 0,05; dapatkah disimpulkan bahwa rata-rata waktu tunggu kurang dari 3 menit? Langkah menjawab: 1. Menentukan Hipotesis Null 2. Menentukan Hipotesi Alternatif H0: µ = 3 menit H1: µ < 3 menit 3. Tentukan taraf signifikansi: α =5% STATISTIKA – CONTOH PENGUJIAN Halaman 344 no. 6 4. Tentukan statistik uji yang sesuai dan wilayah kritiknya: Rumus 1. Z = -1,64 5. Hitung statistik uji-nya x − µ 0 2.75 − 3 z= = = −1,768 σ / n 1 / 50 Tolak H0 Terima H0 6. Kesimpulan: Tolak H0: Cukup bukti untuk menyatakan bahwa waktu tunggu pelanggan kurang dari 3 menit. STATISTIKA – Latihan Try This (don’t be fooled by a complex story) Secara teoritis, chip micro processor yang diproduksi dengan cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata dari 10 chip micro processor prototype tersebut mampu berfungsi normal rata-rata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut dapat dinyatakan benar pada taraf signifikansi 5%? STATISTIKA – Latihan Latihan Bab 11: 3. Gibbs Baby Food Company ingin membandingkan berat bayi yang menggunakan produknya dibanding dengan kompetitornya. Suatu sampel yang terdiri dari 40 bayi yang mengkonsumsi Gibbs Baby Food memiliki berat rata-rata 7,6 pounds dengan standar deviasi 2,3 pounds. Suatu sampel yang lain terdiri dari 55 bayi yang mengkonsumsi makanan merek kompetitor memiliki berat rata-rata 8,1 pounds dengan standar deviasi 2,9 pounds. Pada taraf signifikansi 0,05, dapatkah kita menyimpulkan bahwa bayi yang mengkonsumsi Gibbs Baby Food memiliki berat badan lebih rendah 0,5 pounds dibanding yang mengkonsumsi produk kompetitor? STATISTIKA – Latihan Latihan Bab 11: 4. Departemen riset yang berkantor di New Hampshire Insurance menyusun sebuah riset berkelanjutan tentang penyebab kecelakaan mobil, karakteristik pengemudi, dan lainnya. Suatu sampel random yang terdiri 400 catatan kepolisian menemukan bahwa 120 orang yang berstatus single mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir. Sedangkan dari sampel random yang terdiri 600 catatan kepolisian menemukan,150 orang yang berstatus menikah mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir. Dengan taraf signifikansi 0,05, apakah dapat disimpulkan bahwa proporsi orang yang single dan yang menikah yang mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir adalah berbeda? STATISTIKA – Latihan Latihan Bab 11: 17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk Nexus Media, Inc. Dia ingin membandingkan antara pengeluaran perjalanan harian antara staf penjualan dan staf pemeriksa anggaran. Dia mengumpulkan data sebagai berikut. Sales 131 135 146 165 136 142 Audit 130 102 129 143 149 120 139 Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan bahwa rata-rata pengeluaran perjalanan harian staf penjualan lebih besar dibanding staf pemeriksa anggaran? STATISTIKA – Latihan Latihan Bab 11: 21. Suatu artikel akhir di The Wall Street Journal membandingkan antara biaya untuk mengadopsi anak dari China dan Rusia. Dari 16 sampel kasus adopsi anak dari China membutuhkan biaya rata-rata $11.045 dengan standar deviasi $835. Sedangkan dari 18 kasus adopsi anak dari Rusia membutuhkan biaya rata-rata $12.840 dengan standar deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia lebih tinggi? STATISTIKA – Latihan Latihan Bab 11: 26. Pemerintah federal akhir-akhir ini mengadakan program pendanaan khusus untuk menurunkan angka kejahatan di daerah yang rawan. Suatu penelitian di 8 daerah rawan di Miami Florida menemukan data sebagai berikut. A B C D E F G H Sblm 14 7 4 5 17 12 8 9 Ssdah 2 7 3 6 8 13 3 5 Dapatkah program pemerintah tersebut dikatakan berhasil? Gunakan taraf signifikansi 0,01. STATISTIKA – Latihan Try This (don’t be fooled by a complex story) Secara teoritis, chip micro processor yang diproduksi dengan cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata dari 10 chip micro processor prototype tersebut mampu berfungsi normal ratarata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut dapat dinyatakan benar pada taraf signifikansi 5%? STATISTIKA – Latihan Latihan Bab 11: 17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk Nexus Media, Inc. Dia ingin membandingkan antara pengeluaran perjalanan harian antara staf penjualan dan staf pemeriksa anggaran. Dia mengumpulkan data sebagai berikut. Sales 131 135 146 165 136 142 Audit 130 102 129 143 149 120 139 Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan bahwa rata-rata pengeluaran perjalanan harian staf penjualan lebih besar dibanding staf pemeriksa anggaran? STATISTIKA – Latihan Latihan Bab 11: 21. Suatu artikel akhir di The Wall Street Journal membandingkan antara biaya untuk mengadopsi anak dari China dan Rusia. Dari 16 sampel kasus adopsi anak dari China membutuhkan biaya rata-rata $11.045 dengan standar deviasi $835. Sedangkan dari 18 kasus adopsi anak dari Rusia membutuhkan biaya rata-rata $12.840 dengan standar deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia lebih tinggi? STATISTIKA – Latihan Latihan Bab 11: 26. Pemerintah federal akhir-akhir ini mengadakan program pendanaan khusus untuk menurunkan angka kejahatan di daerah yang rawan. Suatu penelitian di 8 daerah rawan di Miami Florida menemukan data sebagai berikut. A B C D E F G H Sblm 14 7 4 5 17 12 8 9 Ssdah 2 7 3 6 8 13 3 5 Dapatkah program pemerintah tersebut dikatakan berhasil? Gunakan taraf signifikansi 0,01. STATISTIKA – Latihan CHAPTER TEST: Chapter 10; No. 50 Berdasarkan hasil penelitian American Pet Food Dealer Association, 63% rumah tangga di Amerika, memiliki hewan peliharaan. Sebuah laporan yang sedang disusun untuk editorial San Fransisco Chronicle. Sebagai bagian dari editorial, suatu sampel acak yang terdiri dari 300 rumah tangga, didapati 210 di antaranya memiliki hewan peliharaan. Apakah data tersebut bertentangan dengan data yang dimiliki American Pet Food Dealer Association? Jika diberikan level of significance 5% STATISTIKA – Latihan CHAPTER TEST: Chapter 11; No. 32 Suatu perusahaan pembuat komputer memiliki layanan hotline untuk customernya. Perusahaan tersebut menyadari bahwa kemampuan teknisi mereka untuk menyelesaikan masalah secara tepat dan tepat melalui layanan hotline berhubungan erat dengan citra perusahaan. Dari 35 telepon yang diterima berkaitan dengan masalah software, dibutuhkan waktu rata-rata 18 menit dengan standar deviasi 4,2 menit untuk memberikan solusi kepada customer. Sedangkan dari 45 telepon yang diterima berkaitan dengan masalah hardware, dibutuhkan waktu rata-rata 15,5 menit dengan standar deviasi 3,9 menit untuk memberikan solusi kepada customer. Pada taraf signifikansi 5%, dapatkan disimpulkan bahwa waktu yang dibutuhkan untuk menyelesaikan masalah yang berkaitan dengan software lebih lama dibandingkan untuk menyelesaikan masalah hardware? Berapakan nilai p-value nya? P-Value adalah peluang menolak H0 berdasarkan hasil observasi, padahal pada kenyataannya H0 adalah benar. STATISTIKA – Latihan CHAPTER TEST: Chapter 11; No. 33 Perusahaan Advil yang membuat obat pereda sakit kepala, meneliti formula baru yang diklaim lebih efektif. Untuk mengevaluasinya, formula baru tersebut dicobakan kepada 200 orang responden. Setelah satu bulan penggunaan, 180 orang responden berpendapat bahwa formula baru tersebut lebih efektif. Pada saat yang bersamaan, 300 orang responden diminta untuk menguji obat yang lama tetapi diberi tahu bahwa obat yang sedang mereka coba adalah “formula baru”. Dari kelompok responden ini, 261 responden menyatakan bahwa obat yang mereka coba lebih ampuh. Dengan level signifikansi 5%, dapatkah disimpulkan bahwa obat yang baru lebih efektif! STATISTIKA – Latihan Pengembangan LATIHAN PENGEMBANGAN: (Perhatikan Bagaimana Para Peneliti Menggunakan Cara Sederhana untuk Menguji Hal Berikut) Seorang Psikolog berpendapat bahwa kondisi stress akan memperlemah ingatan jangka pendek seseorang. Percobaan dilakukan terhadap 100 mahasiswa yang dipilih secara acak yang terbagi menjadi 2 kelompok, masing-masing 50 mahasiswa. Percobaan dilakukan dengan memperkenalkan 2 buah simpul tali A dan B untuk kegunaan yang sama dan sama dalam hal kesulitan pembuatannya. Dua minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan dengan simpul tali A, sedangkan mahasiswa pada kelompok kedua diperkenalkan dengan simpul tali B. Satu minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan dengan simpul tali B, dan sebaliknya. Setelah UAS yang stress, 100 Mahasiswa tersebut diminta untuk membuat simpul dengan kegunaan tersebut. Jika hasilnya adalah sebagai berikut: Membuat dengan cara Lama Baru 62 38 Dapatkah disimpulkan bahwa pendapat Psikolog tersebut benar? Sig. 0,05 STATISTIKA-Skala Ukur Data dan Korelasi T I PE S K A L A U K U R D A T A Skala Ukur Data Non-metric nominal ordinal metric interval ratio STATISTIKA-Skala Ukur Data dan Korelasi Skala Ukur Nominal Angka yang diberikan kepada obyek hanya sebagai label atau nama saja. Contoh: Nomor Telepon dan Nomor Pemain Sepak Bola STATISTIKA-Skala Ukur Data dan Korelasi Skala Ukur Ordinal Angka yang diberikan kepada suatu obyek memiliki urutan. Contoh: Pemenang Lomba F1 atau MotoGP, urutan juara kelas. STATISTIKA-Skala Ukur Data dan Korelasi Skala Ukur Interval Angka yang diberikan kepada objek memiliki semua sifat skala ukur ordinal, ditambah dengan sifat kesamaan jarak antara masing-masing pengukuran. TETAPI RASIO antar angka-angka tersebut tidak memiliki arti. Contoh: Derajat celcius atau fahreinheit, dan tanggal dalam kalender STATISTIKA-Skala Ukur Data dan Korelasi Skala Ukur Rasio Angka yang diberikan kepada obyek memiliki semua sifat dari skala ukur interval dan rasio antara angka-anka tersebut memiliki arti Contoh: Jarak dalam kilometer STATISTIKA-Skala Ukur Data dan Korelasi Skala Ukur Data Deskripsi Urutan Jarak Rasio Nominal Ya Tidak Tidak Tidak Ordinal Ya Ya Tidak Tidak Interval Ya Ya Ya Tidak Ratio Ya Ya Ya Ya STATISTIKA-Skala Ukur Data dan Korelasi Seringkali orang membicarakan keterkaitan antara suatu hal dengan hal lainnya. Korelasi adalah cara ilmiah yang akan memberikan informasi mengenai hubungan antara dua buah variabel. STATISTIKA-Skala Ukur Data dan Korelasi Berdasarkan Gambar Ilustrasi tersebut. Apa yang dapat anda katakan tentang korelasi: 1. Korelasi menyatakan kekuatan hubungan antara dua buah variabel. 2. Semakin kuat hubungan antara dua buah variabel, semakin tinggi nilai korelasinya. STATISTIKA-Skala Ukur Data dan Korelasi KORELASI SESUAI SKALA UKUR DATA Nominal: Phi coefficient Ordinal: Spearman’s correlation, Kendall’s correlation Interval-Ratio: Pearson Correlation STATISTIKA-Skala Ukur Data dan Korelasi NILAI KORELASI DATA -1.0 Nominal Ordinal Interval Ratio -0.6 -0.3 -0.1 0 +0.1 +0.3 +0.6 +1.0 Catatan Tanda – dan + menandakan arah hubungan. (+) semakin tinggi nilai suatu variabel semakin tinggi juga nilai variabel lainnya (-) semakin tinggi nilai suatu variabel semakin rendah nilai variabel lainnya STATISTIKA-Skala Ukur Data dan Korelasi Nominal: Phi coefficient Langkah menghitung Phi-Coefficient: 1. Buat Tabel Kontingensi 2. Hitung Nilai Chi-Square tabel tersebut dgn rumus: k χ2 = l ∑∑ (O i =1 j =1 ij − Eij ) 2 Eij 3. Hitung Phi-Coefficient menggunakan rumus: ϕ= χ 2 n Catatan: Oij = frekuensi observasi Eij = (ni. x n.j)/n frekuensi ekspektasi n = banyaknya sampel STATISTIKA-Skala Ukur Data dan Korelasi Nominal: Phi coefficient Contoh Kasus: Seorang ahli pemasaran ingin meneliti apakah co-hort (generasi) tertentu memiliki kecendrungan tertentu dalam jenis musik yang disukainya. ---adakah hubungan antara co-hort dan jenis musik tertentu--- Data yang dikumpulkan sbb: Musik Rock Non-Musik TOTAL Rock 80-an 43 9 52 90-an 44 4 48 13 100 TOTAL 87 STATISTIKA-Skala Ukur Data dan Korelasi Nominal: Phi coefficient Langkah Pengerjaannya: 1. Buat Tabel Kontingesi 2. Hitung nilai Chi-Squarenya: E11 = (n1. x n.1)/n = (52 x 87)/100 = 45.24 E21 = (n2. x n.1)/n = (48 x 87)/100 = 41.76 E12 = (n1. x n.2)/n = (52 x 13)/100 = 6.76 E22 = (n2. x n.2)/n = (48 x 13)/100 = 6.24 Chi-Square: χ 2 χ 2 = (43 − 45.24)2 / 45.24 + (44 − 41.76)2 / 41.76 + (9 − 6.76)2 / 6.76 + (4 − 6.24)2 / 6.24 = 1.778 STATISTIKA-Skala Ukur Data dan Korelasi Nominal: Phi coefficient Langkah Pengerjaannya: 3. Hitung phi-coefficient nya: ϕ= 1.778 = 0.133 100 Kesimpulannya: Ada hubungan yang lemah antara co-hort dan jenis musik tertentu STATISTIKA-Skala Ukur Data dan Korelasi Ordinal: Spearman Correlation Rumus rho-coefficient: n ρ = 1− 6∑ d i2 i =1 2 n(n − 1) ; d = different / beda ranking Contoh kasus: Seorang ahli pendidikan ingin mengetahui adakah hubungan antara IQ dan lamanya jam yang dihabiskan untuk menonton televisi dalam seminggu. Berikut adalah datanya: IQ (i) Hours of TV per week (t) 86 97 99 100 100 103 106 110 113 113 0 20 28 50 28 28 7 17 7 12 STATISTIKA-Skala Ukur Data dan Korelasi Ordinal: Spearman Correlation Langkah pengerjaan: Hours of TV per week (t) IQ (i) 86 97 99 100 100 103 106 110 113 113 0 20 28 50 28 28 7 17 7 12 rank (i) rank (t) 1 2 3 4.5 4.5 6 7 8 9.5 9.5 1 6 8 10 8 8 2.5 5 2.5 4 d2 d 0 4 5 5.5 3.5 2 4.5 3 7 5.5 0 16 25 30.25 12.25 4 20.25 9 49 30.25 Hitung Rumus: ρ = 1− 6(196) = −0.188 10(99) STATISTIKA-Skala Ukur Data dan Korelasi Ordinal: Spearman Correlation Langkah pengerjaan: Hitung Rumus: ρ = 1− 6(196) = −0.188 10(99) Kesimpulan: Terdapat korelasi yang lemah dan negatif antara IQ dan lamanya jam yang dihabiskan untuk menonton televisi selama seminggu STATISTIKA-Skala Ukur Data dan Korelasi Ordinal: Kendall Correlation Rumus tau-coefficient: τ= 2P 1 n(n − 1) 2 −1 Contoh kasus: Seorang ahli geniologi ingin meneliti, apakah ada hubungan antara tinggi dan berat badan seseorang. Data yang didapat ternyata tidak sempurna sehingga hanya mendapat data berbentuk ranking. Person A B C D E F G H Rank by Height 1 2 3 4 5 6 7 8 Rank by Weight 3 4 1 2 5 7 8 6 STATISTIKA-Skala Ukur Data dan Korelasi Ordinal: Kendall Correlation Langkah pengerjaan: P = 5 + 4 + 5 + 4 + 3 + 1 + 0 + 0 = 22 2(22) − 1 = 0.57 τ= 1 (8)(7) 2 Kesimpulan: Terdapat korelasi yang sedang antara tinggi dan berat badan seseorang STATISTIKA-Skala Ukur Data dan Korelasi Rasio: Pearson Correlation Rumus r coefficient: rxy = S xy S x .S y Catatan: n Sx = ∑ (x − x) i =1 n 2 i ; St.Dev. x n −1 n S xy = ∑ ( x − x )( y i =1 i n −1 i Sy = ∑(y i =1 i − y)2 n −1 − y) Kovarian antara x dan y ; St.Dev. y STATISTIKA-Skala Ukur Data dan Korelasi Rasio: Pearson Correlation Contoh kasus: Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu. Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah) dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut: Merk Biaya Iklan Nilai Penjualan A 40 385 B 20 400 C 25 395 D 20 365 E 30 475 F 50 440 G 40 490 H 20 420 Apakah ada hubungan antara biaya iklan dan nilai penjualan? I 50 560 J 40 525 K 25 480 L 50 510 STATISTIKA-Skala Ukur Data dan Korelasi Rasio: Pearson Correlation Langkah Pengerjaannya: Merk A B C D E F G H I J K L Biaya Iklan 40 20 25 20 30 50 40 20 50 40 25 50 Nilai Penjualan 385 400 395 365 475 440 490 420 560 525 480 510 (x − x) 5.83 -14.17 -9.17 -14.17 -4.17 15.83 5.83 -14.17 15.83 5.83 -9.17 15.83 Total ( x − x )2 ( y − y) 34.03 -68.75 200.69 -53.75 84.03 -58.75 200.69 -88.75 17.36 21.25 250.69 -13.75 34.03 36.25 200.69 -33.75 250.69 106.25 34.03 71.25 84.03 26.25 250.69 56.25 1641.67 Total ( y − y)2 4726.56 2889.06 3451.56 7876.56 451.56 189.06 1314.06 1139.06 11289.06 5076.56 689.06 3164.06 42256.25 STATISTIKA-Skala Ukur Data dan Korelasi Rasio: Pearson Correlation Langkah Pengerjaannya: Merk A B C D E F G H I J K L Biaya Iklan 40 20 25 20 30 50 40 20 50 40 25 50 Nilai ( x − x )( y − y ) Penjualan 385 -401.04 400 761.46 395 538.54 365 1257.29 475 -88.54 440 -217.71 490 211.46 420 478.13 560 1682.29 525 415.63 480 -240.63 510 890.63 5287.50 Total Hitung Rumus: Sxy= (5287.50)/11 Sx = sqrt(1641.67/11) Sy = sqrt(42256.25/11) r = 0.635 Kesimpulan: Ada hubungan yang kuat dan positif antara biaya iklan dan nilai penjualan STATISTIKA-Skala Ukur Data dan Korelasi Contoh kasus: Pikirkanlah kasus-kasus pemasaran di bawah ini, tentukan dengan skala ukur apa variabel-variabelnya dapat diukur dan korelasi apa yang tepat untuk variabelvariabel tersebut. - Market Share ada hubungannya dengan Brand Share - Kepuasan berhubungan dengan kualitas layanan - Preferensi berhubungan dengan keputusan membeli STATISTIKA-Regresi Linier Sederhana Jika analisis korelasi digunakan untuk mengukur arah dan kekuatan hubungan antara dua buah variabel. Maka kemudian muncul pertanyaan, apakah mungkin untuk menduga nilai dari suatu variabel, jika nilai variabel lainnya diketahui? ANALISIS REGRESI LINIER ADALAH JAWABANNYA STATISTIKA-Regresi Linier Sederhana ANALISIS REGRESI LINIER SEDERHANA Digunakan untuk menduga nilai suatu variabel, jika nilai variabel lainnya diketahui. Analisis regresi linier sederhana hanya melibatkan satu buah variabel independen (x), dan satu variabel dependen (y). VARIABEL INDEPENDEN Variabel yang menentukan nilai dari variabel dependen. BAGAIMANA DENGAN ARTI VARIABEL DEPENDEN? Catatan: Jika banyaknya variabel independen yang digunakan untuk menduga nilai variabel dependen banyaknya lebih dari satu maka digunakan analisis regresi linier berganda. STATISTIKA-Regresi Linier Sederhana Contoh kasus: Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu. Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah) dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut: Merk Biaya Iklan Nilai Penjualan A 40 385 B 20 400 C 25 395 D 20 365 E 30 475 F 50 440 G 40 490 H 20 420 I 50 560 J 40 525 K 25 480 Jika Equitas Merk dari masing-masing merk dianggap sama kuatnya, tentukan: variabel independen, variabel dependen, dan alasannya! L 50 510 STATISTIKA-Regresi Linier Sederhana BENTUK FUNGSI MATEMATIS DARI REGRESI LINIER SEDERHANA: UNTUK POPULASI Y = α + βX UNTUK SAMPEL Y = a + bx + e UNTUK MODEL PENDUGAAN yˆ = a + bx Y=variabel dependen X; x=variabel independen α;a=konstanta β;b=koefisien e=error fungsi ŷ =nilai duga dari variabel dependen STATISTIKA-Regresi Linier Sederhana BAGAIMANA MENDAPATKAN NILAI untuk konstanta (a) dan koefisien (b)? a = y − bx b= S xy S x2 y x = Mean dari y = Mean dari x S xy = Kovarian antara x dan y S x2 = Varian dari x STATISTIKA-Regresi Linier Sederhana UNTUK KASUS MUDAHMAN, BERAPAKAH NILAI konstanta (a) dan koefisien (b)? a = y − bx b= n S xy = S xy S x2 a = (453.750) − (3.221)(34.167) = 343.706 ∑ ( xi − x )( yi − y ) i =1 n −1 n S x2 = ∑ ( xi − x ) i =1 2 n −1 440.625 b = 149 .242 = 3.221 STATISTIKA-Regresi Linier Sederhana UNTUK KASUS MUDAHMAN, BAGAIMANAKAH MODEL PENDUGAAN (Estimation Model) –nya? ŷ = nilai duga dari nilai penjualan yˆ = 343.706 + 3.221x x = biaya iklan SEHINGGA: Merk Biaya Iklan Nilai Penjualan Nilai Duga dari Nilai Penjualan Merk Biaya Iklan Nilai Penjualan Nilai Duga dari Nilai Penjualan A B C D E F 40 20 25 20 30 50 385 400 395 365 475 440 472.546 408.126 424.231 408.126 440.336 504.756 G H I J K L 40 20 50 40 25 50 490 420 560 525 480 510 472.546 408.126 504.756 472.546 424.231 504.756 STATISTIKA-Regresi Linier Sederhana MENGUJI MODEL REGRESI LINIER SEDERHANA – Uji Serentak Digunakan untuk menguji: apakah model regresi linier sederhana tepat digunakan sebagai model pendugaan? H0 = model regresi linier sederhana tidak tepat digunakan sebagai model pendugaan H1 = model regresi linier sederhana tepat digunakan sebagai model pendugaan STATISTIKA-Regresi Linier Sederhana UJI SERENTAK: Menggunakan tabel ANOVA (Analysis of Varian) Source Sum of Degree of Mean Square Square (SS) Freedom (DF) (MS) ∑ (yˆ − yˆ ) n Regresi 2 i −1 1 n Error 2 ( ) e − e ∑ i−1 n-2 n Total 2 ( ) y − y ∑ i −1 n-1 F SSregresi MSregres MSerror 1 SSerror n−2 STATISTIKA-Regresi Linier Sederhana UJI SERENTAK: Untuk kasus Mudahman Source Sum of Degree of Mean Square Square (SS) Freedom (DF) (MS) Regresi 17031.74 1 17031.74 Error 25224.51 10 2522.45 Total 42256.25 11 F 6.75 Selanjutnya: F∞F(αv1 ,v2 ) 05 6.75∞F(10,.10 ) = 4.96 ∴ tolak H 0 model regresi linier sederhana tepat digunakan sebagai model pendugaan STATISTIKA-Regresi Linier Sederhana MENGUJI MODEL REGRESI LINIER SEDERHANA – Uji Parsial Jika dari ANOVA diketahui bahwa: model regresi linier sederhana tepat digunakan sebagai model pendugaan Maka, muncul pertanyaan: Apakah konstanta (a) dan koefisien (b) signifikan? “Everything should be made as simple as possible, but not simpler” Albert Einstein STATISTIKA-Regresi Linier Sederhana UJI PARSIAL untuk Konstanta: t= (a − α )S x n(n − 1) n Se ∞ ∑x i =1 (b − β )S x Se vs H1 : α ≠ 0 tα ,n −1 2 i UJI PARSIAL untuk Koefisien: t= H0 : α = 0 n −1 ∞ Catatan: Sx adalah standar deviasi bagi x Se adalah standar deviasi bagi error H0 : β = 0 tα ,n −1 vs H1 : β ≠ 0 STATISTIKA-Regresi Linier Sederhana UJI PARSIAL - konstanta: Untuk kasus Mudahman t= (343.706 − 0)(12.216) 12(11) ∞ t0.05,11 t = 7.675 ∞ t0.05,11 = 2.228 50.224 15650 ∴ tolak H 0 Nilai konstanta signifikan berbeda dari nilai 0 UJI PARSIAL - koefisien: Untuk kasus Mudahman t= (3.221 − 0)(12.216) 11 50.224 t = 2.598 ∞ t0.05,11 ∞ t0.05,11 = 2.228 ∴ tolak H 0 Nilai koefisien signifikan berbeda dari nilai 0 Sehingga Model Regresi Linier Sederhana-nya adalah yˆ = 343.706 + 3.221x STATISTIKA-Regresi Linier Sederhana Sehingga Model Regresi Linier Sederhana-nya adalah yˆ = 343.706 + 3.221x Selanjutnya: Mudahman ingin membuat merk sepatu yang baru. Jika Mudahman memiliki pos biaya iklan sebesar 50 juta rupiah. Ramalkanlah nilai penjualan yang mungkin didapatkan oleh Mudahman! yˆ = 343.706 + 3.221x yˆ = 343.706 + 3.221(50) = 504.756 Nilai penjualan yang mungkin didapatkan oleh Mudahman adalah 504.706 juta rupiah.