Azimmatul Ihwah • Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. • Ada cara yg lebih baik untuk menginterpretasi data yg akan dibahas kali ini, yaitu variabilitas (ukuran sebaran/dispersi) • Seorang pemain pada suatu tim basket mengalami cedera, jadi pelatih tim tersebut ingin mencari pemain baru untuk menggantikan pemain yg cedera itu. Ada tiga kandidat yg didapat dr seleksi yg dilakukan. Berikut adalah skor point yg didapat ketiga pemain dalam setiap pertandingan yg pernah diikuti. • Berapa mean, median dan modus masing-masing pemain tersebut? • Pemain mana yg akan dipilih oleh pelatih tim basket untuk menggantikan pemain yg cedera? • Mean, median dan modus masing-masing pemain adalah sama yaitu 10. • Hasil dari penghitungan mean, median dan modus memang menghasilkan sesuatu yg sama, tetapi kalau dicermati lg pada skor masing-masing pemain memiliki pencapaian yg berbeda. • Contohnya pada pemain kedua dan ketiga. Pemain ketiga pernah hanya memperoleh skor 3 pada 2 kali pertandingan, tetapi pemain kedua selalu menghasilkan skor di atas 7 pada pertandingan yg pernah diikuti. • Kita dapat mengukur pusat dari data di atas dgn melihat mean. Tetapi mean tidak bisa menjelaskan seberapa menyebar data itu • Salah satu jangkauan. ukuran sebaran data (variabilitas) adalah • Jangkauan disebut juga range / rentangan. • Menghitung jangkauan adalah sangat mudah, yaitu mengurangkan nilai tertinggi dengan nilai terendah dari data. • Contoh skor dr salah 1 pemain mempunyai jangkauan = 13 – 7 =6 • Temukan jangkauan dari data di bawah ini 1. 2. • Perhitungan mean, nilai terendah, nilai tertinggi dan jangkauan dari kedua data diatas menghasilkan nilai yg sama • Jangkauan pada data menghasilkan nilai yg sama, tetapi perhatikan histogram dr kedua data. Kalau dicermati lagi ternyata data tersebar secara berbeda. • Pada histogram data kedua, ternyata terjadi ‘loncatan’ dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11 mempunyai frekuensi 0. • Jangkauan hanya mendeskripsikan lebar dari data, namun tidak bisa menunjukkan apakah terdapat jarak dari skor data satu ke data berikutnya. • Banyak data mempunyai jangkauan yg sama, namun dari jangkauan kita hanya bisa tahu seberapa jauh jarak antara nilai terendah dan nilai tertinggi. Sehingga banyak informasi dari data yg tidak terjelaskan. • Jadi jangkauan merupakan cara yg paling mudah atau cara yg paling dasar untuk mengetahui sebaran data, namun sangat terbatas sekali untuk memberikan informasi mengenai sebaran yg sesungguhnya dalam data. • Bila kurva data yg kita punya seperti dibawah ini, salah satu cara untuk mengatasinya adlh dgn membuat mini range / jangkauan kecil • Salah satu cara untuk membuat mini range adalah mengurutkan data kemudian membagi menjadi 4 bagian yang sama. • Contoh • Kita dapat mengonstruksikan jangkauan dengan cara terlebih dahulu mencari nilai diantara dua bagian data • Kuartil adalah nilai yg memisahkan antar bagian data. • Kuartil terendah dinamakan kuartil pertama (π1 ) dan kuartil tertinggi dinamakan kuartil ketiga ( π3 ). Sedangkan kuartil tengah (π2 ) merupakan median karena membagi data menjadi dua bagian yg sama. • Jangkauan dari nilai dalam kuartil terendah dan kuartil tertinggi dinamakan jangkauan interkuartil • Jangkauan interkuartil = π3 - π1 Jika banyak data n, maka • Mencari letak kuartil terendah : Pertama hitung n : 4. Selanjutnya, 1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari kuartil terendah adalah dgn mencari rata-rata dari data ke-k dan data ke-(k+1). 2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas. Posisi kuartil terendah adalah pada hasil pembulatan tersebut. Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas menjadi 3. Jadi kuartil terendah adalah data ke-3 • Mencari letak kuartil tertinggi : Pertama hitung 3n : 4. Selanjutnya, 1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka nilai kuartil tertinggi adalah dengan mencari rata-rata data ke-m dan data ke-(m+1). 2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan tersebut. • Jika data disajikan dalam tabel distribusi frekuensi data berkelompok, maka kuartil ke-i dicari dgn rumus • πΎπ’πππ‘ππ ππ − π = π + π π π−πΉ 4 π , π = 1,2,3 dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f adalah frekuensi kelas kuartil dan N adalah banyaknya data. Simpangan Kuartil Qd = simpangan kuartil Q3 = nilai kuartil ke-3 Q1 = nilai kuartil ke-1 Simpangan mutlak rata-rata (mean deviation) Data tidak berkelompok Data berkelompok Xm,i = nilai tengah dari interval kelas k = jumlah interval kelas n = banyaknya data fi = frekuensi dalam interval • Box Plot pertama kali dikenalkan oleh American Statistician, John Tukey, pada tahun 1977 yg berguna untuk menampilkan lima summary dalam data yaitu median, kuartil , data maksimum dan minimum. • Boxplot merupakan diagram yg terdiri dari box dan whiskers, sehingga biasa disebut juga dgn box and whisker plot. • Box Plot dapat digambarkan dalam posisi vertical maupun horizontal. Interpretasi Boxplot: • Box mengandung 50% dari data. Tepi kanan dari box disebut Q3 (75% dari data) dan tepi kiri dari box disebut Q1(25 % dari data). • Garis yang terdapat pada box disebut dengan median data (Q2). • Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum (jika tidak ada outlier) • Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari kuartil pertama dan ketiga. • Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan titik ujung garis whisker kanan adalah nilai tertinggi dari data yg kurang dari Q3+(1.5xjangkauan interkuartil) • Apabila jarak antara tepi kiri dan tepi kanan ke median data tidak sama, berarti distribusi data tersebut tidak simetris (skewed). • Misal berikut ini terdapat data tinggi badan siswa dalam cm: 148.7 149.8 147.9 152.1 152.1 147.9 150.4 160.0 150.5 150.4 147.3 142.6 153.4 149.3 153.8 144.7 154.9 152.7 150.5 151.0 149.2 154.0 152.7 147.2 145.8 149.9 151.2 148.0 148.0 153.0 146.3 149.2 149.3 153.0 150.7 152.2 148.7 148.7 146.8 148.9 155.1 151.5 148.9 152.3 156.2 153.3 151.6 154.1 150.3 142.4 Dari data tersebut diperoleh beberapa statistik: Mean : 150.37 cm Median : 150.38 cm SE Mean: 0.46 St. Dev: 3.31 Nilai minimum: 142.4 cm Nilai maximum: 160 cm Q1: 148.49 cm Q3: 152.69 cm • Boxplot untuk data diatas adalah (Data maks < Q3+1.5xIQR) (Data min > Q11.5XIQR) • Terdapat 1 outlier yaitu 160, karena 160 > π3 + 1.5 x 4.2 • Buat Boxplot dari skor point kedua pemain basket berikut (buat dalam satu gambar) • Pemain mana yg akhirnya dipilih untuk menggantikan pemain yg cedera? • Jika akhirnya pelatih memilih pemain pertama untuk menggantikan pemain yg cedera dlm tim berdasarkan median maupun jangkauan interkuartil, namun problemnya adalah kedua ukuran data tersebut hanya dapat mengukur seberapa jauh jarak skor tertinggi dan skor terendah. Pelatih tersebut ingin juga mengetahui seberapa stabil kondisi pemain dgn melihat skornya. • Terdapat ukuran yg lebih tepat untuk mengukur seberapa dekat skor yg diperoleh dgn mean. Dengan kata lain kita ingin mengetahui seberepa besar variabilitas data. • Salah satu cara untuk mengetahui variabilitas data adalah melalui variansi. • Variansi juga adalah salah satu cara untuk mengukur sebaran data. • Variansi pada populasi disimbolkan dengan π 2 , dihitung dengan menggunakan rumus. π π₯−π 2 untuk data pada tabel distribusi frekuensi data tunggal π π π₯π −π 2 untuk data pada tabel distribusi frekuensi data π berkelompok, dgn π₯π merupakan titik tengah tiap kelas f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data. Untuk penyederhanaan penghitungan, variansi dapat dihitung menggunakan rumus • • ππ₯ 2 π ππ₯ 2 , π ππ₯π2 ππ₯π 2 , π − data tunggal untuk data pada tabel distribusi frekuensi − untuk data pada tabel distribusi frekuensi π data berkelompok, dengan π₯π adalah titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data. Variansi pada sampel disimbolkan dgn π 2 , dihitung dengan rumus. • π π₯−π₯ 2 π−1 untuk data pada tabel distribusi frekuensi data tunggal • π π₯π −π₯ 2 π−1 untuk data pada tabel distribusi frekuensi data berkelompok, dgn π₯π merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n adalah ukuran sampel. Penyederhanaan rumus variansi pada sampel • π ππ₯ 2 − ππ₯ 2 , π π−1 untuk data pada tabel distribusi frekuensi data tunggal. • π ππ₯π2 − π π−1 ππ₯π 2 , untuk data pada tabel distribusi frekuensi data berkelompok, dengan π₯π merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran sampel. • Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap nilai dari mean. • Ukuran yg benar-benar menyatakan jarak nilai dari mean adalah standar deviasi. • Standar deviasi merupakan akar dari variansi. • Standar deviasi pada populasi disimbolkan dengan π dan pada sampel disimbolkan dengan s. π = πππππππ π • Menunjukkan seberapa nilai menyimpang dari rataannya. • Standard scores atau bilangan baku merupakan ukuran yg bersifat individual. • Bilangan baku untuk setiap nilai/skor π₯π pada sampel dilambangkan dengan π§π dicari dgn menggunakan rumus π₯π − π₯ π§π = π • Hitung dan bandingkan standard scores dari kedua pemain basket berikut • Berikut standard scores dari kedua pemain dalam kurva • Jika skor kedua pemain distandardize, maka skor dari pemain kedua lebih tinggi dari pemain pertama. • Jadi meskipun pencapain skor pemain pertama lebih tinggi pada suatu pertandingan, tetapi dikatakan bahwa track record pencapaian prestasi pemain kedua relatif lebih baik dr pemain pertama. ο Diketahui besarnya pinjaman 7 orang nasabah suatu bank sbb. (dalam juta Rp). ο Nama A B C D Pinjaman 12.57 14.65 25.50 5.75 E F G 11.80 16.55 15.89 Selidiki, apakah terdapat nasabah yang pinjamannya cukup sedikit atau sangat besar dibandingkan dengan nasabah lainnya 36