Azimmatul Ihwah • Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. • Ada cara yg lebih baik untuk menginterpretasi data yg akan dibahas kali ini. • Salah satu ukuran sebaran data (variabilitas) adalah jangkauan. • Jangkauan disebut juga range / rentangan. • Menghitung jangkauan adalah sangat mudah, yaitu mengurangkan nilai tertinggi dengan nilai terendah dari data. • Contoh skor dr salah 1 pemain mempunyai jangkauan = 13 – 7 = 6 • Temukan mean, nilai terendah, nilai tertinggi dan jangkauan dari data di bawah ini 1. 2. • Perhitungan mean, nilai terendah, nilai tertinggi dan jangkauan dari kedua data diatas menghasilkan nilai yg sama • Jangkauan pada data menghasilkan nilai yg sama, tetapi perhatikan histogram dr kedua data. Kalau dicermati lagi ternyata data tersebar secara berbeda. • Pada histogram data kedua, ternyata terjadi ‘loncatan’ dari skor 8 ke 10 dan dari skor 10 ke 12 karena skor 9 dan 11 mempunyai frekuensi 0. • Jangkauan hanya mendeskripsikan lebar dari data, namun tidak bisa menunjukkan apakah terdapat jarak dari skor data satu ke data berikutnya. • Banyak data mempunyai jangkauan yg sama, namun dari jangkauan kita hanya bisa tahu seberapa jauh jarak antara nilai terendah dan nilai tertinggi. Sehingga banyak informasi dari data yg tidak terjelaskan. • Jadi jangkauan merupakan cara yg paling mudah atau cara yg paling dasar untuk mengetahui sebaran data, namun sangat terbatas sekali untuk memberikan informasi mengenai sebaran yg sesungguhnya dalam data. • Salah satu cara untuk membuat mini range adalah mengurutkan data kemudian membagi menjadi 4 bagian yang sama. • Contoh • Kita dapat mengonstruksikan jangkauan dengan cara terlebih dahulu mencari nilai diantara dua bagian data • Kuartil adalah nilai yg memisahkan antar bagian data. • Kuartil terendah dinamakan kuartil pertama (π1 ) dan kuartil tertinggi dinamakan kuartil ketiga (π3 ). Sedangkan kuartil tengah (π2 ) merupakan median karena membagi data menjadi dua bagian yg sama. • Jangkauan dari nilai dalam kuartil terendah dan kuartil tertinggi dinamakan jangkauan interkuartil • Jangkauan interkuartil = π3 - π1 Jika banyak data n, maka • Mencari letak kuartil terendah : Pertama hitung n : 4. Selanjutnya, 1. Jika hasilnya bilangan bulat, nyatakan dgn k, maka mencari kuartil terendah adalah dgn mencari rata-rata dari data ke-k dan data ke-(k+1). 2. Jika hasilnya bukan bilangan bulat, maka bulatkan ke atas. Posisi kuartil terendah adalah pada hasil pembulatan tersebut. Contoh misal n = 9, maka 9 : 4 = 2.25 dibulatkan ke atas menjadi 3. Jadi kuartil terendah adalah data ke-3 • Mencari letak kuartil tertinggi : Pertama hitung 3n : 4. Selanjutnya, 1. Bila hasil 3n : 4 adlh bilangan bulat, nyatakan dgn m, maka nilai kuartil tertinggi adalah dengan mencari ratarata data ke-m dan data ke-(m+1). 2. Jika hasil 3n : 4 bukan bilangan bulat, maka bulatkan hasilnya ke atas. Posisi kuartil tertinggi adalah pada hasil pembulatan tersebut. • Determine range, lower and upper quartile, and interquartile range from the data below • Jika data disajikan dalam tabel distribusi frekuensi data berkelompok, maka kuartil ke-i dicari dgn rumus • πΎπ’πππ‘ππ ππ − π = π + π π π−πΉ 4 π , π = 1,2,3 dimana b adalah tepi bawah kelas kuartil ke-i, l adalah luas kelas, F adalah jumlah frekuensi sebelum kelas kuartil ke-i, f adalah frekuensi kelas kuartil dan N adalah banyaknya data. • Hitung π1 , π2 , π3 dan jangkauan interkuartil dari data di bawah ini • Box Plot pertama kali dikenalkan oleh American Statistician, John Tukey, pada tahun 1977 yg berguna untuk menampilkan lima summary dalam data yaitu median, kuartil , data maksimum dan minimum. • Boxplot merupakan diagram yg terdiri dari box dan whiskers, sehingga biasa disebut juga dgn box and whisker plot. • Box Plot dapat digambarkan dalam posisi vertical maupun horizontal. Interpretasi Boxplot: • Box mengandung 50% dari data. Tepi atas dari box disebut Q3 (75% dari data) dan tepi bawah dari box disebut Q1(25 % dari data). • Garis yang terdapat pada box disebut dengan median data (Q2). • Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum. • Titik yang berada di luar garis tersebut disebut dengan outlier. Outlier yaitu data yang terletak diluar jarak 1.5 * jangkauan interkuartil dari kuartil pertama dan ketiga. • Untuk boxplot horizontal, titik ujung garis whisker kiri adlh nilai terendah dari data yg lebih dari Q1-(1.5xjangkauan interkuartil), dan titik ujung garis whisker kanan adalah nilai tertinggi dari • Apabila jarak antara tepi bawah dan tepi atas ke median data tidak sama, berarti distribusi data tersebut tidak simetris (skewed). • Misal berikut ini terdapat data tinggi badan siswa dalam cm: 148.7 149.8 147.9 152.1 152.1 147.9 150.4 160.0 150.5 150.4 147.3 142.6 153.4 149.3 153.8 144.7 154.9 152.7 150.5 151.0 149.2 154.0 152.7 147.2 145.8 149.9 151.2 148.0 148.0 153.0 146.3 149.2 149.3 153.0 150.7 152.2 148.7 148.7 146.8 148.9 155.1 151.5 148.9 152.3 156.2 153.3 151.6 154.1 150.3 142.4 Dari data tersebut diperoleh beberapa statistik: Mean : 150.37 cm Median : 150.38 cm SE Mean: 0.46 St. Dev: 3.31 Nilai minimum: 142.4 cm Nilai maximum: 160 cm Q1: 148.49 cm Q3: 152.69 cm • Boxplot untuk data diatas adalah (Data maks < Q3+1.5xIQR) – Q3 (Data min > Q1-1.5XIQR)Q1 • Terdapat 1 outlier yaitu 160, karena 160 > π3 + 1.5 x 4.2 • Ketiga kuartil adalah nilai-nilai yg membagi sekumpulan data menjadi 4 bagian. • Persentil merupakan nilai yg membagi data dalam persentase dalam cara yg sama dgn kuartil. • Persentil ke-k disimbolkan dgn ππ adalah nilai pada k% dari data. • Jadi π1 adalah persentil ke-25, π2 adalah persentil ke-50 dan π3 adalah persentil ke-75 Jika ingin mencari nilai persentil ke-k dgn banyak data n, π pertama hitung π , selanjutnya 100 1. Jika hasilnya bilangan bulat, nyatakan dgn i, maka persentil ke-k adalah rata-rata dari data ke-i dan ke(i+1). 2. Jika hasilnya bukan bilangan bulat, maka posisi persentil adalah pada hasil pembulatan bilangan tersebut. Contoh kita punya 125 data. Untuk mencari persentil ke-10 125 hitung 10 = 12.5. Maka persentil ke-10 adalah data 100 ke-13 • Salah satu cara untuk mengetahui variabilitas data adalah melalui variansi. • Variansi juga adalah salah satu cara untuk mengukur sebaran data. • Variansi pada populasi disimbolkan dengan π 2 , dihitung dengan menggunakan rumus. π π₯−π 2 π untuk data pada tabel distribusi frekuensi data tunggal π π₯π −π 2 π untuk data pada tabel distribusi frekuensi data berkelompok, dgn π₯π merupakan titik tengah tiap kelas f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data. Untuk penyederhanaan penghitungan, variansi dapat dihitung menggunakan rumus • ππ₯ 2 π − ππ₯ 2 , π untuk data pada tabel distribusi frekuensi data tunggal • ππ₯π2 π − ππ₯π 2 , π untuk data pada tabel distribusi frekuensi data berkelompok, dengan π₯π adalah titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan N adalah banyak data. Variansi pada sampel disimbolkan dgn π 2 , dihitung dengan rumus. • π π₯−π₯ 2 π−1 untuk data pada tabel distribusi frekuensi data tunggal • π π₯π −π₯ 2 π−1 untuk data pada tabel distribusi frekuensi data berkelompok, dgn π₯π merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai atau frekuensi tiap kelas dan n adalah ukuran sampel. Penyederhanaan rumus variansi pada sampel • π ππ₯ 2 − ππ₯ 2 , π π−1 untuk data pada tabel distribusi frekuensi data tunggal. • π ππ₯π2 − π π−1 ππ₯π 2 , untuk data pada tabel distribusi frekuensi data berkelompok, dengan π₯π merupakan titik tengah tiap kelas. dan f adalah frekuensi tiap nilai/tiap kelas, n merupakan ukuran sampel. • Perhatikan bahwa variansi adalah rataan kuadrat jarak tiap nilai dari mean. • Ukuran yg benar-benar menyatakan jarak nilai dari mean adalah standar deviasi. • Standar deviasi merupakan akar dari variansi. • Standar deviasi pada populasi disimbolkan dengan π dan pada sampel disimbolkan dengan s. π = πππππππ π • Menunjukkan seberapa nilai menyimpang dari rataannya. • Standard scores atau bilangan baku merupakan ukuran yg bersifat individual. • Bilangan baku untuk setiap nilai/skor π₯π pada sampel dilambangkan dengan π§π dicari dgn menggunakan rumus π₯π − π₯ π§π = π • Hitung dan bandingkan standard scores dari kedua pemain basket berikut • Berikut standard scores dari kedua pemain dalam kurva • Jika skor kedua pemain distandardize, maka skor dari pemain kedua lebih tinggi dari pemain pertama. • Jadi meskipun pencapain skor pemain pertama lebih tinggi pada suatu pertandingan, tetapi dikatakan bahwa track record pencapaian prestasi pemain kedua relatif lebih baik dr pemain pertama.