BAB I PENGANTAR 1. 1 PENGERTIAN STATISTIK

advertisement
BAB I
PENGANTAR
1. 1 PENGERTIAN STATISTIK
Statistik berasal dari dua kata, yaitu: Statia yang merupakan istilah yang digunakan untuk
menyebutkan catatan administrasi pemerintahan di Amerika Serikat, dan Stochos yang berarti anak
panah (bahasa Yunani) atau sesuatu yang mengandung ketidak pastian
Secara umum para ahli mendefenisikan statistik sebagai ilmu yang membahas tentang pengambilan
data, pengolahan data sampai kesimpulan yang diperoleh dari perhitungan dan pengolahan data
tadi, serta membuat keputusan yang dapat diterima berdasarkan analisis.
Dalam bidang bisnis aplikasi statistik akan sangat bermanfaat diantaranya:




Akuntansi
Perusahaan akuntan publik seringkali menggunakan prosedur pengambilan sampel (contoh)
yang memenuhi kaidah-kaidah statistik ketika melakukan audit terhadap kliennya.
Keuangan (Finance)
Penasehat keuangan menggunakan berbagai jenis informasi statistik, termasuk priceearnings ratio dan hasil dividen, untuk membantu dalam memberikan rekomendasi
investasi.
Pemasaran
Pengambilan sampel masyarakat sebagai calon konsumen untuk diminta pendapat tentang
produk yang akan diluncurkan oleh suatu perusahaan seringkali menggunakan kaidah
statistik.
Ekonomi
Para ahli ekonomi menggunakan prosedur statistik dalam melakukan peramalan tentang
kondisi perekonomian pada masa yang akan datang.
1.2 DATA DAN VARIABEL
Statistik dalam prakteknya tidak bisa dilepaskan dari data yang berupa angka, baik itu dalam statistik
deskriptif yang menggambarkan data, maupun statistik inferensi yang melakukan analisis terhadap
data. Data adalah sekumpulan datum yang berisi fakta-fakta serta gambaran suatu fenomena yang
dikumpulkan, dirangkum, dianalisis dan selanjutnya diinterpretasikan. Variabel adalah: karakteristik
data yang menjadi perhatian (Dajan 1987)
Data yang baik harus memenuhi beberapa syarat berikut:
(1) Data harus obyektif, sesuai dengan keadaan sebenarnya (as it is).
(2) Data harus bisa mewakili (representative).
(3) Kesalahan baku (standard error) harus kecil
Suatu perkiraan (estimate) dikatakan baik (memiliki tingkat ketelitian tinggi) jika kesalahan
bakunya kecil.
Syarat (2) & (3) sering disebut sebagai syarat data yang dapat diandalkan (reliable).
(4) Harus tepat waktu (up to date).
(5) Harus relevan, yaitu data yang dikumpulkan harus ada hubungannya dengan masalah yang
akan dipecahkan (Anonim 2007)
Pembagian data adalah sebagai berikut:
(1) Data berdasarkan susunannya
o Data acak atau data tunggal: Adalah data yang belum tersusun atau dikelompokkan
ke dalam kelas-kelas interval.
o Data berkelompok: Adalah data yang tersusun atau dikelompokkan ke dalam kelaskelas interval. Data kelompok disusun dalam bentuk distribusi frekuensi atau tabel
frekuensi.
(2) Data berdasarkan jenisnya
o Data kualitatif: Adalah data yang tidak berbentuk bilangan. Data kualitatif
mempunyai ciri tidak bisa dilakukan operasi matematika, seperti penambahan,
pengurangan, eprkalian dan pembagian. Yang termasuk data kulitatif adalah data
nominal dan data ordinal.
o Data kuantitatif: Adalah data yang berbentuk bilangan. Jadi, berbagai operasi
matematika bisa dilakukan pada data kuantitatif. Yang termasuk data kuantitatif
adalah data interval dan data rasio.
(3) Data berdasarkan waktu pengumpulan
o Data berkala/time series: Adalah data yang terkumpul dari waktu ke waktu untuk
memberikan gambaran perkembangan suatu kegiatan.
o Data cross section: Adalah data yang terkumpul pada suatu waktu tertentu untuk
memberikan gambaran perkembangan keadaan atau kegiatan pada waktu itu.
(4) Data berdasarkan sumber pengambilannya
o Data primer : Adalah data yang diperoleh atau dikumpulkan oleh orang yang
melakukan penelitian atau yang bersangkutan yang memerlukannya. Data ini juga
disebut data asli atau data baru.
o Data sekunder: Adalah data yang diperoleh atau dikumpulkan oleh orang dari
sumber-sumber yang telah ada. Data itu biasanya diperoleh dari perpustakaan atau
dari laporan-laporan peneliti yang terdahulu. Data ini juga disebut sebagai data
tersedia.
(5) Data berdasarkan skala pengukuran
Skala pengukuran adalah peraturan penggunaan notasi bilangan dalam pengukuran.
o Data nominal: Adalah data yang diberikan pada objek atau kategori yang tidak
menggambarkan kedudukan objek atau kategori tersebut terhadap objek atau
kategori lainnya, tetapi hanya sekedar label atau kode saja. Data itu hanya
mengelompokkan objek atau kategori ke dalam kelompok tertentu. Data ini
mempunyai dua ciri, yaitu :
1. Kategori data bersifat saling lepas
2. Kategori data tidak disusun secara logis
Data bertipe nominal adalah data yang paling ‘rendah’ dalam level pengukuran data.
Jika suatu pengukuran hanya menghasilkan satu dan hanya satu-satunya kategori,
data tersebut adalah data nominal (data kategori). Contoh: Status Kewarganegaraan
( 1 untuk indonesia, 2 untuk Amerika,3 untuk China)
o
Data ordinal: Adalah data yang penomoran objek atau kategorinya disusun menurut
besarnya, yaitu dari tingkat terendah ke tingkat tertinggi atau sebaliknya dengan
jarak / rentang yang tidak harus sama. Data ini memiliki ciri seperti pada ciri data
nominal ditambah satu ciri lagi, yaitu kategori data dapat disusun berdasarkan
urutan logis dan sesuai dengan besarnya karakteristik yang dimiliki.
Data ordinal seperti pada data nominal, adalah juga data kualitatif namun dengan
level yang lebih ‘tinggi’ daripada data nominal. Jika pada data nominal semua data
kategori dianggap sama, maka pada data ordinal ada tingkatan data. Contoh: Tingkat
pendidikan, rangking
Data interval: Adalah data dimana objek/kategori dapat diurutkan berdasarkan
suatu atribut yang memberikan informasi tentang interval antara tiap objek/kategori
sama. Besarnya interval dapat ditambah atau dikurangi. Data ini memiliki ciri yang
sama dengan ciri pada data ordinal ditambah satu ciri lagi yaitu urutan kategori data
mempunyai jarak yang sama. Data interval menempati pengukuran data yang lebih
‘tinggi’ dari data ordinal, karena selain bisa bertingkat urutannya, juga urutan
tersebut bisa dikuantitatifkan. Data interval juga tidak memiliki nilai 0 absolut.
Contoh: Nilai test:
o Nilai A untuk nilai dari 80-100
o Nilai B untuk nilai dari 65-79
o Nilai C untuk nilai dari 55-64
o Nilai D untuk nilai dari 45-54
o Nilai E untuk nilai dari 0 - 44
o Data rasio: Adalah data yang memiliki sifat-sifat data nominal, data ordinal, dan data
interval, dilengkapi dengan titik nol absolut dengan makna empiris. Karena terdapat
angka nol maka pada data ini dapat dibuat perkalian atau pembagian. Angka pada
data menunjukkan ukuran yang sebenarnya dari objek/ kategori yang diukur. Data
rasio adalah data dengan pengukuran paling ‘tinggi’ di antara jenis data lainnya.
Contoh: suhu, berat badan (Murtiyasa, 2007)
(6) Data berdasarkan sifatnya
o Data diskret: Data yang didapat dengan cara menghitung.
o Data kontinu: Data yang dapat mempunyai nilai yang terletak dalam suatu interval
(7) Data berdasarkan sumbernya
o Data Internal: Data yang menggambarkan kegiatan atau keadaan di dalam suatu
organisasi.
o Data Eksternal : Data yang menggambarkan kegiatan atau keadaan di luar suatu
organisasi.
1.3 PEMBAGIAN STATISTIK
Statistik secara umum dibedakan atas dua topik kajian utama yaitu:
(1) Statistik deskriptif
Merupakan teknik statistik di mana di sini dilakukan pengambilan data, penyajian data tanpa
adanya kesimpulan. Beberapa hal yang perlu diperhatikan mengenai karakteristik data
adalah pemahaman tentang: cara-cara penyajian data (histogram, distribusi frekuensi),
Untuk letak atau ukuran kecenderungan (berbagai macam mean, berbagai macam median,
modus, akar mean kuadrat, persentil dan kuartil) dan ukuran deviasi (simpangan kuartil,
rentang, simpangan baku, mean absolut simpang,
variansi).
(2) Statistik inferensia
Teknik statistik mempunyai pengumpulan data, pengolahan serta penganalisaan terhadap
data yang diperoleh sehingga nantinya dapat diambil suatu kesimpulan. Statistik inferensi
meliputi perumusan hipotesis statistik (pernyataan tentang populasi), pemilihan uji yang
sesuai, penentuan taraf yang signifikan, analisa statistik. Statistik induktif meliputi 2 hal yaitu
o Teknik pengolahan data secara parametrik
o Teknik pengolahan data secara non parametrik
Dalam dua sesi pelatihan kedepan akan dibahas mengenai aplikasi statistik bagi kebutuhan bisnis
yang difokuskan pada statistik deskriptif dan statistik parametrik.
EVALUASI
(1) Jelaskan perbedaan antara populasi dan sampel !
(2) Berikut diberikan data informasi finansial dari beberapa sampel perusahaan asing untuk 1 Juli
2011
Company
A
B
C
D
E
F
G
H
I
a.
b.
c.
d.
e.
f.
Price ($)
18
10
13
84
14
28
37
22
28
Price/Earnings
per share
12.6
18.2
39.5
18.6
48.2
23.6
18.6
23.3
17.5
Annual Dividend ($)
Ratio
0.36
0.12
0
1.20
0
0.08
0.05
0.30
1.00
Sector
per share
services
basic materials
technology
financial
healthcare
technology
healthcare
consumer-noncyclical
consumer-cyclical
Ada berapa banyak element dalam set data tersebut?
Ada berapa banyak variabel dalam set data tersebut?
Manakah variabel-variabel yang tergolong kualitatif
Manakan variabel-variabel yang tergolong kuantitatif
Apakah data tersebut merupakan data cross sectional ataukah time series?
Untuk kesemua variabel diatas, berikan skala pengukuran yang digunakan.
BAB II
STATISTIK DESKRIPTIF
2.1 MEAN, MEDIAN, MODUS DAN UKURAN PEMUSATAN DATA LAINNYA
Nilai mean (rata-rata hitung) dari suatu himpunan N bilangan X1, X2, ..., XN ditunjukkan oleh X dan
dirumuskan sebagai berikut:
Median adalah data yang berada ditengah sampel atau populasisetalah data tersebut diurutkan,
sedangkan modus adalah data yang paling sering muncul atau data yang memiliki frekuensi terbesar.
Modus mungkin tidak ada atau tidak unik. Beberapa ukuran pemusatan data lainnya (Matjik dan
Sumertajaya 2002) adalah:
(1) Kuartil merupakan ukuran letak yang membagi data kedalam empat kelompok yang sama
besar
(2) Desil merupakan ukuran letak yang membagi data ke dalam 10 kelompok yang sama besar
(3) Persentil merupakan ukuran letak yang membagi data ke dalam 100 kelompok yang sama
besar
2.3 Simpangan baku dan ragam (varians)
Simpangan baku adalah deviasi atau penyimpangan suatu data terhadap rata-ratanya.
Simpangan baku dari N data dapat dirumuskan:
Varians suatu himpunan didefinisikan sebagai kuadrat simpangan baku (S2). Bilamana diperlukan
untuk membedakan simpangan baku populasi dari simpangan baku sampel yang berasal dari
populasi ini seringkali kita menggunakan lambang S untuk simpangan baku sampel dan σ untuk
simpangan baku populasi. Jadi S2 mewakili variansi sampel dan σ2 mewakili variansi populasi.
2.4 ANALISIS STATISTIK DESKRIPTIV DENGAN MICROSOFT EXCEL
Berdasarkan data pada halaman 9 maka beberapa fungsi analisis statistik deskriprtif dengan
menggunakan EXCEL adalah:
Hasil dari perhitungan tersebut:
Cara lebih mudah adalah dengan menggunakan fasilitas statistik deskriptif pada data analisis
yang telah disediakan oleh EXCEL
(3) Klik DATA > DATA ANALYSIS > DESCRIPTIVE STATISTICS
(4) Lengkapi semua kolom isian, masukkan sel A1:A21 kedalam input range, centangi Labels in
first row, taruh output range di salah satu sel bebas, dan centangi summary statistics,
confidence level for mean, Kth largest, kth smallest
(5) Hasilnya adalah sebagai berikut:
Perhatikan bahwa hasil diatas sama persis dengan langkah penyelesaian sebelumnya
dengan memasukkan fungsi statistik.
2.2 PENYAJIAN DATA
Penyajian data dapat dilakukan dengan dua cara yaitu: Tabel dan grafik.
(1) Tabel, dapat dibedakan atas:
o Tabel satu arah (one-way table)
o Tabulasi silang (lebih dari satu arah (two-way table), dst.)
o Tabel Distribusi Frekuensi
(2) Grafik:
o Batang (Bar Graph), untuk perbandingan/pertumbuhan
o
o
o
Lingkaran (Pie Chart), untuk melihat perbandingan (dalam persentase/proporsi)
Grafik Garis (Line Chart), untuk melihat pertumbuhan
Grafik Peta, untuk melihat/menunjukkan lokasi
Aplikasi Excel memudahkan kita untuk melakukan penyajian data. Yang akan dibahas adalah
pembuatan tabel frekuensi dan histogram
A. Pembuatan tabel distribusi frekuensi dilakukan dengan tahap-tahap berikut:
1. Untuk latihan, misalnya kita punya data umur dari hasil survai terhadap 20 orang konsumen
sebagai berikut:
20 18 25 30 34 32 35 17 22 21 38 17 28 30 35 36 32 22 30 32
2. Ketikkan kedalam excel, buat dalam satu kolom misalnya range A2-A21
3. Banyaknya kelas dihitung berdasarkan aturan sturges dimana jumlah kelas (k):
k = 1+(3,33 * log n)
= 1 + (3,33 * log 20) = 5
4. Range atau kisaran data dihitung dengan fungsi =MAX(A2:A21)-MIN(A2:A21) = 38 – 17 = 21
Sehingga lebar kelas adalah = 21/5 = 4,2 ≈ 5
Interval data misalnya: 15-19, 20-24, 25-29, 30-34, 36-49, tuliskan batas atas interval data
(nilai tertinggi setiap kelas) kedalam sel C2-C6
5. Setelah itu, di sel D2 ketikkan rumus berikut: =FREQUENCY(A2:A21,C2:C6).
6. blok range dari D2:D6, kemudian tekan F2 dan tekan CTRL+SHIFT+ENTER bersamaan. Maka
hasil distribusi frekuensi kita akan muncul pada range D2:D6.
7. Kita juga bisa menambahkan persentase di kolom berikutnya. Jumlahkan terlebih dahulu
distribusi frekuensi tersebut dan tempatkan jumlahnya pada sel D7. Kemudian pada sel E2
ketikkan rumus berikut: =(D2/D$7)*100. Selanjutnya, copy rumus tersebut sampai pada sel
Hasil pekerjaan kita akan tampak sebagai berikut:
Cara lebih mudah dapat dilakukan dengan menggunakan fasilitas Histogram pada EXCEL, sebagi
berikut:
5.
Setelah kita menentukan batas atas interval setiap kelas: klik Data >> Data Analysis >>
Histogram
6. Akan muncul kotak dialog:
7. Masukkan range A2-A21 di kotak INPUT RANGE, dan C2-C6 di kotak BIN RANGE, beri check
list pada bagian CUMULATIVE PERCENTAGE DAN CHART OUTPUT
8. Pilih output range di salah satu sel, atau pilih NEW WORKSHEET PLY jika ingin
menampilkannya di sheet terpisah atau NEW WORKBOOK jika inging menampilkannya di
Book baru.
9. Hasilnya akan tampak sebagai berikut
Secara tidak langsung anda telah berkenalan dengan histogram. Histogram merupakan
gambaran secara grafik dari distribusi frekuensi. Histogram atau histogram frekuensi ini
terdiri dari himpunan siku empat yang mempunyai :
o Alas pada sumbu mendatar (sumbu-x) dengan pusat markah (titik tengah kelas) dan
panjang sama dengan ukuran selang kelas.
o Luas sebanding terhadap frekuensi kelas.
Jika semua selang kelas mempunyai ukuran sama, tinggi segi empat sebanding
terhadap frekuensi kelas dan merupakan kebiasaan untuk mengambil tinggi secara
numerik sama dengan frekuensi kelas.
Dari suatu histogram, kita bisa mengetahui informasi mengenai data yang kita teliti, apakah
data tersebut homogen atau tidak, menyebar secara normal atau tidak dan sebagainya. Data
yang kita miliki terlihat tidak proporsional dalam hal ini tidak menyebar secara merata
dimana lebih banyak responden yang berumur 34-39 tahun.
Berdasarkan tampilan data pada histogram dikenal istilah kemencengan (skewness) dan
kurtosis (derajat kepuncakan)
b. Kemencengan
Skewness atau kemencengan adalah derajat ketaksimetrisan, atau
kejauhan dari simetri dari suatu distribusi. Berdasarkan kemencengannya, grafik
distribusi terbagi menjadi tiga, yaitu:
 Negatively skewed distribution, yaitu kurva frekuensi suatu distribusi yang
mempunyai ekor yang lebih panjang ke kiri dari maksimum pusat daripada yang ke
kanan, distribusi ini disebut juga menceng ke kiri atau mempunyai kemencengan
negatif.
 Positively skewed distribution, yaitu kurva frekuensi suatu distribusi yang
mempunyai ekor yang lebih panjang ke kanan dari maksimum pusat daripada yang
ke kiri, distribusi ini disebut juga menceng ke kanan atau mempunyai kemencengan
positif.
 Symmetric distribution, yaitu kurva frekuensi suatu distribusi yang mempunyai ekor
yang sama panjang dari maksimum pusat.
Untuk distribusi yang menceng, mean cenderung terletak pada sisi yang sama dari
modus sebagai ekor yang panjang. Jadi suatu ukuran tak simetri diperlihatkan oleh
selisih (mean-modus).
c. Kurtosis
Kurtosis adalah derajat kepuncakan dari suatu distribusi, biasanya diambil secara
relatif terhadap suatu distribusi normal. Berdasarkan kurtosisnya, grafik distribusi
terbagi menjadi tiga, yaitu:
 Leptokurtik, yaitu distribusi yang mempunyai puncak relatif tinggi.
 Platikurtik, yaitu distribusi yang mempunyai puncak mendatar.
 Mesokurtik, yaitu grafik yang berdistribusi normal yang puncaknya tidak terlalu
lancip atau berpuncak mendatar bentuk grafik seperti ini dikenal juga sebagai grafik
sebaran normal/distribusi normal
Grafik 1. Distribusi kemencengan (atas) dan jenis-jenis distribusi secara kurtosis
(bawah)
EVALUASI
Diketahui hasil penjualan roti produksi Lab. TPG Politani adalah selama 1 bulan adalah sebagai
berikut (dalam puluhan) adalah:
10 20 10 15 30 30 35 40 35 35 35 40 50 45 48 55 33 33 32 33 34 35 33 32 25 34 47 46 28 22
Buatlah analisis statistik deskriptif, lengkapi dengan penyajian data dalam tabel frekuensi dan
histogram. Beri kesimpulan anda!
BAB III
STATISTIK PARAMETRIK
3.1 PENGERTIAN
Metode parametrik merupakan cara pengujian hipotesis didasarkan pada anggapan bahwa sampel
acak diambil dari populasi normal. Kebanyakan uji tersebut masih dapat diandalkan bila
penyimpangannya dari kenormalan hanya sedikit, terutama sekali bila ukuran sampelnya besar.
Statistik parametrik merupakan salah satu teknik statistik inferensia dimana dilakukan pengumpulan
data, pengolahan serta penganalisaan terhadap data yang diperolah sehingga nantinya dapat
diambil suatu kesimpulan. Ciri-ciri data parametrik adalah:
1. Data berdistribusi normal
2. Merupakan data interval atau data rasio
3. Jumlah data lebih dari sama dengan 30 (n ≥ 30)
3.2 Sebaran Peluang Populasi
Sebaran peluang dalam analisis statistika menjadi sangat penting. Dengan diketahuinya sebaran
peluang pada satu populasi pengamatan memungkinkan seorang statistikawan akan dapat dengan
mudah melakukan inferensia.
Sebaran yang terpenting dalam sebaran peluang populasi adalah sebaran normal (Setiafindari 2011).
Sebaran normal merupakan fungsi kepekatan peluang kontine yang paling sering digunakan dalam
bidang statistika. Digunakan untuk menerangkan fenomena alam, industri, perdagangan, tingkat
pendapatan masyarakat, dsb. Ciri-ciri kurva kepekatan peluang normal adalah:
(1)
(2)
(3)
(4)
kurva bersifat simetrik dan setangkup pada titik x=μ
modus = median = mean pada titik x=μ
titik belok kurva pada x=μ ± σ
luas daerah di bawah kurva adalah 1
n(x)
0.3
0.25
0.2
0.15
0.1
0.05
0
-6
-4
-2
0
2
4
x
Grafik 2. Distribusi sebaran Normal
Sebaran Z dirumuskan sebagai berikut:
Z=
6
Dalam prakteknya jarang sekali orang begitu beruntung mengetahui ragam populasi yang digunakan
sebagai acuan dalam pengambilan contoh. Untuk contoh acak berukuran n ≥ 30 taksiran σ2 yang
baik adalah statistik s2. Tetapi bila n ≤ 30 nilai S berubah cukup besar dari contoh ke contoh dan nila
tersebut tidak lagi menyebar normal baku. Dalam hal ini kita menghadapi sebaran statistik yang akan
disebut sebagai t-student.
t=
̅
⁄
√
dimana nilai ini adalah peubahacak yang menyebar t-student dengan derajat bebas n-1
3.3 Jenis-jenis uji statistik parametrik
Beberapa jenis uji statistik parametrik yang paling populer digunakan adalah sebagai berikut:

Uji Kebaikan-Suai/Goodness of fit test
Uji Goodness of Fit digunakan untuk menentukan apakah suatu populasi mempunyai suatu
distribusi teoritis tertentu. Uji tersebut didasarkan atas baiknya kesesuaian yang ada antara
frekuensi terjadinya pengamatan pada sampel teramati dan frekuensi harapan yang diperoleh
dari distribusi yang dihipotesiskan.
Uji goodness of fit adalah uji hipotesis statistik yang digunakan untuk menaksir bentuk apakah
observasi X1,X2,…Xn adalah independen sampel dari distribusi khusus dengan fungsi distribusi F.
Uji goodness of fit dapat digunakan untuk menguji serangkaian uji hipotesis nol. Salah satu jenis
uji goodness of fit yang paling sering digunakan adalah Chi-square test. Chi-square test dapat
dirumuskan sebagai berikut:
  f  f e 2 
x 2   0

fe


Dimana  test statistics adalah setara dengan selisih kuadrat antara frekuensi yang diamati
(f0)dengan yang diharapkan (fe) dibagi banyaknya frekuensi yang diharapkan (fe) dari masingmasing pengamatan. (fe) merupakan frekuensi yang diharapkan atau jika H0 adalah benar.
2

Uji Anova
Anova sering disebut sebagai analisis varians. Sampel acak ukuran n diambil masing-masing dari
k populasi. Ke k populasi yang berbeda ini diklasifikasikan menurut perlakuan atau grup yang
berbeda. Dewasa ini istilah perlakuan digunakan secara umum dengan arti klasifikasi, apakah itu
kelompok, adukan, penganalisis, pupuk yang berbeda, atau berbagai daerah di suatu negara.
Pada Anova terdapat pengujian hipotesis nol bahwa rataan ke k populasi sama lawan tandingan
bahwa paling sedikit dua dari rataan ini tidak sama. Uji yang akan dipakai didasarkan pada
perbandingan dua taksiran bebas dari kesamaan variansi populasi σ2. Perlu dibandingkan ukuran
varians antara perlakuan yang sesuai dengan variansi dalam perlakuan, agar dapat ditemukan
perbedaan yang berarti dalam pengamatan akibat pengaruh perlakuan (Sunaryo 2010).
Analisis varians untuk klasifikasi satu arah (one way) dapat dilihat pada tabel di bawah ini yang
sama dengan tabel Anova.
Tabel 1.Analisis varians untuk one way ANOVA test

Uji F
Pada pengujian kesamaan dua variansi populasi σ12 dan σ22 yang ingin diuji adalah hipotesis nol
Ho bahwa σ12 = σ22lawan salah satu tandingan σ12 < σ22, σ12 > σ22, atau σ12 ≠ σ22. Untuk dua
sampel acak berukuran masing-masing n1 dan n2 dari dua populasi, nilai f untuk menguji σ12 =
σ22ialah nisbah :
dengan s12 dan s22 variansi yang dihitung dari dua sampel. Jika kedua populasiberdistribusi
hampir normal dan hipotesis nol benar maka nisbah f = s12/s22 suatu nilai distribusi – F dengan
derajat kebebasan v1 = n1 – 1 dan v2 = n2 – 1. Dengancdemikian daerah kritis berukuran α yang
sesuai dengan tandingan one way σ12< σ22, σ12 > σ22 adalah masing-masing f > f1-α (v1,v2) dan f >
fα- (v1,v2). Untuk tandingan dua pihak σ12 ≠ σ22, daerah kritis adalah f < f1-α (v1,v2) dan f > fα/2
(v1,v2).
Untuk mengambil keputusan disesuaikan dengan daerah kritis, bila nilai peluang berada
didaerah kritis maka ditolak dan begitupun sebaliknya. Dalam pengambilan keputusan dapat
dengan membandingkan nilai P hasil perhitungan dengan α. Jika P lebih besar daripada α, maka
Ho diterima dan begitupun sebaliknya.
 Uji T
Dalam uji menyangkut dua rataan keadaan yang lebih umum berlaku ialah keadaan dengan
variansi tidak diketahui. Bila si peneliti bersedia menganggap bahwa kedua distribusi normal dan
bahwa σ1 = σ2 = σ, maka uji t gabungan (sering disebut uji-t dua sampel) dapat digunakan. Uji
statistik tersebut berbentuk :
Untuk
Hipotesis dua arah (two way) ditolak apabila
Dapat juga dengan membandingkan nilai P perhitungan dengan taraf kepercayaan (0,05). Jika P
lebih besar maka Ho diterima, dan apabila sebaliknya maka Ho ditolak.
Pengamatan Berpasangan
Perhitungan selang kepercayaan untuk μ1 - μ2 dalam hal ini didasarkan pada peubah acak dengan
statistik hasil perhitungannya adalah:
3.4 PENGUJIAN STATISTIK PARAMETRIK DENGAN MICROSOFT EXCEL
(1) sebaran normal
Misal X menyebar normal dengan nilai tengah 10 dan ragam 4, hitunglah peluang berikut:
a. P(X>10)
b. P(X<5)
c. P(4<x<8)
Langkah penyelesaian menggunakan EXCEL adalah:
Masukkan formula: =NORMDIST(X;MEAN,STDEV;CUMULLATIVE)
Dimana NORMDIST = fungsi matematika untuk penghitungan sebaran peluang; X = nilai yang
ingin kita uji, MEAN = rataan/nilai tengah, STDEV = standar deviasi dalam hal ini adalah akar
dari ragam; CUMULLATIVE adalah fungsi logika yang kita gunakan dalam hal ini TRUE atau
FALSE,
Jawaban:
a. P(X>10) = NORMDIST(10;10;2;TRUE) = 0,5
b. P (X<5) = NORMDIST (5;10;2;TRUE) = 0,0062
c. P (4<X<8) = P(X<8) –P(X>4) = NORMDIST(8;10;2;TRUE)-NORMDIST(4;10;2;TRUE) =0,158
Untuk melihat nilai Z sebagaimana tabel Z maka dapat digunakan fungsi =NORMSDIST(Z)
Contoh nilai dari z = -1,91 = NORMSDIST(1,91) =0,0280
(2) Uji Chi-square
Kaos Sepak bola
Terjual
diharapkan
terjual
Ch.
Owen Beckham Ronaldo
Ronaldinho Zidane
Ronaldo
30
60
40
20
50
70
50
50
50
50
50
50
Berdasakan data tersebut Uji Chi Square adalah:
=CHITEST(array1;array2)
= ..... ?
(3) Uji F
Sebuah perusahaan telekomunikasi berhasil menemukan alat baru untuk mempermudah koneksi
internet mobile. Untuk mengetahui efektifitas alat baru tersebut, dilakukan uji coba pada 10 lokasi
berbeda dengan membandingkannya dengan alat yang diproduksi oleh perusahaan saingan mereka
yang diketahui memiliki kemampuan koneksi paling baik. Tingkat kecepatan pengiriman data (Kbps)
disajikan dalam tabel berikut:
Langkah penyelesaiannya adalah:
a. Pilih F-test Two-sample for Variances pada Analysis Tools di Data Analysis:
b. Masukkan input kedua pasang data tersebut
c. Klik ok dan hasilnya adalah sebagai berikut:
F-Test Two-Sample for Variances
Lama
Baru
Mean
107,6
107,5
Variance
444,2667 429,1667
Observations
10
10
Df
9
9
F
1,035184
P(F<=f) one-tail
0,479882
F Critical one-tail 3,178893
Dengan demikian terima H0 bahwa alat baru yang digunakan memiliki kemampuan yang sama
dengan alat lama yang diproduksi oleh perusahaan lain.
(4) Uji T
Dengan menggunakan data yang sama maka Uji T dapat dilakukan dengan memilih analysis tools
yang sesuai, misalnya DATA > DATA ANALYSIS > t-Test: Paired Two Sample for Means. Hasilnya
adalah:
t-Test: Paired Two Sample for Means
Lama
Baru
107,6
107,5
444,2667 429,1667
10
10
0,926241
Mean
Variance
Observations
Pearson Correlation
Hypothesized
MeanDifference
0
Df
9
t Stat
0,039361
P(T<=t) one-tail
0,484731
t Critical one-tail
1,833113
P(T<=t) two-tail
0,969462
t Critical two-tail
2,262157
Hasilnya juga menunjukkan bahwa nilai tengah kedua kumpulan data tersebut tidak berbeda
nyata, dengan begitu terima H0
(5) Uji anova
Misalkan suatu perusahaan pupuk organik ingin mengujikan respon tinggi sawi terhadap pupuk
organik formulasi baru yang diberikan:
a. Masukkan data diatas kedalam EXCEL, untuk kolom mewakili perlakuan dan untuk baris
mewakili ulangan.
b. Pilih Data > Data analysis > Anova-single factor
c. Kemudian isikan input range dan output range, pada pilihan grouped by, pilih coloumns
d. Klik OK dan hasilnya adalah sebagai berikut:
Anova:
Single Factor
SUMMARY
Groups
Column 1
Column 2
Column 3
Column 4
Column 5
ANOVA
Source of Variation
Between Groups
Within Groups
Count
5
5
5
5
5
SS
223,34
84
Sum
Average Variance
156
31,2
4,325
177
35,4
3,3
182,5
36,5
7,5
198,5
39,7
3,2
163
32,6
2,675
df
4
20
MS
F
P-value
F crit
55,835 13,29405 0,0000192283991718726 2,866081
4,2
Total
307,34
24
Hasilnya dapat disimpulkan bahwa minimal terdapat 1 perlakuan dalam hal ini jenis pupuk organik
yang efektif meningkatkan pertumbuhan tanaman sawi atau dengan kata lain tolak H0
2. Analisis Anova dua faktor dengan ulangan
Di bawah ini adalah hasil survei terhadap banyaknya pembelian voucher pulsa yang biasa dibeli dan
bentuk pengisian voucher di tiga kounter yang dipilih secara acak:
voucher
perusahaan
10
20
15
50
100
Elektrik
96
92
92
74
50
98
88
94
74
50
94
90
84
68
54
non-elektrik
90
88
78
0
0
94
92
82
0
0
92
94
74
0
0
Analisis anova dua faktor dengan ulangan adalah sebagai berikut:
(1) Input data diatas ke dalam EXCEL
(2) Klik DATA > DATA ANALYSIS > Anova: Two-Factor With Replication
(3) Masukkan data input, PENTING : RANGE DATA INPUT HARUS MENGANDUNG 1 BARIS
LABEL:
Perhatikan pada input range dimulai
dari sel A@
(4) Masukkan angka 3 pada Rows per sample sesuai jumlah ulangan
(5) Aplha 0,05 menunjukkan selang kepercayaan
(6) Klik output range di bagian kosong dari work sheet atau jika ingin menampilkannya pada
sheet baru/book baru klik di New Worksheet ply atau New Workbook
(7) Klik OK
(8) Hasilnya adalah sebagai berikut
Anova: Two-Factor With Replication
SUMMARY
10
20
15
3
288
96
4
3
270
90
4
3
270
90
28
3
3
276
274
92 91,33333
4 9,333333
3
234
78
16
6
6
564
544
94 90,66667
8 5,866667
6
504
84
60,8
50
100 Total
elektrik
Count
Sum
Average
Variance
3
3
15
216
154
1198
72 51,33333 79,8666667
12 5,333333 295,12381
non-elektrik
Count
Sum
Average
Variance
3
0
0
0
3
15
0
784
0 52,2666667
0 1982,20952
Total
Count
Sum
Average
Variance
ANOVA
Source of
Variation
Sample
Columns
Interaction
Within
SS
5713,2
25459,2
6258,133
165,3333
Total
37595,87
Df
1
4
4
20
6
6
216
154
36 25,66667
1560 792,6667
MS
F
5713,2 691,112903
6364,8 769,935484
1564,533 189,258065
8,266667
P-value
F crit
5,53E-17 4,35124348
1,37E-21 2,8660814
1,37E-15 2,8660814
29
Tabel SUMMARY merupakan hasil ringkasan terhadap jenis pengisian pulsa terhadap jumlah pulsa
yang dibeli. Hasil analisis ANOVA dua faktor terlihat bahwa baik faktor tunggal jenis pengisian pulsa,
nominal pulsa maupun interaksi antara keduanya berpengaruh terhadap keputusan pembelian pulsa
dari pembeli di ketiga kounter tersebut. Sehingga tolak H0
EVALUASI
1. 5 macam cat diuji ketahanannya terhadap perubahan cuaca, hasil persentase kerusakannya
terhadap cuaca kemudian dicatat sebagai berikut:
Rep
Sherwin
Fuller
Frazee
Pratt
SanLuis
1
13
15
28
16
33
2
19
19
22
10
41
3
9
27
25
20
29
Buatlah analisis sidik ragam (ANOVA) dari ke-5 macam cat tersebut
2. Misalkan X menyebar normal dengan nilai tengah 25 dan ragam 16. Hitunglah :
a. P (X < 10)
b. P (X>50)
c. P (20 < X <35)
3. Diketahui kelompok data hasil penjualan dua sales motor selama 9 bulan dibawah ini:
A
20
25
30
31
20
24
15
20
16
B
22
24
32
40
30
22
14
25
19
Manakah diantara keduanya yang berhak mendapatkan bonus dari perusahaan? Berikan
argumen anda berdasarkan uji statistik yang anda lakukan!
4. Hasil program penurunan berat badan dari suatu perusahaan kecantikan diperoleh tingkat
penurunan berat badan sebagai berikut:
Diet
Olahraga
Tanpa
3 x seminggu
Setiap hari
Tanpa
-5
-1
5
-2
9
0
0
3
3
3
4
5
Rendah Kalori
1
2
6
3
1
2
-2
3
4
6
5
8
Rendah Karbo
-1
3
2
0
6
4
4
12
8
3
7
4
Modifikasi cairan
0
6
5
2
11
9
4
8
7
2
2
4
Apakah ada hubungan antara berolahrhga dengan penurunan berat badan?
DAFTAR PUSTAKA
Anonymous.
2007.
Slide
Statistik
Ekonomi.
(Online).
https://doc-14-0odocs.googleusercontent.com/docs/securesc/q5pgn8nd1eaf9hua7juvenocqnb4pshi/ef60opm
473iqgmq6tec6tnsqumk0ogbg/1319715900000/07613135239192579928/07613135239192
579928/1eSlD6hw0CQcLmsfmrbMEvT9N0aHEzxoynWTyqwkY1U1hjMfvC5bjE7M0Nw?e=do
wnloadnonce=r70acntinbb9g&user=0.7613135239192579928&hash=2vhl9npg3pmp17o8ta
o6embv75iagk3b. Diakses 27 Oktober 2011
Dajan,Anto. (1987). Pengantar Metode Statistik, Jilid 1 & 2. 11. LP3ES. Jakarta.
Matjik, A.A dan Sumartejaya, M. 2002. Perancangan Percobaan. IPB Press. Bogor.
Setiafindari, W. Slides Distirbusi Normal. (online) http://amriarul.files.wordpress.com/2011/06/
distribusi-normal.ppt. diakses 27 Oktober 2011
Sunaryo, S. 2010. Modul Statistika Bisnis-Statistika inferensia (ANOVA). Program Magister
Manajemen Teknik. Institut Teknologi 10 November, Surabaya.
Download