KONSEP TEORI STATISTIK

advertisement
KONSEP TEORI STATISTIK
Analisa data adalah bagian penting dalam penelitian. Melalui analisa data, nantinya
akan diperoleh jawaban dari pertannyaan penelitian. Bagi perawat, tahap analisa data dalam
penelitian ini mungkin akan menjadi suatu tahap yang mencemaskan daripada tahap lainnya
karena berhubungan dengan pengetahuan statistic yang masih dirasa kurang. Untuk itu, dalam
hal penggunaan analisa data dalam penelitiannya, maka perawat harus bisa : (1)
mengidentifikasi penggunaan statistic (2) mempertimbangkan apakah penggunaan statistic
tepat untuk menguji hipotesa, menjawab pertanyaan dan objektivitas penelitian dan apakah
data yang ada perlu dianalisa (3) memahami hasil analisa data (4) mempertimbangkan apakah
bacaan hasil penelitian dari analisa data tepat (5) dan mengevaluasi arti klinis dari penelitian
Dalam bab ini akan menjelaskan mengenai tujuan analisa statistic, proses jalannya
analisa data, pemilihan proses analisa data yang tepat untuk penelitian dan sumber analisa
data.
TUJUAN ANALISA STATISTIK
Statistik dapat digunakan untuk berbagai macam tujuan diantaranya untuk membuat
kesimpulan, mengexplore/mengembangkan makna penyimpangan data, membandingkan
sacara deskriptiv, menguji/mengetes usulan hubungan dalam sebuah model teoritis,
mengambil kesimpulan sementara bahwa sample menunjukan seluruh populasi, menilai
causality, memprediksi, menduga sample menjadi model secara teoritis.
Statistician seperti John Tukey (1977) membagi peran statistic menjadi 2 bagian yaitu
mengembangkan analisa data dan memperkuat analisa data.Exploratori analisa data
digunakan untuk mendapatkan kesimpulan awal dari data kasar dan untuk melihat apakah ada
data yang tersembunyi. Sedangkan Confirmatory analisa data digunakan dalam statistic
inferensial, dimanan peneliti akan menarik kesimpulan dari populasi berdasarkan bukti atau
data-data dari sample.
PROSES ANALISA DATA
Ada beberapa tahapan dalam analisa data yaitu (1) mempersiapkan data, (2)
mendeskripsikan sample, (3) menguji reliabilitas pengukuran, (4) Exploratory analisa data,
(5) Confirmatory analisa data dengan hipotesa, pertanyaan dan objektivitas penelitian dan (6)
analisa post hoc
Walaupun semua tahapan ini seharusnya dilalui dalam proses penelitian, namun
banyak peneliti – peneliti pemula tidak merencanakan secara detail mengenai proses analisa
data ini hingga data dikumpulkan. Ini adalah contoh peneliti yang memiliki teknik penelitian
yang lemah. Peneliti ini akan sering mengumpulkan data yang tidak berguna atau bahkan
gagal dalam mengumpulkan data yang dibutuhkan untuk menjawab pertanyaan penelitian.
Untuk itu, baiknya perencanaan analisa data dilakukan selamam pengembangan metodologi
penelitian.
1. Mempersiapkan Data
Komputer adalah alat yang digunakan secara umum dalam analisa data. Penggunaan
computer/ personal computer (PC) untuk analisa data mengalami peningkatan karena PC
telah lebih mudah diakses dan banyak tersedia di pasaran. Ketika computer digunakan
untuk menganalisa data, langkah awal yang dilakukan adalah memasukan data ke dalam
computer.
Prioritas data yang akan dimasukan ke dalam computer telah dijelaskan dalam bab
sebelumnya. Lokasi masing-masing variable dalam file lomputer perlu diidentifikasi.
Masing – masing variable perlu diberi kode/label. Peneliti perlu mengembangkan rencana
yang sistematis dalam memasukan data untuk mengurangi kesalahan dalam tahap ini.
Data yang telah didapat dalam penelitian sebaiknya langsung dimasukan ke dalam
computer, daripada menunggu data menjadi banyak. Hal ini dilakukan untuk mengurangi
kelelahan dalam tahap ini karena nantinya bisa meningkatkan kesalahan dalam
memasukan data.Data – data yang telah dimasukan ke dalam computer, kemudian
disimpan dalam hardisk computer. Data yang disimpan juga sebaiknya memakai password
( “mengunci data”) untuk keamanan data. Dan terakhir yang penting sekali adalah peneliti
juga perlu untuk memback – up data pada floppy disc sebagai keamanan.

Merapikan data
Dalam hal ini dengan cara mencetak atau membuat printouts dari data-data
yang dimasukan.. Cek ulang setiap lembaran printouts dengan data asli dalam
computer untuk keakuratan. Mengecek secara acak adalah poin penting untuk
keakuratan data. Memeriksa semua kesalahan yang ditemukan dalam file computer.
Selain itu sebagai cek kedua, komputer akan menganalisa masing- masing frekwensi
dari variable.Untuk informasi lebih lengkap telah dijelaskan dalam bab sebelumnya.

Mengidentifikasi data yang hilang
Mengidentifikasi data – data yang hilang juga merupakan bagian penting.
Melihat apakah data – data yang diperoleh telah dimasukan dalam file computer. Jika
terdapat data yang hilang dalam jumlah besar terhadap variable, maka subjek harus
dihapus dari analisa data karena kehilangna data yang penting.

Mentransformasi/ membentuk data
Dalam beberapa kasus, untuk memulai analisa data, data harus dibentuk.
Maksudnya nilai – nilai yang ada pada item yang telah dimasukkan ke dalam
computer dan diletakkan pad form koleksi data tersebut akan disusun berdasarkan
perintah computer. Data – data yang telah disusun bisa berdasarkan nilai tertinggi dan
terbentuk dalam suatu skala.
Data yang tidak simetris atau data non linear atau data yang tidak memiliki
analisa parametric kadang – kadang bisa dibentuk dalam model linear. Hal ini bisa
dilakukan dengan menggunakan operasi metematika seperti kuadrat atau akar kuadrat.

Menilai variable
Kadang – kadang sebuah variable yang ada dalam analisa data tidak
dikumpulkan tapi dapat dihitung dari variable lain. Sebagai contoh, peneliti dapat
mendapatkan variable rasio perawat dengan klien hanya dengan menghitung jumlah
pasien dengan jumlah perawat dalam suatu unit keperawatan. Data – data yang ada
tersebut didapatkan lebih akurat jika perhitungannya menggunakan computer daripada
secara manual. Hasil dari perhitungan data tersebut dapat disimpan sebagi variable.

Membuat back-up data
Setelah proses merapikan data telah selesai, maka dibutuhkan lagi untuk
membuat back-up data. Beri label / kode secara lengkap.
2. Mendeskripsikan/ menggambarkan Sample
Langkah selanjutnya adalah mendapatkan sebuah gambar dari sample. Mulailah
dengan memasukan nilai frekwensi sample dari variable.Hitung ukuran dari kecendrungan
pusat dan ukuran penyebaran sample. Jika dalam penelitian terdapat lebih dari satu
sample, bandingkan variasi kelompok yang dibutuhkan untuk dibentuk. Analisa yang
relevan mungkin terdiri dri penilaian terhadap umur, tingkat pendidikan, status kesehatan,
jenis kelamin, etnik, dll.
3. Menguji Reliabilitas Pengukuran
Menguji reliabilits pengukuran penting dalam penelitian. Reliabilitas pengukuran yang
diobservasi ataupun ukuran fisiologis mungkin telah dilakukan selama tahap pengumpulan
data. Namun sebagai evaluasi tambahan mungkin diperlukan pada poin ini. Jika kertas
ataupun skala pensil digunakan dalam pengkoleksian data, maka koefisien alfa perlu
dibuat. Nilai koefisien tersebut penting dibandingkan dengan nilai yang didapat dalam
penelitian sebelumnya.
4. Exploratory Analisis Data
Menilai kembali gambaran seluruh data dengan mendalam adalah langkah penting dan
dalam penelitian. Namun sayangnya langkah ini sering diabaikan oleh peneliti pemula.
Peneliti ini cendrung “melompat” langsung ke tahap analisa data untuk menguji hipotesa,
pertanyaan dan objektivitas penelitian. Bagaimanapun, hal ini akan mengakibatkan
mereka cendrung kehilangan informasi penting dari data yang didapatkan dan cendrung
untuk menganalisa data secara tidak tepat. Peneliti – peneliti ini perlu manilai data dari
masing – masing variable dengan menggunakan kecendrungan pusat dan penyebaran.
Apakah data berbentuk simetris atau tidak atau berbentuk distribusi normal ? Apakah
varian alami data?
Metode Exploratory analisis data dijelaskan secara lengkap dalam bab 18. Dalam
beberapa kasus, sebagai bagian dari analisa exploratory, prosedur statistic inferensial
digunakan dalam menilai perbedaan dan hubungan sample.
Dalam
beberapa
penelitian
keperawatan,
tujuan
dari
penelitiannya
adalah
mengexploratory analisa data. Dalam penelitian, sering ukuran sampelnya kecil, kekuatan
rendah, pengukuran sederhana dan lapangan penelitian cendrung baru. Dan ini akan
mengarah pada study pilot. Maka kebutuhan yang paling utama adalah penjelasan yang
bersifat sementara terhadap fenomena penelitian. Konfirmasi penemuan penelitian ini
memerlukan design penelitian yang lebih dengan sample yang lebih besar. Jadi kira – kira
penelitian exploratory ini sering menjadi penelitian confirmatory karena mebutuhkan
sample yang lebih besar.

Penggunaan table dan grafik dalam analisa exploratory
Walaupun penggunaan table dan grafik adalah cara untuk mepresentingkan
penelitian, namun cara ini akan lebih berguna dalam mengartikan data dari penelitian.
Tabel dan grafik perlu dibuat sebagai ilustrasi secara deskripsi dari data untuk
memudahkan membaca atau dalam penjelasan data.
5. Confirmatory Analisis Data
Confirmatory analisis data disajikan untuk mengkonfirmasi data yang dilukiskan
melalui hipotesa, pertanyaan dan objektivitas penelitian. Dengan demikian dibutuhkan
prosedur statistic inferensial. Selama proses confirmatory data ini, perlu design penelitian,
metode pengukuran dan sample yang cukup. Selain itu juga dibutuhkan sebuah analisa
data secara tertulis untuk menggambarkan secara jelas exploratory analisis untuk menilai
hipotesa, pertanyaan dan objektivitas penelitian. Langka – langkah dibawah ini biasanya
digunakan dalam membentuk confirmatory analisa data secara sistematik yaitu :

Identifikasi level pengukuran data yang didapat untuk analisa hipotesa, pertanyaan dan
objektivitas penelitian

Pilihlah prosedur statistic yang tepat untuk level pengukuran tersebut

Pilih level yang signifilan yang akan digunakan untuk menginterpretasikan hasil
penelitian

Pilihlah one-tailed atau two-tailed secara tepat (jika ini tepat untuk penelitianmu)

Tentukan ukuran sample untuk dianalisa. Jika terdapat beberapa group untuk analisa,
perlu diidentifikasi ukuran masing – masing group

Evaluasi sample yang representative

Tentukan resiko dari error type II

Kembangkan contoh tebel atau grafik untuk menggambarkan atau memperlihatkan
hasil penelitianmu dalam hubungan dengan hipotesa, pertanyaan dan objektivitas
penelitian.

Tentukan derajat kebebasan analisa

Tunjukan analisa secara manual atau dengan computer

Bandingkan nilai statistic yang didapar dengan nilai table dengan menggunakan level
signifikansi, bagian akhir dari tes dan derajat kebebasan. Jika data dianalisa dengan
computer, informasi ini perlu untuk dibuat printoutnya.

Nilai kembali analisa untuk meyakinkan bahwa prosedur menggunakan variable yang
tepat dan bahwa prosedur statistic adalah benar dalam program computer

Interpretasikan hasil analisa data dalam bagian dari hipotesa, pertanyaan dan
objektivitas penelitian

Interpretasikan hasil analisa dalam bagian dari kerangka kerja.
6. Analisa Post Hoc
Analisa post hoc biasanya digunakan dalam penelitian yang memiliki lebih dari 2
group dimana indikasi analisa untuk masing – masing group berbeda secara signifikan
dan tidak teridentifikasi. Perbedaan kedua group ini juga tidak teridentifiaksi. Hal ini
dapat terjadi, sebagai comtoh dalam analisa Chi-Square dan analisa varian (ANOVA).
Analisa ini mungkin menyimpang dari tujuan penelitian tapi mungkin bermanfaat dalam
menyediakan informasi penting dalam pertanyaan umum untuk penelitian dimasa yang
akan dating.
7. Menyimpan Printouts Computer Dari Analisa Data
Printout computer perlu untuk mengakumulasi secara cepat selama analisa data,
karena bisa saja hasil dari analisa data hilang jika tidak langsung dibuat printoutnya.
Printout ini perlu disimpan secara sistematis supaya mudah diakses ketika ingin
mempublikasikannya atau sebagai persiapan dalam membuat thesis atau disertasi.
Sebaiknya printout tersebut disusun sesuai dengan urutan waktu. Biasanya dalam
computer juga telah disediakan program yang bisa mengidentifikasi tanggal dan jam
pembuatan data. Hal ini kan lebih mempermudah dalam menyimpan data secara
sistematis.
SUMBER ANALISA DATA
1. Program Komputer
Analisa program computer seperti SPSS (Statistical Packages for the Social Sciences),
SAS (Statistical Analysis System), dan BMDP (Biomedical Data Processing) telah banyak
tersedia pada mainframe computer di universitas. Selain itu variasi dari analisa data
lainnya seperti SAS, SPSS/PC, ABSTAT, CRUNCH dan NCSS juga telah tersedia pada
beberapa PC. Tabel 17.1 menggambarkan daftar beberapa program analisa data di PC.
Walaupun dalam program analisa data tersebut terdapat formula matematika, namun harus
dipilih program yang tepat untuk analisa data penelitian. Peneliti harus memahami hal ini.
Program computer akan menunjukan analisa data dan menyediakan printout dari hasil
analisa data itu. Sebagai tambahan, program computer juga akan menganalisa data apapun
yang dimasukan. Jika kamu memasukan data yang tidak tepat maka program computer
tidak bisa mendeteksi kesalahan tersebut dan akan meneruskan analisa data. Maka hasil
penelitian akan tidak berarti dan peneliti akan menarik kesimpilan yang salah.
Tabel 17.1
Sumber analisa data pada PC
NCSS (Number Cruncher Statistical System
Dr. Jerry L. Hintze
329 North 1000 East
Kaysville, Utah 84037
Phone (801)546-0445
FAX (801)546-3907
CRUNCH
Software Corporation
5335 Collega Avenue
Suite 27
Oakland, California 94618
Phone (415)420-8660
FAX (415)420-8174
SPSS/PC
SPSS, Inc
444 N. Michigan Avenue
Chicago, Illinois 60611
Phone (312)329-3500
FAX (312)329-3668
SAS
SAS Institute, INC
SAS Circle, Box 8000
Cary, NC 27512-8000
Phone (919)467-8000
ABSTAT
Anderson – Bell
11479 S. Pine Drive
Suite 400-M
Parker, Colorado 80134
Phone (303)841-9755
Telex : 499-4230
2. Statistical Assistance
Dalam menganalisa data, selain perlu program computer, juga dibutuhkan ahli dalam
menjalanjan program computer ini, yaitu seorang programmer. Programer adalah orang
yang memiliki keterampilan dalam menggunakan bahasa computer. Bahasa computer
adalah pesan yang digunakan untuk memberi perintah yang detail untuk computer. Namun
seorang programmer tidak sama dengan statistician, karena programmer tidak bisa
mengartikan/menterjemahkan hasil analisa data. Di beberapa universitas, mahasiswa ilmu
computer biasanya tersedia sebagai programmer yang akan membantu dalam menjalankan
program computer untuk analisa data.
Selain itu, dalam menganalisa data juga ada statistician. Seorang statistician adalah
orang yang memiliki latar belakang pendidikan dalam statistic dan memiliki kualifikasi
sebagai ahli dalam analisa statistic. Biasanya bayaran dalam menggunakan jasa statistician
ini, dihitung perjam. Kebanyakan perawat peneliti akan lebih diuntungkan jika memakai
jasa statistician ini. Karena perawat peneliti akan lebih diuntungkan dengan bacaan hasil
analisa
data
dari
statistician
ini.
Karena
statisticianlah
yang
ahli
dalam
menginterpretasikan hasil analisa data. Namun bagaimanapun, perawat peneliti tidak bisa
melepaskan tanggung jawab secara total dalam menganalisa data pada statistician.
Perawat peneliti juga harus mengerti dan paham tentang penggunaan prosedur statistic dan
untuk menginterpretasikan prosedur ini kepada audiens ketika hasil penelitian
dipublikasikan.
KONSEP TEORI STATISTIK
Satu alasan yang dibutuhkan perawat dalam menghindari statistic adalah dengan
menggunakan formula atau rumus matematika dalam analisa data. Padahal hal ini
mengandung sedikit atau bahkan tidak ada penjelasan terhadap logika proses analisa data atau
arti dari hasil penelitian. Walaupun program ini juga terdapat dalam computer, namun
informasi ini hanya sedikit membantu dalm membuat keputusan statistic
Karena banyak teori statistic, ide teoritical yang berhubungan dengan statistic telah
dipaparkan penggunaanya dalam analisa data, namun kebanyakan tidak familiar. Ide peneliti
terutama dalam analisa data telah diungkapkan bahasa klinis, namun tidak dijelaskan dalam
bahasa formal dari statistician. Hal ini akan menjadi hambatan dalam proses analisa data oleh
statistician. Untuk itu diperlukan translation dari bahasa klinis ke bahasa statistician. Dan
ketika analisa data telah lengkap, juga perlu ditranslate dari bahasa statistician ke bahasa
klinis. Lihat gambar berikut :
Translation
ANALISA
JAWABAN
Situasi klinis
Situasi klinis
Formula masalah I:
Jawaban Peneliti
Menurut Peneliti
Formula masalah II:
Menurut Statistician
Jawaban Statistician
Interpretasi
Metode statistician
Diskusi berikut adalah penjelasan mengenai beberapa konsep dalam penggunaan teori
statistic. Konsep – konsep itu terdiri dari teori probabilitas, teori decision, inferensial, teori
kurva normal, distribusi sample, distribusi sample dari statistic, statistic dan parameter,
sample dan populasi, perkiraan parameter, derajat kebebasan, tailedness, error type I dan II,
level signifikansi, kekuatan, signifikansi klinis, parameter dan nonparameter analisa statistic,
causality dan relationship.
1. Teori Probabilitas
Teori probabilitas menjelaskan mengenai analisa statistic dari perspektif tingkat
hubungan atau nilai kemungkinan dari suatu kejadian yang diprediksikan secara akurat.
ANALYSES
Translation
ANSWERS
Clinical
Clinical
Situation
Situation
Problem formulation I:
The researcher’s
The researcher’s version
Answer
Problem formulation II:
The statistician’s
The statistician’s version
Answer
Statistical
Method
Gb. Proses translasi dan interpretasi dalam statistik
Interpretation
TEORI KEPUTUSAN DAN UJI HIPOTESA
Teori keputusan adalah induktif dan berdasarkan atas asumsi yang berhubungan dengan kurva
normal oretikal pendekatan ini digunakan ketika menguji kemungkinan dimana semua
kelompok merupakan anggota dari populasi yang sama. Kemungkinan atau asumsi ini di
ekspresikan sebagai hipotesa null. Untuk menguji asumsi ini, point cut-off dipilih sebelum
pengumpulan data. Poin cut-off ini, merujuk pada alfa (ά), atau “level signifikansi” adalah
poin pada kurva normal dimana hasil analisa statistiknya mengindikasikan perbedaan yang
signifikan secara statistik antara kelompok. Teori keputusan membutuhkan poin cut-off yang
absolut. Absolut berarti bahwa walaupun nilai yang didapatkan hanya sedikit diatas poin cutoff, sampel dipertimbangkan berasal dari populasi yang sama dan tidak ada pengertian yang
dapat di hubungkan dengan perbedaan. Jadi tidak tepat menggunakan teori ini untuk membuat
pernyataan bahwa “ penemuan mendekati level ketepatan .051” apabila level alfa di set pada
.05. menggunakan peraturan teori keputusan, penemuan ini mengindikasikan bahwa
kelompok yang di uji tidak begitu berbeda dan hippotesis null tidak ditolak. Di sisi lain,
apabila analisa menunjukkan perbedaan yang mencolok pada .001, hasil ini tidak lebih tepat
dari .05.
KESIMPULAN
Para ahli statistik menggunakan istilah “kesimpulan” atau “menyimpulkan” sama seperti
peneliti menggunakan istilah generalisasi. Kesimpulan membutuhkan penggunaan pemikiran
induktif. Menyimpulkan dari kasus yang spesifik ke kebenaran umum, dari bagian menjadi
keseluruhan, dari yang konkrit ke yang abstrak, dari tahu menjadi tidak tahu. Menggunakan
pemikirian inferensial, anda tidak akan pernah menghasilkan sesuatu; anda tidak akan pernah
pasti. Bagaimanapun juga, salah satu alasan untuk peraturan yang telah tetap berhubungan
dengan prosedur statistikal adalah untuk meningkatkan kemungkinan bahwa kesimpulan
akurat. Kesimpulan dibuat dengan hati – hati dan dengan ketelitian yang tinggi.
KURVA NORMAL
Kurva normal teoritikal adalah ekspresi dari teori statistikal. Teori ini merupakan
distribusi frekuensi teoritikal dari semua skore yang mungkin. Tidak ada distribusi yang benar
– benar cocok dengan kurva normal. Ide tentang kurva normal dikembangkan oleh seorang
ahli matematika berusia 18 tahun, Johann Gauss, pada 1975. ia menemukan bahwa data
diukur secara berulang-ulang pada banyak sampel dari populasi yang sama, menggunakan
skala berdasarkan atas satu kesatuan yang mendasar, dapat dikombinasikan menjadi satu
sampel
yang
besar.
dari
sampel
yang
sangat
besar
ini,
seseorang
dapat
mengembangkansebuah representasi yang akurat dari pola kurva dari populasi tersebut lebih
memungkinkan daripada menggunakan satu sampel. Mengejutkan, banyak kasus, kurvanya
sama, tanpa memperhatikan data yang spesifik yang telah diperiksa atau populasi yang telah
diteliti.
Kurva normal teoritikal ini simetris dan unimodal dan memilikki nilai yang berlanjut.
Mean, median, dan mode (kesimpulan statistikal) sama (gambar 17-2). Distribusi benar –
besnardidefinisikan oleh mean dan standar deviasi. Pengukuran dalam distribusi teoritikal
telah distandardisasi menggunakan Nilai Z. Istilah ini akan dijelaskan lebih lanjut dalam bab
18. nilai Z dan standar deviasi dalam gambar 17-2. proporsi nilai yang mungkin dapat kita
temui dalam area tertentu pada kurva normal telah diidentifikasi. Pada kurva normal, 68%
nilai akan berada pada 1 standar deviasi atau 1 nilai Z diatas atau dibawah mean, 95% akan
berada pada 2 standar deviasi dibawah atau dibawah mean, 99% akan berada pada 3 standar
deviasi diatas atau dibawah mean. Bahkan ketika statistik, seperti mean, berasal dari populasi
yang distribisunya asimetris, distribusi sampling berkembang dari mean multipel yang
didapatkan dari populasi yang asimetris tadi akan mengarah pada pola kurva normal.
Fenomena ini merujuk sebagai central limit theorem. Satu syarat untuk menggunakananalisa
parametrik statistik adalah bahwa data di distribusikan normal – “normal” berarti bahwa data
hampir pas atau sesuai dengan kurva normal. Karena banyak pengukuran statistikal dari
sampel yang asimetris juga sesuai dengan kurva normal disebabkan oleh central limit
theorem, beberapa ahli statistik merasa bahwa penggunaan parameter analisa statistik
walaupun dengan data dari sampel yang asimetris apabila sampel banyak dapat dibenarkan.
DISTRIBUSI SAMPEL
Distribusi sampel dapat dikembangkan dengan menggunakan nilai statistik (seperti
mean) dari banyak sampel yang didapatkan dari populasi yang sama. Mean dari tipe distribusi
ini merujuk sebagai mean dari mean. Distribusi sampel juga dapat dikembangkan dari standar
deviasi. Nilai lain, seperti korelasi antara variabel, skor yang didapatkan dari pengukuran
spesifik, dan skor yang menunjukkan perbedaan antara kelompok dalam populasi, dapat yield
nilai yang dapat digunakan untuk mengembangkan distribusi sampel.
Tujuan dari distribusi sampel adalah untuk mengukur sampling error. Sampling error
adalah perbedaan antara statistik sampling yang digunakan dengan perkiraan parameter dan
kenyataan tapi tidak nilainya tidak diketahui parameter. Apabila kita mengetahui distribusi
sampel maka kita akan dapat mengukur probabilitas pembuatan kesimpulan yang salah.
Seseorang tidak akan membuat kesimpulan tanpa mampu meng-kalkulasikan probabilitas
pembuatan kesimpulan yang salah.
DISTRIBUSI SAMPEL DARI SEBUAH STATISTIK
sama dengan kemungkinan mengembangkan distribusi kesimpulan statistik dalam
populasi, begitupun dengan mengembangkan distribusi hasil statistik inferensial. Contoh,
apabila seseorang mengambil dua sampel dengan besar yang sama dari populasi yang sama
secara berulang dan diuji untuk perbedaan dalam mean menggunakan t-test, distribusi sample
seharusnya berkembang dari hasil nilai t dengan menggunakan teori probabilitas. Dengan
pendekatan ini, distribusi dapat dikembangkan untuk sampel dengan ukuran bervariasi. Yang
dalam kenyataan telah digunakan menggunakan nilai-t.sebuah tabel diatribusi t terdapat pada
appendix C. Tabel tersebut dikembangkan menggunakan strategi ini untuk mengorganisasikan
hasil statistikal untuk banyak prosedur statistikal dari bermacam-macamukuran sampel.
Karena mendaftar semua hasil yang mungkin akan membutuhkan banyak halaman,
kebanyakan tabel memasukkan hanya nilai – nilai yang memiliki probabilitas rendah akan
terjadi pada populasi teoritikal saat ini. Probabilitas ini ditunjukkan dengan alfa (α), biasanya
ditujukan pada level soigbifikansi, dan beta (β), probabilitas error tipe II.
Menggunakan distribusi sampel yang tepat, seseorang dapat menetapkan probabilitas
mendapatkan hasil statistikal yang spesifik apabila dua sampel diteliti benar-benar berasal dari
populasi yang sama. Analisa statistikalmembuat kesimpulan bahwa sampel yang telah diuji
dapat menjadi bagian dari populasi dimana distribusi sampel dikembangkan. Kesimpulan ini
ditunjukkan sebagai hippotesis null.
STATISTIK DAN PARAMETER, SAMPEL DAN POPULASI
Penggunaan istilah statistik dan parameter dapat membingungkan karena populasi
bervariasi merujuk ke teori statistikal. Sebuah statistik (X) adalah nilai numerik didapatkan
dari sebuah sampel. Parameter adalah sebuah karakteristik numerikal nyata (tapi tidak
diketahui) dari populasi. Contoh, μ adalah mean populasi atau rata-rata aritmatikal. Mean dari
distribusi sampling (mean dari mean sample) dapat terlihat sama dengan μ. Jadi, nilai
numerikal yang merupakan mean sampel adalah statistik; nilai numerik yang merupakan
mean populasi adalah parameter (Barnett, 1982)
Menghubungkan statistik dengan parameter membutuhkan kesimpulan dimana
seseorang memindahkan sampel ke distribusi sampling kemudian ke populasi. Populasi
merujuk kepada sesuatu yang konkrit dan yang lainnya dalam abstrak. Ide –ide ini dapat
diilustrasikan sebagai berikut:
Abstrak
Sample
sampling distribution
populasi
Konkrit
Sebagai contoh, penelitian tantang kadar kolesterol pada wanita di U.S. populasinya
adalah wanita di U.S. tentunya anda tidak bisa mengukur kadar kolesterol pada setiap wanita
di U.S; sehingga, anda memilih sampel wanita dari populasi ini. Karena anda mengharapkan
sampel dapat merepresentasikan populasi, anda mendapatkan sampel dengan menggunakan
teknik random sampling. Dengan tujuan untuk mendapatkan kadar kolesterol pada sampel
sama seperti mereka pada populasi, anda harus membandingkan sampel dengan populasi.
Salah satu strategi yang dapat membandingkan sampel dengan populasi dengan mean dari
populasi yang ada. Sayangnya, anda tidak sepenuhnya tahu tentang mean populasi. Sehingga
anda harus membuat perkiraan mean dari populasi tersebut. Anda harus tahu seberapa bagus
statistik sampel anda sebagus estimator parameter populasi.
Pertama anda harus membuat asumsi. Anda mengasumsikan nilai mean dari kadar
kolesterol dari sampel yang multipel random dari populasi akan di-distribusikan secara
normal. Melakukan asumsi ini adalah asumsi lain: bahwa kadar kolesterol populasi akan didistribusikan berdasarkan kurva normal teoritikal- dimana nilai perbedaan dan standar deviasi
dapat di... ke mereka yang dalam kurva normal
Apabila anda berasumsi populasi dalam studi anda didistribusikan secara norlma, anda
dapat juga berasumsi bahwa populasi ini dapat direpresentasikan oleh distribusi sampling
normal. Oleh karena itu, anda menyimpulkan dari sampel anda ke distribusi sampling, secara
matematik mengembangkan populasi teoritikal dibuat dari parameter seperti mean dari mean
dan standar error. Parameter populasi teoritikal ini adalah mereka yang mengukur identifikasi
dimensi dalam distribusi sampling. Anda kemudian dapat menyimpulkan dari distribusi
sampling ke populasi. Anda memiliki populasi konkrit dan populasi abstrak. Populasi konkrit
adalah semua individu yang masuk ke dalam kriteria sampling. Abstrak populasi adalah
individu yang akan memenuhi kriteria sampling pada masa yang akan datang atau kelompok
lain yang masuk secara teoritikal oleh kerangka kerja anda.
PERKIRAAN PARAMETER
Ada dua pendekatan dalam memperkirakan parameter populasi: perkiraan poin dan perkiraan
interval.
Perkiraan Poin
Sebuah statistik yang menghasilkan nilai sebagai fungsi dari skor dalam sampel
disebut dengan estimator. Banyak analisis statistikal inferential melibatkan penggunaan
estimasi poin untuk mengevaluasi kesesuaian antara estimator (statistik) dan parameter
populasi. Perkiraan poin adalah gambaran singel yang memperkirakan sebuah gambaran yang
berhubungan dalam populasi ketertarikan. Estimator poin yang terbaik dari mean populasi
adalah mean dari sampel yang diperiksa. Bagaimanapun juga, mean sampel jarang menyamai
mean dari popuasi. Sebagai tambahan untuk mean, estimator lain yang umum digunakan
termasuk median, variance, standar deviasi, dan koefisien korelasi.
Perkiraan Interval
Ketika sampling dari distribusi contonuous, probabilitas mean sampel yang diteliti
sama dengan mean sampel yaitu zero. Oleh karena itu, kita tahu kita akan dalam keadaan eror
pada saat kita menggunkan estimator poin. Perbedaan antara perkiraan sampel dan nilai
parameter yang benar tapi tidak diketahui adalah eror sampling. Sumber dari eror sampling
adalah kenyataan bahwa kita tidak dapay menghitung setiap indivisu pada populasi. Eror
sampling dikarenakan oleh kempatan dan hanya kesempatan. Hal ini tidak disebabkan oleh
beberapa kekurangan dalam riset metodologi. Perkiraan estimasi adalah sebuah usaha untuk
mengatasi masalah ini dengan mengontrol ketelitian awal estimator. Prosedur interval yang
memberikan kepercayaan 95% akan menghasilkan set interval 95% yang akan termasuk true
value dari parameter. Sayangnya, setelah sampel di gambarkan dan estimasi di kalkulasikan,
tidak ada cara untuk menceritakan apakah interval terdiri dari true value dari parameter.
Perkiraan interval adalah sebuah segmen sejumlah batas ( range score) dimana nilai
dari parameter diperkirakan akan mejadi. Sebagai contoh, menggunkan sampel dengan mean
dari 40 dan standar deviasi 5, seseorang dapat menggunakan rnage score antara standar
deviasi 2 dibawah mean dan standar deviasi 2 diatas mean ( 30, 50) sebagaimana perkiraan
interval. Hal ini akan menyediakan sebuah set skor daripada skor singel. Bagaimanapun juga,
tidak ada kepastian absolut bahwa mean populasi berada pada rentang range. Oleh karena itu,
penting untuk menentukan probablitias bahwa interval ini meliputi mean populasi.
Kebutuhan untu menentukan probabilitas ini membawa kita kembali pada distribusi
sampling. Kita tahu bahwa 95 % mean dalam distribusi sampling berada dalam standar
deviasi 2 dari mean dari mean (populasi mean). Apabila skor ini di konversikan ke Z skor,
table distribusi normal dapat digunakan untuk menentukan berpa banyak standar deviasi
keluar dari mean dari mean seseorang harus menjamin probabilitas yang dipastikan ( seperti
70 %, 95%, atau 99%) perkiraan interval yang didapatkan yang termasuk parameter populasi
yang diperkirakan.
Memeriksa distribusi normal, seseorang menemukan bahwa 2.5% area dibawah kurva
normal berada dibawah nilai Z dari -1.96, atau μ – (1.96 SD/√N), dan 2.5% dari area diatas
nilai Z dari 1.96, atau μ + (1.96 SD/√N), dimana μ adalah meandari means, SD adalah standar
deviasi dan N adalah nulai sampel. Probabilitas adalah .95 dimana sampel yang dipilih secara
random pasti berada pada range ini.
DERAJAT KEBEBASAN
Konsep dari derajat kebebasan (df) adalah produk dari teori statistik dan lebih mudah
untuk dikalkulasikan daripada dijelaskan karena matematika komplek melibatkan deminstrasi
justifikasi dari konsep. Derajat kebebasan melibatkan kebebasan
nilai skor untuk
memvariasikan nilai skore lain yang tersedia dan menstabilkan jumlah dari skor-skor ini.
Sebuah contoh simpel mungkin akan membuka pengetahuan awal dari konsep.
Diandaikan skor yang berbeda didapatkan dari sampel 4 dan meannya adalah 4. skor
perbedaan adalah -2, -1, +1, dan +2. sebagaimana perbedaan skor ini, jumlah skor ini adalah
0. sebagai hasilnya, apabila tiga skor perbedaan ini dikalkulasikan, nilai dari skor ke-empat
tidak bebas bervariasi. Nilainya akan bergantung pada tiga yang lain utnuk menjaga mean
tetap 4 dan jumlahnya 0. derajat kebebasan dari sampel ini adlah tiga, karena hanya tiga skor
yang bebas bervariasi. Dalam kasus ini dan banyak anlisis lainnya, derajat kebebasan adalah
jumlah sampel (N) minus 1 (N – 1).
df = N – 1
dalam contoh ini, df = 4-1 = 3. dalam beberapa analisa, penentuan level signifikan
pada tabel statistikal distribusi sampling membutuhkan pengetahuan tentang derajat
kebebasan.
TAILEDNESS
Pada kurva normal, nilai statistikal yang ekstrim dapat terjadi pada kedua ujung kurva.
Karena ini benar, nilai statistikal 5% yang dipertimbangkan secara statistikal signifikan
berdasarkan teori keputusan harus didistribusikan antara dua kurva ekstrim. Ke-ekstriman dari
kurva disebut sebagai tail (ekor). Apabila hippotesa nondirectional dan mengasumsikan
bahwa nilai skor dapat terjadi pada tail, analisa merujuk pada test signifikan dua ekor.
Gambar 17-3.
Pada tes signifikan satu ekor, hipotesis adalah directional, dan nilai statistikal ekstrim
yang terjadi pada tail singel kurva adalah interest. Mengembangkan hipotesa satu ekor
membutuhkan pengetahuan yang cukup terhadap variabel dan interaksinya dimana dasar test
satu ekor. Di sisi lain, tes satu ekor ini tidaklah tepat. Pengetahuan ini mungkin teoritikal atau
dari penelitian terdahulu. Test satu ekor secara keseluruhan lebih powerful dari test dua ekor,
meningkatkan kemungkinan penolakan hipotesisi null. Pada kasusu ini, nilai statistikal
ekstrim terjadi pada ekor lain kurva secara signifikan tidak berbeda. Pada gambar 17-4, yaitu
gambar satu ekor, porsi dari kurva dimana nilai statistikal akan dipertimbangkan secara
signifikan berada pada ekor kanan kurva.
EROR TIPE I DAN TIPE II
Berdasarkan teori keputusan, dua tipe eror dapat terjadi dalam pembuatan keputusan
tentang pengertian nilai yang didapatkan dari test statistikal: eror tipe I dan eror tipe II. Eror
tipe I terjadi ketika hipotesis null ditolak ketika ini benar. Eror ini mungkin terjadi karena
walaupun nilai statistikal pada akhir ekstrim dari ekor kurva jarang, mereka memang terjadi
pada populasi. Dalam melihat tabel 17-2, ingatlah bahwa pernyataan hipotesis null adalah
tidak ada perbedaan atau tidak ada hubungan antara kelompok.
Occurance Of Type I And Type Ii Error
Data Analysis Indicates
In Reality the Null Hypothesis Is
True
Results
significant
null Type I error
False
Correct decision (power)
rejected
Results not significant null Correct decision
Type II error
not rejected
TABEL 17-2
Ada resiko yang lebih besar dari eror tipe I dengan level kepercayaan .05 daripada
level kepercayaan .01. Sebagaimana level kepercayaan menjadi lebih ekstrim, resiko eror tipe
I menurun, seperti yang digambarkan pada gambar 17-5. Sebagai contoh, misalnya anda
meneliti efek dari tatalaksana dalam penelitian eksperimental menggunkan dua kelompok dan
menemukan bahwa perbedaan antara dua kelompok ini relatif equivalen dalam magnitude
terhadap standar eror. Distribusi sampling dari perbedaan antara kelompok berarti
mengatakan kepada anda bahwa bahkan apabila tidak ada perbedaan yang real antara
kelompok, perbedaan sama besar atau lebih besar dari apa yang anda temukan akan terjadi
karena kesempatan sekitar satu dari setiap tiga kali. Bahwa, perbedaan yang anda temukan
adalah apa yang dapat anda harapkan terjadi apabila tatalaksana yang benar adalah zero. Ini
tidak berarti bahwa perbedaan sebenarnya zero, tapi bahwa pada basis hasil penelitian, anda
tidak akan memberikan pembenaran dalam claiming ada perbedaan sebenarnya antara
keompok. Data dari sampel anda tidak menstabilkan kasus untuk posisi bahwa efek
tatalaksana sebenarnya ada.
Misalkan, pada sisi lain, anda menemukan bahwa perbedaan dalam kelompok anda
melebihi dua kali dari standar erornya ( Z score > 1.96). perbedaan tatalaksana dari magnitude
ini akan terjadi dengan kesemapatan kurang dari sekali dalam 20, dan kita manyebutnya
bahwa hail ini level kepercayaan secara signifikan pada .05. Perbedaan lebih dari 2.6 kali
maka standar eror akan terjadi dengan kesempatan kurang dari sekali dalam 100, dan kita
menyebutnya bahwa perbedaan secara statistikal signifikan pada level .01. Cox (1985)
mengatakan bahwa, “ test signifikan, dari sudut pandang ini, mengukur ke adekuatan dari data
untuk mendukung kesimpulan kualitatif bahwa ada efek nyata dalam menuju perbedan yang
nyata” (p.159). jadi, keputusan adalah sebuah penilaian dan dapat menjadi eror. Dicapainya
level statistik kepercayaan adalah indikasi derajat ketidakpastian dalam pengambilan posisi
dimana perbedaan antara kedua kelompok nyata.
Eror tipe II terjadi ketika hipoptesis null dianggap benar ketika, pada kenyataannya,
salah. Tipe eror ini terjadi karena dalam beberapa kasus ada beberapa derajat overlap antara
nilai perbedaan populasi, sehingga nilai dengan probablitas lebih dari 5%dengan satu populasi
yang mungkin dalam kenyataannya dalam dimensi populasi lain. (gambar 17-6).
Sebagaimana resiko eror tipe I menurun (dengan stting level kepercayaan lebih
ekstrim), resiko eror tipe II meningkat. Ketika resiko eror tipe ii menurun (dengan setting
level kepercayaan kurang ekstrim), resiko eror tipe I meningkat. Tidak mungkin menurunkan
kedua tipe eror secara simultan tanpa peningkatan koresponding dalam ukuran sampel. Oleh
karena itu, peneliti
harus memutuskan resiko mana yang memiliki perlakuan terbesar
terhadap studi spesifik. Dalam penelitian keperawatan, banyak penelitian dilakukan dengan
sampel yang kecil dan instrumen yang tidak tepat pengukuran variabel penelitian. Dalam
banyak situasi keperawatan, multipel variabel berinteraksi untuk menuju kepada perbedaan
diantara populasi. Bagaimanapun juga, ketika seseorang hanya memeriksa sedikit variabel
yang berinteraksi, sedikit perbedaan yang dapat terlihat, mengakibatkan kesimpulan salah dari
tidak adanya perbedaan antara sampel. Pada kasus ini, resiko eror tipe II memiliki perhatian
yang lebih. Dan lebih lemah level kepercayaan yang didapatkan.
Sebagai contoh yang beruhubungan dengan eror, mempertimbangkan mengikuti
masalah. Apabila anda berada pada posisi mendapatkan tiga sampel engan menggunkaan
metodologi yang sama, setiap sampel memiliki mean yang berbeda. Samapai anda membuat
keputusan untuk menerima atau menolak hipotesa null. Pernyataan hipotesa null adalah
bahwa mean populasi adalah 50 dan bahwa tiga sampel tadi berasal dari populasi yang sama.
Asumsikan anda mendapatkan hasil seperti berikut:
Ukuran sampel
N = 50 subjek
X = 52.0
N = 50 subjek
X = 60.5
N = 50 subjek
X = 52.2
2. tefcdjbsada
3. kjhdjygajs
4.
Mean Sampel
Download