MISKONSEPSI TENTANG TARAF SIGNIFIKANSI PADA PENGUJIAN HIPOTESIS DI PENELITIAN PSIKOLOGI DAN PENDIDIKAN Oleh Dali S. Naga Abstract. The translation of the word significance in statistical hypothesis testing into bermakna or berarti often leads to misconception about its true meaning. Statistically, significant does not imply that the hypothesis testing is meaningful or important. It is merely a technical term to denote the probability of erroneously rejecting H0. Hence it is better to translate it literally into signifikan. Keywords: Level of significance, Hypothesis testing. Pendahuluan Sejumlah penelitian psikologi dan pendidikan menggunakan statistika untuk pengujian hipotesis. Berbekal data statistik sampel, pengujian hipotesis tentang parameter populasi melibatkan level atau degree of significance yang sering dinyatakan melalui lambang . Pada sejumlah penelitian atau metodologi penelitian psikologi dan pendidikan, kata Inggris ini diterjemahkan menjadi bermakna atau kebermaknaan serta berarti atau keberartian. Masalah bermunculan pada orang yang kurang memahami arti sesungguhnya dari kata significance di dalam statistika. Kalau kita bertanya apa yang bermakna atau berarti pada kebermaknaan atau keberartian itu, maka mulai muncul penjelasan yang menunjukkan miskonsepsi. Pada hipotesis korelasi, misalnya, miskonsepsi ini mengemuka ketika kebermaknaan atau keberartian itu diterjemahkan sebagai korelasi yang besar atau kuat atau penting. Pada hipotesis selisih dua rerata, misalnya, miskonsepsi ini tampak ketika kebermaknaan atau keberartian itu diterjemahkan sebagai selisih yang besar atau yang penting. Demi kejelasan serta untuk mencegah timbulnya miskionsepsi, ada baiknya, kita mempelajari sejumlah bacaan tentang statistika. J. A. Capon (1988, h. 203), misalnya, jelas-jelas menyatakan bahwa ada perbedaan arti “significance” dalam pengertian umum dan artinya di dalam pengertian statistika. Th. Wonnacott dan J. Wonnacott (1990, h. 260) menyatakan bahwa ada masalah pada istilah “statistically significant.” Ini adalah kata teknis yang hanya mengertikan bahwa telah cukup banyak data yang terkumpul untuk memastikan bahwa perbedaan betul ada. Ini tidak berarti bahwa perbedaan itu harus penting. Sebelum kita melihat lebih lanjut penjelasan kata significance di dalam sejumlah buku statistika, ada baiknya, kita melihat peristiwa yang menghasilkan kata significance itu. Kita melihat apa yang diartikan dengan kata significant ketika peneliti sampai kepada keputusan pada pengujian hipotesis. Pengujian Hipotesis Setelah peneliti menyusun hipotesis penelitian, maka mereka mencari data untuk menguji hipotesis penelitian mereka itu. Kalau data yang terkumpul bersifat probabilistik, maka biasanya, para peneliti menguji hipotesis mereka dengan bantuan statistika. Bersama itu, mereka tunduk kepada peraturan yang ditentukan di dalam statistika. Aturan pertama adalah penuangan hipotesis penelitian ke dalam hipotesis statistika. Di sini, para peneliti hanya memiliki kebebasan yang terbatas. Tidak boleh tidak, mereka harus memilih parameter statistika serta statistik statistika yang sudah tersedia untuk mengungkapkan hipotesis statistika mereka. Mereka hanya memiliki kebebasan untuk memilih di antara beberapa parameter seperti rerata, proporsi, koefisien korelasi, dan sejumlah parameter seperti itu. Pada pengujian hipotesis statistika, peneliti perlu merumuskan hipotesis itu ke dalam bentuk H0 dan H1 atau notasi lain yang sama artinya. Pada dasarnya hanya boleh ada dua pilihan H0 atau H1 dan tidak boleh ada pilihan ketiga atau pilihan tumpang tindih di antara H0 dan H1. Dengan demikian, kalau sampai salah satu H ditolak maka tidak ada lagi pilihan lain kecuali H lainnya harus diterima. Itulah sebabnya mengapa kalau H0 ditolak maka H1 harus diterima. Untuk melihat bagaimana hipotesis statistika diuji, kita lihat Gambar 1. Pada H0 terdapat hubungan = sehingga hanya ada satu populasi H0. Dalam hal ini, hanya ada satu populasi yang ditunjukkan oleh parameter ρXY = 0. Sebaliknya pada H1 terdapat hubungan >, <, atau sehingga di sini terdapat banyak sekali populasi. Dalam hal ini, terdapat banyak sekali populasi yang ditunjukkan oleh ρXY > 0. Selanjutnya, pada Gambar 1 ditunjukkan pula sampel rXY = 2,25. Di sini, ρXY adalah parameter populasi koefisien korelasi linier sedangkan rXY adalah statistik sampel koefisien korelasi linier. Populasi Ho Ho: xy = 0 xy = 0 Probabilitas Sampel rxy=0,25 Probabilitas H1: xy > 0 xy > 0 Populasi H1 Gambar 1. Hipotesis dan Sampel Kita melihat tujuan dari pengujian hipotesis statistika ini. Dalam hal ini, peneliti hanya memiliki satu data sampel yakni statistik sampel rXY = 0,25 dan peneliti tidak memiliki data populasi parameter ρXY. Dengan data atau statistik sampel itu, peneliti ingin mengambil keputusan tentang parameter populasi. Caranya adalah peneliti akan memilih apakah sampel itu berasal dari populasi yang sama dengan populasi H0 atau berasal dari populsi yang sama dengan populasi H1. Tampak pada Gambar 1 bahwa peneliti tidak mungkin menyelidiki apakah sampel berasal dari populasi yang sama dengan populasi H1 karena terlalu banyak populasi H1. Jadi, peneliti hanya mungkin menyelediki apakah sampel berasal dari populasi yang sama dengan populasi H0. Pengambilan Keputusan Peneliti hanya menyelidiki atau menguji apakah sampel rXY = 0,25 berasal dari populasi yang sama dengan populasi H0 yakni ρXY = 0. Untuk itu peneliti menggunakan probabilitas atau kemungkinan. Kalau peneliti menemukan bahwa ada probabilitas atau kemungkinan yang besar bahwa sampel berasal dari populasi yang sama dengan populasi H0, maka tanpa ragu-ragu lagi, peneliti berkeputusan untuk menerima hal itu yakni menerima H0. Peneliti menerima bahwa sampel yang dimilikinya berasal dari populasi yang sama dengan populasi H0. Akibatnya adalah hipotesis H1 ditolak. Sebaliknya kalau peneliti menemukan bahwa hanya kecil yakni tidak lebih dari α (α itu kecil misalnya 0,01 atau 0,05) probabilitas atau kemungkinan bahwa sampel berasal dari populasi yang sama dengan populasi H0 maka peneliti menjadi ragu-ragu. Kalau peneliti menerima H0 rasanya terlalu berbahaya karena probabilitas atau kemungkinannya terlalu kecil. Tetapi kalau peneliti berani menolak H0 maka ada saja risiko kelirunya karena ada probabilitas sebesar α (walau kecil) bahwa sampel berasal dari H0. Keputusannya adalah peneliti memilih menolak H0 dengan risiko probabilitas keliru sebesar α. Risiko keliru dalam pengambilan keputusan menolak H0 inilah yang dinamakan taraf signifikansi. Kalau sampai H0 ditolak maka karena tidak ada pilihan ketiga atau pilihan tumpang tindih, maka satu-satunya pilihan yang ada adalah menerima H1. Tampak di sini bahwa dengan taraf signifikansi sebesar α tidak disebut-sebut risiko untuk menerima H0 tetapi ada risiko sebesar probabilitas α untuk keliru menolak H0. Tentang bagaimana caranya mengetahui probabilitas atau kemungkinan itu, peneliti perlu mengetahui kedudukan sampel rXY = 0,25 di antara semua sampel yang dapat ditarik dari populasi H0 atau dengan kata lain kedudukan sampel rXY = 0,25 di dalam distribusi probabilitas pensampelan dari sampel rXY. Hal itu tidak dibicarakan di sini. Penjelasan Taraf Signifikansi Setiap buku statistika menceriterakan taraf signifikansi α. Kita melihat beberapa di antaranya. Selain menjelaskan bahwa taraf signifikansi adalah probabilitas keliru di dalam pengambilan keputusan untuk menolak H0, mereka juga menambahkannya dengan berbagai keterangan lainnya. D.H. Sanders, A.F. Murph, dan R.J. Eng (1980, h. 178) mengatakannya sebagai perbedaan signifikan di antara sampel dan H0 yang menjurus ke penolakan H0. J.A. Capon (1988, h. 203) mengatakan bahwa kurang dari α bahwa hal itu terjadi karena kebetulan [menolak H0]. R.I. Levin dan D.S. Rubin (1998, h. 408) mengatakan bahwa itu adalah perbedaan di antara statistik sampel dengan parameter populasi yang dihipotesiskan [H0]. J.L. Folks (1981, h. 168) mengatakannya sebagai disjunksi logik yakni probabilitas statistik uji seekstrim seperti yang tampak sesungguhnya ketika hipotesis [H0] adalah benar. S.P. Gordon dan F.S. Gordon (1994, h. 385) mengatakannya sebagai terlalu tak boleh jadi untuk terjadi karena kebetulan menolak H0. T.H. Wonnacott dan R.J. Wonnacott (1990, h. 260) mengatakan bahwa hal itu hanya mengatakan bahwa cukup banyak data sudah terkumpul untuk memastikan bahwa ada perbedaan [di antara sampel dan H0]. R.M. Yaremko, H. Harari, R.C. Harrison, dan E. Lynn (1982, h. 184) mengatakannya sebagai nilai-p yakni probabilitas untuk memperoleh perbedaan [di antara sampel dan H0]. E.W. Minium (1978, h. 253 dan 270) mengatakannya sebagai derajat kejarangan terjadi [bahwa sampel berasal dari H0]. J. Welkowitz, R.B. Ewen, dan J. Cohen (1982, h. 129 dan 183) mengatakannya sebagai kurang dari α sebagai cukup tidak boleh jadi atau nyata beda [sampel] dari H0. J.D. Cryer dan R.B. Miller (1994, h. 471) mengatakannya sebagai tidak boleh jadi untuk terjadi secara kebetulan murni [bahwa sampel berasal dari H0]. Dan R.J. Shavelson (1996, h. 263) mengatakannya sebagai tidak boleh jadi [sampel berasal dari H0]. Dan Mason dan Bramble (1989, h. 210) menyatakan bahwa “dengan signifikansi statistika, kita hanya mengertikan bahwa hasilnya akan tidak boleh-jadi terjadi secara peluang jika hipotesis nol adalah benar. Itu tidak berarti bahwa hasilnya adalah penting atau berharga dalam arti lain.” Penutup Dengan penjelasan seperti ini, rasanya, terjemahan kata significant ke "bermakna" atau "berarti" mudah mendatangkan miskonsepsi. Barangkali kata "nyata" lebih memadai dalam arti "besarnya nyata berbeda" di antara sampel dan H0 atau "taraf kenyataan" bahwa sampel bukan berasal dari populasi H0. Tetapi ini pun mudah mengundang miskonspsi juga. Karena itu, sebaiknya kita menggunakan saja padanan berbentuk "taraf signifikansi." Daftar Pustaka Capon, J.A. (1988). Elementary statistics for the social sciences. Belmont, CA: Wadsworth Publishing Company. Cryer, J.D. and R.B. Miller (1994). Statistics for business: data analysis and modeling. Belmont, CA: Wadsworth, Inc. Folks, J.L. (1981). Ideas of statistics. New York: John Wiley & Sons. Gordon, S.P. and F.S. Gordon (1994). Contemporary statistics: a computer approach. New York: McGraw-Hill Inc. Levin, R.I. and D.S. Rubin (1998). Statistics for management. Seventh edition. UpperSaddle River, NJ: Prentice-Hall International Inc. Mason, J.M. and W.J. Bramble (1989). Understanding and conducting research: applications in education and behavioral sciences. Second edition. New York: Mc-Graw-Hill Book Company. Minium, E.W. (1978). Statistical reasoning in psychology and education. Second edition. New York: John Wiley & Sons. Sanders, D.H., A.F. Murph, and R.J. Eng (1980). Statistics: a fresh approach. Second edition. New York: McGraw-Hill International Book Company. Shavelson, R.I. (1996). Statistical reasoning for the behavioral sciences. Third edition. Boston: Allyn and Bacon. Welkowitz, J., R.B. Ewen, and J. Cohen (1982). Introductory statistics for the behavioral sciences. Third edition. San Diego: Harcourt Brace Jovanovich. Wonnacott, T.H. and R.J. Wonnacott (1990). Introductory statistics for business and economics. Third edition. New York: John Wiley & Sons. Yaremko, R.M., H. Harari, R.C. Harrison, and E. Lynn (1982). Reference handbook of research and statistical methods in psychology for students and professionals. New York: Harper & Row.