Uploaded by Aji Witono

bab 15 teori

advertisement
CHAPTER 15 COMPARING THE MEANS OF DEPENDENT SAMPLES
15.1 Arti “Tanggungan”
Anda baru saja belajar tentang menilai perbedaan antara cara yang diperoleh dari dua sampel
independen, di mana pengamatan dari sampel sama sekali tidak terkait. Kadang-kadang
pertanyaan substantif atau desain penelitian melibatkan sampel dependen. Di sini, pengamatan
dari satu sampel terkait dalam beberapa cara dengan yang dari yang lain. Dalam bab ini, kami
memeriksa prosedur statistik untuk menganalisis perbedaan antara cara yang berasal dari
sampel tersebut. Seperti yang akan Anda lihat, logika umum pengujian hipotesis nol yang
melibatkan sampel dependen adalah identic untuk yang digunakan ketika sampel independen.
Ada dua cara dasar di mana sampel dapat bergantung. Yang pertama kasus, dua cara, X1 dan
X2, didasarkan pada individu yang sama. Ini dikenal sebagai desain tindakan berulang.
Skenario "sebelum-sesudah" adalah contoh: sampel dipilih, semua peserta menyelesaikan
pretest, intervensi terjadi, dan kemudian individu yang sama menyelesaikan posttest. Minat
peneliti adalah perbedaan antara mean pretest (X1) dan mean posttest (X2). Misalkan kamu
ingin menguji efektivitas intervensi pengurangan berat badan untuk remaja muda. Anda
memilih 30 sukarelawan, merekam bobot mereka sebelum intervensi dan lagi sesudahnya.
Agaknya, anak-anak yang lebih berat pada penimbangan awal (X1) umumnya akan lebih tinggi
dan memiliki bingkai yang lebih besar dan, karenanya, juga akan cenderung demikian di antara
anak-anak yang lebih berat pada penimbangan akhir (X2) - terlepas dari efek apa pun intervensi
mungkin. Demikian pula, Anda akan mengharapkan anak-anak yang lebih ringan pada awalnya
(bingkai yang lebih kecil, lebih pendek) berada di antara anak-anak yang lebih ringan pada
akhirnya. Artinya, jika Anda menghitung koefisien korelasi Pearson (r) antara 10 pasangan
bobot X1 dan X2, Anda akan mengharapkan untuk menemukan korelasi positif. (Untuk alasan
ini, sampel dependen juga disebut sampel "berpasangan" atau "berkorelasi"). Singkatnya, X1
dan X2 tidak independen. Ini berbeda dari contoh independen desain yang dijelaskan dalam
bab terakhir, di mana tidak ada dasar untuk apa pun memasangkan skor X1 dan X2. Dalam
percobaan, terkadang satu kelompok peserta mengalami kedua perawatan kondisi; ini adalah
contoh lain dari desain tindakan berulang. Untuk Misalnya, Anda meminta setiap individu
untuk mengingat item dari daftar kata yang disajikan di bawah dua kondisi — secara auditil
dalam satu, secara visual dalam kondisi lainnya. Dengan demikian, setiap peserta memiliki
sepasang skor: jumlah kata yang ditarik dari presentasi pendengaran kata-kata (X1) dan jumlah
kata yang diingat dari presentasi visual (X2). Minat Anda adalah perbedaan antara dua cara,
X1 dan X2. Dalam apa akal apakah kedua ini berarti "tergantung"? Nah, individu dengan
kemampuan verbal tinggi dan pengetahuan kata akan cenderung memiliki ingatan yang lebih
baik dalam kondisi apa pun (mis., skor X1 dan X2 lebih tinggi pada keduanya) daripada
individu dengan kemampuan verbal dan kata pengetahuan, sehingga menciptakan korelasi
positif antara skor yang dipasangkan. Ketika individu yang sama digunakan dalam kedua
kondisi percobaan, masing-masing seseorang dalam arti melayani sebagai kelompok
kontrolnya sendiri. Sampel dapat tergantung dengan cara kedua. Di sini, individu yang berbeda
digunakan untuk dua kondisi penelitian, tetapi, sebelum membentuk kelompok, simpatisan
mencocokkan mereka orang per orang dengan beberapa karakteristik yang berkaitan dengan
variabel respons. Dikenal sebagai desain subjek yang cocok, prosedur ini meningkatkan
kesetaraan dua kelompok (pada variabel yang cocok) lebih dari dan di atas yang dipengaruhi
oleh tugas acak saja. Bayangkan Anda mau menyelidiki keefektifan relatif dari dua intervensi
membaca kelas satu. Sebelum secara acak menempatkan 60 siswa kelas awal mulai satu
intervensi atau yang lain, Anda cocokkan anak-anak dengan kesiapan membaca. Secara
khusus, Anda membentuk 30 pasangan anak sedemikian rupa sehingga pada masing-masing
pasangan kedua anak memiliki jumlah yang sama (atau hampir sama) sama) skor pada
penilaian kesiapan membaca yang baru diberikan. Pengambilan setiap pasangan secara
bergantian, Anda melempar koin untuk menugaskan salah satu anak untuk intervensi A dan
yang lainnya untuk intervensi B. Pada akhir intervensi, Anda memberikan a membaca tes
prestasi untuk semua dan kemudian membandingkan nilai rata-rata anak-anak di Indonesia
Intervensi A (XA) dengan anak-anak dalam intervensi B (XB). Sejauh ini bahwa tes yang
digunakan untuk pencocokan adalah ukuran kesiapan anak yang memadai untuk manfaat dari
membaca instruksi, Anda akan mengharapkan skor XA dan XB yang relatif tinggi dari
pasangan yang cocok tinggi dalam kesiapan membaca dan, juga, XA yang relatif rendah dan
skor XB dari pasangan yang cocok rendah dalam kesiapan membaca. Yaitu, jika Anda
pertimbangkan dua skor prestasi untuk setiap pasangan yang cocok, yang Anda harapkan a
kecenderungan untuk skor XA tinggi untuk pergi dengan skor XB tinggi dan skor XA rendah
untuk pergi dengan skor XB rendah. Sekali lagi, akan ada korelasi positif antara pasangan skor;
akibatnya, kedua sampel tidak independen.1
15.2 Kesalahan Standar Perbedaan Antara Cara Bergantung
Ketika sampel tergantung, kesalahan standar dari perbedaan antara berarti dimodifikasi untuk
memperhitungkan tingkat korelasi antara skor berpasangan. Perkiraan kesalahan standar untuk
cara-cara bergantung ditunjukkan di Formula (15.1):
1Kadang-kadang, ketidaktergantungan sampel adalah hasil dari pencocokan "alami", seperti
dalam studi yang identic kembar, saudara kandung, pasangan, atau teman serasah (dalam
penelitian yang melibatkan hewan, tentu saja).
Pada pandangan pertama, formula ini mungkin terlihat sangat sedikit! Mari kita identifikasi
dulu ketentuan, yang semuanya telah Anda lihat sebelumnya: s21 dan s22 adalah perkiraan
populasi varians, r12 adalah korelasi sampel antara X1 dan X2, s1 dan s2 perkiraan standar
deviasi populasi, dan n adalah jumlah pasangan pengamatan. Jika Anda membagi fraksi di
bawah akar kuadrat menjadi tiga bagian, masing - masing dengan penyebut umum n, Formula
(15.1) dapat dibandingkan dengan perkiraan kesalahan standar untuk sampel independen
(Bagian 14.4):
Jika n1 n2= n, rumus ini tampaknya berbeda hanya dalam dua cara. Pertama, untuk
ketergantungan sampel, dua estimasi varians (s21 dan s22 ) digunakan secara terpisah untuk
memperkirakanvarians populasi masing-masing, sedangkan untuk sampel independen,
dikumpulkan estimasi varians (s2 pooled) digunakan untuk keduanya. Tetapi ketika n1 n2= n,
seperti halnya dengan sampel berpasangan, ini terbukti tidak ada perbedaan sama sekali.
Artinya, ketika n1 n2, bisa jadi menunjukkan itu
Perbedaan yang tersisa antara dua rumus di atas — dan oleh karena itu satu-satunya perbedaan
— adalah istilah yang melibatkan r12, yang dikurangkan dalam rumus untuk dependen sampel.
Jadi,
Ketika sampel tergantung, kesalahan standar dari perbedaan antara berarti biasanya akan
lebih kecil daripada ketika sampel independen. Ini adalah karena korelasi positif antara skor
X1 dan X2.
Lihat lagi pembilang Formula (15.1). Jumlah pengurangan kesalahan standar terutama
tergantung pada ukuran koefisien korelasi, r12. Semakin besar korelasi positif, semakin kecil
kesalahan standar. Menggunakan hal yang sama orang-orang dalam kedua kondisi itu hampir
selalu memaksa korelasi positif di antara keduanya skor X1 dan X2 (ukurannya tergantung
pada variabel tertentu yang sedang diukur dan kondisi tertentu yang dikenakan). Sedangkan
untuk desain subjek yang cocok, pengurangan kesalahan standar dibawa oleh pencocokan
sangat tergantung pada relevansi variabel pencocokan. Masuk akal untuk mencocokkan skor
kesiapan membaca dalam studi efek dari dua intervensi membaca karena mereka yang
memiliki kesiapan membaca paling tinggi kemungkinan baik dalam kondisi baik relatif
terhadap rekan-rekan kesiapan rendah mereka. Sebaliknya, akan konyol untuk mencocokkan
anak-anak, katakanlah, kepadatan bintik, karena kepadatan bintik tidak terkait dengan prestasi
membaca (yang setidaknya kami sadari). Karena itu, tidak akan ada pengurangan kesalahan
standar. Pengurangan dalam kesalahan standar adalah keuntungan statistik utama dari
menggunakan dependen sampel: Semakin kecil kesalahan standar, semakin banyak hasil
sampel akan mencerminkan tingkat perbedaan "benar" atau populasi. Dalam pengertian ini,
standar yang lebih kecil kesalahan memberi Anda tes yang lebih kuat secara statistik. Artinya,
kemungkinan besar Anda akan menolak H0 palsu. (Bab 19 dikhususkan untuk subjek kekuatan
statistik.)
15.3 Derajat Kebebasan
Ketika sampel tergantung, derajat kebebasan terkait dengan standar kesalahan adalah n - 1, di
mana n adalah jumlah pasangan. Perhatikan bahwa di sini df hanya setengah dari (n - 1) (n - 1)
df untuk dua sampel independen yang memiliki jumlah pengamatan yang sama. Untuk melihat
mengapa demikian, ingat bahwa df mencerminkan jumlah potongan independen informasi
yang disediakan oleh hasil sampel untuk memperkirakan kesalahan standar. Dengan sampel
independen, Anda memiliki n - 1 df untuk sampel skor X1 dan n - 1 df untuk sampel skor X2.
Namun, dengan sampel dependen, setiap skor X1 ada dalam beberapa cara dan sampai tingkat
tertentu terkait dengan skor X2, sehingga Anda tidak mendapatkan bagian independen
tambahan informasi ketika Anda menggunakan skor X1 dan X2 dalam estimasi kesalahan
standar. Memberikan derajat kebebasan untuk kesalahan standar yang lebih kecil adalah
tradeoff statistic dalam menggunakan sampel dependen — pengorbanan yang harus dipikirkan
dengan cermat. Jika r12 rendah, pengurangan df bisa menjadi perbedaan antara menolak dan
mempertahankan hipotesis nol palsu, khususnya ketika n kecil. Sekilas tentang Tabel B
(Lampiran C) akan mengkonfirmasi, ini karena nilai kritis t tumbuh lebih besar sebagai df
berkurang, sehingga membuatnya lebih sulit untuk menolak H0. Alhasil, saat mencocokkan
peserta, Anda tidak harus mencocokkan pada variabel yang "mungkin membantu," tetapi
hanyapada satu Anda cukup yakin memiliki hubungan yang kuat dengan variabel respons.
15.4 Uji t untuk Dua Sampel Bergantung
Struktur uji t untuk sampel dependen identik dengan struktur independent-samples t test:
Di pembilang, Anda melihat perbedaan antara dua (tergantung) sampel berarti, X1 - X2,
dibandingkan dengan kondisi yang ditentukan dalam hipotesis nol, μ1 - μ2. Penyebutnya
adalah kesalahan standar seperti yang diberikan dalam Formula (15.1). Karena hipotesis nol
biasanya menentukan μ1 −μ2 =0, rumus untuk uji-sampel dependen menyederhanakan untuk:
Rasio t akan mengikuti distribusi t Student dengan df n− 1 (di mana, sekali lagi, n adalah jumlah
pengamatan berpasangan). Meskipun asumsi normalitas mendasari penggunaan t ketika sampel
tergantung, tidak perlu mengasumsikan homogenitas varians.
Formula (15.2) dapat agak membebani dalam praktik, terutama karena kebutuhan untuk
menghitung r12 untuk kesalahan standar. Karenanya, kami menawarkan kepada Anda
alternatif populer untuk menghitung t, metode perbedaan langsung. Itu setara ke Formula (15.2)
dan lebih mudah digunakan.
Metode Perbedaan Langsung
Metode Formula (15.2) berurusan secara eksplisit dengan karakteristik keduanya distribusi —
skor X1 dan skor X2. Sebaliknya, metode perbedaan langsung berfokus pada karakteristik
distribusi tunggal, distribusi perbedaan antara skor X1 dan X2 yang berpasangan. Lihat Tabel
15.1, yang menunjukkan subset data dari sampel dependen Desain. Dengan mengurangi setiap
skor X2 dari skor X1 yang dipasangkan, Anda mendapatkan perbedaannya skor D (1) untuk
setiap pasangan. Misalnya, pasangan skor pertama berhubungan dengan D X1 −X2 24− 37 13,
menunjukkan bahwa skor pertama dalam pasangan ini adalah 13 poin lebih rendah dari yang
kedua. Sekarang perhatikan hipotesis nol bahwa μ1 - μ2 0. Jika ini hipotesis itu benar, maka
rerata populasi perbedaan antara pasangan nilai, μD, sama dengan nol juga. Yaitu, H0: μ1 - μ2
0, yang dinyatakan dalam istilah dua populasi, dapat disajikan kembali dalam satu populasi
dengan skor perbedaan sebagai H0: μD 0. Dengan metode perbedaan langsung, Anda
menemukan D ("d-bar"), rata-rata dari sampel skor perbedaan (2). Anda kemudian
menanyakan apakah artinya ini berbeda secara signifikan dari mean hipotesis (nol) dari
populasi skor perbedaan. Kesalahan standar dari skor perbedaan, dilambangkan dengan sD,
dihitung sebagai berikut:
ssD adalah jumlah kuadrat berdasarkan skor perbedaan. Seperti yang akan kita tunjukkan
sebentar lagi, itu diperoleh dengan menjumlahkan (D - D) 2 di semua nilai D (seperti yang
Anda lakukan dalam menghitung X jumlah kuadrat). Statistik uji yang dihasilkan mengambil
bentuk yang sudah dikenal: Ini adalah perbedaan di antara keduanya hasil sampel (D) dan
kondisi yang ditentukan dalam hipotesis nol (μD), dibagi oleh kesalahan standar (sD):
Karena hipotesis nol biasanya berbentuk μD 0, pembilangnya menyederhanakan ke D. Jadi:
15.5 Menguji Hipotesa Tentang Dua Cara Bergantung: Sebuah Contoh
Misalkan klaim kuat, tanpa bukti, telah dibuat tentang kemanjuran dari pengobatan herbal
untuk attention deficit disorder (ADD). Anda memutuskan untuk melakukannya secara empiris
menguji validitas klaim ini. Anda menemukan 10 siswa kelas lima, di 10 ruang kelas yang
berbeda, yang telah didiagnosis dengan ADD. Duduk Anda diam-diam berada di belakang
setiap ruang kelas dengan stopwatch di tangan jumlah detik yang anak dengan ADD keluar
dari kursi selama 20 menit periode membaca diam (X1). Masing-masing dari 10 anak tersebut
kemudian diberi dosis harian perawatan herbal selama satu bulan, setelah itu Anda kembali ke
ruang kelas lagi merekam perilaku di luar kursi selama membaca diam (X2). Jadi, Anda
berakhir dengan 10 pasang pengamatan: skor pra-perawatan dan skor pasca-perawatan untuk
setiap anak. Data ini muncul di dua kolom pertama dari Tabel 15.2 (yang, untuk kenyamanan
Anda, kami telah membulatkan ke menit terdekat). Apakah klaim tentang kemanjuran
pengobatan herbal itu valid? Artinya, lakukan anak-anak dengan ADD menunjukkan lebih
sedikit gangguan dan perilaku tidak aktif setelah menerima herbal penangkal? Jika demikian,
maka Anda mengharapkan perbedaan rata-rata positif, D. Yaitu, skor X1 dalam pasangan harus
cenderung lebih tinggi dari skor X2 yang sesuai. Inferensial pertanyaannya adalah apakah D
cukup besar untuk menolak hipotesis nol tanpa perbedaan— bahwa dalam populasi perbedaan
rata-rata adalah nol (μD= 0). Mari kita berjalan melalui langkah-langkah menguji hipotesis ini,
yang akan Anda temukan sejajar dengan argumen pengujian signifikansi dalam bab-bab
sebelumnya.
Tabel 15.2 Jumlah Menit Keluar Kursi dalam Sampel Anak dengan Attention Deficit
Disorder, Before (X1) dan After (X2) Pengobatan Herbal
Langkah 1 Merumuskan hipotesis statistik dan memilih tingkat signifikansi. Hipotesis statistik
Anda adalah:
H0: μD =0
H1: μD >0
Anda merumuskan hipotesis alternatif arah karena dipublikasikan klaim tentang pengobatan
herbal hanya valid jika anak-anak menunjukkan kurang perhatian (dalam bentuk waktu di luar
kursi) setelah satu bulan menerima pengobatan herbal. Anda memutuskan untuk mengatur
level signifikansi pada α 05.
Langkah 2 Tentukan ukuran sampel yang diinginkan dan pilih sampel. Dalam ilustrasi ini, kami
menggunakan 10 pasang subjek (sehingga semua perhitungan dapat dengan mudah
ditunjukkan).
Langkah 3 Hitung statistik sampel yang diperlukan.
Pertama, tentukan D untuk setiap pasangan skor, yang kami tunjukkan pada Tabel 15.2.
Misalnya, D=11− 8= 3 untuk kasus pertama. Kemudian hitung rata-rata nilai D: D=+ 1 00 (2).
Perhatikan bahwa D sama dengan perbedaan antara X1 dan X2: D= X1 −X2 =8 5 −7 5 =+1 00.
Untuk sampel ini dari anak-anak dengan ADD, maka, rata-rata waktu di luar tempat duduk
adalah satu menit lebih sedikit setelah sebulan menjalani pengobatan herbal. Sekarang
dapatkan deviasi kuadrat untuk setiap skor D (), yang Anda pilih jumlah untuk mendapatkan
SSD 80 (). Masukkan angka ini ke dalam Formula (15.3) dan Anda memiliki kesalahan standar,
sD 94 (). Mundur sejenak: Sebagai standard error, nilai ini mewakili jumlah variabilitas dalam
distribusi perbedaan sampel yang mendasari. Yaitu, 0,94 adalah perkiraan Anda dari standar
deviasi dari semua nilai yang mungkin dari Dhad yang Anda lakukan percobaan sampel dalam
jumlah tak terbatas semacam ini. Seperti halnya standar apa pun kesalahan, ini digunakan untuk
mengevaluasi perbedaan antara hasil sampel Anda (D dalam kasus ini) dan kondisi yang
dinyatakan dalam hipotesis nol (μD 0). Seberapa besar perbedaan ini, mengingat apa yang
Anda harapkan dari variasi sampel acak saja? Pertanyaan ini dijawab oleh final perhitungan, t
rasio (): t 1 06. Langkah 4 Identifikasi wilayah penolakan. Rasio sampel t mengikuti distribusi
t Student dengan df 10− 9 (). Konsultasikan Tabel B untuk menemukan nilai t kritis untuk uji
satu sisi di α 05 dengan 9 df. Nilai ini adalah t 05 1 833 (), nilai t melampaui yang 5% paling
ekstrim dari semua sampel yang mungkin jatuh (di ekor atas hanya) jika H0 benar. Wilayah
penolakan dan rasio sampel t yang diperoleh ditunjukkan pada Gambar 15.1. Langkah 5 Buat
keputusan statistik dan bentuk kesimpulan. Rasio sampel t 1,06 jatuh di wilayah retensi, jadi
H0 adalah dipertahankan (). Bisa saja benar bahwa μD 0 (walaupun Anda punya sama sekali
tidak terbukti bahwa ini adalah masalahnya). Seperti yang sering dikatakan dalam situasi
ini,tidak ada "perbedaan yang signifikan" antara kedua cara. Ini mengarahAnda sampai pada
kesimpulan substantif bahwa, setelah satu bulan pengobatan herbal, anak-anak dengan GPP
tidak kurang terganggu dari sebelumnya pengobatan, yang mempertanyakan klaim populer
mengenai kemanjuran pengobatan.
Hasilnya akan sama jika Anda menggunakan Formula (15.2) untuk menguji H0. Meskipun
metode perbedaan langsung lebih mudah digunakan daripada Formula (15.2), kita harus
melakukannya mengakui bahwa metode perbedaan langsung menghasilkan lebih sedikit
informasi. Ketika kamu selesai, Anda akan tahu ukuran perbedaan antara dua sampel berarti
(D) dan signifikansi statistiknya. Namun, dalam sebagian besar penelitian, Anda juga ingin
tahu — dan akan wajib melaporkan — dua cara dan standar deviasi. Dan jika Anda penasaran
tentang berapa banyak korelasi yang disebabkan oleh pasangan, Anda akan ingin tahu r12 juga
(r12=+ 80 dalam kasus ini). Tetapi metode perbedaan langsung menghasilkan tidak ada
informasi itu. Jika jumlah ini diinginkan, Anda harus kembali ke data dan menghitungnya
(dalam hal ini Anda dapat menyimpulkan bahwa jumlah total pekerjaan adalah hampir sama
antara kedua metode).
15.6 Estimasi Interval μD
Logika estimasi interval dengan sampel dependen identik dengan yang di dalamnya sampel
independen. Satu-satunya perbedaan prosedural ditemukan dalam penentuan df dan kesalahan
standar, yang masing-masing memperhitungkan sifat pasangan dari pengamatan. Bentuk
estimasi interval untuk sampel dependen adalah:
Mari kita tentukan interval kepercayaan 95% untuk μD dari pengobatan herbal belajar, di mana
D =+1 00 dan sD =94. Untuk melakukan ini, Anda perlu kritis dua sisi nilai, 2,262 (α =05, df
=9). Sekarang masukkan D, sD, dan nilai kritis dua sisi ke dalam Formula (15.5):
1 00 ± (2 262) (94) 1 00 ± 2 13
−1 13 (batas bawah) hingga 3 13 (batas atas)
Dengan demikian, Anda yakin 95% bahwa perbedaan sebenarnya ada di mana saja dari sedikit
peningkatan waktu di luar tempat duduk (-1,13 menit) dengan penurunan yang agak lebih besar
perilaku (3,13 menit). Nilai apa pun dalam interval ini adalah kandidat yang masuk akal untuk
μD — termasuk tidak ada perbedaan sama sekali. Mengingat hasil ini, klaim mengenai
kemanjuran pengobatan herbal ADD akan muncul untuk dicurigai. Karena D X1 −X2, μD μ1
- μ2, dan sD sX1 X2, Formula (15.5) dapat disajikan secara setara dalam hal X1 - X2, μ1 - μ2,
dan sX1 − X2:
Formula (15,6) memberikan interval kepercayaan (1 - α) (100) persen untuk μ1 - μ2, yang
identik dengan interval yang dihasilkan dari Formula (15.5).
15.7 Ringkasan
Tes perbedaan antara dua cara bias dilakukan dengan sampel tergantung serta dengan sampel
independen. Ada dua cara umum membentuk sampel tergantung. Dalam pengukuran berulang
desain, X1 dan X2 didasarkan pada hal yang sama individu — misalnya, peserta dapat diuji
sebelum dan sesudah intervensi, atau mereka dapat menerima keduanya merupakan kondisi
perawatan dari suatu percobaan. Di Sebaliknya, individu yang berbeda digunakan dalam desain
subjek yang cocok, tetapi keduanya cocok beberapa karakteristik yang relevan sebelum secara
acak ditugaskan untuk kondisi perawatan. Manfaat statistik menggunakan sampel tergantung
adalah kesalahan standar yang lebih kecil, yang berarti ada akan lebih tinggi kemungkinannya
mendeteksi perbedaan antara dua populasi saat perbedaan sebenarnya ada Manfaat ini
tergantung pada ukuran korelasi positif yang disebabkan oleh pasangan: semakin tinggi
korelasinya, semakin besar keuntungannya. Itu manfaat eksperimental adalah bahwa
dimungkinkan untuk mengerahkan kontrol lebih besar atas faktor-faktor luar yang bias
memengaruhi hasilnya dengan mempertahankannya terus-menerus proses pemasangan. Dalam
desain subjek yang cocok, statistic keuntungan dari pencocokan hilang jika individu cocok
dengan karakteristik yang terkait lemah ke variabel respons. Karena jumlahnya lebih sedikit
derajat kebebasan dalam desain ini, kemampuan untuk menolak H0 palsu dapat dirusak,
khususnya ketika n kecil. Keuntungan eksperimental hilang demikian juga. Sampel t rasio,
dihitung dengan t (X1 −X2) sX1 X2 atau t D sD, ikuti Student distribusi dengan n - 1 derajat
kebebasan, di mana n adalah jumlah pasangan pengamatan. A (1 −α) (100) Interval
kepercayaan persen diperkirakan menggunakan aturan, D ± tαsD, yang setara dengan X1 −X2
± tαsX1 X2.
Download