CHAPTER 15 COMPARING THE MEANS OF DEPENDENT SAMPLES 15.1 Arti “Tanggungan” Anda baru saja belajar tentang menilai perbedaan antara cara yang diperoleh dari dua sampel independen, di mana pengamatan dari sampel sama sekali tidak terkait. Kadang-kadang pertanyaan substantif atau desain penelitian melibatkan sampel dependen. Di sini, pengamatan dari satu sampel terkait dalam beberapa cara dengan yang dari yang lain. Dalam bab ini, kami memeriksa prosedur statistik untuk menganalisis perbedaan antara cara yang berasal dari sampel tersebut. Seperti yang akan Anda lihat, logika umum pengujian hipotesis nol yang melibatkan sampel dependen adalah identic untuk yang digunakan ketika sampel independen. Ada dua cara dasar di mana sampel dapat bergantung. Yang pertama kasus, dua cara, X1 dan X2, didasarkan pada individu yang sama. Ini dikenal sebagai desain tindakan berulang. Skenario "sebelum-sesudah" adalah contoh: sampel dipilih, semua peserta menyelesaikan pretest, intervensi terjadi, dan kemudian individu yang sama menyelesaikan posttest. Minat peneliti adalah perbedaan antara mean pretest (X1) dan mean posttest (X2). Misalkan kamu ingin menguji efektivitas intervensi pengurangan berat badan untuk remaja muda. Anda memilih 30 sukarelawan, merekam bobot mereka sebelum intervensi dan lagi sesudahnya. Agaknya, anak-anak yang lebih berat pada penimbangan awal (X1) umumnya akan lebih tinggi dan memiliki bingkai yang lebih besar dan, karenanya, juga akan cenderung demikian di antara anak-anak yang lebih berat pada penimbangan akhir (X2) - terlepas dari efek apa pun intervensi mungkin. Demikian pula, Anda akan mengharapkan anak-anak yang lebih ringan pada awalnya (bingkai yang lebih kecil, lebih pendek) berada di antara anak-anak yang lebih ringan pada akhirnya. Artinya, jika Anda menghitung koefisien korelasi Pearson (r) antara 10 pasangan bobot X1 dan X2, Anda akan mengharapkan untuk menemukan korelasi positif. (Untuk alasan ini, sampel dependen juga disebut sampel "berpasangan" atau "berkorelasi"). Singkatnya, X1 dan X2 tidak independen. Ini berbeda dari contoh independen desain yang dijelaskan dalam bab terakhir, di mana tidak ada dasar untuk apa pun memasangkan skor X1 dan X2. Dalam percobaan, terkadang satu kelompok peserta mengalami kedua perawatan kondisi; ini adalah contoh lain dari desain tindakan berulang. Untuk Misalnya, Anda meminta setiap individu untuk mengingat item dari daftar kata yang disajikan di bawah dua kondisi — secara auditil dalam satu, secara visual dalam kondisi lainnya. Dengan demikian, setiap peserta memiliki sepasang skor: jumlah kata yang ditarik dari presentasi pendengaran kata-kata (X1) dan jumlah kata yang diingat dari presentasi visual (X2). Minat Anda adalah perbedaan antara dua cara, X1 dan X2. Dalam apa akal apakah kedua ini berarti "tergantung"? Nah, individu dengan kemampuan verbal tinggi dan pengetahuan kata akan cenderung memiliki ingatan yang lebih baik dalam kondisi apa pun (mis., skor X1 dan X2 lebih tinggi pada keduanya) daripada individu dengan kemampuan verbal dan kata pengetahuan, sehingga menciptakan korelasi positif antara skor yang dipasangkan. Ketika individu yang sama digunakan dalam kedua kondisi percobaan, masing-masing seseorang dalam arti melayani sebagai kelompok kontrolnya sendiri. Sampel dapat tergantung dengan cara kedua. Di sini, individu yang berbeda digunakan untuk dua kondisi penelitian, tetapi, sebelum membentuk kelompok, simpatisan mencocokkan mereka orang per orang dengan beberapa karakteristik yang berkaitan dengan variabel respons. Dikenal sebagai desain subjek yang cocok, prosedur ini meningkatkan kesetaraan dua kelompok (pada variabel yang cocok) lebih dari dan di atas yang dipengaruhi oleh tugas acak saja. Bayangkan Anda mau menyelidiki keefektifan relatif dari dua intervensi membaca kelas satu. Sebelum secara acak menempatkan 60 siswa kelas awal mulai satu intervensi atau yang lain, Anda cocokkan anak-anak dengan kesiapan membaca. Secara khusus, Anda membentuk 30 pasangan anak sedemikian rupa sehingga pada masing-masing pasangan kedua anak memiliki jumlah yang sama (atau hampir sama) sama) skor pada penilaian kesiapan membaca yang baru diberikan. Pengambilan setiap pasangan secara bergantian, Anda melempar koin untuk menugaskan salah satu anak untuk intervensi A dan yang lainnya untuk intervensi B. Pada akhir intervensi, Anda memberikan a membaca tes prestasi untuk semua dan kemudian membandingkan nilai rata-rata anak-anak di Indonesia Intervensi A (XA) dengan anak-anak dalam intervensi B (XB). Sejauh ini bahwa tes yang digunakan untuk pencocokan adalah ukuran kesiapan anak yang memadai untuk manfaat dari membaca instruksi, Anda akan mengharapkan skor XA dan XB yang relatif tinggi dari pasangan yang cocok tinggi dalam kesiapan membaca dan, juga, XA yang relatif rendah dan skor XB dari pasangan yang cocok rendah dalam kesiapan membaca. Yaitu, jika Anda pertimbangkan dua skor prestasi untuk setiap pasangan yang cocok, yang Anda harapkan a kecenderungan untuk skor XA tinggi untuk pergi dengan skor XB tinggi dan skor XA rendah untuk pergi dengan skor XB rendah. Sekali lagi, akan ada korelasi positif antara pasangan skor; akibatnya, kedua sampel tidak independen.1 15.2 Kesalahan Standar Perbedaan Antara Cara Bergantung Ketika sampel tergantung, kesalahan standar dari perbedaan antara berarti dimodifikasi untuk memperhitungkan tingkat korelasi antara skor berpasangan. Perkiraan kesalahan standar untuk cara-cara bergantung ditunjukkan di Formula (15.1): 1Kadang-kadang, ketidaktergantungan sampel adalah hasil dari pencocokan "alami", seperti dalam studi yang identic kembar, saudara kandung, pasangan, atau teman serasah (dalam penelitian yang melibatkan hewan, tentu saja). Pada pandangan pertama, formula ini mungkin terlihat sangat sedikit! Mari kita identifikasi dulu ketentuan, yang semuanya telah Anda lihat sebelumnya: s21 dan s22 adalah perkiraan populasi varians, r12 adalah korelasi sampel antara X1 dan X2, s1 dan s2 perkiraan standar deviasi populasi, dan n adalah jumlah pasangan pengamatan. Jika Anda membagi fraksi di bawah akar kuadrat menjadi tiga bagian, masing - masing dengan penyebut umum n, Formula (15.1) dapat dibandingkan dengan perkiraan kesalahan standar untuk sampel independen (Bagian 14.4): Jika n1 n2= n, rumus ini tampaknya berbeda hanya dalam dua cara. Pertama, untuk ketergantungan sampel, dua estimasi varians (s21 dan s22 ) digunakan secara terpisah untuk memperkirakanvarians populasi masing-masing, sedangkan untuk sampel independen, dikumpulkan estimasi varians (s2 pooled) digunakan untuk keduanya. Tetapi ketika n1 n2= n, seperti halnya dengan sampel berpasangan, ini terbukti tidak ada perbedaan sama sekali. Artinya, ketika n1 n2, bisa jadi menunjukkan itu Perbedaan yang tersisa antara dua rumus di atas — dan oleh karena itu satu-satunya perbedaan — adalah istilah yang melibatkan r12, yang dikurangkan dalam rumus untuk dependen sampel. Jadi, Ketika sampel tergantung, kesalahan standar dari perbedaan antara berarti biasanya akan lebih kecil daripada ketika sampel independen. Ini adalah karena korelasi positif antara skor X1 dan X2. Lihat lagi pembilang Formula (15.1). Jumlah pengurangan kesalahan standar terutama tergantung pada ukuran koefisien korelasi, r12. Semakin besar korelasi positif, semakin kecil kesalahan standar. Menggunakan hal yang sama orang-orang dalam kedua kondisi itu hampir selalu memaksa korelasi positif di antara keduanya skor X1 dan X2 (ukurannya tergantung pada variabel tertentu yang sedang diukur dan kondisi tertentu yang dikenakan). Sedangkan untuk desain subjek yang cocok, pengurangan kesalahan standar dibawa oleh pencocokan sangat tergantung pada relevansi variabel pencocokan. Masuk akal untuk mencocokkan skor kesiapan membaca dalam studi efek dari dua intervensi membaca karena mereka yang memiliki kesiapan membaca paling tinggi kemungkinan baik dalam kondisi baik relatif terhadap rekan-rekan kesiapan rendah mereka. Sebaliknya, akan konyol untuk mencocokkan anak-anak, katakanlah, kepadatan bintik, karena kepadatan bintik tidak terkait dengan prestasi membaca (yang setidaknya kami sadari). Karena itu, tidak akan ada pengurangan kesalahan standar. Pengurangan dalam kesalahan standar adalah keuntungan statistik utama dari menggunakan dependen sampel: Semakin kecil kesalahan standar, semakin banyak hasil sampel akan mencerminkan tingkat perbedaan "benar" atau populasi. Dalam pengertian ini, standar yang lebih kecil kesalahan memberi Anda tes yang lebih kuat secara statistik. Artinya, kemungkinan besar Anda akan menolak H0 palsu. (Bab 19 dikhususkan untuk subjek kekuatan statistik.) 15.3 Derajat Kebebasan Ketika sampel tergantung, derajat kebebasan terkait dengan standar kesalahan adalah n - 1, di mana n adalah jumlah pasangan. Perhatikan bahwa di sini df hanya setengah dari (n - 1) (n - 1) df untuk dua sampel independen yang memiliki jumlah pengamatan yang sama. Untuk melihat mengapa demikian, ingat bahwa df mencerminkan jumlah potongan independen informasi yang disediakan oleh hasil sampel untuk memperkirakan kesalahan standar. Dengan sampel independen, Anda memiliki n - 1 df untuk sampel skor X1 dan n - 1 df untuk sampel skor X2. Namun, dengan sampel dependen, setiap skor X1 ada dalam beberapa cara dan sampai tingkat tertentu terkait dengan skor X2, sehingga Anda tidak mendapatkan bagian independen tambahan informasi ketika Anda menggunakan skor X1 dan X2 dalam estimasi kesalahan standar. Memberikan derajat kebebasan untuk kesalahan standar yang lebih kecil adalah tradeoff statistic dalam menggunakan sampel dependen — pengorbanan yang harus dipikirkan dengan cermat. Jika r12 rendah, pengurangan df bisa menjadi perbedaan antara menolak dan mempertahankan hipotesis nol palsu, khususnya ketika n kecil. Sekilas tentang Tabel B (Lampiran C) akan mengkonfirmasi, ini karena nilai kritis t tumbuh lebih besar sebagai df berkurang, sehingga membuatnya lebih sulit untuk menolak H0. Alhasil, saat mencocokkan peserta, Anda tidak harus mencocokkan pada variabel yang "mungkin membantu," tetapi hanyapada satu Anda cukup yakin memiliki hubungan yang kuat dengan variabel respons. 15.4 Uji t untuk Dua Sampel Bergantung Struktur uji t untuk sampel dependen identik dengan struktur independent-samples t test: Di pembilang, Anda melihat perbedaan antara dua (tergantung) sampel berarti, X1 - X2, dibandingkan dengan kondisi yang ditentukan dalam hipotesis nol, μ1 - μ2. Penyebutnya adalah kesalahan standar seperti yang diberikan dalam Formula (15.1). Karena hipotesis nol biasanya menentukan μ1 −μ2 =0, rumus untuk uji-sampel dependen menyederhanakan untuk: Rasio t akan mengikuti distribusi t Student dengan df n− 1 (di mana, sekali lagi, n adalah jumlah pengamatan berpasangan). Meskipun asumsi normalitas mendasari penggunaan t ketika sampel tergantung, tidak perlu mengasumsikan homogenitas varians. Formula (15.2) dapat agak membebani dalam praktik, terutama karena kebutuhan untuk menghitung r12 untuk kesalahan standar. Karenanya, kami menawarkan kepada Anda alternatif populer untuk menghitung t, metode perbedaan langsung. Itu setara ke Formula (15.2) dan lebih mudah digunakan. Metode Perbedaan Langsung Metode Formula (15.2) berurusan secara eksplisit dengan karakteristik keduanya distribusi — skor X1 dan skor X2. Sebaliknya, metode perbedaan langsung berfokus pada karakteristik distribusi tunggal, distribusi perbedaan antara skor X1 dan X2 yang berpasangan. Lihat Tabel 15.1, yang menunjukkan subset data dari sampel dependen Desain. Dengan mengurangi setiap skor X2 dari skor X1 yang dipasangkan, Anda mendapatkan perbedaannya skor D (1) untuk setiap pasangan. Misalnya, pasangan skor pertama berhubungan dengan D X1 −X2 24− 37 13, menunjukkan bahwa skor pertama dalam pasangan ini adalah 13 poin lebih rendah dari yang kedua. Sekarang perhatikan hipotesis nol bahwa μ1 - μ2 0. Jika ini hipotesis itu benar, maka rerata populasi perbedaan antara pasangan nilai, μD, sama dengan nol juga. Yaitu, H0: μ1 - μ2 0, yang dinyatakan dalam istilah dua populasi, dapat disajikan kembali dalam satu populasi dengan skor perbedaan sebagai H0: μD 0. Dengan metode perbedaan langsung, Anda menemukan D ("d-bar"), rata-rata dari sampel skor perbedaan (2). Anda kemudian menanyakan apakah artinya ini berbeda secara signifikan dari mean hipotesis (nol) dari populasi skor perbedaan. Kesalahan standar dari skor perbedaan, dilambangkan dengan sD, dihitung sebagai berikut: ssD adalah jumlah kuadrat berdasarkan skor perbedaan. Seperti yang akan kita tunjukkan sebentar lagi, itu diperoleh dengan menjumlahkan (D - D) 2 di semua nilai D (seperti yang Anda lakukan dalam menghitung X jumlah kuadrat). Statistik uji yang dihasilkan mengambil bentuk yang sudah dikenal: Ini adalah perbedaan di antara keduanya hasil sampel (D) dan kondisi yang ditentukan dalam hipotesis nol (μD), dibagi oleh kesalahan standar (sD): Karena hipotesis nol biasanya berbentuk μD 0, pembilangnya menyederhanakan ke D. Jadi: 15.5 Menguji Hipotesa Tentang Dua Cara Bergantung: Sebuah Contoh Misalkan klaim kuat, tanpa bukti, telah dibuat tentang kemanjuran dari pengobatan herbal untuk attention deficit disorder (ADD). Anda memutuskan untuk melakukannya secara empiris menguji validitas klaim ini. Anda menemukan 10 siswa kelas lima, di 10 ruang kelas yang berbeda, yang telah didiagnosis dengan ADD. Duduk Anda diam-diam berada di belakang setiap ruang kelas dengan stopwatch di tangan jumlah detik yang anak dengan ADD keluar dari kursi selama 20 menit periode membaca diam (X1). Masing-masing dari 10 anak tersebut kemudian diberi dosis harian perawatan herbal selama satu bulan, setelah itu Anda kembali ke ruang kelas lagi merekam perilaku di luar kursi selama membaca diam (X2). Jadi, Anda berakhir dengan 10 pasang pengamatan: skor pra-perawatan dan skor pasca-perawatan untuk setiap anak. Data ini muncul di dua kolom pertama dari Tabel 15.2 (yang, untuk kenyamanan Anda, kami telah membulatkan ke menit terdekat). Apakah klaim tentang kemanjuran pengobatan herbal itu valid? Artinya, lakukan anak-anak dengan ADD menunjukkan lebih sedikit gangguan dan perilaku tidak aktif setelah menerima herbal penangkal? Jika demikian, maka Anda mengharapkan perbedaan rata-rata positif, D. Yaitu, skor X1 dalam pasangan harus cenderung lebih tinggi dari skor X2 yang sesuai. Inferensial pertanyaannya adalah apakah D cukup besar untuk menolak hipotesis nol tanpa perbedaan— bahwa dalam populasi perbedaan rata-rata adalah nol (μD= 0). Mari kita berjalan melalui langkah-langkah menguji hipotesis ini, yang akan Anda temukan sejajar dengan argumen pengujian signifikansi dalam bab-bab sebelumnya. Tabel 15.2 Jumlah Menit Keluar Kursi dalam Sampel Anak dengan Attention Deficit Disorder, Before (X1) dan After (X2) Pengobatan Herbal Langkah 1 Merumuskan hipotesis statistik dan memilih tingkat signifikansi. Hipotesis statistik Anda adalah: H0: μD =0 H1: μD >0 Anda merumuskan hipotesis alternatif arah karena dipublikasikan klaim tentang pengobatan herbal hanya valid jika anak-anak menunjukkan kurang perhatian (dalam bentuk waktu di luar kursi) setelah satu bulan menerima pengobatan herbal. Anda memutuskan untuk mengatur level signifikansi pada α 05. Langkah 2 Tentukan ukuran sampel yang diinginkan dan pilih sampel. Dalam ilustrasi ini, kami menggunakan 10 pasang subjek (sehingga semua perhitungan dapat dengan mudah ditunjukkan). Langkah 3 Hitung statistik sampel yang diperlukan. Pertama, tentukan D untuk setiap pasangan skor, yang kami tunjukkan pada Tabel 15.2. Misalnya, D=11− 8= 3 untuk kasus pertama. Kemudian hitung rata-rata nilai D: D=+ 1 00 (2). Perhatikan bahwa D sama dengan perbedaan antara X1 dan X2: D= X1 −X2 =8 5 −7 5 =+1 00. Untuk sampel ini dari anak-anak dengan ADD, maka, rata-rata waktu di luar tempat duduk adalah satu menit lebih sedikit setelah sebulan menjalani pengobatan herbal. Sekarang dapatkan deviasi kuadrat untuk setiap skor D (), yang Anda pilih jumlah untuk mendapatkan SSD 80 (). Masukkan angka ini ke dalam Formula (15.3) dan Anda memiliki kesalahan standar, sD 94 (). Mundur sejenak: Sebagai standard error, nilai ini mewakili jumlah variabilitas dalam distribusi perbedaan sampel yang mendasari. Yaitu, 0,94 adalah perkiraan Anda dari standar deviasi dari semua nilai yang mungkin dari Dhad yang Anda lakukan percobaan sampel dalam jumlah tak terbatas semacam ini. Seperti halnya standar apa pun kesalahan, ini digunakan untuk mengevaluasi perbedaan antara hasil sampel Anda (D dalam kasus ini) dan kondisi yang dinyatakan dalam hipotesis nol (μD 0). Seberapa besar perbedaan ini, mengingat apa yang Anda harapkan dari variasi sampel acak saja? Pertanyaan ini dijawab oleh final perhitungan, t rasio (): t 1 06. Langkah 4 Identifikasi wilayah penolakan. Rasio sampel t mengikuti distribusi t Student dengan df 10− 9 (). Konsultasikan Tabel B untuk menemukan nilai t kritis untuk uji satu sisi di α 05 dengan 9 df. Nilai ini adalah t 05 1 833 (), nilai t melampaui yang 5% paling ekstrim dari semua sampel yang mungkin jatuh (di ekor atas hanya) jika H0 benar. Wilayah penolakan dan rasio sampel t yang diperoleh ditunjukkan pada Gambar 15.1. Langkah 5 Buat keputusan statistik dan bentuk kesimpulan. Rasio sampel t 1,06 jatuh di wilayah retensi, jadi H0 adalah dipertahankan (). Bisa saja benar bahwa μD 0 (walaupun Anda punya sama sekali tidak terbukti bahwa ini adalah masalahnya). Seperti yang sering dikatakan dalam situasi ini,tidak ada "perbedaan yang signifikan" antara kedua cara. Ini mengarahAnda sampai pada kesimpulan substantif bahwa, setelah satu bulan pengobatan herbal, anak-anak dengan GPP tidak kurang terganggu dari sebelumnya pengobatan, yang mempertanyakan klaim populer mengenai kemanjuran pengobatan. Hasilnya akan sama jika Anda menggunakan Formula (15.2) untuk menguji H0. Meskipun metode perbedaan langsung lebih mudah digunakan daripada Formula (15.2), kita harus melakukannya mengakui bahwa metode perbedaan langsung menghasilkan lebih sedikit informasi. Ketika kamu selesai, Anda akan tahu ukuran perbedaan antara dua sampel berarti (D) dan signifikansi statistiknya. Namun, dalam sebagian besar penelitian, Anda juga ingin tahu — dan akan wajib melaporkan — dua cara dan standar deviasi. Dan jika Anda penasaran tentang berapa banyak korelasi yang disebabkan oleh pasangan, Anda akan ingin tahu r12 juga (r12=+ 80 dalam kasus ini). Tetapi metode perbedaan langsung menghasilkan tidak ada informasi itu. Jika jumlah ini diinginkan, Anda harus kembali ke data dan menghitungnya (dalam hal ini Anda dapat menyimpulkan bahwa jumlah total pekerjaan adalah hampir sama antara kedua metode). 15.6 Estimasi Interval μD Logika estimasi interval dengan sampel dependen identik dengan yang di dalamnya sampel independen. Satu-satunya perbedaan prosedural ditemukan dalam penentuan df dan kesalahan standar, yang masing-masing memperhitungkan sifat pasangan dari pengamatan. Bentuk estimasi interval untuk sampel dependen adalah: Mari kita tentukan interval kepercayaan 95% untuk μD dari pengobatan herbal belajar, di mana D =+1 00 dan sD =94. Untuk melakukan ini, Anda perlu kritis dua sisi nilai, 2,262 (α =05, df =9). Sekarang masukkan D, sD, dan nilai kritis dua sisi ke dalam Formula (15.5): 1 00 ± (2 262) (94) 1 00 ± 2 13 −1 13 (batas bawah) hingga 3 13 (batas atas) Dengan demikian, Anda yakin 95% bahwa perbedaan sebenarnya ada di mana saja dari sedikit peningkatan waktu di luar tempat duduk (-1,13 menit) dengan penurunan yang agak lebih besar perilaku (3,13 menit). Nilai apa pun dalam interval ini adalah kandidat yang masuk akal untuk μD — termasuk tidak ada perbedaan sama sekali. Mengingat hasil ini, klaim mengenai kemanjuran pengobatan herbal ADD akan muncul untuk dicurigai. Karena D X1 −X2, μD μ1 - μ2, dan sD sX1 X2, Formula (15.5) dapat disajikan secara setara dalam hal X1 - X2, μ1 - μ2, dan sX1 − X2: Formula (15,6) memberikan interval kepercayaan (1 - α) (100) persen untuk μ1 - μ2, yang identik dengan interval yang dihasilkan dari Formula (15.5). 15.7 Ringkasan Tes perbedaan antara dua cara bias dilakukan dengan sampel tergantung serta dengan sampel independen. Ada dua cara umum membentuk sampel tergantung. Dalam pengukuran berulang desain, X1 dan X2 didasarkan pada hal yang sama individu — misalnya, peserta dapat diuji sebelum dan sesudah intervensi, atau mereka dapat menerima keduanya merupakan kondisi perawatan dari suatu percobaan. Di Sebaliknya, individu yang berbeda digunakan dalam desain subjek yang cocok, tetapi keduanya cocok beberapa karakteristik yang relevan sebelum secara acak ditugaskan untuk kondisi perawatan. Manfaat statistik menggunakan sampel tergantung adalah kesalahan standar yang lebih kecil, yang berarti ada akan lebih tinggi kemungkinannya mendeteksi perbedaan antara dua populasi saat perbedaan sebenarnya ada Manfaat ini tergantung pada ukuran korelasi positif yang disebabkan oleh pasangan: semakin tinggi korelasinya, semakin besar keuntungannya. Itu manfaat eksperimental adalah bahwa dimungkinkan untuk mengerahkan kontrol lebih besar atas faktor-faktor luar yang bias memengaruhi hasilnya dengan mempertahankannya terus-menerus proses pemasangan. Dalam desain subjek yang cocok, statistic keuntungan dari pencocokan hilang jika individu cocok dengan karakteristik yang terkait lemah ke variabel respons. Karena jumlahnya lebih sedikit derajat kebebasan dalam desain ini, kemampuan untuk menolak H0 palsu dapat dirusak, khususnya ketika n kecil. Keuntungan eksperimental hilang demikian juga. Sampel t rasio, dihitung dengan t (X1 −X2) sX1 X2 atau t D sD, ikuti Student distribusi dengan n - 1 derajat kebebasan, di mana n adalah jumlah pasangan pengamatan. A (1 −α) (100) Interval kepercayaan persen diperkirakan menggunakan aturan, D ± tαsD, yang setara dengan X1 −X2 ± tαsX1 X2.