Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM 1 UJI MCNEMAR DAN UJI WILCOXON (Uji Hipotesa Non-Parametrik Dua Sampel Berpasangan) Oleh: Ade Heryana, SST, MKM Prodi Kesmas FIKES Univ. Esa Unggul Email: [email protected]atau [email protected]PENDAHULUAN Sampel berpasangan adalah kelompok atau obyek penelitian yang sama dengan intervensi yang berbeda. Misalnya ada 20 bidan yang ingin diketahui sikapnya terhadap kerja tim, mula-mula diukur sikapnya dengan tidak diberikan kegiatan outbond. Lalu diberikan kegiatan outbond dan diukur sikapnya. Sikap bidan tersebut sebelum dan sesudah mengikuti outbond dapat diukur dengan uji statistik dua sampel berpasangan. Jika data berdistribusi normal dengan skala ukur interval atau rasio, maka menggunakan uji t sampel berpasangan. Namun jika data berdistribusi tidak normal dengan skala ukur nominal atau ordinal, maka menggunakan uji statistik non-parametrik dua sampel berpasangan. Pada artikel ini hanya akan dijelaskan dua jenis uji non-parametrik dua sampel berpasangan yaitu yaitu Uji McNemar, dan Uji Wilcoxon. Uji statistik non-parameter dua sampel berpasangan digunakan untuk tujuan-tujuan sebagai berikut: 1. Menganalisis perbedaan dari dua sampel yang saling berpasangan; 2. Menguji apakah kedua sampel yang berpasangan tersebut berasal dari satu populasi dengan karakteristik yang sama; 3. Menguji apakah dua perlakuan atau intervensi yang diberikan kepada sampel memberikan hasil yang sama atau tidak; dan 4. Menguji apakah perlakuan atau intervensi yang satu lebih baik dibanding yang lain. Hal perlu mendapat perhatian dalam melakukan perbandingan dua sampel adalah perbedaan yang signifikan antara dua perlakukan belum tentu disebabkan oleh adanya perbedaan perlakukan tersebut, namun oleh faktor-faktor lain yang tidak dapat dikendalikan. Sehingga variabel yang dapat mempengaruhi variabel penelitian sebaiknya dikendalikan terlebih dahulu. Misalnya pada contoh di atas, perubahan sikap pada 20 bidan yang mengikuti outbond belum tentu disebabkan oleh kegiatan outbond tersebut, namun bisa disebabkan
14
Embed
UJI MCNEMAR DAN UJI WILCOXON (Uji Hipotesa Non …adeheryana.weblog.esaunggul.ac.id/wp-content/uploads/sites/5665/... · Misalnya ada 20 bidan yang ingin diketahui sikapnya terhadap
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
1
UJI MCNEMAR DAN UJI WILCOXON
(Uji Hipotesa Non-Parametrik Dua Sampel Berpasangan)
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
2
oleh kondisi setelah kegiatan outbond seperti pergantian pimpinan, perubahan kebijakan, dan
sebagainya.
DISTRIBUSI CHI-SQUARE
Uji statistik non-parametrik dua sampel berpasangan menggunakan distribusi
frekuensi chi-square sebagai dasar perhitungannya. Distribusi Chi-square (dibaca “khai
square” atau khai kuadrat dengan simbol 2)1 adalah distribusi probabilitas teoritis yang
asimetrik dan kontinyu. Nilai sebuah 2 selalu positif antara 0 sampai dengan (tak hingga)
atau 0 ≤ 2 ≤ , tidak seperti distribusi normal atau distribusi t yang dapat bernilai negatif.
Nilai statistik 2 dihitung dengan rumus sebagai berikut:
𝜒2 =(𝑓0 − 𝑓𝑒)2
𝑓𝑒
dimana, 𝑓0 = banyaknya frekuensi yang diobservasi dan 𝑓𝑒 = banyaknya frekuensi yang
diharapkan.
Gambar 1 menampilkan tiga jenis distribusi Chi-square dengan derajat kebebasan 1,5,
dan 10. Tampak bahwa 1) semakin kecil derajat kebebasan, kemencengan kurva distribusi
semakin positif artinya proporsi nilai rendah pada distribusi lebih besar; dan 2) semakin besar
derajat kebebasan, kurva distribusi semakin simetris.
Gambar 1. Distribusi Chi-square dengan Derajat Kebebasan (df) yang
Berbeda-beda (1, 5, dan 10)
(sumber: Sheskin, 2004, hal. 185)
1 Mahasiswa sering salah membuat notasi chi-square dengan tanda X2
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
3
UJI MCNEMAR
Uji McNemar digunakan untuk menguji hipotesa: “Apakah dua sampel berpasangan
berasal dari atau mewakili dua populasi yang berbeda?” Uji ini pertama kali dikembangkan
tahun 1947 oleh McNemar. Sebenarnya uji ini adalah kasus khusus dari uji Cochran Q (yang
digunakan untuk menguji lebih dari dua sampel berpasangan). Uji McNemar didesain untuk
data berpasangan yang bersifat nomimal atau dikotomi (yaitu dua kejadian yang saling
mutually excluxive, seperti permukaan koin, jenis kelamin, dsb). Asumsi yang digunakan pada
uji ini adalah setiap n subyek (atau n pasangan dari subyek yang sesuai) menghasilkan dua
nilai sebagai variabel yang berpasangan.
Dengan demikian, penggunaan Uji McNemar antara lain adalah:
1. Menilai atau mengevaluasi sifat kategorik data yang dihasilkan dari eksperimen.
Eksperimen tersebut dilakukan dengan memanipulasi variabel independen atau disebut
dengan true experiment. Sehingga eksperimen ini menghasilkan dua nilai dari masing-
masing subyek dari dua kondisi eksperimen yang independen). Hasil uji yang siginifikan
dapat disimpulan sebagai terdapat kecenderungan yang tinggi bahwa nilai eksperimen
mewakili dua populasi yang berbeda. Hal ini dilakukan untuk memastikan bahwa uji yang
dipakai mendapatkan hasil yang valid; dan
2. Menilai atau mengevaluasi desain penelitian pretest dan post test pada satu kelompok.
Pada penggunaan ini, nilai pada masing-masing pre dan post test diukur sehingga
menghasilkan variabel yang dikotomi. Rumusan hipotesanya adalah “apakah terdapat
perbedaan yang signifikan antara nilai pre-test dan post-test?”
Model ringkas pada uji McNemar berbentuk tabel 2x2 disajikan pada tabel 1 berikut2.
Tabel 1. Model Uji McNemar
(sumber: Sheskin, 2004, hal. 652)
Kondisi 2 (Post-Test) Penjumlahan
Baris Respon kategori 1 Respon kategori 2
Kondisi 1 (Pre-
Test)
Respon kategori 1 a b a+b = n1
Respon kategori 2 b d c+d = n2
Penjumlahan Kolom a+c b+d n = n1 + n2
Sel a, b, c dan d menunjukkan jumlah observasi/subyek pada setiap kemungkinan
kategori yang digunakan untuk menampilkan dua jenis respon subyek. Nilai pada kotak a
2 Tabel ini sering disebut dengan Tabel Kontinjensi atau Contingency Table
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
4
menunjukkan jumlah responden yang pada kondisi pre-test merespon kategori 1 dan pada
kondisi post-test merenspon kategori 1. Nilai pada kotak b menunjukkan jumlah responden
yang pada kondisi pre-test merespon kategori 1 dan pada kondisi post-test merenspon
kategori 2. Nilai pada kotak c menunjukkan jumlah responden yang pada kondisi pre-test
merespon kategori 2 dan pada kondisi post-test merenspon kategori 1. Akhirnya nilai pada
kotak d menunjukkan jumlah responden yang pada kondisi pre-test merespon kategori 2 dan
pada kondisi post-test merenspon kategori 2.
Asumsi-asumsi yang terpenuhi dalam Uji McNemar adalah:
1. Sampel yang berasal dari n subyek harus dipilih secara acak dari populasi yang mewakili;
2. Setiap n observasi yang terdapat pada tabel 2x2 independen atau tidak berhubungan
dengan observasi yang lain;
3. Nilai subyek dalam tabel 2x2 bersifat dikotomi dan bersifat mutually exclusive; dan
4. Beberapa literatur menyatakan Uji McNemar tidak tepat dijalankan pada ukuran sampel
yang sangat kecil. Bila terpaksa menggunakan sampel dengan jumlah kecil, maka untuk
akurasi hasil sebaiknya perlu dihitung probabilitas binomial yang nyata. Beberapa literatur
juga menyarankan menggunakan correction of continuity bila terpaksa menggunakan
sampel ukuran kecil untuk menjamin nilai chi-square hitung menghasilkan estimasi yang
akurat dari dari distribusi binomial.
Contoh soal 1 (mengevaluasi perbedaan antara dua data yang berpasangan)
Seorang psikolog ingin membandingkan sebuah obat untuk menangani enuresis
(buang air kecil di tempat tidur) dengan Placebo3. Sebanyak 100 anak-anak yang masih
ngompol diberikan obat Endurin dan Placebo dengan menggunakan desain studi
double blind (baik anak-anak maupun peneliti tidak tahu mana obat Endurin atau
Placebo) selama 6 bulan. Selama studi, setiap anak mendapat 6 obat dan 6 placebo
yang diberikan tiap minggu. Untuk memastikan bahwa tidak ada efek yang didapat
dari satu pengobatan ke pengobatan lainnya, selama seminggu pada setiap
pengobatan, anak-anak tidak diberikan obat maupun placebo. Urutan pengobatan
selama 12 kali pengobatan bagi setiap anak dipilih secara acak. Variabel dependen
pada studi ini adalah pendapat orangtua tentang perkembangan anak setelah
3 Terapi dengan obat yang tidak mengandung zat yang bersifat terapetik. Biasanya hanya untuk keperluan uji klinis obat
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
5
diberikan obat atau placebo. Hasil studi disajikan pada tabel di bawah. Pertanyaan:
Berdasarkan hasil penelitian, apakah studi ini menunjukkan bahwa obat Endurin efektif
untuk mengurangi enuresis?
Respon terhadap obat Endurin Jumlah
baris Baik Tidak baik
Respon terhadap
Placebo
Baik 10 13 23
Tidak baik 41 36 77
Jumlah Kolom 51 49 100
Tabel di atas menunjukkan bahwa:
a. 10 anak merespon “baik” terhadap Obat dan Placebo
b. 13 anak merespon “tidak baik” terhadap Obat dan “baik” terhadap placebo
c. 41 anak merespon “baik” terhadap obat dan “tidak baik” terhadap placebo, dan
d. 36 anak merespon “tidak baik” terhadap Obat dan Placebo.
e. Dari 100 responden, 51 anak merespon “baik” terhadap obat, sementara 49 anak
merespon “tidak baik”
f. Dari 100 respon, 23 anak merespon “baik” terhadap placebo dan 77 anak merespon
“tidak baik” terhadap placebo.
Rumusan Hipotesa
Dalam uji McNemar, sesuai dengan contoh soal di atas, sel yang menjadi
perhatian adalah sel b dan c yaitu sel yang memilik perbedaan respon terhadap dua
kondisi, yaitu sel dengan jumlah observasi 13 dan 41. Sehingga bila Obat lebih efektif
dibanding Placebo maka proporsi pada sel c (jumlah observasi 41) lebih besar
dibanding sel b (jumlah observasi 13). Kondisi eksperimen (dalam hal ini pemberian
Obat dan Placebo) tidak berbeda secara signifikan jika proporsi sel b dan c (terhadap
penjumlah b dan c) sama dengan 0,5 atau jika 𝜋𝑏 = 𝑏 (𝑏 + 𝑐)⁄ dan 𝜋𝑐 = 𝑐 (𝑏 + 𝑐)⁄
maka kondisi eksperimen tidak memiliki perbedaan yang signifikan jika 𝜋𝑏 = 𝜋𝑐 =
0,50. Berdasarkan data di atas, nilai 𝜋𝑏dan 𝜋𝑐 diestimasikan dengan nilai 𝑝𝑏 dan 𝑝𝑐
sehingga 𝑝𝑏 = 𝑏 (𝑏 + 𝑐) = 13 (13 + 41) = 0,24⁄⁄ dan 𝑝𝑐 =
𝑐 (𝑏 + 𝑐) = 41 (13 + 41) = 0,76⁄⁄
Dengan demikian rumusan hipotesa berdasarkan informasi di atas adalah
sebagai berikut:
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
6
1. Hipotesis Nol = 𝐻0: 𝜋𝑏 = 𝜋𝑐 (proporsi observasi pada sel b sama dengan proporsi
observasi pada sel c atau tidak ada perbedaan antara obat dengan placebo)
2. Hipotesis Alternatif = 𝐻1: 𝜋𝑏 ≠ 𝜋𝑐 (proporsi observasi pada sel b tidak sama
dengan proporsi observasi pada sel c atau terdapat perbedaan antara obat dengan
placebo). Hipotesa ini bersifat dua arah (two-tailed hypothesis), karena nilai 𝜋𝑐 bisa
lebih besar atau lebih kecil dibanding 𝜋𝑏
atau
Hipotesis Alternatif = 𝐻1: 𝜋𝑏 < 𝜋𝑐 atau 𝐻1: 𝜋𝑏 > 𝜋𝑐 (proporsi observasi pada sel b
lebih kecil atau lebih besar dari proporsi observasi pada sel c atau terdapat
perbedaan antara obat dengan placebo). Hipotesa ini bersifat satu arah (one-tailed
hypothesis).
Menghitung Statistik Uji McNemar
Rumus menghitung nilai uji statistik McNemar (yang dibuat berdasarkan
distribusi Chi-square) adalah sebagai berikut:
𝜒2 =(𝑓0 − 𝑓𝑒)2
𝑓𝑒
Karena hanya sel b dan c yang diperhatikan, maka rumus di atas menjadi
𝜒2 =[𝑏 −
𝑏 + 𝑐2 ]
2
𝑏 + 𝑐2
+[𝑐 −
𝑏 + 𝑐2 ]
2
𝑏 + 𝑐2
𝜒2 =(𝑏 − 𝑐)2
𝑏 + 𝑐
dimana, b dan c adalah jumlah observasi pada sel b dan c pada tabel 2x2 dengan
derajat kebebasan (df)4 = 1. Karena distribusi chi-square yang bersifat kontinyu dan
simetris digunakan untuk mendekati distribusi diskrit, maka rumus di atas pada tahun
1934 oleh Yates dikoreksi dengan cara mengurangi selisih b dan c atau b-c dengan
angka 1, sehingga rumusnya menjadi:
𝜒2 =(|𝑏 − 𝑐| − 1)2
𝑏 + 𝑐
dimana |b – c| adalah nilai absolut dari selisih antara b dan c. Sehingga sesuai data di
atas nilai 𝜒2 uji McNemar adalah:
4 Nilai derajat kebebasan (degree of freedom atau df ) dihitung dengan rumus 𝑑𝑓 = (𝑟 − 1) × (𝑐 − 1) dimana r = jumlah baris dan c = jumlah kolom. Untuk tabel 2x2 maka df = (2-1) x (2-1) = 1
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
7
𝜒2 =(|13 − 41| − 1)2
13 + 41= 13,5
Interpretasi Hasil
Hasil perhitungan 𝜒2 = 13,5 dibandingkan dengan Tabel Distribusi Chi-Square
dengan derajat kebebasan = 1 pada taraf = 0,05 yaitu 3,841 (tabel terlampir). Nilai
hitungan 𝜒2 = 13,5 lebih besar dari nilai tabel 𝜒2 = 3,841, sehingga H0 ditolak sehingga
terdapat perbedaan signifikan antara Obat dengan Placebo, atau dapat dikatakan
bahwa obat Endurin efektif dalam mengurangi enuresis.
Contoh soal 2 (mengevaluasi pre-test dan post-test)
Seorang peneliti ingin mengetahui efektifitas sebuah metode penyuluhan untuk
meningkatkan pengetahuan murid terhadap Perilaku Hidup Bersih dan Sehat (PHBS)
pada anak-anak SD. Sebanyak 100 murid SD dipilih secara random untuk dilakukan
pengukuran tingkat pengetahuan tentang PHBS. Setelah tes pengetahuan dijalankan,
100 anak-anak SD tersebut diberikan sebuah metode penyuluhan tentang PHBS.
Setelah diberikan penyuluhan, tingkat pengetahuan PHBS anak SD tersebut diukur
kembali. Hasil pengukuran disajikan pada tabel di bawah. Berdasarkan data tersebut,
apakah dapat disimpulkan bahwa metode penyuluhan yang diberikan efektif
meningkatkan pengetahuan anak SD tentang PHBS.
Post-test
Jumlah
baris
Pengetahuan
baik
Pengetahuan
tidak baik
Pre-test Pengetahuan baik 10 13 23
Pengetahuan tidak baik 41 36 77
Jumlah Kolom 51 49 100
Karena jumlah frekuensi pada tabel 2x2 di atas mirip dengan contoh kasus pertama,
maka prinsip pengerjaannya mirip, yang membedakan hanya pada rumusan
hipotesisnya, yaitu:
1. Hipotesis Nol = 𝐻0: 𝜋𝑏 = 𝜋𝑐 (proporsi observasi pada sel b sama dengan proporsi
observasi pada sel c atau tidak ada perbedaan antara pengetahuan PHBS sebelum
intervensi dengan sesudah intervensi)
2. Hipotesis Alternatif = 𝐻1: 𝜋𝑏 ≠ 𝜋𝑐 (proporsi observasi pada sel b tidak sama
dengan proporsi observasi pada sel c atau terdapat perbedaan antara pengetahuan
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
8
PHBS sebelum intervensi dengan sesudah intervensi). Hipotesa ini bersifat dua arah
(two-tailed hypothesis), karena nilai 𝜋𝑐 bisa lebih besar atau lebih kecil dibanding
𝜋𝑏
atau
Hipotesis Alternatif = 𝐻1: 𝜋𝑏 < 𝜋𝑐 atau 𝐻1: 𝜋𝑏 > 𝜋𝑐 (proporsi observasi pada sel b
lebih kecil atau lebih besar dari proporsi observasi pada sel c atau terdapat
perbedaan antara pengetahuan PHBS sebelum intervensi dengan sesudah
intervensi). Hipotesa ini bersifat satu arah (one-tailed hypothesis).
Contoh soal 3 (perbedaan sebelum dan sesudah pelayanan)
Peneliti ingin mengetahui apakah pelayanan di RS dapat mengubah tingkat kemauan
pasien dalam merekomendasikan pelayanan di RS tersebut kepada temannya. Untuk
keperluan itu dipilih 13 pasien, dengan hasil sebagai berikut:
No. Responden Sebelum dilayani Sesudah dilayani
1 Mau Mau
2 Tidak mau Mau
3 Tidak mau Mau
4 Mau Mau
5 Mau Mau
6 Mau Mau
7 Mau Mau
8 Mau Mau
9 Tidak mau Mau
10 Mau Tidak mau
11 Mau Mau
12 Tidak mau Mau
13 Mau Tidak mau
Dari contoh soal di atas, variabel penelitian yang dipakai adalah sikap sebelum
pelayanan dan sikap sesudah pelayanan, sehingga rumusan hipotesisnya adalah:
H0 : 𝜋𝑏 = 𝜋𝑐 (tidak terdapat perbedaan sikap pasien sebelum dan sesudah pelayanan)
Ha : 𝜋𝑏 ≠ 𝜋𝑐 (terdapat perbedaan sikap pasien sebelum dan sesudah pelayanan)
Hasil penelitian diringkas dalam tabel 2x2 berikut:
Uji McNemar dan Uji Peringkat Bertanda Wilcoxon data berpasangan | Ade Heryana, SST, MKM
9
Sesudah dilayani
Jumlah
baris
Mau
merekomendasikan
Tidak mau
merekomendasikan
Sebelum
dilayani
Mau
merekomendasikan
7 2 9
Tidak mau
merekomendasikan
4 0 4
Jumlah Kolom 11 2 13
Nilai 𝜒2ℎ𝑖𝑡𝑢𝑛𝑔 =(|2−4|−1)2
2+4= 0,667
Nilai 𝜒2𝑡𝑎𝑏𝑒𝑙 dengan df =1 dan =0,05 adalah 3,841
Karena nilai 𝜒2ℎ𝑖𝑡𝑢𝑛𝑔 lebih kecil dari 𝜒2𝑡𝑎𝑏𝑒𝑙
maka H0 tidak dapat ditolak atau terdapat
perbedaan sikap pasien sebelum dan sesudah dilayani.
UJI WILCOXON DUA SAMPEL BERPASANGAN
Pertama kali dikenalkan oleh ahli statistik bernama Frank Wilcoxon. Seperti juga uji
McNemar, uji Wilcoxon digunakan untuk menguji hipotesis non-parametrik pada dua sampel
berpasangan. Yang membedakan adalah uji Wilcoxon dipakai jika data berskala ordinal,
sementara uji McNemar dipakai jika data berskala nominal.
Uji Wilcoxon dua sampel berpasangan merupakan pengembangan dari uji Wilcoxon
bertanda satu kelompok5. Untuk dapat menerapkan uji wilcoxon dua sampel berpasangan,
maka dibutuhkan rangakaian data yang berskala interval/rasio pada setiap subyek. Kemudian
hitung selisih masing-masing data pada setiap subyek dengan mengurangi data pada kondisi
2 dengan kondisi 1.
Uji hipotesis pada uji ini adalah “apakah sampel/kondisi percobaan berasal dari
populasi yang mewakili ?” sehingga nilai median dari skor yang berbeda adalah nol. Bila
terdapat perbedaan yang signifikan, maka hal ini mengindikasikan bahwa terdapat
kecenderungan sampel/kondisi percobaan berasal dari populasi yang berbeda.
Asumsi-asumsi yang digunakan pada uji ini antara lain:
1. Sampel pada n subyek dipilih secara acak dari populasi yang mewakili
2. Nilai asal yang dihasilkan dari setiap subyek dalam format skala interval/rasio;
5 Lihat artikel penulis berjudul “Wilcoxon Signed-ranks Test Single-sample” pada alamat url berikut: http://adeheryana.weblog.esaunggul.ac.id/2017/04/16/wilcoxon-signed-rank-test-single-sample/