MODUL 2
MULTIVARIATE ANALYSIS OF VARIANCE (MANOVA)
1. Tujuan Praktikum
Setelah praktikum pada modul 2 ini diharapkan mahasiswa mempunyai kompetensi
sebagai berikut:
1) Dapat melakukan prosedur pengujian g nilai tengah secara multivariat (MANOVA)
satu arah (one-way)
2) Dapat melakukan prosedur pengujian g nilai tengah secara multivariat (MANOVA)
dua arah (two-way)
2. Materi
Dari kuliah-kuliah terdahulu telah kita pelajari prosedur pengujian perbandingan nilai
tengah antara dua grup (atau populasi) atau lebih untuk pengukuran secara univariat
(satu variabel).
Tabel 1. Padanan Prosedur Pengujian Perbandingan Nilai Tengah Antara Dua/Lebih Grup
Banyaknya Grup dalam
Variable Prediktor
(Treatment)
Banyaknya Variable Respon
Satu
(univariate)
Dua atau lebih
(multivariate)
Dua grup
(Specialized Case) t test Hottelings T2
Lebih dari dua grup
(Generalized Case) ANOVA MANOVA
1) MANOVA satu arah
Struktur Data
Struktur data MANOVA satu arah (one-way) dapat dilihat sebagaimana ditampilkan
dalam Tabel 2. Di mana, Treatment (perlakuan) dibagi dalam g grup dan masing-
masing grup diulang sebanyak n kali. Ulangan untuk masing-masing grup bisa berbeda
dan bisa sama untuk semua grup. Perlakuan dilambangkan dengan X, sedangkan respon
atau variabel dependen dilambangkan dengan Y.
Tabel 2. Struktur data MANOVA satu-arah
Treatment (Xl j) Variable
Dependen ke-1
Variable
Dependen ke-2
Variable
Dependen ke-k
X11
X12
.
.
X1j
X21
X22
.
.
X2j
.
.
Xg1
Xg2
.
.
Xgj
Y11
Y12
.
.
Y1n1
.
.
.
.
Y1n2
.
.
.
.
.
.
Y1ng
Y21
Y22
.
.
Y2n1
.
.
.
.
Y2n2
.
.
.
.
.
.
Y2ng
Yk1
Yk2
.
.
Ykn1
.
.
.
.
Ykn2
.
.
.
.
.
.
Ykng
Model aditif MANOVA saru arah
Y lj l lje dengan j = 1, 2, ln dan l =1, 2, g (2.1)
dengan = observasi ke-j dari grup ke-l
= rata-rata keseluruhan (grand mean)
= efek grup (atau perlaakuan) ke-l terhadap respon, karena merupakan
efek tetap (fixed factor) sehingga diasumsikan 1
0
g
l l
l
n
= variabel random yang mengikuti distribusi ( , )pN 0 , dengan p merujuk
pada banyaknya variabel respon
Perlu diingat bahwa variabel random error saling berkorelasi, sedangkan matriks
kovarian error ( ) adalah sama untuk semua populasi. Satu observasi yang ditulis
dalam bentuk vektor dapat didekomposisi berdasarkan model regresi tersebut, menjadi
= + +
penaksir efeknilai rata-rata (observasi)
perlakuan sample keseluruhan
lj l lj l
l
y y y y y y
))
residual
lj
e
)
Analog dengan ANOVA, hipotesis untuk pengujian pengaruh perlakuan terhadap
respon-respon adalah sebagai berikut:
H0: 1 2 g 0 (tidak ada efek treatment terhadap respon)
H1: Paling tidak ada satu l di mana l 0 ( terdapat efek treatment terhadap respon)
(Pengujian lebih lanjut bisa dibaca di Applied Multivariate Statistical Analysis, Johnson
dan Wichern atau buku-buku teks lainnya)
2) MANOVA dua-arah
Model aditif MANOVA
dengan j = 1, 2, nl ; l =1, 2, g dan k = 1, 2,
b
dengan = observasi
= rata-rata keseluruhan (grand mean)
= efek level ke-g faktor l terhadap respon
= efek level ke-b factor k terhadap respon
= efek interaksi factor l dan k terhadap respon
= error model
Hipotesis untuk menguji efek interaksi terhadap respon adalah sebagai berikut
H0: (tidak ada efek treatment terhadap respon)
H1: Minimal ada satu pasangan l dan k untuk sehingga 0
(Pengujian lebih lanjut bisa dibaca di Applied Multivariate Statistical Analysis, Johnson
& Wichern atau buku-buku teks lainnya)
Pada praktikum ini kita akan menggunakan empat macam pengujian yang dapat
diperoleh dari SPSS maupun R yaitu: Hotteling-Lawley atau Hottelings trace, Wilks
lambda, Pillais trace dan Roys largest root.
3. Alat dan Bahan
Komputer dan software SPSS dan R
4. Kegiatan Praktikum
1) MANOVA satu arah
1. Menyiapkan dataset patlos_sample.sav (file dapat diperoleh pada direktori
installation SPSS di dalam folder Program Files yakni di dalam folder
Samples > English > patlos_sample.sav)
2. Prosedur MANOVA satu arah dengan SPSS adalah sebagai berikut
a. Klik menu Analysis > General Linear Model > pilih Multivariate
b. Pilih Length of stay (los) dan Treatment costs (costs) sebagai variabel
dependen.
c. Pilih Clot-dissolving drugs (clotsolv) sebagai fixed factor (faktor tetap),
yang merupaakan variabel prediktor dan terdiri atas tiga level (ulangan /
grup / perlakuan):
Level 1 : Streptokinase
Level 2 : Reteplase
Level 3 : Alteplase
Sehingga kita mendapatkan struktur data hasil observasi eksperimen sebagai
berikut:
Treatment
(clotsolv)
Variable Dependen ke-1
(los)
Variable Dependen ke-2
(costs) nl
Level 1 :
Streptokinase
Y11
Y12
.
.
11Y n
Y21
Y22
.
.
12Y n
n1 = 116
Level 2 :
Reteplase
Y11
Y12
.
.
21Y n
Y21
Y22
.
.
22Y n
n2 = 696
Level 3 :
Alteplase
Y11
Y12
.
.
31Y n
Y21
Y22
.
.
32Y n
n2 = 669
Perhatikan pula bahwa nl untuk maing-masing treatment tidaklah sama.
Kemudian klik Options.
Pilih SSCP matrices, untuk menampilkan matiks sum square dan cross product
(SSCP)
Pilih Homogenity test, untuk menampilkan hasil tes homoskedastisitas
Pilih Estimates of effect size, untuk menampilkan statistic yang menunjukkan
besarnya efek treatment terhadap respon.
Klik Continue.
Klik OK.
d. Memahami output GLM-MANOVA satu arah dari SPSS
Tabel MANOVA yang dihasilkan dari analisis linier model di atas adalah:
Output dengan judul Between-Subjects SSCP di atas digunakan untuk menyusun
tabel MANOVA. Dari output tersebut kita dapat menyusun tabel MANOVA
sebagai berikut:
Sumber keragaman Matriks SSCP df
Treatment B = 2 - 2 2
- 2 2 1 g 1 = 3 1 = 2
Error W = 2 1 12 2 1 2 2
- g =
116 + 696 + 669 -3 = 1478
Total B + W = [?] - 1 = 1481-1 = 1480
Berikutnya dibahas mengenai pengujian hipotesis untuk MANOVA dari output
yang yang berjudul Multivariate Tests. Output tersebut menunjukkan beberapa
statistik uji untuk melakukan pengujian hipotesis dalam MANOVA. Terdapat
empat statistic uji yang dimunculkan: Pillais Trace, Wilks Lambda, Hottelings
Trace, dan Roys Largest Root Berikut karakteristik dari keempat statistik
tersebut:
Statistik uji Karakteriestik
Pillais Trace dan
Hottelings Trace
Kedua statistik ini bernilai positif. Meningkatnya nilai statistik
menandakan pengaruh treatment (perlakuan) terhadap model
yang lebih tinggi.
Statistik Hottelings Trace nilainya kadang lebih tinggi atau bisa
juga sama dengan nilai statistic Pillais Trace
Wilks Lambda
Statistik Wilks' Lambda bernilai positif antara 0 sampai dengan
1. Pengaruh treatment terhadap model bertambah seiring dengan
menurunnya nilai statistic Wilks' Lambda.
Roys Largest Root
Statistik ini bernilai positif. Meningkatnya nilai statistik
menandakan pengaruh treatment terhadap model yang lebih
tinggi. Nilainya kurang dari atau sama dengan statistik
Hottelings Trace Saat nilai Roys Largest Root sama dengan
Hottelings Trace menandakan efek treatment tidak banyak
berkontribusi terhadap model.
Untuk keputusan tolak / tidak H0, kita dapat langsung membandingkan nilai p-
value atau Sig. (signifikansi) dengan F-tabel sesuai dengan yang sudah
ditetapkan serta derajat bebas (df) yang telah disediakan dalam output.
Partial Eta Squared merupakan putput tambahan (bisa tidak ditampilkan) untuk
melihat tingkat pengaruh treatment terhadap respon atau model. Nilai maksimum
dari Partial Eta Squared adalah 1, semakin nilainya mendekati 1 maka pengaruh
treatment yang bersangkutan semakin besar.
Dalam kasus ini, keempat statistik uji memiliki p-value yang sangat kecil
dibandingkan level signifikan (misal, = 5%). Maka untuk pengujian efek
treatment clotsolv dalam kasus ini, H0 dapat ditolak. Besarnya pengaruh
treatment clotsolv terhadap respon diindikasikan oleh nilai Partial Eta Squared,
di mana nilainya secara umum untuk masing-masing staitstik uji cenderung kecil
(0.013 atau 0.024).
Latihan: lakukan pengujian hipotesis untuk efek treatment secara manual dengan
Wilks Lambda = |W| / |B + W|.
3. Sedangkan prosedur melakukan MANOVA satu arah menggunakan R adalah
sebagai berikut:
a. Pada tahap persiapan data, data dapat diimport dari SPSS secara langsung
dengan memanggil file berekstensi *.sav, tetapi pastikan Anda telah
memiliki package foreign. Alternatif lainnya, dari file SPSS bisa disalin
terlebih dahulu ke dalam Notepad atau Ms. Excel, kemudian dapat
dipanggil melalui perintah berikut
> library(foreign)
## Memanggil data sekaligus memastikannya berbentuk matriks
> patlos
b. Membentuk model MANOVA satu arah dengan perintah berikut
c. Memahami keluaran MANOVA satu arah dari R. Dari keluaran di atas
tampak bahwa statistik uji yang digunakan adalah Pillais, apabila kita
ingin menggunakan statistik yang lain, perintah-perintah berikut akan
membantu:
## Mengetahui nama-nama variabel pada dataset (berdasarkan kolom)
> names(patlos)
[1] "proc" "clotsolv" "los" "cost"
> library(MASS)
## MANOVA satu arah dengan 2 variabel respon
> respon manovasatu summary(manovasatu)
Df Pillai approx F num Df den Df Pr(>F)
as.factor(clotsolv) 2 0.025064 9.3786 4 2956 1.569e-07 ***
Residuals 1478
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
## Menampilkan hasil MANOVA dengan empat statistic uji
# tampak bahwa, Pillai test merupakan default
> summary(manovasatu, tests = "Pillai")
Df Pillai approx F num Df den Df Pr(>F)
as.factor(clotsolv) 2 0.025064 9.3786 4 2956 1.569e-07 ***
Residuals 1478
> summary(manovasatu, test = "Wilks")
Df Wilks approx F num Df den Df Pr(>F)
as.factor(clotsolv) 2 0.97496 9.4244 4 2954 1.44e-07 ***
Residuals 1478
> summary(manovasatu, test = "Hotelling-Lawley")
Df HL approx F num Df den Df Pr(>F)
as.factor(clotsolv) 2 0.025664 9.4701 4 2952 1.322e-07 ***
Residuals 1478
> summary(manovasatu, test = "Roy")
Df Roy approx F num Df den Df Pr(>F)
as.factor(clotsolv) 2 0.024786 18.317 2 1478 1.387e-08 ***
Residuals 1478
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
statistik Pillai statistik uji F derajat bebas
num = db1,
den = db2
p-value
Berdasarkan keluaran R di atas, hasil pengujian (tentu saja) sama dengan
yang ditampilkan SPSS. Dengan keempat pengujian, dapat disimpulkan
bahwa variabel clotsolv berpengaruh nyata terhadap kedua respon bahkan
pada level signifikan = 0.001.
2) MANOVA dua arah
1. Dengan dataset yang sama, lakukan analisis dengan MANOVA dua arah
terhadap variabel-variabel berikut menggunakan SPSS:
Dimana variabel Clot-dissolving (clotsolv) sudah kita kenali dari MANOVA satu
arah, sedangkan variabel Surgical treatment (proc) adalah faktor tetap yang
terdiri atas dua level yaitu: (1) PTCA dan (2) CABG (prosedur-prosedur operasi)
Kemudian pada Options, pilih SSCP matrices, Homogenity test, dan Estimates
of effect size.
Klik Continue.
Klik OK.
Memahami output GLM-MANOVA dua arah, perhatikan tabel MANOVA dua
arah berikut:
Seperti halnya pada MANOVA satu arah, output dengan judul Between-Subjects
SSCP digunakan untuk menyusun tabel MANOVA. Dari output tersebut kita
dapat menyusun tabel MANOVA sebagai berikut:
Sumber keragaman Matriks SSCP df
Faktor 1: proc SS1 = 2 2 1 1 2
g 1 = 2 1 = 1
Faktor 2 : clotsolv SS2 = 2 - 12
- 12 12 b 1 = 3 1 = 2
Faktor 1 * Faktor 2 SSint = 1 1 1 1 1 2
(g - 1)(b - 1) = 2
Error W = 1 1 2 1 2
1475
Total SS1 + SS2 + SSint + W - 1 = 1480
Dalam kasus ini, pengambilan keputusan untuk hipotesis cukup dengan melihat
hasil pengujian efek treatment karena efek interaksi cenderung tidak signifikan.
Sedangkan efek treatment clotsolv signifikan begitu pula dengaan efek proc,
tentu saja dengan level pengaruh yang berbeda (lihat nilai Partial Eta Square).
Latihan: lakukan pengujian hipotesis untuk efek treatment secara manual dengan Wilks
Lambda terhadap interaksi, faktor clotsolv dan faktor proc.
2. Dengan dataset yang sama, lakukan analisis dengan MANOVA dua arah
terhadap variabel-variabel berikut menggunakan R:
> library(MASS)
## MANOVA dua arah dengan 2 variabel respon
> respon manovadua summary(manovasatu)
Df Pillai approx F num Df
as.factor(clotsolv) 2 0.02966 11.10 4
as.factor(proc) 1 0.74546 2158.44 2
as.factor(clotsolv):as.factor(proc) 2 0.00408 1.51 4
Residuals 1475
den Df Pr(>F)
as.factor(clotsolv) 2950 6.155e-09 ***
as.factor(proc) 1474 < 2.2e-16 ***
as.factor(clotsolv):as.factor(proc) 2950 0.1971
Residuals
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Keluaran di atas juga dapat dimodifikasi untuk mendapatkan statistic uji selain
default (Pillai), sebagaimana mada MANOVA satu arah. Keluaran pun tidak
berbeda dari SPSS, perbedaan angka disebabkan oleh angka ketelitian.
5. Tugas
1. Carilah data hasil pencatatan disain eksperimen dua faktor dan multirespon (minimal
dua variabel dependen) kemudian analisis dan lakukan pengujian dengan MANOVA
satu arah dan dua arah. Data bisa diperoleh dari data tugas akhir atau data dari internet
yang salah satunya bisa dari UCI Machine Learning Repository
(archive.ics.uci.edu/ml)
2. Membuat laporan praktikum mengikuti format yang telah diberikan.
3. Tugas dilakukan berkelompok sesuai kesepakatan dan dikumpulkan paling lambat
seminggu setelah praktikum Modul 2 berakhir.