1 1 Vembri Noor Helia, ST., MT. Penyebaran Data atau Variasi : Variansi Variansi (variance 2 s atau 2 ), adalah ukuran yang menunjukkan rata-rata kuadrat penyimpangan data dari nilai rata-rata data (mean value). Variansi dihitung sebagai berikut ) 1 /( ) ( 1 2 2 n x x s n i i , dimana (n-1) adalah derajat kebebasan (degree of freedom) dari sejumlah n data setelah berkurang satu karena telah digunakan untuk menghitung nilai rata-rata x . Dari perhitungan tersebut, dapat diturunkan cara perhitungan lain yang dinilai lebih mudah untuk penghitungan secara manual sebagai berikut ) 1 /( / ) ( 1 1 2 2 n n x x s n i i n i i . 2 Ada cara perhitungan lain yang dilakukan dengan melihat perbedaan setiap pasang data seperti pada persamaan berikut ) 1 ( 2 / ) ( 1 1 2 2 n n x x s n i n j j i . Dengan cara ini, tidak terlihat adanya perhitungan nilai rata-rata (lokasi pemusatan data). Penggunaan (n-1) sebagai ganti n menghasilkan estimasi tidak bias untuk variansi populasi. Jika digunakan nilai rata- rata yang bukan berasal dari data (misalkan diketahui ), maka derajat kebebasannya (degree of freedom) tetap berjumlah n, dan variansi dihitung sebagai berikut n x s n i i / ) ( 1 2 2 . 3 Simpangan baku Simpangan baku atau standard deviation (s atau ) menunjukkan rata-rata penyimpangan data dari nilai rata-ratanya, atau akar kuadrat dari variansi ) 1 /( ) ( 1 2 n x x s n i i atau n x s n i i / ) ( 1 2 . Dalam distribusi normal, rata-rata menunjukkan parameter lokasi, sedangkan deaviasi standar menunjukkan parameter skala (sebagai kluster data-data observasi). Statistik ini memiliki bias yang besarnya dapat dilihat sebagai faktor koreksi ) 3 4 /( ) 1 ( 4 4 n n c (lihat tabel pada buku pengendalian kualitas). 4 Koefisien variasi Koefisien variasi (coefficeint of variation, CV) diberikan oleh persamaan berikut (biasanya dinyatakan dalam %) x s CV / . Statistik ini penting, karena menghasilkan skala yang memiliki nilai nol yang mutlak dan digunakan untuk membandingkan variasi antara dua variabel yang berbeda dimensi Rentang Rentang atau range (R) adalah ukuran yang menunjukkan selisih antara data terbesar dengan data terkecil pada sebuah kelompok data. Nilai simpangan baku dapat diestimasi dengan menggunakan rata-rata rentang R yang dikonversikan sebagai 2 / ˆ d R s , dimana 2 d (ditentukan oleh ukuran sampel). n 2 3 4 5 6 7 8 9 10 2 d 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078 5 Perhatikan contoh berikut: Diperoleh data nilai hasil penjualan dua jenis produk di beberapa outlet untuk perioda bulan yang lalu dan bulan ini sebagai berikut: Produk A Produk B Outlet Bulan lalu Bulan ini Bulan lalu Bulan ini East 89.7 87.3 84.7 86.3 West 81.4 79.7 86.1 79.3 North 84.5 85.1 83.2 82.6 South 84.8 81.7 91.9 89.1 (dalam Rp. 000.000,-) Rata-rata hasil penjualan produk A (84.28), dan produk B (85.40) Rata-rata hasil penjualan bulan lalu (85.79), dan bulan ini (83.89) Rata-rata hasil penjualan outlet East (87), West (81.63), North (83.85), dan South (86.88) 6
Penjelasan mengenai uji analisis anova untuk anak kuliah
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
1
Vembri Noor Helia, ST., MT.
Penyebaran Data atau Variasi :
Variansi
Variansi (variance 2s atau 2 ), adalah ukuran yang menunjukkan rata-rata kuadrat penyimpangan data dari nilai rata-rata data (mean value). Variansi dihitung sebagai berikut
)1/()(1
22
nxxsn
ii ,
dimana (n-1) adalah derajat kebebasan (degree of freedom) dari sejumlah n data setelah berkurang satu karena telah digunakan untuk menghitung nilai rata-rata x . Dari perhitungan tersebut, dapat diturunkan cara perhitungan lain yang dinilai lebih mudah untuk penghitungan secara manual sebagai berikut
)1/(/)(11
22
nnxxsn
ii
n
ii .
2
Ada cara perhitungan lain yang dilakukan dengan melihat perbedaan setiap pasang data seperti pada persamaan berikut
)1(2/)(1 1
22
nnxxsn
i
n
jji .
Dengan cara ini, tidak terlihat adanya perhitungan nilai rata-rata (lokasi pemusatan data). Penggunaan (n-1) sebagai ganti n menghasilkan estimasi tidak bias untuk variansi populasi. Jika digunakan nilai rata-rata yang bukan berasal dari data (misalkan diketahui ), maka derajat
kebebasannya (degree of freedom) tetap berjumlah n, dan variansi dihitung
sebagai berikut nxsn
ii /)(
1
22
.
3
Simpangan baku Simpangan baku atau standard deviation (s atau ) menunjukkan rata-rata penyimpangan data dari nilai rata-ratanya, atau akar
kuadrat dari variansi )1/()(1
2
nxxsn
ii atau
nxsn
ii /)(
1
2
. Dalam distribusi normal, rata-rata
menunjukkan parameter lokasi, sedangkan deaviasi standar menunjukkan parameter skala (sebagai kluster data-data observasi). Statistik ini memiliki bias yang besarnya dapat dilihat
sebagai faktor koreksi )34/()1(44 nnc (lihat tabel pada
buku pengendalian kualitas).
4
Koefisien variasi Koefisien variasi (coefficeint of variation, CV) diberikan oleh persamaan berikut (biasanya dinyatakan dalam %)
xsCV / . Statistik ini penting, karena menghasilkan skala yang memiliki nilai nol yang mutlak dan digunakan untuk membandingkan variasi antara dua variabel yang berbeda dimensi
Rentang Rentang atau range (R) adalah ukuran yang menunjukkan selisih antara data terbesar dengan data terkecil pada sebuah kelompok data. Nilai simpangan baku dapat diestimasi dengan menggunakan rata-rata rentang R yang dikonversikan sebagai
2/ˆ dRs , dimana 2d (ditentukan oleh ukuran sampel).
Perhatikan contoh berikut: Diperoleh data nilai hasil penjualan dua jenis produk di beberapa outlet untuk perioda bulan yang lalu dan bulan ini sebagai berikut:
Produk A Produk B
Outlet Bulan lalu Bulan ini Bulan lalu Bulan ini
East 89.7 87.3 84.7 86.3 West 81.4 79.7 86.1 79.3 North 84.5 85.1 83.2 82.6 South 84.8 81.7 91.9 89.1
(dalam Rp. 000.000,-)
Rata-rata hasil penjualan produk A (84.28), dan produk B (85.40)
Rata-rata hasil penjualan bulan lalu (85.79), dan bulan ini (83.89)
Rata-rata hasil penjualan outlet East (87), West (81.63), North (83.85), dan South (86.88)
6
2
Dari data-data tersebut muncul pertanyaan berikut: Apakah ada perbedaan nilai penjualan dilihat dari faktor-faktor jenis produk, perioda waktu penjualan atau lokasi penjualan (outlet)? Apakah ada pengaruh bersama (interaksi) dari faktor-faktor tersebut sehingga terdapat variasi pada nilai penjualan?
7 8
• ANOVA (ANalysis Of VAriance)
adalah metoda statistika untuk menentukan keberadaan (existence) perbedaan (differences) dari beberapa rata-rata populasi.
9
ANOVA dirancang untuk mendeteksi perbedaan dari rata-rata populasi karena adanya perbedaan perlakukan (treatments) tertentu.
ANOVA adalah pengujian terpadu (joint test)
▪ Kesamaan beberapa rata-rata populasi diuji secara bersamaan atau simultan.
ANOVA menguji kesamaan beberapa rata-rata populasi dengan mengevaluasi dua estimator variansi populasi (karenanya disebut analysis of variance).
10
Diperlukan r sampel random independen dimana setiap sampel berkaitan dengan sebuah perlakuan tertentu.
Total observasi yang diperlukan adalah
n = n1+ n2+ n3+ ...+nr.
Sehingga rata-rata sampel: x1, x2 , x3 , ... , xr
Rata-rata sampel ini digunakan untuk menghitung estimator variansi populasi. Jika rata-rata populasi sama maka variansi diantara rata-rata sampel tersebut kecil.
Variansi sampel : s12, s2
2, s32, ...,sr
2
Variansi sampel ini digunakan untuk menentukan pooled estimator dari variansi populasi.
11
• Asumsikan sampling random independen dari setiap populasi.
• Asumsikan pula bahwa populasi tersebut: Berdistribusi normal,
memiliki rata-rata i (dapat sama atau berbeda),
dengan variansi yang sama, i2.
1 2 3
Population 1 Population 2 Population 3
Statistik uji:
F(r-1, n-r) =Estimasi variansi dari rata-rata sampel
Estimasi variansi dari seluruh observasi
Statistik uji dalam analisis variansi dilandasi oleh rasio dua estimator
variansi dengan (r-1) degrees of freedom untuk pembilang dan (n-r)
degrees of freedom untuk penyebut.
Uji hipotesis:
H0: 1 = 2 = 3 = 4 = ... r
H1: tidak semua i (i = 1, ..., r) sama
12
3
x
x
x
Jika hipotesis awal benar:
Diharapkan bahwa rata-rata sampel hampir
bernilai sama, karenya diharapkan juga bahwa
variasi diantara rata-rata sampel (between
sample) kecil, relatif terhadap variasi pada rata-
rata sampel tertentu (within sample).
Jika hipotesisi awal benar, pembilang pada
statistik uji kecil, relatif terhadap pembilang:
F(r-1, n-r)=Estimate of variance based on means from r samples
Estimate of variance based on all sample observations
H0:
13
x xx
Jika hipotesis awal salah:
is equal to but not to ,
is equal to but not to ,
is equal to but not to , or
, , and are all unequal.
Dalam kondisi tersebut diinginkan variansi diantara rata-rata sampel (between
sample) besar relatif terhadap variasi disekitar rata-rata sampel individual (within
sample).
Jika hipotesis awal tidak dapat diterima, statistik uji pembilang besar relatif
terhadap penyebut:
F(r-1, n-r)=Estimate of variance based on means from r samples
Estimate of variance based on all sample observations
14
15
•Dari 4 populasi, diambil sampel random n1 + n2 + n3 + n4 = 54. Statistik
uji :F(4-1, 54-4)= F(3,50) = Estimate of variance based on means from 4 samples
Estimate of variance based on all 54 sample observations
543210
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0F(3,50)
f (F)
FDistributionwith3 and 50 Degrees of Freedom
2.79
a=0.05
Area penerimaan (untuk a=0.05) adalah F
2.79, dan area penolakan F > 2.79. Jika
statustik uji kurang dari 2.79 maka hipotesis
awal diterima, dan disimpulkan rata-rata 4
populasi sama. Sebaliknya jika statistik uji
lebih besar dari 2.79, hipotesis awal ditolak,
artinya rata-rata ke-4 populasi tidak sama.
Randomly chosen groups of customers were served different types of coffee and asked to rate the
coffee on a scale of 0 to 100: 21 were served pure Brazilian coffee, 20 were served pure Colombian
coffee, and 22 were served pure African-grown coffee.
The resulting test statistic was F = 2.02
berbeda). signifikan secara(tidak sama dianggap populasi
rata-rata ketiga artinya ditolak,dapat tidak 0
H
15.360,2
02.2
15.360,2363,13)-(,1-
:adalah 0.05=untuk kritis Batas
3=r
63=22+20+21=n 22=3
n 20=2
n 21=1
n
equal means threeallNot :1
H321
:0
H
FF
FFrnr
F
a
543210
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0F
f( F)
F Distribution with 2 and 60 Degrees of Freedom
a=0.05
Test Statistic=2.02 F(2,60)=3.15
16
Rata-rata total , x, adalah rata-rata dari n = n1+ n2+ n3+...+ nr observasi dari
seluruh r sampel.
i. -ke populasi dari sampel dalam j-ke dataadalah ij
memungkinkan untuk membandingkan setiap pasang rata-rata populasi dengan sebuah tingkat
pembedaan (single level of significance).
•Uji ini dilandasi oleh studentized range distribution, q, dengan r dan (n-r) degrees of
freedom.
•Nilai kritis dalam uji Tukey Pairwise Comparisons adalah Tukey Criterion:
dimana ni adalah ukuran sampel terkecil dianatar r sample.
•Statistik uji adalah perbedaan absolut (absolute value of the difference) antara rata-rata sampel,
dan hipotesis awal ditolak jika statistik uji lebih besar dari nilai kritis kriteria Tukey
(Tukey Criterion)
T qMSE
ni
a
compare. tomeans population of pairs )!2(!2
!
2
r are e that therNote
r
r
36
7
Contoh:
i Treatment Mean I. H0: 1 2 VI. H0: 2 4
1 Guadeloupe 89 H1: 1 2 H1: 2 4
2 Martinique 75 |89-75|=14>13.7* |75-91|=16>13.7*
3 Eleuthra 73 II. H0: 1 3 VII. H0: 2 5
4 Paradise Is. 91 H1: 1 3 H1: 2 5
5 St. Lucia 85 |89-73|=16>13.7* |75-85|=10<13.7
III. H0: 1 4 VIII. H0: 3 4
The critical point T0.05 for H1: 1 4 H1: 3 4
r=5 and (n-r)=195 |89-91|=2<13.7 |73-91|=18>13.7*
degrees of freedom is: IV. H0: 1 5 IX. H0: 3 5
H1: 1 5 H1: 3 5
|89-85|=4<13.7 |73-85|=12<13.7
V. H0: 2 3 X. H0: 4 5
H1: 2 3 H1: 4 5
|75-73|=2<13.7 |91-85|= 6<13.7
Reject the null hypothesis if the absolute value of the difference between the sample means
is greater than the critical value of T. (The hypotheses marked with * are rejected.)
T qMSE
ni
a
386504 4
4013 7.
..
37
Hipotesis awal yang membandingkan rata-rata populasi 1 dan 2, 1 dan 3, 2 dan 4, dan 3 dan 4 ditolak. Sebaliknya, hipotesis awal kesamaan rata-rata populasi 1 dan 4, 1 dan 5, 2 dan 3, 2 dan 5, 3 dan 5, dan 4 dan 5 diterima.
Garis tebal mengindikasikan pengelompokkan tiga rata-rata populasi, yaitu:
2 dan 3; 2, 3, dan 5; dan 1, 4, dan 5.
1
2
3
4
5
38
Uji ketidak samaan rata-rata populasi:Newman-Keuls test (Newman 1939; Keuls 1952)Tukey test (Tukey 1953)Duncan’s multiple range test (Duncan 1955).
39
Duncan’s multiple range test:Urutkan rata-rata populasi (kecil – besar)Tentukan standar error setiap rata-rataTemukan nilai ra(p,f), untuk p=2,3,…a (a adalah rentang terbesar)Hitung rentang perbedaan deviasi Rp
40
Tentukan standar error setiap rata-rata
Temukan nilai ra(p,f) dari tabelHitung rentang perbedaan deviasi (least significance range)
41
Contoh:Industri kertas mengamati pengaruh konsetrasi “hardwood” 5%;10%;15%;20% dan 25%. Setiap sampel berukuran 5, sehingga ada 25 data (degree of freedom error 25-5=20). Diketahui MSE=8.06, sehingga stadar error adalah 1,27. Urutan rata-rata adalah: