Nama : Faradila Martha Devi NIM : 107094003053 1. Pengelompokkan data dengan metode K-Means Cluster (3 Cluster) a. Perusahaan yang masuk Cluster 1, 2, 3 Cluster 1 : Bumi resources, Aneka Tambang, Astra Internasional, Indofood Sukses Makmur Cluster 2 : Aqua Golden Mississipi Cluster 3 : Astra Agro Lestari, Sampoerna Agro, SMART, Adaro Energy, Resources Alam Indonesia, Elnusa, Holcim Indonesia, Indocement Tunggal, Astra Otoparts, Indomobil Sukses Internasional, Ades Waters Indonesia, Siantara Top, Ultra Jaya Milk, Bentoel Int, Gudang Garam, HM Sampoerna, Indofarma, Kalbe Farma, Merck, Mustika ratu b. Output dan Interpretasinya Descriptives Descriptive Statistics N Minimum Maximum Mean Std. Deviation assets 25 190 77788 12160,84 17903,472
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Nama : Faradila Martha DeviNIM : 107094003053
1. Pengelompokkan data dengan metode K-Means Cluster (3 Cluster)
a. Perusahaan yang masuk Cluster 1, 2, 3Cluster 1 : Bumi resources, Aneka Tambang, Astra Internasional, Indofood Sukses MakmurCluster 2 : Aqua Golden MississipiCluster 3 : Astra Agro Lestari, Sampoerna Agro, SMART, Adaro Energy,
Resources Alam Indonesia, Elnusa, Holcim Indonesia, Indocement Tunggal, Astra Otoparts, Indomobil Sukses Internasional, Ades Waters Indonesia, Siantara Top, Ultra Jaya Milk, Bentoel Int, Gudang Garam, HM Sampoerna, Indofarma, Kalbe Farma, Merck, Mustika ratu
b. Output dan Interpretasinya
Descriptives
Descriptive Statistics
N Minimum Maximum Mean Std. Deviationassets 25 190 77788 12160,84 17903,472Hi 25 215 129500 13274,40 27400,901Low 25 50 100000 6851,56 20653,768Close 25 50 127000 8624,00 25713,036Freq 25 15 1192213 130952,96 273001,617Valid N (listwise) 25
Analisis :Tabel ini merupakan table Deskriptif Statistik, yang mendeskriptifkan data-data (minimum, maximum, mean-rataan, standar deviasi) dalam table
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasi
a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 3. The minimum distance between initial centers is 4,821.
Output ini menyatakan telah terjadi 3 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final Cluster Centers)
Output ini adalah akhir dari proses clustering, dengan analisis :Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada angka z, dengan ketentuan berikut :
a. Angka negative berarti data di bawah rata-rata totalb. Angka positif berarti data di atas rata-rata total
Hal itu berarti, data-data di atas berada di atas rata-rata totalMis, angka 1,61235 pada variable Zassets menyatakan rata-rata assets responden pada cluster 1, yaitu :
X = µ + z.
Dimana :X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu)µ = Rata-rata populasiz = Nilai standardisasi yang didapat pada SPSS = Standar deviasi
Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk mempunyai perbedaan tiap cluster, melalui pengujian output ANOVA
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Analisis :Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran within cluster mean, sehingga kolom F :
F = Cluster ErrorContoh :Angka F (pada ZHi) = 9,405/0,236 = 39,85 sebanding dengan 39,872 (perbedaan angka mungkin karena pembulatan)
Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk.Sebagai contoh :Pada variable Close, angka F = 126,373 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata, atau dengan kata lain, factor Close sangat memmbedakan karakteristik ketiga cluster
Sekarang kita bandingkan, angka F variable ZAssets (11,927) lebih kecil dari angka F variable ZClose (126,373), hal itu berarti perbedaan assets jauh lebih kecil dari perbedaan Close antar responden pada ketiga cluster
Number of Cases in each Cluster
Cluster 1 4,0002 1,0003
20,000
Valid 25,000Missing ,000
Analisis :Dari table di atas didapat :
1. Responden yang masuk ke cluster 1 sebanyak 4 responden2. Responden yang masuk ke cluster 2 sebanyak 1 responden3. Responden yang masuk ke cluster 3 sebanyak 20 responden
Tidak ada variable yang hilang (missing), karena semua responden (25 resonden) terpeta pada ketiga cluster.
2. Pengelompokkan data dengan metode Hierarchical Cluster
Output dan Interpretasinya :
ProximitiesCase Processing Summary(a)
Cases
Valid Missing Total
N Percent N Percent N Percent
24 96,0% 1 4,0% 25 100,0%
a Squared Euclidean Distance used
Output menyatakan bahwa 24 data yang ada telah diproses Cluster
Analisis :Tabel menyatakan matrix proximity, dengan angka yang tertera adalah jarak (distance) antara 2 buah variableSeperti diketahui, langkah pertama cluster, adalah melakukan pengukuran tterhadap kesamaan (similarity) antar variable, sesuai tujuan cluster untuk mengelompokkan variable yang sama (similar)Contoh :Jarak antara variable 1 (Sumatera Utara) dengan variable 2 (Sumatera Barat) adalah 3, 891Jarak antara variable 1 (Sumatera Utara) dengan variable 3 (Riau) adalah 3, 485
Average Linkage (Between Groups)
Agglomeration Schedule
3 19 ,781 0 0 6
10 12 ,795 0 0 5
11 13 ,800 0 0 10
4 6 1,142 0 0 9
10 18 1,697 2 0 10
2 3 2,102 0 1 12
5 17 2,161 0 0 20
21 22 2,277 0 0 14
1 4 2,423 0 4 11
10 11 2,476 5 3 13
1 7 2,914 9 0 16
2 20 3,020 6 0 15
10 14 5,145 10 0 17
21 23 5,164 8 0 18
2 9 5,199 12 0 18
1 16 5,467 11 0 17
1 10 6,204 16 13 19
2 21 7,025 15 14 19
1 2 8,221 17 18 20
1 5 10,714 19 7 21
1 15 18,349 20 0 22
1 8 28,552 21 0 23
1 24 32,379 22 0 0
Stage1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Cluster 1 Cluster 2
Cluster Combined
Coefficients Cluster 1 Cluster 2
Stage Cluster FirstAppears
Next Stage
Analisis : Tabel di atas adalah hasil proses clustering dengan metode Between Group LinkageSetelah jarak antar variable diukur dengan cara Euclidean, maka dilakukan pengelompokkan variable secara hierarki, yaitu pengelompokkan dilakukan secara bertingkat, satu demi satu, atau dari terbentuknya cluster yang banyak, hingga akhirnya terbentuk 1 cluster, dengan cara Agglomerasi
Pada Stage 1 : terbentuk 1 cluster dengan anggotanya variable 3 (Riau) dan 19 (Kalimantan Tengah), dengan coeffisien 0,781, yang menyatakan jarak antar varibel 3 dan 19, dan ini adalah jarak yang terdekat dari sekian banyak kombinasi jarak dari 24 variabel yang ada. Pada kolom Next stage, tertulis angka 6, yang berarti langkah clustering selanjutnya dengan melihat stage 6
Pada Stage 6 : Variabel 3 membentuk cluster dengan variable 2 (Sumatera Barat). Dengan demikian, sekarang cluster terdiri dari 3 variabel, 2 (Sumaera barat), 3 (Riau) dan 19 (Kalimantan Tengah), dengan jarak rata-rata :
- Jarak variable 3 dan 19 (Pada Proximity Matrix) = 0,781
- Jarak variable 2 dan 3 = 1,379- Jadi, jarak rata-rata = (0,781+1,379)/2 = 1,08
Demikian seterusnya, hingga terbentuk 1 cluster saja (divisualisasikan dalam Dendogram)
Cluster Membership
1 1
1 1
1 1
1 1
1 1
1 1
1 1
2 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
3 2
Case1:SUMATERA UTARA
2:SUMATERA BARAT
3:RIAU
4:JAMBI
5:SUMATERA SELATAN
6:BENGKULU
7:LAMPUNG
8:DKI JAKARTA
9:JAWA BARAT
10:JAWA TENGAH
11:DI YOGYAKARTA
12:JAWA TIMUR
13:BALI
14:NTB
15:NTT
16:KALIMANTAN BARAT
17:KALIMANTAN TIMUR
18:KALIMANTANSELATAN
19:KALIMANTAN TENGAH
20:SULUT
21:SUL TENGAH
22:SULSEL
23:SULTENG
24:IRIAN JAYA
3 Clusters 2 Clusters
Jawaban :a. Jika terbentuk 2 cluster
1. Cluster 1 : 23 Provinsi di Irian Jaya2. Cluster 2 : Irian Jaya
b. Jika terbentuk 3 cluster1. Cluster 1 : 22 Provinsi di luar DKI Jakarta dan Irian Jaya2. Cluster 2 : DKI Jakarta3. Cluster 3 : Irian Jaya
Vertical Icicle
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X X
X X X X X X X X X X X X X X X X X X X X X X X X X
Number of clusters1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24:IRI
AN JA
YA
8:DKI
JAKAR
TA
15:NTT
17:
KALIM
ANTAN
TIMUR
5:S
UMATE
RA SE
LATAN
23:
SULTE
NG
22:SU
LSEL
21:
SUL T
ENGA
H
9:JAW
A BAR
AT
20:SU
LUT
19:KA
LIMAN
TAN TE
NGAH
3:R
IAU
2:SUM
ATERA
BARAT
14:
NTB
13:BA
LI 11:
DI YOG
YAKAR
TA
18:KA
LIMAN
TAN SE
LATAN
12:
JAWA T
IMUR
10:
JAWA T
ENGA
H
16:KA
LIMAN
TAN BA
RAT
7:LAM
PUNG
6:B
ENGK
ULU
4:JAM
BI
1:SUM
ATERA
UTAR
A
Case
Jawaban c. Analisis Dendogram
Proses Aggloomerasi dimulai pada skala 0, dengan ketentuan jika sebuah garis dekat dengan angka 0, maka variable-variabel yang terwakili dengan garis tersebut semakin mungkin membentuk cluster1. 3 dan 19; 11 dan 13; 10, 12, dan 18; 4 dan 6; membentuk clusternya masing-
masing, sehingga terbentuk 4 cluster pada proses pertama, dan yang lainnya berdiri sendiri
2. Cluster yang terbentuk :- Cluster 3 dan 19 bergabung dengan var 2, 20 membentuk 1 cluster- 21 dan 22- Cluster 11 & 13 bergabung dengan cluster 10, 12, & 18- Cluster 4 & 6 bergabung dengan var 1, 7
- 5 dan 173. Cluster yang terbentuk pada proses 3 :
- Cluster 3, 19, 20, 2 bergabung dengan var 9- Cluster 21,22 bergabung dengan var 23- Cluser 11, 13, 10, 12, 18 bergabung dengan var 14- Cluster 4, 6, 1, 7 bergabung dengan var 16
Begitu seterusnya hingga terbentuk 1 cluster, yang merupakan gabungan dari cluster sebelumnya dan variable 24 - Irian Jaya
Soal no. 3Produksi Perikanan Laut Yang Dijual Di TPI (Tempat Penjualan Ikan) Menurut Provinsi, 2005-2009 (Ton)
P r o v i n s i 2005 2006 2007 2008 2009
1 Nanggroe Aceh 1 841 4 042 4 676 5 629 5 978
2 Sumatera Utara 3 082 93 1 214 1 841 63 004
3 Sumatera Barat 335 5 063 8 650 27 813 4 047
4 R i a u 163 118 90 261 440
5 Lampung 3 259 6 599 3 070 4 507 4 733
6 DKI Jakarta 26 553 24 881 35 348 39 820 30 362
7 Jawa Barat 23 150 48 958 54 092 54 906 34 935
8 Jawa Tengah 152 352 146 284 163 856 159 307 158 961
9 DI. Yogyakarta 623 629 1 851 1 171 1 492
10 Jawa Timur 60 058 41 259 58 799 92 489 104 634
11 Banten 7 689 11 197 7 490 8 071 6 509
12 B a l i 15 828 8 108 20 206 18 821 34 706
13 NTB 4 300 4 610 5 019 6 633 7 678
14 NTT 1 460 2 072 4 053 4 053 4 280
15 Kalimantan Barat 6 320 6 636 10 230 10 869 9 931
16 Kalimantan Sel 8 510 6 579 14 850 15 528 17 931
17 Kalimantan Timur 8 251 6 464 11 141 10 060 8 465
18 Sulawesi Utara 149 2 073 1 983 2 123 2 384
19 Sulawesi Tengah 1 053 469 842 11 252 1 176
20 Sulawesi Selatan 26 803 23 209 29 779 33 166 35 612
21 Sulawesi Tenggara 2 363 2 760 6 837 3 764 2 428
22 Gorontalo 1 604 3 828 9 413 5 082 4 186
Sumber : http://www.bps.go.id/tab_sub/view.php?tabel=1&daftar=1&id_subyek=56¬ab=3
Analisis :QCL_1 menunjukkan provinsi masuk ke cluster manaQCL_2 menunjukkan jaraknyaJadi, dari QCL_1, yang termasuk :Cluster 1 : 19 Provinsi selain Jawa Tengah, Jawa Barat, dan Jawa TimurCluster 2 : Jawa TengahCluster 3 : Jawa Barat dan Jawa Timur
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasi
Iteration History(a)
Iteration
Change in Cluster Centers
1 2 31 ,568 ,000 1,1702 ,000 ,000 ,000
a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,000. The current iteration is 2. The minimum distance between initial centers is 4,550.
Output ini menyatakan telah terjadi 2 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final Cluster Centers), di bawah ini :
Output ini adalah akhir dari proses clustering, dengan analisis :
Angka di atas terkait dengan proses standardisasi data sebelumnya, yang mengacu pada angka z, dengan ketentuan berikut :
a. Angka negative berarti data di bawah rata-rata totalb. Angka positif berarti data di atas rata-rata total
Hal itu berarti, data-data di atas berada di atas rata-rata totalMis, angka 4,06497 pada variable Zduaribu_lima (2005) menyatakan rata-rata penjualan ikan pada tahun 2005 responden pada cluster 2, yaitu :
X = µ + z.
Dimana :X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu)µ = Rata-rata populasiz = Nilai standardisasi yang didapat pada SPSS = Standar deviasiContoh Perhitungannya :
a. Rata-Rata Assets cluster 1 = 16170,27 + (-0,29 x 33501,25) = 6454.91b. Rata-Rata Assets cluster 2 = 16170,27 + (4,07 x 33501,25) = 152520,36c. Rata-Rata Assets cluster 3 = 16170,27 + (0,76 x 33501,25) = 41631,22
Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk mempunyai perbedaan tiap cluster, melalui pengujian output ANOVA
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Analisis :Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran within cluster mean, sehingga kolom F :
F = Cluster ErrorContoh :Angka F (pada Zduaribu_enam) = 10,060/0,046 = 218,7 sebanding dengan 217,149 (perbedaan angka mungkin karena pembulatan)
Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk.Sebagai contoh :Pada variable duaribu_enam, angka F = 217,149 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata, atau dengan kata lain, factor Close sangat membedakan karakteristik ketiga cluster
Sekarang kita bandingkan, angka F variable Zduaribu_sembilan (31,992) lebih kecil dari angka F variable Zduaribu_enam (217,149), hal itu berarti perbedaan pada tahun duaribu_sembilan jauh lebih kecil dari perbedaan pada tahun duaribu_enam antar responden pada ketiga cluster
Number of Cases in each Cluster
Cluster 1 19,000
2 1,000
3 2,000Valid 22,000Missing ,000
Analisis :Dari table di atas didapat :
1. Responden yang masuk ke cluster 1 sebanyak 19 responden
2. Responden yang masuk ke cluster 2 sebanyak 1 responden
3. Responden yang masuk ke cluster 3 sebanyak 2 responden