Top Banner
PENGGUNAA DAN REGRE H FAKULTAS MA AN ANALISIS KOMPONEN UTAM ESI KEKAR DALAM PENDUGAAN HUJAN LOKAL DI INDRAMAYU RAHMA ANISA DEPARTEMEN STATISTIKA ATEMATIKA DAN ILMU PENGETAHU INSTITUT PERTANIAN BOGOR BOGOR 2010 MA KEKAR N CURAH UAN ALAM
30

Analisis Komponen Utama Kekar dan Regresi Kekar

Jul 11, 2015

Download

Education

die_raa
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Analisis Komponen Utama Kekar dan Regresi Kekar

PENGGUNAAN ANALISIS KOMPONEN UTAMA KEKARDAN REGRESI KEKAR DALAM PENDUGAAN CURAH

HUJAN LOKAL DI INDRAMAYU

RAHMA ANISA

DEPARTEMEN STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2010

PENGGUNAAN ANALISIS KOMPONEN UTAMA KEKARDAN REGRESI KEKAR DALAM PENDUGAAN CURAH

HUJAN LOKAL DI INDRAMAYU

RAHMA ANISA

DEPARTEMEN STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2010

PENGGUNAAN ANALISIS KOMPONEN UTAMA KEKARDAN REGRESI KEKAR DALAM PENDUGAAN CURAH

HUJAN LOKAL DI INDRAMAYU

RAHMA ANISA

DEPARTEMEN STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2010

Page 2: Analisis Komponen Utama Kekar dan Regresi Kekar

RINGKASAN

RAHMA ANISA. Penggunaan Analisis Komponen Utama Kekar dan Regresi Kekar dalamPendugaan Curah Hujan Lokal di Indramayu. Dibimbing oleh AJI HAMIM WIGENA danI MADE SUMERTAJAYA.

Prediksi iklim akan memberikan kontribusi positif pada berbagai bidang, khususnyainformasi mengenai curah hujan. Salah satu cara prediksi curah hujan adalah melakukan EmpiricalStatistical Downscaling (ESD) terhadap data luaran Global Circulation Model (GCM).Karakteristik data luaran GCM adalah berdimensi tinggi, terdapat multikolinieritas antar grid, dankemungkinan terdapat pencilan. Metode Analisis Komponen Utama (AKU) klasik yang selama inidigunakan untuk mereduksi dimensi data tersebut tidak bersifat kekar terhadap pencilan.Permasalahan tersebut dapat diatasi dengan metode Analisis Komponen Utama Kekar (AKU-K)atau Robust Principal Component Analysis (ROBPCA) dengan penduga Minimum CovarianceDeterminant (MCD). Pencilan pada data stasiun lokal dapat diatasi dengan penduga M Huber danpenimbang ganda Tukey dalam menyusun model regresi kekar. Penelitian ini bertujuan untukmelakukan pendugaan curah hujan lokal di wilayah Indramayu menggunakan prosedur AKU-Kdengan penduga MCD dan penerapannya pada pemodelan regresi kekar dengan penduga M Huberdan penimbang ganda Tukey, serta membandingkan efektifitas penerapan metode AKU kekar,penduga M Huber, dan penimbang ganda Tukey dengan metode AKU klasik. Hasil penelitian inimenunjukkan bahwa metode regresi komponen utama kekar menghasilkan pendugaan yang lebihunggul dibandingkan model lainnya. Namun performa setiap model hampir sama sehingga dalampenelitian ini metode kekar digunakan sebagai alternatif pendugaan selain metode klasik karenapencilan yang terdapat pada data luaran GCM bukan merupakan amatan berpengaruh.

Kata kunci: Global Circulation Model, Empirical Statistical Downscaling, Minimum CovarianceDeterminant, ROBPCA, penduga M Huber, Penimbang Ganda Tukey.

Page 3: Analisis Komponen Utama Kekar dan Regresi Kekar

PENGGUNAAN ANALISIS KOMPONEN UTAMA KEKARDAN REGRESI KEKAR DALAM PENDUGAAN CURAH

HUJAN LOKAL DI INDRAMAYU

RAHMA ANISA

Skripsi sebagai salah satu syarat untuk memperoleh gelarSarjana Statistika pada Departemen Statistika

DEPARTEMEN STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGORBOGOR

2010

Page 4: Analisis Komponen Utama Kekar dan Regresi Kekar

Judul Skripsi : Penggunaan Analisis Komponen Utama Kekar dan Regresi Kekardalam Pendugaan Curah Hujan Lokal di Indramayu

Nama : Rahma AnisaNRP : G14061334

Menyetujui :Pembimbing I, Pembimbing II,

Dr. Ir. Aji Hamim Wigena, M.Sc. Dr. Ir. I Made Sumertajaya, M.Si.NIP. 195209281977011001 NIP. 196807021994021001

Mengetahui :Ketua Departemen Statistika FMIPA

Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.SiNIP. 196504211990021001

Tanggal Lulus :

Page 5: Analisis Komponen Utama Kekar dan Regresi Kekar

KATA PENGANTAR

Segala puji dan syukur dipanjatkan kepada Allah SWT atas limpahan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Sholawat serta salam semoga selalutercurah kepada pemimpin umat nabi Muhammad SAW, beserta keluarga, sahabat, dan umatnya.Karya ilmiah ini berjudul “Penggunaan Analisis Komponen Utama Kekar dan Regresi Kekardalam Pendugaan Curah Hujan Lokal di Indramayu”.

Terima kasih yang sebesar-besarnya kepada semua pihak yang telah turut peran serta dalampenyusunan karya ilmiah ini, terutama kepada :

1. Bapak Dr. Ir. Aji Hamim Wigena, M.Sc. dan Bapak Dr. Ir. I Made Sumertajaya, M.Si.selaku dosen pembimbing.

2. Ibu Pika Silvianti, S.Si., Msi. selaku dosen penguji yang telah memberi masukanuntuk menyempurnakan tulisan ini.

3. Badan Meteorologi, Klimatologi, dan Geofisika (BMKG), atas segala informasi yangtelah diberikan.

4. Imam Sanjaya dan Hana H. Kasyfillah, atas infomasi dan segala bantuannya dalampenelitian ini.

5. Defri R. Ismana, Magri Handoko, dan Widya Ningsih, terimakasih atas segala bantuandan dukungannya.

6. Keluarga Besar Departemen Statistika IPB, staff dan seluruh dosen , terutama sahabat-sahabat statistika 43 tercinta, Ana, Ayu, Tami, Dewi, Cici, dkk. Terima kasih atassegala dukungan, semangat, dan doa yang selalu kalian berikan.

7. Keluarga yang sangat penulis sayangi, terima kasih atas segala doa, dukungan, cintadan kasih sayang serta inspirasi yang telah diberikan selama ini.

Semoga semua bantuan yang diberikan kepada penulis mendapatkan balasan dari AllahSWT, dan semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Desember 2010

Rahma Anisa

Page 6: Analisis Komponen Utama Kekar dan Regresi Kekar

RIWAYAT HIDUP

Penulis lahir di Bogor, pada tanggal 14 Februari 1988 dari pasangan R. Ahmad Rifat danSiti Salsiah. Pendidikan penulis berawal dari Sekolah Dasar Negeri Pengadilan III Bogor padatahun 1994, dan melanjutkan pendidikannya ke SLTP Negeri 1 Bogor hingga lulus pada tahun2003. Pada tahun 2003 penulis melanjutkan pendidikan di SMA Negeri 1 Bogor, dan lulus padatahun 2006. Pada tahun yang sama penulis diterima sebagai mahasiswa di Institut Pertanian Bogormelalui jalur Undangan Seleksi Masuk IPB. Pada tahun kedua di IPB, penulis memilih programstudi Statistika sebagai mayor, dan memilih ilmu konsumen sebagai minor pada tahun berikutnya.

Selama masa perkuliahan, penulis aktif dalam berbagai kegiatan kepanitiaan yangdiselenggerakan oleh Himpunan Keprofesian Gamma Sigma Beta (GSB), BEM KM, BEM TPBdan BEM FMIPA. Selain itu penulis juga aktif dalam kegiatan UKM LISES Gentra Kaheman dankepengurusan UKM Merpati Putih.

Pada pertengahan tahun 2009 penulis berkesempatan menjadi asisten mata kuliah MetodeStatistika. Dan pada Februari-April 2010 penulis melakukan praktek lapang di PT. Tempo IntiMedia,Tbk di Jakarta Barat.

Page 7: Analisis Komponen Utama Kekar dan Regresi Kekar

vii

DAFTAR ISI

HalamanDAFTAR TABEL..........................................................................................................................viii

DAFTAR GAMBAR .....................................................................................................................viii

DAFTAR LAMPIRAN..................................................................................................................viii

PENDAHULUAN.............................................................................................................................1

Latar Belakang ....................................................................................................................1

Tujuan .................................................................................................................................1

TINJAUAN PUSTAKA....................................................................................................................1

Global Circulation Model ...................................................................................................1

Empirical Statistical Downscaling......................................................................................1

Analisis Regresi Berganda ..................................................................................................1

Analisis Komponen Utama .................................................................................................2

Analisis Komponen Utama Kekar.......................................................................................2

Penduga M Huber ...............................................................................................................3

Penimbang Ganda Tukey ....................................................................................................4

METODOLOGI ................................................................................................................................4

Data .....................................................................................................................................4

Metode ................................................................................................................................4

HASIL DAN PEMBAHASAN.........................................................................................................5

Eksplorasi Data ...................................................................................................................5

AKU dan Regresi Kekar .....................................................................................................6

Seluruh Stasiun Curah Hujan ..............................................................................................8

KESIMPULAN DAN SARAN.......................................................................................................11

Kesimpulan .......................................................................................................................11

Saran .................................................................................................................................11

DAFTAR PUSTAKA .....................................................................................................................11

LAMPIRAN....................................................................................................................................12

Page 8: Analisis Komponen Utama Kekar dan Regresi Kekar

viii

DAFTAR TABELHalaman

1 Keragaman KU menggunakan AKU Klasik dan AKU-K ..........................................................6

2 Nilai Koefisien determinasi (R2), RMSEP dan korelasi (r) tiap model .....................................7

3 Persentase data pencilan untuk setiap stasiun curah hujan ..........................................................8

4 Persentase pencilan pada sisaan model awal menggunakan AKU ..............................................8

5 Persentase pencilan pada sisaan model awal menggunakan AKU-K ..........................................8

6 Koefisien determinasi (R2) tiap model pada 14 stasiun curah hujan di Indramayu .....................9

7 Nilai RMSEP dari 6 model berbeda pada 14 stasiun curah hujan di Kabupaten Indramayu.....10

8 Nilai koefisien korelasi pada validasi keenam model 14 stasiun curah hujan di Indramayu .....10

DAFTAR GAMBARHalaman

1 Boxplot jarak mahalanobis (MD) dan jarak kekar (RD) data luaran GCM .................................5

2 Boxplot data curah hujan bulanan di stasiun curah hujan Sukadana ...........................................5

3 Screeplot AKU dan AKU-K........................................................................................................6

4 Boxplot sisaan model regresi komponen utama klasik................................................................6

5 Boxplot sisaan model regresi komponen utama kekar ................................................................6

6 Plot ACF sisaan model 1 stasiun Sukadana.................................................................................7

7 Plot prediksi rata–rata curah hujan bulanan dengan 6 metode berbeda .......................................7

DAFTAR LAMPIRANHalaman

1 Domain yang digunakan............................................................................................................12

2 Variance Inflation Factors (VIF) pada prediktor Angin Zonal .................................................12

3 Prediksi rata-rata curah hujan bulanan di stasiun curah hujan Sukadana ..................................13

4 Elemen diagonal matriks HAT pada prediktor Angin Zonal .....................................................13

5 Boxplot untuk data curah hujan dari 14 stasiun cuaca di Indramayu ........................................16

6 Komponen Utama (KU) terpilih untuk metode AKU Klasik dan AKU Kekar .........................17

7 Boxplot sisaan model awal menggunakan AKU Klasik............................................................18

8 Boxplot sisaan model awal menggunakan AKU-K ...................................................................19

9 Plot prediksi rata-rata curah hujan lokal ....................................................................................20

Page 9: Analisis Komponen Utama Kekar dan Regresi Kekar

1

PENDAHULUAN

Latar BelakangIklim memiliki peranan yang cukup

penting dalam berbagai bidang, terutama dibidang pertanian yang erat kaitannya denganbidang sosial dan ekonomi. Oleh karena ituprediksi mengenai kondisi iklim akanmemberikan kontribusi positif pada bidang-bidang tersebut. Curah hujan merupakan salahsatu unsur iklim yang penting untuk dikaji.Salah satu cara untuk melakukan prediksicurah hujan adalah dengan memanfaatkanmodel iklim global atau disebut juga sebagaiGlobal Circulation Model (GCM).

Data luaran GCM tersebut kemudiandiolah menggunakan metode EmpiricalStatistical Downscaling (ESD) sehinggamampu menghasilkan prediksi curah hujanpada wilayah tertentu yang bersifat lokal.Namun, terdapat beberapa kendala pada dataluaran GCM, yaitu berdimensi tinggi, terdapatmultikolinearitas antar grid yang salingberdekatan, dan kemungkinan terdapatpencilan. Oleh karenanya, perlu dilakukanreduksi dimensi data yang bersifat kekarterhadap pencilan.

Selama ini Analisis Komponen Utama(AKU) Klasik kerap kali digunakan, namunmetode tersebut tidak kekar terhadapkeberadaan data pencilan. Maka dari itu,metode Analisis Komponen Utama Kekar(AKU-K) dengan penduga MinimumCovariance Determinant (MCD) yang dikenaldengan algoritma ROBPCA akan diterapkanuntuk mengatasi permasalahan tersebut.Selain itu, model regresi kekar akan disusunmenggunakan penduga M Huber danpenimbang ganda Tukey untuk mengatasikemungkinan adanya pencilan pada data yangdiperoleh dari stasiun curah hujan lokal.

TujuanTujuan utama yang ingin dicapai dalam

penelitian ini adalah:1. melakukan pendugaan curah hujan lokal di

wilayah Indramayu menggunakanprosedur AKU-K dengan penduga MCDdan penerapannya pada pemodelan regresikekar dengan penduga M Huber danpenimbang ganda Tukey;

2. membandingkan efektifitas penerapanmetode AKU-K, penduga M Huber, danpenimbang ganda Tukey dengan metodeAKU Klasik dalam pemodelan regresidata luaran GCM.

TINJAUAN PUSTAKA

Global Circulation ModelGCM adalah suatu model berbasis

komputer yang terdiri atas berbagaipersamaan numerik dan deterministik yangterpadu dan mengikuti kaidah-kaidah fisika.GCM merupakan alat prediksi utama iklimdan cuaca secara numerik dan sebagai sumberinformasi primer untuk menilai pengaruhperubahan iklim (Wigena 2006).

Wilby et al. (2007) menjelaskan modeliklim global atau GCM sebagai alat untukmewakili sistem iklim tiga-dimensimenggunakan persamaan yangmenggambarkan pergerakan energi (hukumpertama termodinamika) dan momentum(hukum kedua gerak Newton), bersamadengan kekekalan massa (persamaankontinuitas) dan uap air (hukum gas ideal).Setiap persamaan tersebut diselesaikan padatitik-titik diskret pada seluruh permukaanbumi, pada interval waktu yang tetap, danuntuk tiap lapisan yang terpisah di atmosferyang didefinisikan oleh grid.

Empirical Statistical DownscalingBenestad et al. (2008) mendefinisikan

statistical downscaling sebagai suatu prosesyang menghubungkan antara kumpulanbeberapa peubah yang mewakili sebuah ruangberdimensi tinggi (skala besar) denganbeberapa peubah yang mewakili ruang dengandimensi yang jauh lebih rendah (skala kecil).Inti dari downscaling dijelaskan sebagaipemanfaatan hubungan antara skala yangberbeda untuk menjelaskan tentang suatukondisi pada skala yang jauh lebih kecil dariinformasi yang diperoleh pada peubah denganskala besar.

Model iklim global cenderung memilikiresolusi spasial yang kasar, dan tidak mampumewakili aspek spasial dengan skala yanglebih kecil dari ukuran kotak grid. Model-model iklim global juga tidak mampumenjelaskan variasi substansial dalam statistikiklim di suatu wilayah kecil. Oleh karena ituperlu dilakukan downscaling yang konsepnyaadalah melihat hubungan secara statistikantara data luaran GCM yang berskala besardengan data lokal yang berskala kecil, denganmemanfaatkan data historis yang kemudiandapat digunakan untuk memprediksi kondisiiklim lokal di masa depan.

Analisis Regresi BergandaPersamaan regresi berguna untuk

menganalisis hubungan antara peubah respon

Page 10: Analisis Komponen Utama Kekar dan Regresi Kekar

2

dan peubah bebas. Dalam regresi linierberganda, parameter yang diduga bersifatlinier serta jumlah peubah bebas dan atau takbebas yang terlibat di dalamnya berjumlahlebih dari satu. Regresi linier berganda dapatdinyatakan dengan model berikut:= +dimana y, X, β, dan ε berturut-turut adalahpeubah respon, peubah bebas, parameterregresi, dan sisaan.

Salah satu asumsi yang perlu dipenuhidalam analisis regresi adalah tidak adamultikolinieritas dalam data. Myers (1989)menjelaskan secara harfiah bahwamultikolinieritas berasal dari kata multi yangberarti banyak dan collinear yang berartiketerpautan linier, dan multikolinieritasdidefinisikan sebagai suatu fenomena yangmenggambarkan adanya hubungan korelasiantar peubah bebas sehingga akan sulit untukmengetahui dampak tiap peubah tersebutterhadap respon yang diamati. Fenomena iniperlu diatasi karena dapat menimbulkan biasdalam pendugaan parameter-parameter didalamnya. Permasalahan ini dapat diatasidengan metode Analisis Komponen Utama(AKU) yang mampu mereduksi dimensi datadengan melakukan transformasi pada peubahbebas agar saling bebas, dengan tetapmempertahankan keragamannya.

Permasalahan lain yang mungkin munculadalah data pencilan. Pencilan merupakansuatu keganjilan dan menandakan suatu titikdata yang sama sekali tidak tipikaldibandingkan data lainnya. Terdapat beberapakemungkinan munculnya data pencilan, yaitupencilan pada peubah bebas, pencilan padapeubah respon, atau keduanya. Hubert danDebruyne (2010) menjelaskan bahwa pencilanpada peubah bebas dapat dideteksi denganmenghitung jarak mahalanobis atauMahalanobis Distance (MD):( ) = ( − ) ( − )Sementara perhitungan menggunakan jarakkekar atau Robust Distance (RD) dapatdihitung dengan rumus:( ) = ( − ) ∑ ( − )dimana ̂ didefinisikan sebagai penduganilai tengah MCD, dan ∑ sebagai pendugaragam peragam MCD. Salah satu cara untukmenangani data yang mengandung pencilansekaligus multikolinieritas adalah denganmenerapkan metode Analisis KomponenUtama Kekar (AKU-K).

Di sisi lain, juga terdapat kemungkinanpencilan pada data peubah respon. Hal inidapat dilihat dari sisaan model regresi. Draper

dan Smith (1992) menjelaskan bahwa sisaanyang merupakan pencilan adalah sisaandengan nilai mutlak yang jauh lebih besardaripada sisaan-sisaan lainnya dan bisa jaditerletak tiga atau empat kali simpangan bakuatau lebih jauh lagi dari rata-rata sisaannya.Metode regresi kekar merupakan salah satucara penanganan terhadap pencilan tersebut.Regresi kekar merupakan metode regresidengan menambahkan fungsi penimbangtertentu pada model, di antaranya adalahdengan menggunakan penduga M Huber danPenimbang Ganda Tukey.

Analisis Komponen UtamaJolliffe (1986) menjelaskan bahwa konsep

sentral dari Analisis Komponen Utama (AKU)adalah untuk mengurangi dimensi darisegugus data yang terdiri dari sejumlah besarpeubah yang saling berkorelasi, dengan tetapmempertahankan keragaman data tersebut.Hal ini dicapai dengan melakukantransformasi menjadi segugus data baru, yaituKomponen Utama (KU), yang tidak salingberkorelasi, dan disusun sedemikian sehinggauntuk k KU pertama mewakili keragamanterbesar dari keseluruhan peubah aslinya.

Komponen utama dapat dihitung denganrumus berikut: (∑- ) = 0dimana ∑ didefinisikan sebagai matriksragam peragam , sebagai akar ciri dari∑, dan merupakan matriks identitas yangberukuran × , dimana p adalah banyaknyapeubah bebas dalam data.

Dalam sebuah persamaan regresi, jikaditranformasi dengan persamaan = ,dimana adalah peubah bebas yang telahdikurangi dengan rataannya dan adalahmatriks ortogonal yang berisi komponenutama yang berukuran × , dan adalahkoefisien regresi untuk komponen utama yangdigunakan. Maka persamaan regresikomponen utama dapat didefinisikan dalambentuk model berikut:= +

Analisis Komponen Utama KekarHubert et al. (2005) menerangkan bahwa

metode Analisis Komponen Utama Kekar(AKU-K) merupakan kombinasi konsepProjection Pursuit (PP) dan pendugakovarians yang kekar. Konsep PP digunakandalam tahap inisiasi reduksi dimensi.Beberapa konsep penduga kovarians yangkekar menggunakan (MCD) kemudianditerapkan pada data dengan dimensi yang

Page 11: Analisis Komponen Utama Kekar dan Regresi Kekar

3

lebih rendah. Secara umum algoritma AKU-Kterdiri dari tahap-tahap berikut:1. Mereduksi ruang data, terutama ketika

p≥n, dimana p merupakan jumlah peubahbebas dan n adalah jumlah observasi.Langkah ini dilakukan dengan metodeSingular Value Decomposition (SVD)terhadap matriks data yang telahdipusatkan, dengan rumus berikut:, − = , , ,dimana ̂ merupakan vektor rataan klasik,0 = ( , − ), D adalahmatriks diagonal berukuran 0 × 0, danU’U=Iro=V’V, dimana Ir0 adalah matriksidentitas berukuran 0 × 0.

2. Menemukan h keterpencilan terkecil,tahap ini dilakukan dengan memilih½<α<1 untuk mendapatkan nilaih=max{[αn],[(n+kmax+1)/2]}, dimana kmax

merupakan jumlah maksimum komponenyang akan dihitung. Selanjutnyaketerpencilan dihitung dengan rumusStahel-Donoho:

OutlO(xi) = max ( )( )dimana ̂ dan merupakanpenduga nilai tengah dan simpangan bakuMCD univariat. Sebanyak h pengamatandengan nilai keterpencilan terkecildihitung vektor nilai tengah ( ) danmatriks ragam peragamnya (S0).Kemudian matriks ragam peragamdidekomposisi sehingga diperolehkomponen utamanya. Sebanyak kkomponen utama pertama dipilih dansemua data diproyeksikan pada subruangberdimensi-k yang direntang oleh k vektorciri pertama sehingga diperoleh Xn,k.

3. Pada Xn,k dari langkah 2, dihitung kembalipenduga nilai tengah ( ̂ ) dan matriksragam peragam MCD (S1). Komponenutama akhir adalah vektor ciri dari matriksragam peragam tersebut (S1).

Perhitungan pada langkah terakhir algoritmaROBPCA memerlukan sejumlah h datadengan matriks ragam peragam yangminimum. Oleh karenanya, digunakanpenduga Minimum Covariance Determinant(MCD), yang dihitung dengan algoritmaFAST-MCD yang diadaptasi.

Hubert dan Debryune (2010) menyebutkanbahwa penduga MCD merupakan pendugayang sangat kekar dalam lokasi dan tebaranpeubah ganda. Karena sifatnya yang kekartersebut, penduga MCD amat berguna dalammendeteksi pencilan, serta mampumenghasilkan analisis yang lebih handal.

Perhitungan untuk memperoleh pendugaMCD dilakukan dengan algoritma FAST-MCD yang dijelaskan oleh Rousseeuw danVan Driessen (1999) dalam Ningsih (2009)sebagai berikut:1. Ditentukan h, dimana (n+p+1)/2≤h≤n atau

h=(n+p+1)/2 atau h=0.75n dimana nmerupakan banyaknya pengamatan. Nilaih pada FAST-MCD sama dengan h yangtelah ditentukan pada langkah keduaalgoritma ROBPCA.

2. Diambil sejumlah himpunan bagian daridata secara acak. Himpunan bagiantersebut berukuran (p+1) dan diperbesarhingga mencapai h menggunakan C-Step.

3. Dalam setiap h bagian yang terambildilakukan dua C-Step. C-Step melakukanperhitungan penduga nilai tengah ̂ danpenduga matriks ragam peragam ∑ darih pengamatan, kemudian menghitungjarak dari tiap titik sebagai berikut:

,∑ ( ) = ( − ) ∑ ( − )Himpunan h baru dibentuk dari hpengamatan dengan jarak pengamatanterkecil.

4. Untuk 10 himpunan bagian h dengandeterminan matriks ragam peragamterkecil, dilakukan C-Step hinggakonvergen dan himpunan bagian terakhirdisimpan dalam H1.

5. Penduga nilai tengah dan matriksragam peragam ∑ diperoleh dari H1

dengan determinan matriks ragamperagam terkecil.

6. Selanjutnya, dilakukan tahap pembobotan:= (∑ ) (∑ )= ∑ ( − )( − )′∑ − 1

dimana = ∑ , dan

= 1 ; ,∑ ( ) ≤ , .97520 ;7. Terakhir, komponen utama didefinisikan

sebagai k vektor ciri dari S1 yangbersesuaian dengan k akar ciri terbesardari S1.

Penduga M HuberPenduga M Huber merupakan salah satu

metode pada regresi kekar. Metode inimenggantikan kuadrat sisaan MKT dengansuatu fungsi lain dari sisaan, denganmenambahkan suatu fungsi penimbang.

Page 12: Analisis Komponen Utama Kekar dan Regresi Kekar

4

Penduga M diperoleh dengan meminimumkanfungsi obyektif:min ∑ ( ) = min ∑ ( − )sehingga akan dihasilkan persamaan:min ∑ ( − ) = 0dimana w merupakan fungsi penimbang.Solusi dari persamaan di atas dapat diperolehsecara iteratif dengan metode iterativelyreweighted least-squares (IRLS). Fungsipenimbang yang disarankan oleh Hubermenggunakan fungsi obyektif:

( ) = 12 ; | | ≤| | − 12 ; | | >dan fungsi penimbang:( ) = 1 ; | | ≤| | ; | | >dimana k merupakan tunning constant, Hubermerekomendasikan nilai k= 1.345σ, dengan σdidefinisikan sebagai simpangan baku darisisaan.

Penimbang Ganda TukeyMetode lain dalam regresi kekar yaitu

dengan menggunakan penimbang gandaTukey. Fungsi penimbang yang disarankanoleh Tukey disebut juga sebagai bisquareweight (penimbang kuadrat ganda) ataubiweight (penimbang ganda) menggunakanfungsi obyektif:

( ) = 6 1 − 1 − ; | | ≤6 ; | | >

dan fungsi penimbang (w):( ) = 1 −0 ; | | > ; | | ≤dimana k merupakan tunning constant, untuk

penimbang ganda Tukey direkomendasikannilai k= 4.685σ, dengan σ didefinisikansebagai simpangan baku dari sisaan.

METODOLOGI

DataData yang digunakan sebagai peubah

respon pada penelitian ini adalah data curahhujan lokal dari 14 stasiun curah hujan diKabupaten Indramayu. Stasiun curah hujanyang digunakan tersebut adalah stasiun curahhujan Bangkir, Bulak, Cidempet, Cikedung,Losarang, Sukadana, Sumurwatu, Tugu,Ujungaris, Lohbener, Sudimampir, Juntinyuat,Kedokan Bunder, dan Krangkeng. Data

tersebut merupakan data curah hujan bulanandari tahun 1979 hingga 2008.

Berdasarkan penelitian sebelumnya(Sanjaya 2010), prediktor terbaik pada ESDuntuk studi kasus kabupaten Indramayuadalah angin zonal. Data angin zonal yangdigunakan merupakan data luaran GCMNational Centers for EnvironmentalPrediction and the National Center forAtmospheric Research (NCEP-NCAR)reanalysis, dengan domain seluas 8×8 gridberukuran 2.5o×2.5o yang terletak di ataswilayah Indramayu, yaitu pada 98.75˚ BT -116.25˚ BB dan 1.25˚ LU - 16.25˚ LS(Lampiran 1). Data ini diakses melalui situs:http://www.esrl.noaa.gov/psd/data/gridded/tales/monthly.html. [ 8 Maret 2010]

MetodeTahapan dalam penelitian ini adalah

sebagai berikut:1. Memilih domain GCM yang akan

digunakan sebagai peubah bebas.2. Mengeksplorasi karakteristik data luaran

GCM dan data curah hujan lokal, ekplorasidilakukan menggunakan boxplot untukmengetahui keberadaan data pencilan.Multikolinieritas pada data luaran GCMdilihat dari nilai Variance InflationFactors (VIF), nilai VIF yang lebih besardari 10.00 mengindikasikan adanyamultikolinieritas dalam data.

3. Melakukan analisis komponen utama(AKU) Klasik dan AKU-K terhadap dataluaran GCM Angin Zonal tahun 1979-2007. Prosedur AKU-K dilakukan denganalgoritma ROBPCA untuk memperolehvektor ciri dari matriks ragam peragamdengan determinan yang minimum.

4. Menentukan jumlah komponen utamayang akan digunakan. Pada penelitian inidigunakan sejumlah k komponen utamapertama yang mampu memenuhi proporsikeragaman kumulatif sebesar 90%.

5. Meregresikan skor komponen utama darisetiap peubah bebas, yaitu data luaranGCM Angin Zonal, terhadap peubahrespon, yaitu data curah hujan lokal.Sehingga diperoleh dua model awal yaituRegresi Komponen Utama (RKU) klasikdan RKU kekar.

6. Memeriksa pencilan dari sisaan modelawal menggunakan boxplot.

7. Jika terdapat pencilan pada sisaan modelawal, regresi kekar disusun denganmenambahkan penduga M Huber danpenimbang ganda Tukey terhadap duamodel awal, yaitu RKU Klasik dan RKU

Page 13: Analisis Komponen Utama Kekar dan Regresi Kekar

5

Kekar, sehingga diperoleh empat modelregresi kekar.

8. Memeriksa kebebasan sisaan keenammodel menggunakan plot AutocorrelationFunction (ACF). Jika terdapatautokorelasi, sisaan tersebut dimodelkandengan pemodelan deret waktu.Pemodelan dapat menggunakan analisistren atau ARIMA, kemudian nilai dugaanmodel deret waktu sisaan dijumlahkandengan model RKU awal. Selanjutnyadihitung Koefisien Determinasi (R2) darikeenam model akhir.

9. Melakukan validasi keenam model yangtelah diperoleh, yaitu: model 1: RKU Klasik, model 2: RKU Klasik dengan

penduga M Huber, model 3: RKU Klasik dengan

penimbang ganda Tukey, model 4: RKU Kekar, model 5: RKU Kekar dengan

penduga M Huber, model 6: RKU Kekar dengan

penimbang ganda Tukey.Validasi dilakukan menggunakan datacurah hujan tahun 2008. Pada tahap inidihitung nilai RMSEP dan korelasi antaranilai dugaan dengan observasi curah hujantahun 2008.

10. Membandingkan keenam model tersebutberdasarkan nilai RMSEP dan korelasiyang dihasilkan pada tahap validasi model.

Pengolahan data dilakukan menggunakanperangkat lunak R 2.11.0. Fungsi yangdigunakan adalah PcaClassic dan PcaHubertpada paket rrcov untuk perhitungan AKU danAKU-K, serta fungsi rlm pada paket MASSuntuk perhitungan regresi kekar.

HASIL DAN PEMBAHASAN

Pada penelitian ini pendugaan curah hujanlokal dilakukan pada 14 stasiun curah hujan diKabupaten Indramayu. Namun untukmemperlihatkan proses penelitian secara utuh,maka akan dijelaskan terlebih dahulumengenai hasil penelitian pada salah satustasiun curah hujan, yaitu stasiun Sukadana.

Eksplorasi DataMultikolinieritas ditandai dengan korelasi

yang kuat antar peubah bebas dan nilaiVariance Inflation Factors (VIF) yang lebihdari 10.00. Dari hasil perhitungan nilaikorelasi dan VIF, diperoleh bahwa persentasepasangan peubah yang memiliki korelasi lebih

dari 0.70 mencapai 40.85% dari total seluruhpasangan peubah. Selain itu, pada Lampiran 2dapat dilihat bahwa nilai VIF berkisar antara569.072 hingga 223438.99. Artinya, setiappeubah bebas memiliki nilai VIF lebih besardari 10.00 yang mengindikasikan adanyamultikolinieritas antar peubah, atau dalam halini dapat dikatakan bahwa terdapat hubunganyang kuat antar grid yang saling berdekatan.

Gambar 1 Boxplot jarak mahalanobis (MD)dan jarak kekar (RD) data luaranGCM

Perhitungan jarak dilakukan untukmendeteksi pencilan dengan menggunakanjarak mahalanobis (MD) dan jarak kekar(RD). Hasil perhitungan jarak ini kemudiandibuat dalam bentuk boxplot. Pada Gambar 1dapat dilihat bahwa RD mendeteksi lebihbanyak data pencilan dibandingkan denganMD. Persentase pencilan berdasarkan MDadalah sebesar 0.86%, sementara berdasarkanRD jumlahnya mencapai 2.59% dari totalseluruh pengamatan.

Eksplorasi terhadap data curah hujan lokaldi stasiun curah hujan Sukadana jugadilakukan dengan menggunakan boxplot. PadaGambar 2 dapat dilihat bahwa terdapat datapencilan pada data curah hujan lokal yangakan digunakan sebagai peubah respon.

Gambar 2 Boxplot data curah hujan bulanandi stasiun curah hujan Sukadana

5

Kekar, sehingga diperoleh empat modelregresi kekar.

8. Memeriksa kebebasan sisaan keenammodel menggunakan plot AutocorrelationFunction (ACF). Jika terdapatautokorelasi, sisaan tersebut dimodelkandengan pemodelan deret waktu.Pemodelan dapat menggunakan analisistren atau ARIMA, kemudian nilai dugaanmodel deret waktu sisaan dijumlahkandengan model RKU awal. Selanjutnyadihitung Koefisien Determinasi (R2) darikeenam model akhir.

9. Melakukan validasi keenam model yangtelah diperoleh, yaitu: model 1: RKU Klasik, model 2: RKU Klasik dengan

penduga M Huber, model 3: RKU Klasik dengan

penimbang ganda Tukey, model 4: RKU Kekar, model 5: RKU Kekar dengan

penduga M Huber, model 6: RKU Kekar dengan

penimbang ganda Tukey.Validasi dilakukan menggunakan datacurah hujan tahun 2008. Pada tahap inidihitung nilai RMSEP dan korelasi antaranilai dugaan dengan observasi curah hujantahun 2008.

10. Membandingkan keenam model tersebutberdasarkan nilai RMSEP dan korelasiyang dihasilkan pada tahap validasi model.

Pengolahan data dilakukan menggunakanperangkat lunak R 2.11.0. Fungsi yangdigunakan adalah PcaClassic dan PcaHubertpada paket rrcov untuk perhitungan AKU danAKU-K, serta fungsi rlm pada paket MASSuntuk perhitungan regresi kekar.

HASIL DAN PEMBAHASAN

Pada penelitian ini pendugaan curah hujanlokal dilakukan pada 14 stasiun curah hujan diKabupaten Indramayu. Namun untukmemperlihatkan proses penelitian secara utuh,maka akan dijelaskan terlebih dahulumengenai hasil penelitian pada salah satustasiun curah hujan, yaitu stasiun Sukadana.

Eksplorasi DataMultikolinieritas ditandai dengan korelasi

yang kuat antar peubah bebas dan nilaiVariance Inflation Factors (VIF) yang lebihdari 10.00. Dari hasil perhitungan nilaikorelasi dan VIF, diperoleh bahwa persentasepasangan peubah yang memiliki korelasi lebih

dari 0.70 mencapai 40.85% dari total seluruhpasangan peubah. Selain itu, pada Lampiran 2dapat dilihat bahwa nilai VIF berkisar antara569.072 hingga 223438.99. Artinya, setiappeubah bebas memiliki nilai VIF lebih besardari 10.00 yang mengindikasikan adanyamultikolinieritas antar peubah, atau dalam halini dapat dikatakan bahwa terdapat hubunganyang kuat antar grid yang saling berdekatan.

Gambar 1 Boxplot jarak mahalanobis (MD)dan jarak kekar (RD) data luaranGCM

Perhitungan jarak dilakukan untukmendeteksi pencilan dengan menggunakanjarak mahalanobis (MD) dan jarak kekar(RD). Hasil perhitungan jarak ini kemudiandibuat dalam bentuk boxplot. Pada Gambar 1dapat dilihat bahwa RD mendeteksi lebihbanyak data pencilan dibandingkan denganMD. Persentase pencilan berdasarkan MDadalah sebesar 0.86%, sementara berdasarkanRD jumlahnya mencapai 2.59% dari totalseluruh pengamatan.

Eksplorasi terhadap data curah hujan lokaldi stasiun curah hujan Sukadana jugadilakukan dengan menggunakan boxplot. PadaGambar 2 dapat dilihat bahwa terdapat datapencilan pada data curah hujan lokal yangakan digunakan sebagai peubah respon.

Gambar 2 Boxplot data curah hujan bulanandi stasiun curah hujan Sukadana

Jarak Mahalanobis (MD) Jarak Kekar (RD)

5010

015

020

025

030

035

0

5

Kekar, sehingga diperoleh empat modelregresi kekar.

8. Memeriksa kebebasan sisaan keenammodel menggunakan plot AutocorrelationFunction (ACF). Jika terdapatautokorelasi, sisaan tersebut dimodelkandengan pemodelan deret waktu.Pemodelan dapat menggunakan analisistren atau ARIMA, kemudian nilai dugaanmodel deret waktu sisaan dijumlahkandengan model RKU awal. Selanjutnyadihitung Koefisien Determinasi (R2) darikeenam model akhir.

9. Melakukan validasi keenam model yangtelah diperoleh, yaitu: model 1: RKU Klasik, model 2: RKU Klasik dengan

penduga M Huber, model 3: RKU Klasik dengan

penimbang ganda Tukey, model 4: RKU Kekar, model 5: RKU Kekar dengan

penduga M Huber, model 6: RKU Kekar dengan

penimbang ganda Tukey.Validasi dilakukan menggunakan datacurah hujan tahun 2008. Pada tahap inidihitung nilai RMSEP dan korelasi antaranilai dugaan dengan observasi curah hujantahun 2008.

10. Membandingkan keenam model tersebutberdasarkan nilai RMSEP dan korelasiyang dihasilkan pada tahap validasi model.

Pengolahan data dilakukan menggunakanperangkat lunak R 2.11.0. Fungsi yangdigunakan adalah PcaClassic dan PcaHubertpada paket rrcov untuk perhitungan AKU danAKU-K, serta fungsi rlm pada paket MASSuntuk perhitungan regresi kekar.

HASIL DAN PEMBAHASAN

Pada penelitian ini pendugaan curah hujanlokal dilakukan pada 14 stasiun curah hujan diKabupaten Indramayu. Namun untukmemperlihatkan proses penelitian secara utuh,maka akan dijelaskan terlebih dahulumengenai hasil penelitian pada salah satustasiun curah hujan, yaitu stasiun Sukadana.

Eksplorasi DataMultikolinieritas ditandai dengan korelasi

yang kuat antar peubah bebas dan nilaiVariance Inflation Factors (VIF) yang lebihdari 10.00. Dari hasil perhitungan nilaikorelasi dan VIF, diperoleh bahwa persentasepasangan peubah yang memiliki korelasi lebih

dari 0.70 mencapai 40.85% dari total seluruhpasangan peubah. Selain itu, pada Lampiran 2dapat dilihat bahwa nilai VIF berkisar antara569.072 hingga 223438.99. Artinya, setiappeubah bebas memiliki nilai VIF lebih besardari 10.00 yang mengindikasikan adanyamultikolinieritas antar peubah, atau dalam halini dapat dikatakan bahwa terdapat hubunganyang kuat antar grid yang saling berdekatan.

Gambar 1 Boxplot jarak mahalanobis (MD)dan jarak kekar (RD) data luaranGCM

Perhitungan jarak dilakukan untukmendeteksi pencilan dengan menggunakanjarak mahalanobis (MD) dan jarak kekar(RD). Hasil perhitungan jarak ini kemudiandibuat dalam bentuk boxplot. Pada Gambar 1dapat dilihat bahwa RD mendeteksi lebihbanyak data pencilan dibandingkan denganMD. Persentase pencilan berdasarkan MDadalah sebesar 0.86%, sementara berdasarkanRD jumlahnya mencapai 2.59% dari totalseluruh pengamatan.

Eksplorasi terhadap data curah hujan lokaldi stasiun curah hujan Sukadana jugadilakukan dengan menggunakan boxplot. PadaGambar 2 dapat dilihat bahwa terdapat datapencilan pada data curah hujan lokal yangakan digunakan sebagai peubah respon.

Gambar 2 Boxplot data curah hujan bulanandi stasiun curah hujan Sukadana

Jarak Mahalanobis (MD) Jarak Kekar (RD)

5010

015

020

025

030

035

0

Page 14: Analisis Komponen Utama Kekar dan Regresi Kekar

6

Tabel 1 Keragaman KU menggunakan AKU Klasik dan AKU-KAKU klasik AKU-K

KU1 KU2 KU1 KU2Akar Ciri 341.5282 20.43263 212.3872 19.68266Standar Deviasi 18.4805 4.52025 14.5735 4.43651Proporsi Keragaman 0.8736 0.05226 0.8286 0.07679Proporsi Kumulatif 0.8736 0.92585 0.8286 0.90544

AKU dan Regresi KekarJumlah KU yang digunakan untuk

membangun model awal dipilih berdasarkanscreeplot pada Gambar 3. Pada gambarterlihat bahwa akar ciri KU pada keduametode, yaitu AKU Klasik dan AKU-K, mulaistabil setelah KU kedua. Dapat dilihat pulapada Tabel 1 bahwa besarnya proporsikeragaman kumulatif pada komponen keduatelah mencapai 90%.

Gambar 3 Screeplot AKU dan AKU-K

Model awal pertama dibangun denganmeregresikan KU yang dihasilkan oleh AKUKlasik terhadap data curah hujan lokal,sehingga diperoleh model regresi:

y = 127.2557 – 4.5975 KU1 + 1.4859 KU2 + e (1)

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 4.

Gambar 4 Boxplot sisaan model regresikomponen utama klasik

Hasil eksplorasi terhadap model awalmenunjukkan adanya pencilan sehinggadisusun model regresi kekar denganmenambahkan penduga M Huber danpenimbang Ganda Tukey. Dari hasil analisisregresi komponen utama klasik denganpenduga M Huber diperoleh model berikut:

y = 122.4607 – 4.6137 KU1 + 2.3737 KU2 + e (2)

Sementara dari hasil analisis regresikomponen utama klasik dengan penimbangganda Tukey diperoleh model berikut:

y = 120.0592 – 4.5796 KU1 + 2.7988 KU2 + e (3)

Dengan cara yang sama, sebanyak duakomponen utama terpilih dari hasil analisiskomponen utama kekar (AKU-K)diregresikan terhadap data curah hujan lokal.Dari hasil analisis regresi tersebut diperolehmodel sebagai berikut:

y = 127.2557 – 4.5896 KU1 + 1.7644 KU2 + e (4)

Gambar 5 Boxplot sisaan model regresikomponen utama kekar

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 5. Padagambar tersebut terlihat bahwa terdapatpencilan pada sisaan model (4), karenanyadilakukan penambahan penduga M Huber danpenimbang ganda Tukey. Pada analisis regresikomponen utama kekar dengan penduga MHuber diperoleh model berikut:

y = 122.464 – 4.6031 KU1 + 2.6261 KU2 + e (5)

Sementara dari hasil analisis regresikomponen utama kekar dengan penimbangganda Tukey diperoleh model berikut:

2 4 6 8 10

01

23

45

6

Index

Eige

nval

ues

robustclassical

Scree plot

AKUAKU-K

6

Tabel 1 Keragaman KU menggunakan AKU Klasik dan AKU-KAKU klasik AKU-K

KU1 KU2 KU1 KU2Akar Ciri 341.5282 20.43263 212.3872 19.68266Standar Deviasi 18.4805 4.52025 14.5735 4.43651Proporsi Keragaman 0.8736 0.05226 0.8286 0.07679Proporsi Kumulatif 0.8736 0.92585 0.8286 0.90544

AKU dan Regresi KekarJumlah KU yang digunakan untuk

membangun model awal dipilih berdasarkanscreeplot pada Gambar 3. Pada gambarterlihat bahwa akar ciri KU pada keduametode, yaitu AKU Klasik dan AKU-K, mulaistabil setelah KU kedua. Dapat dilihat pulapada Tabel 1 bahwa besarnya proporsikeragaman kumulatif pada komponen keduatelah mencapai 90%.

Gambar 3 Screeplot AKU dan AKU-K

Model awal pertama dibangun denganmeregresikan KU yang dihasilkan oleh AKUKlasik terhadap data curah hujan lokal,sehingga diperoleh model regresi:

y = 127.2557 – 4.5975 KU1 + 1.4859 KU2 + e (1)

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 4.

Gambar 4 Boxplot sisaan model regresikomponen utama klasik

Hasil eksplorasi terhadap model awalmenunjukkan adanya pencilan sehinggadisusun model regresi kekar denganmenambahkan penduga M Huber danpenimbang Ganda Tukey. Dari hasil analisisregresi komponen utama klasik denganpenduga M Huber diperoleh model berikut:

y = 122.4607 – 4.6137 KU1 + 2.3737 KU2 + e (2)

Sementara dari hasil analisis regresikomponen utama klasik dengan penimbangganda Tukey diperoleh model berikut:

y = 120.0592 – 4.5796 KU1 + 2.7988 KU2 + e (3)

Dengan cara yang sama, sebanyak duakomponen utama terpilih dari hasil analisiskomponen utama kekar (AKU-K)diregresikan terhadap data curah hujan lokal.Dari hasil analisis regresi tersebut diperolehmodel sebagai berikut:

y = 127.2557 – 4.5896 KU1 + 1.7644 KU2 + e (4)

Gambar 5 Boxplot sisaan model regresikomponen utama kekar

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 5. Padagambar tersebut terlihat bahwa terdapatpencilan pada sisaan model (4), karenanyadilakukan penambahan penduga M Huber danpenimbang ganda Tukey. Pada analisis regresikomponen utama kekar dengan penduga MHuber diperoleh model berikut:

y = 122.464 – 4.6031 KU1 + 2.6261 KU2 + e (5)

Sementara dari hasil analisis regresikomponen utama kekar dengan penimbangganda Tukey diperoleh model berikut:

2 4 6 8 10

01

23

45

6

Index

Eige

nval

ues

robustclassical

Scree plot

AKUAKU-K

6

Tabel 1 Keragaman KU menggunakan AKU Klasik dan AKU-KAKU klasik AKU-K

KU1 KU2 KU1 KU2Akar Ciri 341.5282 20.43263 212.3872 19.68266Standar Deviasi 18.4805 4.52025 14.5735 4.43651Proporsi Keragaman 0.8736 0.05226 0.8286 0.07679Proporsi Kumulatif 0.8736 0.92585 0.8286 0.90544

AKU dan Regresi KekarJumlah KU yang digunakan untuk

membangun model awal dipilih berdasarkanscreeplot pada Gambar 3. Pada gambarterlihat bahwa akar ciri KU pada keduametode, yaitu AKU Klasik dan AKU-K, mulaistabil setelah KU kedua. Dapat dilihat pulapada Tabel 1 bahwa besarnya proporsikeragaman kumulatif pada komponen keduatelah mencapai 90%.

Gambar 3 Screeplot AKU dan AKU-K

Model awal pertama dibangun denganmeregresikan KU yang dihasilkan oleh AKUKlasik terhadap data curah hujan lokal,sehingga diperoleh model regresi:

y = 127.2557 – 4.5975 KU1 + 1.4859 KU2 + e (1)

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 4.

Gambar 4 Boxplot sisaan model regresikomponen utama klasik

Hasil eksplorasi terhadap model awalmenunjukkan adanya pencilan sehinggadisusun model regresi kekar denganmenambahkan penduga M Huber danpenimbang Ganda Tukey. Dari hasil analisisregresi komponen utama klasik denganpenduga M Huber diperoleh model berikut:

y = 122.4607 – 4.6137 KU1 + 2.3737 KU2 + e (2)

Sementara dari hasil analisis regresikomponen utama klasik dengan penimbangganda Tukey diperoleh model berikut:

y = 120.0592 – 4.5796 KU1 + 2.7988 KU2 + e (3)

Dengan cara yang sama, sebanyak duakomponen utama terpilih dari hasil analisiskomponen utama kekar (AKU-K)diregresikan terhadap data curah hujan lokal.Dari hasil analisis regresi tersebut diperolehmodel sebagai berikut:

y = 127.2557 – 4.5896 KU1 + 1.7644 KU2 + e (4)

Gambar 5 Boxplot sisaan model regresikomponen utama kekar

Dari model tersebut, dilakukan eksplorasiterhadap sisaannya menggunakan boxplotyang dapat dilihat pada Gambar 5. Padagambar tersebut terlihat bahwa terdapatpencilan pada sisaan model (4), karenanyadilakukan penambahan penduga M Huber danpenimbang ganda Tukey. Pada analisis regresikomponen utama kekar dengan penduga MHuber diperoleh model berikut:

y = 122.464 – 4.6031 KU1 + 2.6261 KU2 + e (5)

Sementara dari hasil analisis regresikomponen utama kekar dengan penimbangganda Tukey diperoleh model berikut:

AKUAKU-K

Page 15: Analisis Komponen Utama Kekar dan Regresi Kekar

7

y = 120.0335 – 4.5396 KU1 + 3.0273 KU2 + e (6)

Pada keenam model tersebut dilakukanpemeriksaan kebebasan sisaan. Karena datayang digunakan dalam penelitian inimerupakan data bulanan, ada kekhawatiranbahwa data dipengaruhi oleh fungsi waktusehingga sisaan model tidak saling bebas. PlotAutocorrelation Function (ACF) yang dapatdilihat pada Gambar 6 menunjukkan adanyaautokorelasi pada sisaan model 1.

Gambar 6 Plot ACF sisaan model 1 stasiunSukadana

Penanganan autokorelasi pada sisaanmodel dilakukan dengan memodelkan sisaanmodel tersebut menggunakan model deretwaktu. Pada penelitian ini, dapat digunakanmodel deret waktu analisis tren atau modelARIMA, jika diperlukan. Model akhirmerupakan gabungan dari model RKU danmodel deret waktu. Pada stasiun Sukadana,ternyata analisis tren mampu memberikanhasil yang cukup baik dalam memodelkansisaan tersebut. Hal ini dilihat dari nilai R2

yang lebih besar. Sebagai contoh penyusunanmodel akhir, jika t didefinisikan sebagaipengaruh waktu, persamaan analisis trenuntuk sisaan model 1 pada stasiun Sukadanaadalah sebagai berikut:

y*(t) = -6.79 + 0.0389 t

Selanjutnya persamaan tersebut digabungkandengan persamaan regresi awal sehinggapersamaan regresi yang digunakan menjadi:

y = 127.2557 – 4.5975 KU1 + 1.4859 KU2+ -6.79 + 0.0389 t

Dengan demikian diharapkan akurasipendugaan yang dihasilkan model akanmeningkat karena telah memperhatikanpengaruh waktu yang semula diabaikan.

Begitu pula dengan kelima model lain,dilakukan pemodelan terhadap sisaannya.Setelah itu validasi dilakukan terhadapkeenam model dengan menghitung nilaidugaan (prediksi) yang dihasilkan masing-masing model menggunakan data tahun 2008.Hasil perhitungan nilai RMSEP dan korelasiantara data curah hujan aktual tahun 2008dengan hasil prediksi keenam model dapatdilihat pada Tabel 2.

Tabel 2 Nilai Koefisien determinasi (R2),RMSEP dan korelasi (r) tiap model

R2 RMSEP rModel 1 51.5852% 59.0465 0.9135Model 2 51.5853% 8.7774 0.9995Model 3 51.5853% 12.3740 0.9999Model 4 51.5850% 14.3109 0.9991Model 5 51.5852% 8.4792 0.9995Model 6 51.5853% 12.1529 0.9999

Pada stasiun curah hujan Sukadana,jumlah keragaman yang mampu dijelaskan

Gambar 7 Plot prediksi rata–rata curah hujan bulanan dengan 6 metode berbeda

0 5 10 15 20 25

0.0

0.2

0.4

0.6

0.8

1.0

Lag

AC

F

Series s isa$sukadana_m odel1

0

50

100

150

200

250

300

350

400

Rat

a-ra

ta c

urah

huj

an b

ulan

an (m

m)

observasi model1 model2 model3 model4 model5 model6

Page 16: Analisis Komponen Utama Kekar dan Regresi Kekar

8

oleh keenam model tidak berbeda yaituberkisar 51.59%. Namun pada model 2 hinggamodel 6, korelasi antara data aktual danprediksi untuk tahun 2008 mencapai 0.99, dannilai RMSEP yang dihasilkan pun relatif kecil,yaitu hanya berkisar antara 8.48 hingga 12.37.Sementara pada model 1, nilai RMSEPmencapai 59.05 dan korelasi untuk data tahun2008 hanya sebesar 0.91. Hal inimenunjukkan bahwa metode kekar lebihunggul daripada metode klasik karena mampumelakukan pendugaan dengan akurasi yanglebih baik daripada metode klasik.

Demikian pula bila dilihat dari nilaiprediksi yang dihasilkan oleh keenam model(Lampiran 3), nilai prediksi yang dihasilkanoleh metode kekar lebih mendekati nilaiaktualnya. Grafik pada Gambar 8menunjukkan bahwa model 2 hingga model 6mampu melakukan pendugaan curah hujanyang mengikuti pola curah hujansesungguhnya. Namun model 1 tidak mampumengikuti pola curah hujan sebenarnya,khususnya pada bulan Februari dan Nopember2008. Hal ini dapat ditandai dengan plotprediksi model 2 hingga model 6 yang salingberhimpit dengan nilai observasi, sementaraplot untuk model 1 tidak berhimpit.

Seluruh Stasiun Curah HujanProsedur penelitian yang sama juga

diterapkan pada 14 stasiun curah hujan diKabupaten Indramayu. Secara umum,berdasarkan nilai R2, RMSEP, dan korelasiyang diperoleh pada 13 stasiun lain, hasilnyaberbeda dengan stasiun Sukadana. Berikutakan dijelaskan lebih detil mengenai hasilpenelitian yang diperoleh pada seluruh stasiuncurah hujan tersebut.

Tabel 3 Persentase data pencilan untuksetiap stasiun curah hujan

StasiunJumlah

PencilanPersentase

Bangkir 18 5.17%Losarang 18 5.17%Bulak 16 4.60%Cidempet 13 3.74%Lohbener 12 3.45%Kedokan Bunder 11 3.16%Ujungaris 10 2.87%Juntinyuat 10 2.87%Sudimampir 9 2.59%Krangkeng 8 2.30%Tugu 4 1.15%Cikedung 3 0.86%Sukadana 3 0.86%Sumurwatu 2 0.57%

Tabel 4 Persentase pencilan pada sisaanmodel awal menggunakan AKU

StasiunJumlah

PencilanPersentase

Bangkir 44 12.64%Losarang 40 11.49%Lohbener 33 9.48%Ujungaris 32 9.20%Kedokan Bunder 32 9.20%Bulak 30 8.62%Cidempet 28 8.05%Sudimampir 27 7.76%Juntinyuat 25 7.18%Tugu 22 6.32%Sumurwatu 20 5.75%Krangkeng 20 5.75%Cikedung 17 4.89%Sukadana 17 4.89%

Eksplorasi terhadap data curah hujan pada14 stasiun curah hujan dilakukan denganmenggunakan boxplot (Lampiran 5). Padaboxplot terlihat bahwa setiap stasiun memilikipencilan dengan masing-masing persentasepencilan pada Tabel 3. Persentase pencilanterbesar terdapat pada stasiun curah hujanBangkir dan Losarang yang mencapai 5.17%,sementara persentase terkecil sebesar 0.57%terdapat pada stasiun curah hujan Sumurwatu.

Tabel 5 Persentase pencilan pada sisaanmodel awal menggunakan AKU-K

StasiunJumlah

PencilanPersentase

Bangkir 45 12.93%Losarang 39 11.21%Lohbener 33 9.48%Ujungaris 32 9.20%Kedokan Bunder 32 9.20%Bulak 32 9.20%Cidempet 29 8.33%Sudimampir 28 8.05%Juntinyuat 26 7.47%Tugu 25 7.18%Krangkeng 22 6.32%Sumurwatu 20 5.75%Sukadana 19 5.46%Cikedung 18 5.17%

Pemeriksaan pencilan terhadap sisaanmodel awal, yaitu regresi komponen utamaklasik (model 1) dengan dua KU, dilakukanmenggunakan boxplot (Lampiran 7) denganbesarnya persentase pencilan dapat dilihatpada Tabel 4. Presentase pencilan terbesarmencapai 12.64% pada model dengan peubahrespon stasiun curah hujan Bangkir.Sementara persentase pencilan terkecil

Page 17: Analisis Komponen Utama Kekar dan Regresi Kekar

9

sebesar 4.89% pada stasiun curah hujanCikedung dan Sukadana.

Pemeriksaan pencilan juga dilakukanterhadap sisaan model awal berikutnya yangdiperoleh dari regresi komponen utama kekar(model 4) menggunakan dua KU.Pemeriksaan tersebut dilakukanmenggunakan boxplot (Lampiran 7) denganbesarnya persentase untuk masing-masingstasiun dapat dilihat pada Tabel 5. Presentasepencilan terbesar sebesar 12.93% terdapatpada model untuk stasiun curah hujanBangkir. Sementara persentase pencilanterkecil sebesar 5.17% terdapat pada modeluntuk stasiun curah hujan Cikedung.

Model regresi awal dengan kedua metodeyaitu AKU klasik dan AKU-K ternyatamemiliki sisaan dengan proporsi pencilanyang hampir sama. Hal ini mungkin terjadikarena struktur komponen utama dari keduametode tersebut tidak jauh berbeda. Dapatdilihat pada Lampiran 6 bahwa vektor ciriyang juga merupakan koefisien untukmelakukan tranformasi terhadap data awalpada dua KU pertama dari AKU klasik danAKU-K ternyata memiliki nilai yang mirip.

Pengolahan data selanjutnya dilakukandengan menambahkan penduga M Huber danpenimbang ganda Tukey pada masing-masingmodel awal. Sehingga dihasilkan 6 modelyang dievaluasi berdasarkan nilai RMSEPpada Tabel 7 dan koefisien korelasi antaranilai prediksi dan observasi pada Tabel 8.

Sebelum melakukan validasi, terlebihdahulu dilakukan pemeriksaan kebebasansisaan keenam model yang telah diperolehtersebut. Sama seperti pada stasiun Sukadana,pemeriksaan dilakukan menggunakan plotACF, dan hasil menunjukan bahwa terdapat

autokorelasi pada sisaan keenam modelhampir di setiap stasiun. Permasalahantersebut dapat diatasi dengan memodelkansisaan dari masing-masing model dengananalisis deret waktu. Model yang akhirnyadigunakan adalah model dengan nilaikoefisien determinasi terbesar. Melalui prosestersebut, pada stasiun Cikedung dan Ujungarisdigunakan model ARIMA, pada stasiun Tugudigunakan RKU biasa, dan pada stasiunlainnya digunakan model analisis tren.

Pada Tabel 6 dapat dilihat bahwa nilai R2

yang diperoleh dari semua model berkisarantara 43.82% hingga 76.54%. Secarakeseluruhan, rata-rata nilai R2 terbesardihasilkan oleh model 6 yaitu sebesar 64.35%dan model 4 sebesar 64.28%. Artinya modelregresi kekar dengan penimbang ganda Tukeymampu menjelaskan keragaman denganpersentase yang lebih besar dibandingkanmodel lainnya.

Pada tahap validasi model, dihitung nilaiRMSEP dan korelasi antara nilai prediksi rata-rata curah hujan bulanan dengan dataobservasi pada tahun 2008. Nilai RMSEPterendah pada stasiun Bangkir, Bulak,Cidempet, Losarang, Ujungaris, Sudimampirdan Juntinyuat, dihasilkan oleh model 1, yaituRKU klasik. Sementara pada stasiunLohbener nilai RMSEP terendah dihasilkanoleh model 2, yaitu RKU klasik denganpenduga M Huber. Nilai RMSEP terendahpada stasiun Cikedung, Kedokan Bunder, danKrangkeng dihasilkan oleh model 4, yaituRKU kekar, sementara pada stasiun Sukadanadan Sumurwatu dihasilkan oleh model 5, yaituRKU kekar dengan penduga M Huber. Padamodel 6, yaitu RKU dengan penimbang gandaTukey, dihasilkan nilai RMSEP yang

Tabel 6 Koefisien determinasi (R2) tiap model pada 14 stasiun curah hujan di Indramayu

StasiunKoefisien Determinasi (R2)

Model 1 Model 2 Model 3 Model 4 Model 5 Model 6Bangkir 60.05% 66.61% 76.53% 59.74% 66.49% 76.54%Bulak 56.25% 67.24% 74.65% 56.10% 67.08% 74.65%Cidempet 56.40% 65.12% 75.17% 56.10% 65.12% 75.17%Cikedung 52.27% 47.20% 43.96% 51.84% 46.92% 43.82%Losarang 54.17% 62.73% 72.76% 53.88% 62.73% 72.76%Sukadana 51.59% 51.59% 51.59% 51.59% 51.59% 51.59%Sumurwatu 56.85% 54.17% 54.61% 56.40% 53.73% 54.32%Tugu 52.00% 51.96% 51.93% 52.53% 52.51% 52.48%Ujungaris 49.98% 56.25% 63.04% 49.70% 56.10% 63.20%Lohbener 51.70% 58.06% 68.39% 51.41% 58.06% 68.56%Sudimampir 61.62% 68.39% 75.17% 61.31% 68.23% 75.00%Juntinyuat 56.55% 59.91% 64.96% 56.25% 59.91% 65.29%Kedokan Bunder 56.70% 61.78% 67.90% 56.25% 61.62% 68.06%Krangkeng 57.61% 57.30% 59.29% 57.15% 57.15% 59.44%Rataan 55.27% 59.17% 64.28% 55.02% 59.09% 64.35%

Page 18: Analisis Komponen Utama Kekar dan Regresi Kekar

10

Tabel 7 Nilai RMSEP dari 6 model berbeda pada 14 stasiun curah hujan di Kabupaten Indramayu

StasiunRMSEP

Model 1 Model 2 Model 3 Model 4 Model 5 Model 6Bangkir 94.5241 99.9517 111.8539 95.0978 100.7420 95.9998Bulak 97.1174 106.1267 113.8878 97.4207 106.5284 114.3786Cidempet 102.1018 109.8332 121.3261 102.1132 110.1214 121.8354Cikedung 72.0353 72.1257 73.0594 71.3044 71.3541 72.1937Losarang 70.8327 79.2642 89.8431 70.9087 79.5089 90.1541Sukadana 59.0465 8.7774 12.3740 14.3109 8.4792 12.1529Sumurwatu 90.1299 88.0937 88.3521 89.5431 87.5432 87.8834Tugu 63.8293 61.4120 60.3234 63.2718 61.0318 59.9557Ujungaris 48.8766 49.0766 49.0583 49.0128 49.1757 49.1440Lohbener 80.0289 80.6890 84.5845 80.4564 81.2237 85.2219Sudimampir 96.1580 101.9506 108.5935 96.5584 102.4639 108.9613Juntinyuat 91.7388 94.8092 99.5359 92.3261 95.6333 100.5502Kedokan Bunder 66.3141 70.3536 74.1236 65.8269 70.0004 73.8928Krangkeng 41.2696 43.2828 44.2672 40.7462 42.7205 43.7089Rataan 76.7145 76.1247 80.7988 73.4927 76.1805 79.7166Simpangan 19.3089 28.2921 31.0412 25.4197 28.6012 30.3985

minimum hanya pada stasiun Tugu. Jikadilihat dari rataan seluruh stasiun, nilaiRMSEP terendah adalah sebesar 73.492678yang dihasilkan oleh model 4 dengan selisih3.222 poin lebih rendah daripada nilaiRMSEP pada model 1.

Nilai korelasi antara data prediksi danobservasi pada tahun 2008 dapat dilihat padaTabel 8. Nilai korelasi tertinggi pada stasiunBulak, Cidempet, Losarang, Ujungaris,Sudimampir, dan Juntinyuat dihasilkan olehmodel 1, sementara pada stasiun Bangkir olehmodel 2, dan pada stasiun Lohbenerdihasilkan oleh model 3. Pada stasiunCikedung, Sumurwatu, Tugu, KedokanBunder, dan Krangkeng nilai korelasiterendah dihasilkan oleh model 4, dan pada

stasiun Sukadana dihasilkan model 6. Jikadilihat dari rataan nilai korelasi tersebut padaseluruh stasiun, nilai terendah dihasilkan olehmodel 4 yang menerapkan metode regresikomponen utama kekar.

Di sisi lain, jika diamati dari nilai rataanR2, nilai tertinggi dihasilkan oleh model 6,yaitu RKU kekar dengan penimbang gandaTukey. Hal ini menunjukan bahwa fungsipenimbang dalam regresi kekar mampumembangun model yang mampu menjelaskankeragaman data training dengan cukup baik,namun tidak demikian halnya denganpendugaan pada validasi model yangmenggunakan segugus data baru.

Dengan mempertimbangkan nilai RMSEPyang minimum dan nilai korelasi validasi

Tabel 8 Nilai koefisien korelasi pada validasi keenam model 14 stasiun curah hujan di Indramayu

StasiunKorelasi antara Data Prediksi dan Observasi Tahun 2008

Model 1 Model 2 Model 3 Model 4 Model 5 Model 6Bangkir 0.9140 0.9147 0.9141 0.9106 0.9108 0.9142Bulak 0.9515 0.9459 0.9397 0.9493 0.9431 0.9365Cidempet 0.9528 0.9466 0.9370 0.9519 0.9454 0.9353Cikedung 0.9980 0.9975 0.9963 0.9984 0.9979 0.9968Losarang 0.9556 0.9458 0.9395 0.9543 0.9445 0.9380Sukadana 0.9135 0.9995 0.9999 0.9991 0.9995 0.9999Sumurwatu 0.9062 0.9058 0.9057 0.9088 0.9083 0.9083Tugu 0.9394 0.9383 0.9380 0.9401 0.9392 0.9390Ujungaris 0.9311 0.9308 0.9300 0.9304 0.9300 0.9292Lohbener 0.8617 0.8667 0.8699 0.8584 0.8627 0.8653Sudimampir 0.9124 0.9096 0.9075 0.9085 0.9052 0.9028Juntinyuat 0.9434 0.9413 0.9393 0.9398 0.9377 0.9355Kedokan Bunder 0.8823 0.8699 0.8640 0.8837 0.8714 0.8655Krangkeng 0.9162 0.9068 0.9027 0.9184 0.9093 0.9054Rataan 0.9270 0.9299 0.9274 0.9323 0.9289 0.9265Simpangan 0.0339 0.0390 0.0389 0.0389 0.0393 0.0391

Page 19: Analisis Komponen Utama Kekar dan Regresi Kekar

11

yang maksimum, maka dapat dikatakanbahwa model 4, yaitu RKU kekar,lebihunggul daripada model lainnya. Namunperbedaan antara model 4 dan kelima modellainnya tidak signifikan, hal ini dapat dilihatdari selisih nilai rataan RMSEP model 4 danmodel 1 yang relatif kecil, yaitu sebesar 3.222poin, serta rentang nilai rataan korelasi antaradata prediksi dengan observasi tahun 2008yang relatif sempit, yaitu berkisar antara0.926542 hingga 0.932264.

Kondisi ini terjadi karena karakteristikpencilan yang terdapat pada data luaran GCMyang digunakan bukan merupakan amatanberpengaruh. Informasi diagnostik mengenaiamatan berpengaruh dapat diperoleh denganmenghitung matriks HAT dengan rumus= ( ) ′. Pada Lampiran 4 dapatdilihat bahwa nilai elemen diagonal matriksHAT atau h[i,i] dari data luaran GCM AnginZonal hanya berkisar antara 0.096686 hingga0.354262. Menurut Myers (1989), suatupengamatan dikatakan sebagai amatanberpengaruh bila nilai h[i,i] melebihi 2p/n,dimana p adalah banyaknya peubah dan nadalah banyaknya pengamatan. Dalampenelitian ini batas 2p/n setara dengan0.3678161, artinya tidak terdapat h[i,i] yangmelebihi batas tersebut. Dengan demikiandapat dikatakan bahwa pencilan yang terdapatpada data bukanlah amatan berpengaruh. Olehkarenanya, dalam kasus penelitian ini,metode kekar yang diusulkan hanya sebatasdijadikan sebagai alternatif pendugaan selainmetode klasik, karena hasil menunjukanbahwa metode kekar tersebut belum mampumemperbaiki pendugaan secara signifikandibandingkan metode klasik.

KESIMPULAN DAN SARAN

KesimpulanMetode regresi komponen utama kekar

menunjukan hasil pendugaan yang lebihunggul dibandingkan model lainnya. Namunhasil penelitian menunjukkan bahwa performasetiap model hampir sama sehingga padapenelitian ini metode kekar digunakan sebagaialternatif pendugaan selain metode klasik. Halini disebabkan oleh pencilan yang terdapatpada data luaran GCM yang digunakan bukanmerupakan amatan berpengaruh.

SaranPerlu dilakukan simulasi untuk

mengontaminasi data dengan keterpencilandan proporsi pencilan yang relatif besar,sehingga ketahanan metode AKU-K dan

regresi kekar dapat dikaji secara lebihmendalam. Selain itu, diperlukan deteksipencilan yang lebih detil, untuk membedakanpencilan yang merupakan pengamatan denganpengaruh baik dan pengaruh buruk.

DAFTAR PUSTAKA

Benestad RE, Hanssen-Bauer I, Chen D.2008. Empirical Statistical Downscaling.Singapore: World Scientific Publishing.

Draper NR, Smith H. 1992. Analisis RegresiTerapan Edisi Kedua. Sumantri B,penerjemah. Jakarta: Gramedia PustakaUtama. Terjemahan dari: AppliedRegression Analysis.

Hubert M, Debruyne M. 2010. Minimumcovariance determinant. WIREsCompstats. 2: 36-43.

Hubert M, Rousseeuw PJ, Vanden-BrandenK. 2005. ROBPCA: a new approach torobust principal component analysis.Technometrics. 47: 64-79.

Myers RH. 1989. Classical and ModernRegression with Applications SecondEdition. Boston: PWS-KENT PublishingCompany.

Ningsih W. 2009. Identifikasi dan penangananpengaruh pencilan pada analisis komponenutama [Skripsi]. Bogor: DepartemenStatistika FMIPA IPB.

Sanjaya I. 2010. Penentuan prediktor padastatistical downscaling dengan singularvalue decomposition (studi kasus distasiun meteorologi indramayu) [Skripsi].Bogor: Departemen Statistika FMIPA IPB.

Todorov V, Filzmoser P. 2009. An object-oriented framework for robust multivariateanalysis. Journal of Statistical Software.32( 3):1-47.

Wigena AH. 2006. Pemodelan statisticaldownscaling dengan regresi projectionpursuit untuk peramalan curah hujanbulanan: kasus curah hujan bulanan diindramayu [Disertasi]. Bogor: ProgramPascasarjana, Institut Pertanian Bogor.

Wilby RL et al. 2009. A review of climaterisk information for adaptation anddevelopment planning. Int. J. Climatol.29: 1193-1215.

Page 20: Analisis Komponen Utama Kekar dan Regresi Kekar

LAMPIRAN

Page 21: Analisis Komponen Utama Kekar dan Regresi Kekar

12

Lampiran 1 Domain yang digunakan

LintangBujur Timur

98.75˚ 101.25˚ 103.75˚ 106.25˚ 108.75˚ 111.25˚ 113.75˚ 116.25˚1.25˚LU X5045 X5046 X5047 X5048 X5049 X5050 X5051 X50521.25˚LS X5188 X5189 X5190 X5191 X5192 X5193 X5194 X51953.75˚LS X5331 X5332 X5333 X5334 X5335 X5336 X5337 X53386.25˚LS X5474 X5475 X5476 X5477 X5478 X5479 X5480 X54818.75˚LS X5617 X5618 X5619 X5620 X5621 X5622 X5623 X5624

11.25˚LS X5760 X5761 X5762 X5763 X5764 X5765 X5766 X576713.75˚LS X5903 X5904 X5905 X5906 X5907 X5908 X5909 X591016.25˚LS X6046 X6047 X6048 X6049 X6050 X6051 X6052 X6053

Lampiran 2 Variance Inflation Factors (VIF) pada prediktor Angin Zonal

No. Prediktor VIF1 x5045 22.4172 x5046 88.6803 x5047 184.6554 x5048 2007.2325 x5049 4079.7186 x5050 1199.4687 x5051 94.0358 x5052 19.1269 x5188 256.543

10 x5189 725.81911 x5190 983.65212 x5191 5089.15313 x5192 12365.39414 x5193 2091.21915 x5194 246.89216 x5195 77.11217 x5331 2119.45518 x5332 4895.21319 x5333 2503.42420 x5334 13001.90221 x5335 91115.66322 x5336 57284.54223 x5337 3913.54824 x5338 154.36525 x5474 9167.68926 x5475 38747.32627 x5476 33199.49528 x5477 18616.65829 x5478 101211.97030 x5479 135476.10031 x5480 42623.21632 x5481 4958.418

No. Prediktor VIF33 x5617 16716.96934 x5618 97371.57035 x5619 176933.08036 x5620 128648.49037 x5621 92530.35338 x5622 75852.80839 x5623 39195.66640 x5624 6012.17441 x5760 13404.59142 x5761 79735.71143 x5762 178639.89044 x5763 223438.99045 x5764 182984.98046 x5765 102817.86047 x5766 39727.99148 x5767 5364.24449 x5903 3874.69050 x5904 23831.90351 x5905 56693.75352 x5906 87300.35753 x5907 107184.26054 x5908 91363.24755 x5909 41664.43256 x5910 5499.09957 x6046 569.07258 x6047 4411.44959 x6048 12989.80060 x6049 19746.12461 x6050 23630.14062 x6051 20958.66163 x6052 10186.99764 x6053 1414.860

Page 22: Analisis Komponen Utama Kekar dan Regresi Kekar

13

Lampiran 3 Prediksi rata-rata curah hujan bulanan di stasiun curah hujan Sukadana

Obs.Data

AktualModel 1 Model 2 Model 3 Model 4 Model 5 Model 6

1 346 276.313 353.616 356.076 361.104 353.260 355.7652 275 370.227 286.802 285.791 284.138 285.931 285.1893 297 237.596 310.556 310.695 304.078 310.130 310.2994 57 143.647 72.249 72.986 60.373 71.799 72.5875 0 63.445 9.742 14.441 8.459 9.529 14.2496 31 66.410 38.470 44.272 42.299 38.334 44.1447 0 41.275 6.486 13.177 12.515 6.413 13.0938 2 21.341 7.474 14.988 16.157 7.486 14.9539 0 56.717 0.000 9.706 21.424 0.000 9.68410 95 87.916 97.571 105.564 113.797 97.477 105.49311 84 162.290 90.940 95.666 100.704 90.723 95.43412 233 224.952 237.969 242.749 253.559 237.856 242.569

RMSEP 59.04647 8.777412 12.374 14.31094 8.479183 12.15288r 0.913479 0.999516 0.999897 0.999087 0.999546 0.999905

Keterangan model 1: regresi komponen utama klasik model 2: regresi komponen utama klasik dengan penduga M Huber model 3: regresi komponen utama klasik dengan penimbang ganda Tukey model 4: regresi komponen utama kekar model 5: regresi komponen utama kekar dengan penduga M Huber model 6: regresi komponen utama kekar dengan penimbang ganda Tukey

Lampiran 4 Elemen diagonal matriks HAT pada prediktor Angin Zonal

Obs. h[i,i]1 0.22432 0.16503 0.13994 0.15725 0.14726 0.17147 0.20438 0.24549 0.2071

10 0.164011 0.157212 0.222613 0.246214 0.248215 0.131316 0.165517 0.126218 0.152219 0.147220 0.116221 0.173922 0.131623 0.147924 0.2088

Obs. h[i,i]25 0.218626 0.193727 0.212428 0.148629 0.096730 0.111331 0.125132 0.143833 0.108734 0.113835 0.223636 0.269837 0.286138 0.243239 0.201740 0.134041 0.140642 0.154643 0.191644 0.219445 0.193146 0.181547 0.198548 0.1338

Obs. h[i,i]49 0.176050 0.201951 0.203452 0.175053 0.169954 0.126755 0.125756 0.174757 0.171358 0.148959 0.157060 0.201461 0.153962 0.213763 0.146064 0.118365 0.146266 0.188167 0.144968 0.155969 0.105970 0.182071 0.112072 0.1565

Page 23: Analisis Komponen Utama Kekar dan Regresi Kekar

14

Lampiran 4 Elemen diagonal matriks HAT pada prediktor Angin Zonal (Lanjutan)

obs h[i,i]73 0.164774 0.245275 0.149776 0.185977 0.157478 0.254079 0.116880 0.149581 0.173182 0.166983 0.123284 0.154785 0.261986 0.208687 0.130188 0.151189 0.126390 0.112391 0.167892 0.221093 0.159094 0.155395 0.140796 0.148197 0.164798 0.245299 0.1497

100 0.1859101 0.1574102 0.2540103 0.1168104 0.1495105 0.1731106 0.1669107 0.1232108 0.1547109 0.2619110 0.2086111 0.1301112 0.1511113 0.1263114 0.1123115 0.1678116 0.2210117 0.1590118 0.1553119 0.1407120 0.1481121 0.1647122 0.2452123 0.1497124 0.1859125 0.1574

obs h[i,i]126 0.1631127 0.3375128 0.1833129 0.1808130 0.1966131 0.1987132 0.2069133 0.1743134 0.2404135 0.1667136 0.0967137 0.1432138 0.1357139 0.1378140 0.1843141 0.1078142 0.1403143 0.1639144 0.1450145 0.2799146 0.2671147 0.1396148 0.1472149 0.1850150 0.1631151 0.3375152 0.1833153 0.1808154 0.1966155 0.1987156 0.2069157 0.1743158 0.2404159 0.1667160 0.0967161 0.1432162 0.1357163 0.1378164 0.1843165 0.1078166 0.1403167 0.1639168 0.1450169 0.2799170 0.2671171 0.1396172 0.1472173 0.1850174 0.1631175 0.3375176 0.1833177 0.1808178 0.1966

obs h[i,i]179 0.1467180 0.1944181 0.1707182 0.1955183 0.2391184 0.2058185 0.1538186 0.1264187 0.1938188 0.2374189 0.2524190 0.1524191 0.2351192 0.1780193 0.2266194 0.2293195 0.1641196 0.2135197 0.1288198 0.1644199 0.1734200 0.2870201 0.2065202 0.1501203 0.1467204 0.1944205 0.1707206 0.1955207 0.2391208 0.2058209 0.1538210 0.1264211 0.1938212 0.2374213 0.2524214 0.1524215 0.2351216 0.1780217 0.2266218 0.2293219 0.1641220 0.2135221 0.1288222 0.1644223 0.1734224 0.2870225 0.2065226 0.1501227 0.1467228 0.1944229 0.1707230 0.1955231 0.2391

Page 24: Analisis Komponen Utama Kekar dan Regresi Kekar

15

Lampiran 4 Elemen diagonal matriks HAT pada prediktor Angin Zonal (Lanjutan)

obs h[i,i]232 0.2230233 0.2184234 0.2187235 0.1600236 0.1681237 0.1235238 0.1863239 0.2064240 0.2580241 0.1637242 0.1835243 0.2534244 0.2411245 0.1983246 0.2156247 0.1360248 0.1750249 0.1916250 0.1563251 0.1746252 0.2440253 0.2334254 0.3082255 0.1705256 0.2619257 0.2239258 0.2593259 0.1497260 0.1702261 0.2014262 0.1797263 0.1875264 0.2148265 0.1783266 0.2358267 0.2148268 0.1321269 0.1743270 0.1281

obs h[i,i]271 0.1883272 0.1446273 0.2387274 0.1997275 0.1840276 0.2107277 0.2322278 0.2835279 0.1939280 0.1589281 0.2299282 0.2556283 0.2566284 0.1636285 0.1799286 0.2430287 0.1662288 0.1483289 0.2131290 0.2570291 0.1239292 0.1837293 0.1692294 0.1523295 0.1496296 0.1460297 0.1643298 0.1524299 0.1804300 0.1510301 0.2178302 0.1891303 0.2324304 0.1575305 0.1138306 0.1853307 0.1730308 0.2189309 0.1611

obs h[i,i]310 0.1763311 0.1484312 0.2244313 0.1529314 0.2428315 0.2335316 0.1573317 0.1915318 0.2001319 0.1683320 0.1577321 0.2094322 0.1175323 0.2067324 0.2540325 0.2432326 0.2461327 0.2311328 0.2120329 0.1515330 0.2262331 0.2274332 0.2121333 0.2210334 0.2406335 0.2400336 0.2218337 0.2920338 0.2261339 0.2963340 0.1695341 0.1538342 0.2103343 0.3005344 0.2741345 0.2839346 0.3168347 0.3186348 0.2297

Page 25: Analisis Komponen Utama Kekar dan Regresi Kekar

16

Lampiran 5 Boxplot untuk data curah hujan dari 14 stasiun curah hujan di Indramayu

bangkir bulak cidempet losarang sumurwatutugu ujungaris lohbener juntinyuat krangkeng

020

040

060

080

0

Stasiun Klimatologi

Rat

a-ra

ta C

urah

Huj

an B

ulan

an (m

m)

Bangkir Bulak Cidempet Cikedung Losarang Sukadana Sumur Tugu Ujungaris Lohbener Sudi Juntinyuat Kedokan KrangkengWatu mampir Bunder

Stasiun Curah Hujan

Page 26: Analisis Komponen Utama Kekar dan Regresi Kekar

17

Lampiran 6 Komponen Utama (KU) terpilih untuk metode AKU Klasik dan AKU Kekar

AKU klasik AKU KekarKU1 KU2 KU1 KU2

x5045 0.0026 0.0079 -0.0014 0.0073x5046 -0.0166 -0.0030 0.0194 -0.0020x5047 -0.0026 0.0065 0.0044 0.0024x5048 0.0403 0.0177 -0.0442 -0.0048x5049 0.0559 0.0064 -0.0621 -0.0286x5050 0.0306 -0.0041 -0.0340 -0.0251x5051 -0.0035 -0.0083 0.0063 -0.0137x5052 -0.0062 -0.0020 0.0081 -0.0050x5188 0.0053 0.0554 -0.0020 0.0537x5189 0.0150 0.0068 -0.0147 -0.0009x5190 0.0091 0.0077 -0.0087 -0.0009x5191 -0.0257 0.0107 0.0333 0.0064x5192 -0.0491 0.0053 0.0603 0.0028x5193 -0.0247 -0.0074 0.0289 -0.0062x5194 -0.0002 -0.0209 0.0006 -0.0199x5195 0.0142 -0.0124 -0.0164 -0.0197x5331 -0.0585 0.1529 0.0688 0.1665x5332 -0.0319 0.0724 0.0395 0.0757x5333 -0.0049 0.0152 0.0068 0.0102x5334 -0.0443 -0.0082 0.0522 -0.0026x5335 -0.1356 -0.0052 0.1560 0.0157x5336 -0.1293 -0.0144 0.1460 0.0038x5337 -0.0480 -0.0114 0.0551 -0.0052x5338 -0.0170 -0.0027 0.0209 -0.0027x5474 -0.1287 0.2614 0.1320 0.2728x5475 -0.1076 0.2175 0.1140 0.2203x5476 -0.0632 0.1159 0.0671 0.1089x5477 -0.0417 0.0090 0.0473 0.0052x5478 -0.1199 -0.0443 0.1350 -0.0336x5479 -0.1750 -0.0628 0.1900 -0.0494x5480 -0.1546 -0.0363 0.1660 -0.0261x5481 -0.1442 -0.0187 0.1570 -0.0045x5617 -0.1647 0.2856 0.1530 0.2800x5618 -0.1757 0.2807 0.1710 0.2782x5619 -0.1713 0.2242 0.1710 0.2246x5620 -0.1313 0.1199 0.1340 0.1228x5621 -0.1184 0.0248 0.1230 0.0312x5622 -0.1305 -0.0536 0.1330 -0.0492x5623 -0.1481 -0.0790 0.1520 -0.0740x5624 -0.1625 -0.0771 0.1710 -0.0663x5760 -0.1517 0.2339 0.1330 0.2185x5761 -0.1656 0.2284 0.1490 0.2178x5762 -0.1845 0.2036 0.1720 0.1998x5763 -0.1937 0.1512 0.1860 0.1554x5764 -0.1874 0.0757 0.1830 0.0840x5765 -0.1744 -0.0328 0.1730 -0.0277x5766 -0.1695 -0.1232 0.1710 -0.1215x5767 -0.1674 -0.1740 0.1710 -0.1746x5903 -0.1001 0.1177 0.0858 0.1084x5904 -0.1106 0.0967 0.0962 0.0903x5905 -0.1283 0.0587 0.1150 0.0554x5906 -0.1533 0.0145 0.1420 0.0147x5907 -0.1847 -0.0435 0.1760 -0.0419x5908 -0.2115 -0.1182 0.2080 -0.1172x5909 -0.2223 -0.1907 0.2210 -0.1929x5910 -0.2199 -0.2573 0.2210 -0.2635x6046 -0.0593 0.0263 0.0519 0.0321x6047 -0.0762 0.0015 0.0703 0.0111x6048 -0.1017 -0.0335 0.0979 -0.0226x6049 -0.1214 -0.0754 0.1180 -0.0679x6050 -0.1454 -0.1340 0.1420 -0.1320x6051 -0.1695 -0.1908 0.1680 -0.1929x6052 -0.1852 -0.2459 0.1850 -0.2526x6053 -0.1910 -0.3127 0.1940 -0.3235

Page 27: Analisis Komponen Utama Kekar dan Regresi Kekar

18

Lampiran 7 Boxplot sisaan model awal menggunakan AKU Klasik

bangkir bulak cidempet losarang sumurwatutugu ujungaris lohbener juntinyuat krangkeng

-400

-200

020

040

060

0

Stasiun Klimatologi

Rat

a-ra

ta C

urah

Huj

an B

ulan

an (m

m)

Bangkir Bulak Cidempet Cikedung Losarang Sukadana Sumur Tugu Ujungaris Lohbener Sudi Juntinyuat Kedokan Krangkengwatu mampir Bunder

Stasiun Curah Hujan

Page 28: Analisis Komponen Utama Kekar dan Regresi Kekar

19

Lampiran 8 Boxplot sisaan model awal menggunakan AKU-K

bangkir bulak cidempet losarang sumurwatutugu ujungaris lohbener juntinyuat krangkeng

-400

-200

020

040

060

0

Stasiun Klimatologi

Rat

a-ra

ta C

urah

Huj

an B

ulan

an (m

m)

Bangkir Bulak Cidempet Cikedung Losarang Sukadana Sumur Tugu Ujungaris Lohbener Sudi Juntinyuat Kedokan Krangkengwatu mampir Bunder

Stasiun Curah Hujan

Page 29: Analisis Komponen Utama Kekar dan Regresi Kekar

20

Lampiran 9 Plot prediksi rata-rata curah hujan lokal

20

Lampiran 9 Plot prediksi rata-rata curah hujan lokal

20

Lampiran 9 Plot prediksi rata-rata curah hujan lokal

Page 30: Analisis Komponen Utama Kekar dan Regresi Kekar

21

Lampiran 9 Plot prediksi rata-rata curah hujan lokal (lanjutan)

21

Lampiran 9 Plot prediksi rata-rata curah hujan lokal (lanjutan)

21

Lampiran 9 Plot prediksi rata-rata curah hujan lokal (lanjutan)