PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA (Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara) SKRIPSI Oleh: Rizky Ade Putranto NIM : 24010210141018 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2015
19
Embed
PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION … filefakultas sains dan matematika universitas diponegoro ... perbandingan analisis klasifikasi antara decision tree dan support
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE
DAN SUPPORT VECTOR MACHINE MULTICLASS
UNTUK PENENTUAN JURUSAN PADA SISWA SMA
(Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara)
SKRIPSI
Oleh:
Rizky Ade Putranto
NIM : 24010210141018
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2015
i
PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE
DAN SUPPORT VECTOR MACHINE MULTICLASS
UNTUK PENENTUAN JURUSAN PADA SISWA SMA
(Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara)
SKRIPSI
Oleh:
Rizky Ade Putranto
NIM : 24010210141018
JURUSAN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2015
ii
iii
iv
KATA PENGANTAR
Puji syukur penulis panjatkan atas hadirat Allah SWT yang telah
memberikan rahmat dan karunia-Nya, sehingga Laporan Tugas Akhir ini
terselesaikan. Laporan Tugas akhir yang berjudul “Perbandingan Analisis
Klasifikasi Antara Decision Tree dan Support Vector Machine Multiclass
Untuk Penentuan Jurusan Pada Siswa SMA (Studi Kasus Nilai Mata
Pelajaran Pokok di SMA Negeri 1 Jepara)“ dapat terselesaikan. Pada
kesempatan ini penulis ingin mengucapkan terima kasih kepada :
1. Ibu Dra. Dwi Ispriyanti, M.Si selaku Ketua Jurusan Statistika FSM
Universitas Diponegoro Semarang.
2. Ibu Triastuti Wuryandari, S.Si, M.Si selaku Dosen Pembimbing I dan Bapak
Drs. Sudarno, M.Si selaku Dosen Pembimbing II yang telah meluangkan
waktu memberikan masukan, motivasi, bimbingan dan pengarahan kepada
penulis.
3. Bapak/Ibu Dosen dan teman-teman mahasiswa Statistika Undip yang telah
memberikan motivasi dan dukungan kepada penulis.
4. Semua pihak yang tidak dapat disebutkan satu per satu.
Penulis menyadari bahwa Laporan Tugas Akhir ini belumlah sempurna.
Oleh karena itu, kritik dan saran yang bersifat membangun sangat penulis
harapkan. Penulis berharap semoga Laporan Tugas Akhir ini bisa membawa
manfaat bagi penulis sendiri khususnya maupun bagi para pembaca pada
umumnya.
Semarang, 29 September 2015
Penulis
v
ABSTRAK
Data mining adalah proses yang mempekerjakan satu atau lebih teknikMachine Learning untuk menganalisis dan mengekstraksi pengetahuan secaraotomatis. Analisis klasifikasi data mining adalah menentukan sebuah record databaru ke salah satu dari beberapa kategori yang telah didefinisikan sebelumnya,disebut juga dengan Supervised Learning. Klasifikasi Decision Tree merupakansalah satu teknik terkenal dalam data mining dan merupakan salah satu metodeyang popular dalam menentukan keputusan suatu kasus dimana dalam prosesmetodenya diperoleh kriteria entropy, information gain dan gain ratio. KlasifikasiSupport Vector Machine Multiclass (SVMM) dikenal sebagai teknik MachineLearning paling mutakhir menangani kasus multi kelas dimana output darihimpunan data memiliki lebih dari dua kelas atau kategori. Penulisan Tugas Akhirini bertujuan untuk membandingkan tingkat ketepatan dan laju error klasifikasiDecision Tree dan SVMM untuk prediksi penjurusan siswa SMA di SMA Negeri1 Jepara. Total akurasi sebesar 88,57% dan laju error 11,43% untuk klasifikasidecision tree dan total akurasi sebesar 87,14% dan laju error 12,86% untukklasifikasi SVMM.
Kata kunci : Data Mining, Machine Learning, Supervised Learning, DecisionTree, Support Vector Machine Multiclass.
vi
ABSTRACT
Data mining is a process that employs one or more of Machine Learningtechniques to analyze and extract knowledge automatically. Analysis of datamining is to determine the classification of a new data record into one of severalcategories that have been defined previously, also known as Supervised Learning.Classification Decision Tree is one of the well-known technique in data miningand is one of the popular methods in the decision making process of a case inwhich the method is obtained entropy criteria, information gain and gain ratio.Classification Support Vector Machine Multiclass (SVMM) is known as the mostadvanced machine learning techniques to handle multi-class case where the outputof the data set has more than two classes or categories. This final project aims tocompare the level of accuracy and error rate of Decision Tree classification andprediction majors SVMM for high school students at SMAN 1 Jepara. The totalaccuracy of 88,57% and 11,43% error rate for the classification decision tree andthe total accuracy of 87,14% and the error rate for the classification SVMM12,86%.Keywords : Data Mining, Machine Learning, Supervised Learning, Decision
Tree, Support Vector Machine Multiclass
vii
DAFTAR ISIHalaman
HALAMAN JUDUL ………………………………………………………..… i
HALAMAN PENGESAHAN I ………………………………………………. ii
HALAMAN PENGESAHAN II ………………………………………………. iii
KATA PENGANTAR ………………………………………………………… iv
ABSTRAK …………………………………………………………………….. v
ABSTRACT…………………………………………………………………… vi
DAFTAR ISI ………………………………………………………………….. vii
DAFTAR TABEL …………………………………………………………….. ix
DAFTAR GAMBAR ………………………………………………………….. xi
DAFTAR LAMPIRAN………………………………………………………… xii
BAB I PENDAHULUAN……………………………………………………... 1
1.1 Latar Belakang …….………………………………………………. 1
1.2 Rumusan Masalah ….………………………..…………………….. 5
1.3 Batasan Masalah ….……………………………………………….. 6
1.4 Tujuan …………………….……………………………………….. 6
BAB II TINJAUAN PUSTAKA …………………….………………………... 7
2.1 Konsep Dasar Data Mining .………………………………..……... 7
2.2 Operasi Data Mining………………………………………………. 10
2.3 Permasalahan dalam Data Mining …………….…………………... 11