Page 1
IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL
BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar
Sarjana Komputer Program Studi Teknik Informatika
Oleh :
Klaudius Giri Priyatama
125314095
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 2
i
IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL
BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar
Sarjana Komputer Program Studi Teknik Informatika
Oleh :
Klaudius Giri Priyatama
125314095
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 3
ii
IDENTIFIED THE MEANING OF SABAR WORD IN INDONESIAN
ARTICLES USING NAIVE BAYES ALGORITHM
SKRIPSI
Presented as Partial Fullfillment of the Requirements to Obtain Sarjana
Komputer Degree in Informatics Engineering Study Program
Written by :
Klaudius Giri Priyatama
125314095
INFORMATICS ENGINEERING STUDY PROGRAM
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2017
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 4
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 5
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 6
v
HALAMAN PERSEMBAHAN
“Sometimes everything is going to be dark in your life, but it doesn’t matter,
you have to walk and believe that you will find the light”
(Lyoto Machida)
“Every teacher once was a student.
Every winner once was a loser.
Every expert once was a beginner.
But all of them have crossed
The bridge called
Learning”
(9gag.com)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 7
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan
dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.
Yogyakarta, 16 Januari 2017
Penulis
Klaudius Giri Priyatama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 8
vii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata
Dharma:
Nama : Klaudius Giri Priyatama
NIM : 125314095
Demi pengembangan ilmu pengetahuan, saya memberikan kepada
perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul:
IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL
BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya
memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk
menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk
pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di
internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari
saya maupun memberikan royalty kepada saya selama tetap mencantumkan nama
saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Yogyakarta, 16 Januari 2017
Yang menyatakan
Klaudius Giri Priyatama
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 9
viii
IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL
BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES
ABSTRAK
Kesabaran merupakan nilai hidup yang dijunjung tinggi bangsa Indonesia.
Menurut Subandi (2011), kesabaran merupakan ajaran yang dijunjung oleh kelima
agama yang besar di Indonesia (Islam, Kristen, Katolik, Hindu, dan Budha). Lebih
lanjut disebutkan oleh Subandi bahwa dalam Al Qur'an terdapat 44 ayat yang
menggunakan kata sabar dan 14 ayat yang menggunakan kata kesabaran.
Penelusuran dalam Alkitab (Bible) Bahasa Indonesia menunjukkan 70 ayat yang
menunggunakan kata sabar, kesabaran, dan kata lain dengan lema sabar. Subandi
(2011) juga menyebutkan bahwa kesabaran merupakan bahwa kesabaran
merupakan bentuk pengendalian diri yang sangat penting dalam agama Budha dan
agama Hindu.
Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh
Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan klasifikasi atau
pengelompokan makna kata sabar kedalam 6 kategori atau kelompok, yaitu
giliran, kondisi, komunikasi, sifat, pekerjaan, dan urutan tindakan.
Dalam skripsi ini identifikasi makna kata sabar dilakukan dengan
menggunakan algoritma Naive Bayes, yang hasilnya kemudian dibandingkan
dengan hasil penelitian terdahulu oleh ahli untuk mendapatkan akurasi dari
algoritma Naive Bayes dalam klasifikasi makna kata sabar. Hasil akurasi yang
didapat adalah 39.72 % menggunakan data 108 artikel, 40% menggunakan data
50 artikel, dan 43.33% menggunakan data 30 artikel.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 10
ix
IDENTIFIED THE MEANING OF SABAR WORD IN INDONESIAN
ARTICLES USING NAIVE BAYES ALGORITHM
ABSTRACT
Kesabaran ‘patience’ is the value of life that hold Indonesian people.
According to Subandi (2011) kesabaran ‘patience’ is a doctrin that been held by
fifth big religions in Indonesia (Islam, Christian, Catholic, Hindu, and Budha).
Furthermore, Subandi said that in Al-Qur’an there are 44 verses use the sabar
‘patient’ word and 14 verses use kesabaran ‘patience’ word. In Bibble that been
translated into Indonesian language, there are 70 verses use patient, kesabaran
‘patience’, and another word that has same meaning with sabar ‘patient’ word.
Subbandi (2011) also said that kesabaran ‘patience’ is same with self controll that
it important in Budhism and Hinduism.
The research to indentified the meaning of sabar ‘patient’ word has been
done by Dwijatmoko, and the result is about grouping the meaning of sabar
‘patient’ word into six group, that is turn, condition, communication,
characteristic, and sequence of actions.
In this thesis, the identification of sabar ‘patient’ word is done by using
Naive Bayes Algorithm, and then compare the result of the system with the result
that according to expert to get the accuration of Naive Bayes Algorithm in
identification the meaning of sabar ‘patient’ word. The results of the system are
39.72% by 108 articles, 40% by 50 articles, and 43.44% by 30 articles.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 11
x
KATA PENGANTAR
Puji syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena berkat
kebaikan dan bimbingan-Nya, penulis dapat menyelesaikan tugas akhir yang
berjudul “IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL
BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES”,
sebagai salah satu syarat memperoleh gelar sarjana komputer program studi
Teknk Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.
Dalam proses penulisan tugas akhir ini, penulis mengucapkan terimakasih
kepada:
1. Kedua orang tua, Bapak Paulus Marjana dan Ibu Yustina Sugiyati
yang selalu mendoakan dan memberikan motivasi kepada penulis.
2. Ibu Sri Hartati Wijono, M.kom. dan Bapak Dr. Benedictus Bherman
Dwijatmoko, M.A. selaku dosen pembimbing yang telah membimbing
penulis dengan sabar sehingga penulis dapat menyelesaikan tugas
akhir ini dengan baik.
3. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T. dan Bapak Albertus
Agung Hadhiatma, M.T. selaku dosen penguji yang telah memberikan
banyak masukan dan perbaikan terhadap tugas akhir ini.
4. Seluruh staff dan dosen program studi Teknik Informatika Universitas
Sanata Dharma yang telah memberikan bimbingan serta pengalaman
selama penulis menempuh studi.
5. Teman-teman seperjuangan Teknik Informatika angkatan 2012 yang
telah berjuang bersama dari awal hingga akhir studi.
6. Semua pihak, baik langsung maupun tidak langsung yang telah
membantu dalam proses penyelesaian tugas akhir ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 12
xi
DAFTAR ISI
HALAMAN JUDUL ...................................................................................... i
HALAMAN PERSETUJUAN ....................................................................... iii
HALAMAN PENGESAHAN ........................................................................ iv
HALAMAN PERSEMBAHAN ..................................................................... v
PERNYATAAN KEASLIAN KARYA ......................................................... vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI ......................... vii
ABSTRAK ...................................................................................................... viii
KATA PENGANTAR .................................................................................... x
DAFTAR ISI .................................................................................................. xi
DAFTAR GAMBAR ..................................................................................... xiv
DAFTAR TABEL ......................................................................................... xv
DAFTAR POTONGAN PROGRAM ........................................................... xvi
BAB I PENDAHULUAN
1.1. Latar Belakang........................................................................ 1
1.2. Rumusan Masalah .................................................................. 2
1.3. Batasan Masalah ..................................................................... 2
1.4. Tujuan Penelitian .................................................................... 2
1.5. Metodologi Penelitian ............................................................. 3
1.6. Sistematika Penulisan ............................................................. 4
BAB II LANDASAN TEORI
2.1. Information Retrieval ............................................................. 5
2.2. Ideologi Kesabaran ................................................................ 5
2.1.1. Penerimaan Keadaan ................................................. 6
2.2.2. Penantian Giliran ....................................................... 6
2.2.3. Penerimaan Urutan Tindakan .................................... 8
2.2.4. Ketersediaan Menunggu dalam Pembicaraan ........... 9
2.2.5. Sifat Sabar ................................................................. 10
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 13
xii
2.2.6. Ketekunan dalam Pekerjaan ..................................... 11
2.3. Teks Prepocessing ................................................................. 12
2.3.1. Tokenizing ................................................................. 12
2.3.2. Stop Word Filtering................................................... 12
2.3.3. Stemming ................................................................... 13
2.3.3.1. Algoritma Nazief Andriani .......................... 13
2.3.4. Menghitung tf .............................................................. 17
2.4. Algoritma Naive Bayes ......................................................... 17
2.4.1. Laplace Smoothing ................................................... 18
2.5. K-fld Cross Validation .......................................................... 18
2.6. Precision ............................................................................... 19
BAB III ANALISIS DAN DESAIN
3.1. Deskripsi Sistem ................................................................. 20
3.2. Data ..................................................................................... 22
3.3. Penyimpanan Data .............................................................. 22
3.4. Struktur Data ....................................................................... 24
3.5. Diagram Kelas Model Naive Bayes..................................... 25
3.6. Diagram Kelas View ........................................................... 27
3.7. Diagram Kelas Keseluruhan ............................................... 28
3.8. Cara Pengujian dan Analisis Hasil ..................................... 29
3.8.1. Pengujian dengan K-Fold Cross Validation .......... 29
3.8.2. Akurasi ................................................................... 31
3.9. Contoh Klasifikasi dengan Algoritma Naive Bayes ........... 31
BAB IV IMPLMENTASI SISTEM
4.1. Spesifikasi Perangkat Keras dan Perangkat Lunak ............. 49
4.2. Implementasi Antar Muka ....................................................49
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 14
xiii
4.2.1. Antarmuka Frame Utama ....................................... 49
4.2.2. Antarmuka Frame Klasifikasi ................................ 50
4.2.3. Antarmuka Frame Akurasi .................................... 51
4.3. Implementasi Model Naive Bayes....................................... 53
4.3.1. Implementasi Hitung Tf .......................................... 53
4.3.2. Implementasi Hitung Prior Probability.................. 54
4.3.3. Implementasi Hitung Conditional Probability ...... 55
4.3.4. Implementasi Hitung Peluang ............................... 56
BAB V HASIL DAN PEMBAHASAN
5.1. Skema Pengujian ............................................................... 57
5.2. Analisa Hasil Pengujian ..................................................... 60
BAB VI KASIMPULAN DAN SARAN
6.1. Kesimpulan ........................................................................ 62
6.2. Saran .................................................................................. 62
DAFTAR PUSTAKA ................................................................................ 63
LAMPIRAN 1 ........................................................................................... 64
LAMPIRAN 2 ........................................................................................... 101
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 15
xiv
DAFTAR GAMBAR
Gambar 3.1.1. Skema Klasifiaksi ............................................................... 21
Gambar 3.1.2. Skema Penghitungan Akurasi ............................................. 22
Gambar 3.3. Struktur Data ......................................................................... 24
Gambar 3.5. Diagram Kelas Model Naive Bayes ...................................... 25
Gambar 3.6. Diagram Kelas View ............................................................. 27
Gambar 3.7. Diagram Kelas Keseluruhan ................................................. 28
Gambar 4.2.1. Antarmua Frame Utama .................................................... 50
Gambar 4.2.2. Antarmuka Frame Klasifikasi ........................................... 51
Gambar 4.2.3. Antarmuka Frame Akurasi ................................................ 52
Gambar 4.3.1. Flowcart Hitung Tf ............................................................ 53
Gambar 4.3.2. Flowcart Hitung Prior Probability ................................... 54
Gambar 4.3.3. Flowcart Hitung Conditional Probability ........................ 55
Gambar 4.3.4. Flowcart Hitung Peluang ................................................. 56
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 16
xv
DAFTAR TABEL
Tabel 2.1. Kombinasi Awalan Akhiran yang Tidak Diijinkan ........................ 14
Tabel 2.2. Aturan Penghapusan Awalan “me-” ............................................... 15
Tabel 2.3. Aturan Penghapusan Awalan “pe-” ................................................ 16
Tabel 2.4. Aturan Penghapusan Awalan “be-“ ................................................ 16
Tabel 2.5. Aturan Penghapusan Awalan “te-“ ................................................. 16
Tabel 5.1.1.1. Pengujian 1 ............................................................................... 57
Tabel 5.1.1.2. Hasil Pengujian 1....................................................................... 58
Tabel 5.1.2.1. Hasil Pengujian 2 ...................................................................... 58
Tabel 5.1.3.1. Hasil Pengujian 3....................................................................... 59
Tabel 5.3.1. Analisa Hasil Pengujian ............................................................... 60
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 17
1
BAB I PENDAHULUAN
1.1. Latar Belakang
Informasi merupakan hal yang penting bagi setiap orang. Seseorang
membutuhkan informasi sebagai penunjang untuk pengetahuan sampai
pengambilan keputusan. Kemajuan dunia teknologi di jaman sekarang,
berpengaruh pula dengan pertambahan informasi yang tersedia dan kecepatan
pemerolehan informasi.
Salah satu bentuk informasi adalah dalam bentuk dokumen teks. Dalam
skripsi ini akan dibahas bagaimana mengolah suatu dokumen teks dengan cara
mengidentifikasi dokumen tersebut guna memperoleh informasi termasuk ke
dalam kategori apakah dokumen tersebut.
Metode yang digunakan untuk melakukan identifikasi terhadap dokumen
teks disebut dengan metode klasifikasi. Dalam metode klasifikasi terdapat
beberapa algoritma yang dapat digunakan, dalam skripsi ini akan menggunakan
algoritma Naive Bayes, dimana dalam algoritma ini setiap kesamaan kata yang
ada pada suatu dokumen dicocokan dengan kata pada dokumen yang lain, dan
dihitung probabilitasnya, probabilitas kemiripan antar dokumen yang paling besar
menunjukan letak kategori dari dokumen tersebut.
Algoritma Naive Bayes pernah digunakan untuk klasifikasi dokumen
bahasa jawa, dengan tingkat ketepatan atau akurasi yaitu 77,5 % menggunakan
metode K-Fold Cross Validation dengan 3 fold. (Violya, 2015).
Dalam skripsi ini akan dilakukan identifikasi terhadap makna kata sabar
dalam artikel berbahasa Indonesia. Data yang digunakan adalah dokumen teks
dalam bentuk artikel berbahasa Indonesia yang diambil dari website
www.corci.org dengan jumlah 108 artikel dan telah terbagi kedalam 6 kategori,
yaitu kondisi, komunikasi, sifat, pekerjaan,giliran dan urutan tindakan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 18
2
1.2. Rumusan Masalah
Berdasarkan latar belakang diatas, maka dapat dirumuskan rumusan
masalah sebagai berikut :
1. Bagaimana membangun sistem untuk mengidentifikasi makna kata
sabar dalam artikel berbahasa Indonesia menggunakan metode Naïve
Bayes ?
2. Bagaimana akurasi metode Naïve Bayes dalam identifikasi makna
kata sabar dalam artikel berbahasa Indonesia ?
1.3. Batasan Masalah
Batasan masalah dalam pembuatan sistem ini adalah sebagai berikut :
1. Pengklasifikasian menggunakan informasi teks dengan ektensi .txt
2. Algoritma yang digunakan adalah algoritma Naïve Bayes.
3. Klasifikasi dilakukan dengan mengambil 3 kalimat dari sebuah artikel,
yaitu kalimat utama yang mengandung kata kunci sabar, dan 2
kalimat pendukung, yaitu kalimat yang ada di depan kalimat utama
dan kalimat yang berada di belakang kalimat utama.
1.4. Tujuan Penelitian
Tujuan yang ingin dicapai dari penelitian ini adalah :
1. Mengimplementasikan metode Naïve Bayes dalam mengidentifikasi
makna kata sabar dalam artikel.
2. Mengetahui akurasi metode Naïve Bayes dalam identifikasi makna
kata sabar dalam artikel.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 19
3
1.5. Metodologi Penelitian
Metodologi penelitian yang digunakan dalam penelitian ini adalah :
1. Studi Literatur
Studi literatur dilakukan dengan mencari informasi tentang
penggunaan metode Naïve Bayes dalam klasifikasi teks dari sumber-
sumber berupa buku, jurnal, maupun website.
2. Pengumpulan data
Pada tahap ini dilakukan pengumpulan data. Data di peroleh dari
situs corci.org (Corpus Of Current Indonesia) yang mana data berupa
kalimat dalam bahasa Indonesia.
3. Perancangan
Pada tahap ini dilakukan perancangan sistem.
4. Pembuatan Sistem
Setelah melakukan perancangan sistem, maka dilanjutkan dengan
pembuatan sistem.
5. Implementasi dan Pengujian
Implementasi sistem dilakukan dengan pengujian terhadap sistem,
yaitu dengan menginputkan teks ke sistem untuk selanjutnya
diklasifikasikan.
6. Evaluasi
Adalah tahap menganalisa hasil implentasi sistem dan membuat
kesimpulan terhadap penelitian yang dilakukan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 20
4
1.6. Sistematika Penulisan
Tugas akhir ini disusun dalam suatu laporan yang dibagi secara sistematis
menjadi 5 bab, adapun ringkasannya sebagai berikut:
Bab 1 Penahuluan, bab ini memuat latar belakang masalah, rumusan masalah,
batsan masalah, tujuan penalitan, metodologi penelitian dan sistematika penulisan.
Bab 2 Tinjauan Pustaka, bab ini menjelaskan berbagai teori yang di
dapatkan dari sumber pustaka maupun sumber lain yang digunakan untuk
penyusunan tugas akhir.
Bab 3 Perancangan Sistem, bab ini menjelaskan proses- proses
perancangan sistem dengan teori yang telah dipilih, berisi perancangan basis
pengetahuan, alur kerja sistem, antar muka pemakai dan perancangan penelitian.
Bab 4 Implementasi dan Analisis Sistem, bab ini memuat hasil pengujian
atau implementasi dan pembahasan atau analisis dari pengujian tersebut.
Bab 5 hasil dan Pembahasan, bab ini berisi anilasa dan hasil dari pengujian
yang dilakukan.
Bab 6 Kesimpulan dan Saran, bab ini berisi kesimpulan yang menguraikan
pernyataan singkat yang dijabarkan dari hasil analisi kegiatan atau riset
implementasi dalam pemyusunan tugas akhir. Saran – saran memuat langkah-
langkah kegiatan dalam riset atau metode pengembangan yang belum dilakukan
namun dirasa akan memperbaiki kinerja sistem jika langkah- langkah tersebut
dilaksanakan pada riset mendatang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 21
5
BAB II
LANDASAN TEORI
2.1. Information Retrieval
Adalah suatu konsep mendapatkan kembali informasi yang tersimpan,
penyimpanan, pengorganisasian dan pengaksesan informasi.
Information Retrieval System adalah kegiatan yang bertujuan untuk
menyediakan dan memasok informasi bagi pemakai sebagai jawaban atas
permintaan atau berdasarkan kebutuhan pemakai. Dapat dinyatakan bahwa sistem
temu kembali informasi memiliki fungsi dalam menyediakan kebutuhan informasi
sesuai dengan kebutuhan dan permintaan penggunanya (Sulistyo-Basuki).
2.2. Ideologi Kesabaran
Kesabaran merupakan nilai hidup yang dijunjung tinggi bangsa Indonesia.
Menurut Subandi (2011), kesabaran merupakan ajaran yang dijunjung oleh kelima
agama yang besar di Indonesia (Islam, Kristen, Katolik, Hindu, dan Budha). Lebih
lanjut disebutkan oleh Subandi bahwa dalam Al Qur'an terdapat 44 ayat yang
menggunakan kata sabar dan 14 ayat yang menggunakan kata kesabaran.
Penelusuran dalam Alkitab (Bible) Bahasa Indonesia menunjukkan 70 ayat yang
menunggunakan kata sabar, kesabaran, dan kata lain dengan lema sabar. Subandi
(2011) juga menyebutkan bahwa kesabaran merupakan bahwa kesabaran
merupakan bentuk pengendalian diri yang sangat penting dalam agama Budha dan
agama Hindu.
Penelitian untuk mengetahui arti kesabaran dalam artikel berbahasa
Indonesia pernah dilakukan oleh B.B.Dwijatmoko (2016) dalam Kongres
Internasional Masyarakat Linguistik Indonesia, menggunakan 108 artikel
berbahasa Indonesia yang mengandung kata kunci sabar, kesabaran, bersabar,
penyabar, dan menyabarkan. Dari hasil penelitian tersebut, didapat hasil bahwa
kalimat dengan lema sabar menunjukan 6 (enam) makna, yaitu
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 22
6
2.2.1. Penerimaan Keadaan
Arti penerimaan keadaan muncul atas kesadaran pelaku atau
pembicara pada keadaan lawan bicara atau orang lain yang tidak baik
atau jelek. Pelaku atau pembicara karena keadaan itu tidak dapat diubah
lagi dan harus diterima saja atau ditolak.
Data (1) dan (2) berikut menunjukkan penerimaan keadaan pelaku
atau pembicara.
(1) Pun ketika ingin membentuk sebuah kalimat, bingung aku menentukan
tense-nya. Bahasa Inggrisku tak maju-maju.” “Begini, ” kata Lintang
sabar menghadapi ketololanku. Ketika itu ia sedang memaku sandal
cunghai-nya yang menganga seperti buaya lapar.
(2) "… Kamu harus mau menuntun gua, Roy!" Dengan sabar dan telaten,
Roy menuntun sobatnya. Kadangkala kalau Toni kecapekan dan
merasa sakit pada lututnya akibat bergesekan dengan kaki palsunya,
Roy tidak bosan-bosan memompa semangatnya.
Pada data (1) Lintang menunjukkan penerimaannya pada keadaan
temannya yang bahasa Inggrisnya jelek. Lintang menerima ketololan
pembicara dengan sabar. Pada data (2) Roy menerima keadaan Toni yang
memakai kaki palsu. Roy dengan sabar memapah Toni yang kecapekan
dalam menempuh perjalanan yang panjang.
Penerimaan keadaan yang dilakukan oleh Lintang dan Roy
mempunyai latar-balakang yang sama. Pembicara dan Lintang pada data
(1) dan Tony dan Roy merupakan sahabat. Sebagai sahabat mereka
menerima keadaan sahabat mereka, dan sabar menghadapi keadaan yang
tidak mungkin diubah pada sahabat mereka.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 23
7
2.2.2. Penantian Giliran
Kesabaran juga muncul pada penantian dari tindakan orang lain.
Pelaku atau pembicara perlu sabar untuk menunggu orang lain selesai
melakukan tindakannya atau menunggu gilirannya.
Arti penantian giliran juga terlihat pada data (3) dan (4).
(3) Penumpang berebut turun. Wajah gadis itu nampak sabar
sekali menunggu luangnya jalan. Joki memberinya kesempatan
untuk lewat.
(4) Rupanya laki-laki itu sudah menggenggam satu-satunya payung
di tangannya. Ia tak sabar menunggu istrinya berpikir. ”Jangan,
Pak. Aku saja.”
Gadis pada data (3) sabar menunggu gilirannya untuk turun. Ia
lebih aman dan nyaman menunggu sampai kesempatan untuk lewat
datang. Pada data (4), laki-laki itu tidak sabar menunggu istrinya
berpikir. Ia ingin segera melakukan apa yang akan ia kerjakan.
Alasan munculnya perilaku kesabaran pada data (3) dan (4)
berbeda. Pada data (3) wanita itu sadar akan keadaan yang ramai. Ia tidak
mungkin langsung berebut turun. Pada data (4), suami itu sudah tidak
sabar menunggu istirnya berpikir. Ia langsung mengambil payung, dan
siap pergi. Dengan ketidak-sabaran itu, ia menunjukkan kekuasaannya
atas istrinya. Kekuasaan itu juga diakui oleh istrinya dengan berkata
"Jangan, Pak. Aku saja (yang pergi)."
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 24
8
2.2.3. Penerimaan Urutan Tindakan
Penerimaan urutan tindakan juga merupakan kesabaran. Pelaku
atau pembicara perlu melakukan tindakan sesuai dengan urutannya. Bila
seseorang melakukan tindakan yang tidak sesuai dengan urut-urutannya
menunjukkan ketidak-sabaran orang itu.
Data (5) dan (6) menunjukkan ketidak-sabaran para sapi dan Haji
Sudung.
(5) Kami, delapan ekor sapi, yang akan tampil pada plot kedua,
gemetar menunggu aba-aba dari Mahar untuk menerjang arena.
Kami tak sabar dan rasanya kaki sudah gatal ingin
mendemonstrasikan kehebatan mamalia menari. Kami adalah
remaja-remaja kelebihan energi dan lapar akan perhatian.
(6) Tak satu baju pun yang tertinggal di almari. Seolah-olah Haji
Sudung tak akan kembali lagi ke rumah itu. Malam itu, sambil
mendekap buntalan tasnya, Haji Sudung tak sabar untuk segera
tertidur. Ia ingin berlari memburu pagi.
Karapan atau pacuan kuda mempunyai urut-urutan sendiri. Peserta
karapan harus mengikuti urut-urutan yang ditentukan sebelum mereka
akhirnya dapat berpacu di arena. Sapi-sapi pada data (5) menunjukkan
ketidak-sabarannya untuk mengikuti urutan itu. Demikian juga Haji
Sulung. Ia harus mengemasi barang-barangnya sebelum ia tidur dan
kemudian pergi pada keesokan harinya. Ia ingin segera tidur dan pergi
keesokan harinya.
Sapi-sapi pada data (5) dan Haji Sulung pada data (6) mempunyai
persamaan sifat. Sapi-sapi dan Haji Sulung menunjukkan kekuatan fisik
yang besar. Sapi-sapi itu merupakan "remaja yang kelebihan energi," dan
Haji Sulung "ingin berlari memburu pagi." Kiranya kekuatan fisik dapat
merupakan sebab ketidak-sabaran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 25
9
2.2.4. Ketersedian Menunggu dalam Pembicaraan
Kesaabaran juga mempunyai arti kesediaan menunggu dalam
pembicaraan. Peserta pembicaraan perlu menunggu sampai orang yang
berbicara selesai berbicara sebelum ia memulai bicara. Menyela
pembicaraan merupakan perilaku tidak sabar.
Data (7) dan (8) menunjukkan arti kesabaran yang berkaitan
dengan kesediaan menunggu dalam pembicaraan.
(7) Cun An tercenung sebentar, kelihatannya menyerap omongan
penyamun ini untuk disari-sarikan, tapi setelah itu dengan tak
sabar berkata, "Sudah saya bilang jangan bertele-tele. Katakan
saja tawaranmu itu."
(8) Mamak berhenti sejenak. Kalan semakin tidak sabar. Sebatang
rokok keretek yang ia selai tak cukup mampu untuk
menghilangkan gundahnya. ”Maksud Mamak?
Cun An menunjukkan ketidak-sabarannya dengan memotong
pembicaraan penyamun itu, dan Kalan dengan memotong pembicaraan
Mamak.
Latar belakang ketidak-sabaran Cun An dan Kalan berbeda.
Kalimat Sudah saya bilang jangan bertele-tele. Katakan saja tawaran itu
menunjukkan bahwa Cun An mempunyai kekuatan yang lebih besar
daripada penyamun itu. Cun An tidak takut pada penyamun itu. Berbeda
dengan Cun An, Kalan merasa tidak nyaman untuk melakukan tindakan
yang dapat diartikan tidak sabar. Ia merasa terpaksa harus memotong
pembicaraan mamaknya, orang yang harus dihormatinya. Sebatang rokok
keretek yang ia selai tak cukup mampu untuk menghilangkan gundahnya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 26
10
2.2.5. Sifat Sabar
Sifat sabar merupakan sifat baik yang dipunyai oleh orang yang
diidamkan. Sifat itu sejajar dengan sifat-sifat baik yang lain seperti
bijaksana, baik, tabah, dan setia.
Data (9) dan (10) menunjukkan sifat sabar yang dimilik oleh
pelaku, pembiara, atau orang ketiga yang dibicarakan.
(9) Perempuan memang bukan persoalan baginya. Hanya
masalahnya sampai sekarang dia baru bisa memahami seorang
perempuan saja, mamanya, wanita yang sabar, setia, bijaksana,
dan penuh kasih sayang.
(10) ”Kata orangtua saya, sebagai istri saya mesti menghormati
suami, saya tidak boleh membantah kata suami. Hanya orang
yang baik dan sabar yang akan bisa masuk surga.”
Data (9) membicarakan mama pelaku yang mempunyai sifat sabar,
dan data (10) menunjukkan pembicara sendiri yang mempunyai sifat
sabar. Sifat sabar pada data (9) disertai dengan sifat yang baik lainnya
yaitu setia, bijaksana, dan penuh kasih sayang, dan pada data (10) sifat
itu disertai dengan sifat baik.
Pengakuan pelaku bahwa ibu pelaku itu mempunyai sifat sabar
yang belum ia jumpai pada wanita lain pada data (9) dan pengakuan
pembicara bahwa sifat sabarnya ia kembangkan karena kata orangtuanya
menunjukkan peran orang tua dalam penanaman sifat sabar. Mereka
melihat sosok orang tua sebagai orang yang dapat mereka tauladani
dalam kesabaran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 27
11
Akan tetapi perilaku sabar pada data (10) menunjukkan jalan
pemikiran yang berbeda. Kesabaran pada wanita itu merupakan
kesabaran yang dipaksakan. Seorang istri tidak boleh membantah kata
suaminya apapun yang dikatakan suaminya. Bila ia melanggar aturan itu,
ia diancam untuk tidak dapat masuk surga.
2.2.6. Ketekunan dalam Pekerjaan
Arti kesabaran yang terakhir adalah ketekunan dalam pekerjaan.
Orang yang sabar adalah orang yang dapat menghadapi situasi yang sulit
untuk dihadapi atau melakukan pekerjaannya dengan tekun. Ia tidak
mudah menyerah menghadapi keadaan yang sulit dan terus tekun untuk
mencapai tujuannya.
Data (11) dan (12) menunjukkan (ketiadaan) ketabahan dan
ketekunan itu.
(11) "Bagaimana aku bisa sabar, kalau harus membuang tenaga,
waktu, dan pikiran cuma untuk beberapa ratus Indian rupee!"
(12) Uang itu ditolak Emak. Tetapi, setelah dibujuk berulang-ulang
oleh Si Pelukis dengan sabar dan manis, akhirnya uang yang
cukup banyak itu diterima Emak.
Pembicara pada data (11) tidak sabar atau tabah menghadapi
keadaan yang sulit. Ia tidak mau membuang tenaga, waktu, dan
pikirannya karena uang yang diterimanya sangat sedikitnya. Sebaliknya,
Si Pelukis dengan gigih atau tekun terus membujuk ibu pembicara
sehingga wanita itu mau menerima uang yang ingin diberikannya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 28
12
Latar belakangnya munculnya kesabaran atau ketidak-sabaran pada
(11) dan (12) berbeda. Pembicara pada (11) tidak sabar atas perilaku
pemilik pekerjaan atau orang yang memberinya pekerjaan. Ia merasa
diperlakukan tidak sebanding antara tenaga, waktu, dan pikiran yang
dikeluarkannya dengan uang yang diterimanya. Pemilik uang, modal,
atau pekerjaan dapat memperlakukan orang yang dipekerjakannya
dengan tidak sepantasnya. Pada data (12) faktor kedudukan dan usia
Emak menuntut pelukis itu untuk bertindak gigih untuk meyakinkan
wanita itu agar mau menerima uang.
2.3. Teks Preprocessing
Merupakan tahapan awal dalam mengolah data input. Pada tahap teks
preprocessing terdapat beberapa langkah, yaitu tokenizing, stopword filtering,
stemming, dan menghitung tf (term frequency).
2.3.1. Tokenizing
Adalah proses menguraikan kalimat kedalam kata kata yang
terpisah tanpa memperhatikan keterhubungan antar kata. Selanjutnya
adalah mengubah setiap kata yang berhuruf besar menjadi huruf kecil
(lower case).
2.3.2. Stop Word Filtering
Adalah proses memeriksa kata yang seharusnya dihilangkan
untuk efisiensi proses klasifikasi karena kata tersebut tidak banyak
berpengaruh. Daftar kata yang seharusnya dihilangkan disimpan dalam
stopword list. Kata yang dapat dihilangkan misalnya adalah kata
sambung yaitu : dan, yang, untuk.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 29
13
2.3.3. Stemming
Stemming merupakan suatu proses yang terdapat dalam sistem
Information Retrieval yang mengubah kata-kata yang terdapat dalam
suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan
aturan-aturan tertentu. Sebagai contoh kata bersama, kebersamaan,
menyamai, akan distem ke root wordnya, yaitu “sama”.
Proses stemming bisa dilakukan dengan beberapa algoritma, salah
satu algoritma stemming yang digunakan dalam skripsi ini adalah
algoritma Nazief Adriani.
2.3.3.1. Agoritma Nazief Adriani (Algoritma Stemming)
Adalah algoritma untuk melakukan proses stemming pada kata
berbahasa Indonesia yang dibuat oleh Bobby Nazief dan Mirna
Adriani. Algoritma Nazief Adriani memiliki tahap-tahap sebagai
berikut :
1. Cari kata yang akan distem dikamus, jika ditemukan maka
diasumsikan bahwa kata tersebut adalah root word. Maka algoritma
berhenti.
2. Inflections Suffixes (“-lah”, ”-kah”, ”-ku”, ”-mu”, atau “-nya”)
dibuang. Jika berupa particles (“-lah”, ”-kah”, “-tah”, atau “-pun”)
maka langkah ini diulang lagi untuk menghapus Possesive Pronouns
(“-ku”, “-mu”, -“nya”), jika ada.
3. Hapus Derivation Suffixes (“-I”, “-an”, atau “-kan”). Jika kata
ditemukan dikamus, maka algoritma berhenti. Jika tidak maka ke
langkah 3a
a. Jika “-an” telah dihapus dan huruf terakhir dari kata
tersebut adalah “-k” maka “-k” juga ikt dihapus. Jika kata
terseburt ditemukan dikamus maka algoritma berhenti. Jika
tidak maka lakukan langkah 3b.
b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”)
dikembalikan lanjut kelangkah 4.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 30
14
4. Hapus Derrivation Prefix. Jika pada langkah 3 ada suffiks
yang dihapus pergi ke langkah 4a, jika tidak pergi k langkah 4b.
a. Periksa tabel kombinasi awalan-akhiran yang tidak
diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak
pergi ke langkah 4b.
b. For i=0 to 3, tentukan tipe awalan kemudian hapus
awalan. Jika root word belum juga ditemukan lakukan langkah
5, jika sudah maka algoritma berhenti. Catatan: jika awalan
kedua sama dengan awalan pertama maka algoritma berhenti.
5. Melakukan recording.
6. Jika semua langkah telah selesai tetapi tidak juga berhasil
maka kata awal diasumsikan sebagai root word. Proses selesai.
Tipe Awalan ditentukan melalui langkah-langkah berikut:
1. Jika Awalannya adalah: “di-”, “ke-“, atau “se-“ maka tipe
awalannya secara berturut-turut adalah “di-”, “ke-“, atau “se-“.
2. Jika awalannya adalah “te-“, “me-“ , “be-” atau “pe-“ maka
dibuthkan sebuah proses tambahan untuk menentukan tipe awalannya.
3. Jika dua karakter pertamanya bukan “di-“, “ke-“, “se-“, “te-
“,”be-“,”me-“, atau “pe-“ maka proses berhenti.
Berikut adalah atura untuk melakukan penghapusan awalan.
Dengan keterangan C adalah huruf konsonan, V adalah huruf hidup, A
adalah semua huruf, dan P adalah karakter tertentu, misal ‘er’.
Awalan Akhiran yng tidak diijinkan
be- -i
di- -an
ke- -i, -kan
me- -an
se- -i, -kan
Tabel 2.1 Kombinasi Awalan Akhiran Yang Tidak Diijinkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 31
15
Aturan Kontruksi Prefix yang dihapus
1 me{l|r|w|y}V… me-
2 mem{b|f|v}… mem-
3 mempe… mem-pe
4 mem{rV|V}… me-m
me-p
5 men{c|d|j|s|z}… men-{ c|d|j|s|z }…
6 mengV… meng-V… | meng-kV… |
(mengV-… ifV=’e’)
7 meng{g|h|q|k}… meng-
8 mengV… meng-
9 menyV… mensy-s
10 mempA… mem-pA… where A!=’e’
Tabel 2.2. Aturan Penghapusan Awalan, Untuk Awalan “me-“
Aturan Kontruksi Prefix yang dihapus
1 pe{w|y}V… pe-{w|y}V...
2 perV… per-V... | pe-rV...
3 perCAP per-CAP... where C!= ‘r’ and
P!= “er”
4 per CAerV… per-CAerV... where C!= ‘r’
5 pem{b|f|V}… pem-{b|f|V}...
6 pem{rV|V}… pe-m{rV|V}... |
pe-p{rV|V}...
7 pen{c|d|j|z}… pen-{c|d|j|z}...
8 penV… pe-nV... | pe-tV...
9 pengC… peng-C...
10 pengV… peng-V... | peng-kV... |
(pengV-... if V=‘e’)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 32
16
11 penyV… peny-sV...
12 pelV… pe-lV... except “pelajar”,
return “ajar”
13 peCerV… per-erV… where
C!={r|w|y|l|m|n}
14 peCP… pe-CP… where
C!={r|w|y|l|m|n} and P!=’er’
15 peC1erC2… pe-C1erC2… where C1
!={r|w|y|l|m|n}
Tabel 2.3. Aturan Penghapusan Awalan, Untuk Awalan “pe-“
Aturan Kontruksi Prefix yang dihapus
1 berV... ber-V... | be-rV...
2 berCAP... ber-CAP... where C!= ‘r’ and
P!= “er”
3 berCAerV... ber-CaerV... where C!= ‘r’
4 belajar bel-ajar
5 beC1erC2…
be-C1erC2... where C1!={
‘r’|‘l’}
Tabel 2.4. Aturan Penghapusan Awalan, Untuk Awalan “be-”
Aturan Kontruksi Prefix yang dihapus
1 terV... ter-V... | te-rV...
2 terCerV... ter-CerV... where C!= ‘r’
3 terCP...
ter-CP... where C!= ‘r’ and
P!= ‘er’
4 teC1erC2…
te-C1erC2… where C1=’r’
Tabel 2.5. Aturan Penghapusan Awalan, Untuk Awalan “te-”
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 33
17
2.3.4. Menghitung tf (term frequency)
Langkah terakhir dari peoses preprocessing adalah menghitung tf.
Tf (term frequency) adalah banyaknya kemunculan sebuah kata dalam
sebuah dokumen.
2.4. Naïve Bayes
Algoritma Naïve Bayes merupakan salah satu algoritma yang terdapat pada
teknik klasifikasi. Naïve Bayes merupakan pengklasifikasian dengan metode
probabalitias.
Probabilitas sebuah dokumen d termasuk dalam kategori atau kelas c dapat
dihitung dengan rumus sebagai berikut.
Dimana adalah conditional probability dari kata tk dalam dokumen
yang termasuk dalam kelas c. merupakan ukuran besarnya kontribusi kata
tk terhadap kelas c, sehingga kelas c merupakan kelas yang tepat. adalah
prior probability dari dokumen yang termasuk dalam kelas c.
Untuk menentukan nilai dari prior probability digunakan rumus berikut
Dimana adalah jumlah dari dokumen yang termasuk dalam kelas c dan N
adalah jumlah total dari seluruh dokumen.
Conditional probability adalah frekuensi relatif dari kata t dalam dokumen
yang berada dalam kelas c, dan dapat dihitung dengan rumus :
Dimana adalah banyaknya kata t dalam dokumen training dari kelas c.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 34
18
2.4.1. Laplace Smoothing
Pada proses penghitungan Naïve Bayes terdapat masalah apabila
ada peluang yang bernilai 0. Oleh karena itu digunakan laplace smoothing
yaitu penambahan dengan angka 1 sehingga tidak ada peluang yang akan
bernilai 0.
Penerapan laplace smoothing dalam klasifikasi Naïve Bayes adalah
sebagai berikut:
Perhitungan teknik smoothing ini dilakukan agar tidak ada nilai
peluang yang bernilai 0. B adalah banyaknya kata unik dalam keseluruhan
dokumen.
2.5. K-fold Cross Validation
k-Fold Cross Validation merupakan salah satu metode yang bisa
digunakan untuk mengukur kinerja sebuah sistem. Dalam k-fold Cross validation,
data akan dipartisi secara acak ke dalam k partisi (D1, D2, …, Dk, masing-masing
D memiliki jumlah yang kira-kira sama). Pada iterasi pertama, partisi D1
digunakan sebagai data testing, sedangkan sisa partisi digunakan sebagai data
training. Maka dari itu pada iterasi pertama, D1 digunakan sebagai data testing
dan D2, D3, …, Dk digunakan sebagai data training. Pada iterasi kedua, D2
digunakan sebagai data testing, sedangkan D1, D3, …, Dk digunakan sebagai data
training. Pada iterasi ketiga, D3 digunakan sebagai data testing, sedangkan D1,
D2, … Dk digunakan sebagai data training dan seterusnya. Setiap sample D,
hanya digunakan sekali sebagai testing dan berkali-kali sebagai training
(Han&Kamber,2006).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 35
19
2.6. Precision
Precision adalah tingkat ketepatan atau akurasi dari hasil proses
klasisifikasi. Rumus menghitung precision adalah sebagai berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 36
20
BAB III
ANALISIS DAN DESAIN
3.1. Deskripsi Sistem
Sistem yang dibangun berupa sistem pemerolehan informasi, yang
mempunyai fungsi untuk melakukan identifikasi makna kata sabar pada artikel
berbahasa Indonesia. Proses identifikasi yang dilakukan oleh sistem menggunakan
salah satu algoritma klasifikasi yaitu algoritma Naïve Bayes.
Data yang digunakan dalam proses ini berupa file dalam format .txt,
dimana data tersebut terbagi menjadi 2 yaitu untuk data training dan data testing.
Setiap file training dimasukan dalam folder dengan nama sesuai dengan
kategori atau kelasnya, sedangkan data testing dimasukan dalam sebuah folder
bernama testing. Sistem kemudian akan mengambil file-file tersebut dan
memprosesnya.
Secara garis besar, sistem dibagi menjadi 2 fungsi. Fungsi yang pertama
adalah untuk melakukan identifikasi makna kata dalam suatu artikel, keluaran dari
proses identifikasi ini adalah kata tersebut dikategorikan atau masuk ke kelas yang
mana berdasar kategori yang telah ditentukan. Dalam proses ini terdapat beberapa
tahapan, yaitu tahap pemotongan kalimat yang mengandung kata atau keyword
yang ingin dicari maknanya, selanjutnya adalah tahap preprocessing yang
bertujuan untuk membuat model dari data yang diinputkan, dalam tahap
preprocessing ini data diproses sebagai berikut : tokenisasi (pemenggalan kata
dan penghapusan tanda baca), case folding (mengubah kata kedalam huruf kecil),
stopword (penghapusan kata kata yang tidak penting), stemming (pengembalian
kata ke bentuk dasar), dan menghitung tf (jumlah kemunculan kata yang sama
dalam sebuah dokumen). Proses preprocessing ini digunakan untuk mengolah
input data training dan data testing. Setelah tahap preprocessing, selanjutnya
adalah tahap pengklasifikasian menggunakan algoritma Naïve Bayes. Berikut
adalah skema proses klasifikasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 37
21
Gambar 3.1.1 Skema Klasifikasi
Fungsi yang kedua adalah penghitungan akurasi. Dalam proses
penghitungan akurasi ini, sistem menggunakan metode k-fold cross validation,
dimana data training dibagi menjadi beberapa fold, yang kemudian dilakukan
proses klasifikasi pada satu fold terhadap fold yang lain sampai semua fold
terklasifikasi, dan hasil klasifikasi tersebut di cocokan apakah klasifikasinya
benar atau salah, setelah itu dihitung persentase kebenaran dari proses klasifikasi
yang telah dilakukan. Berikut adalah skema proses penghitungan akurasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 38
22
Gambar 3.1.2. Skema Penghitungan Akurasi
3.2. Data
Data yang digunakan adalah dalam bentuk artikel berbahasa Indonesia
yang diambil dari website corci.org dengan jumlah data 108 artikel, untuk setiap
artikel dibagi menjadi kalimat-kalimat. Setiap kalimat digolongkan menjadi 6
kategori yaitu sifat, kondisi, urutan tindakan, giliran, pekerjaan, dan komunikasi.
Keyword yang digunakan dalam kalimat tersebut adalah kata “sabar”.
3.3. Penyimpanan Data
Media penyimpanan data yang digunakan oleh sistem adalah berbentuk
format .txt untuk data testing, data training, data stopword, dan data kata dasar.
Untuk data yang akan dilakukan pemrosesan, disimpan dalam bentuk ArrayList,
yaitu kata-kata yang terbentuk setelah melalui proses prepocessing.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 39
23
3.3.1. Daftar media penyimpanan dalam .txt :
3.3.1.1 StopwordList.txt : adalah file yang berisi mengenai
daftar stopword atau kata yang
dianggap tidak penting.
3.3.1.2 Kata Dasar.txt : adalah file yang berisi tentang
daftar kata dasar dalam bahasa
Indonesia.
3.3.2. Daftar media penyimpanan dalam array :
3.3.2.1. ArrayList<>Training : adalah ArrayList yang menyimpan
dokumen- dokumen training setelah
dilakukan prepocessing.
3.3.2.2. ArrayList<>Testing : adalah ArrayList yang menyimpan
dokumen testing setelah dilakukan
prepocessing.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 40
24
3.4. Struktur Data
Struktur data dalam sistem ini menggunakan ArrayList sebagai media
penyimpanan data sementara untuk data yang akan dilakukan pemrosesan.
Strukturnya sebagai berikut, ArrayList objek Kategori menyimpan ArrayList
objek Kalimat dan ArrayList objek Kalimat menyimpan ArrayList objek Word.
Gambar 3.4. Struktur Data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 41
25
3.5. Diagram Kelas Model Naive Bayes
Gambar 3.5. Diagram Kelas Model Naive Bayes
Model Naive Bayes dalam sistem terdiri dari 8 kelas yaitu Word.java,
Kalimat.java, Kategori.java, StopWord.java, Stemming.java, NaiveBayes.java,
Fold.java, Akurasi.java, dengan rincian sebagai berikut :
1. Kelas Kategori.java memiliki method untuk pemotongan
kalimat yang mengandung kata yang akan di identifikasi
menggunakan rumus (n-1)+n+(n+1) dan menyimpan hasilnya
ke dalam ArrayList objek Kalimat.java.
2. Kalimat.java terdapat method untuk melakukan preprocessing
dan penghitungan tf, kemudian hasilnya disimpan di ArrayList
Objek Word.java.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 42
26
3. Word.java berisi kata- kata dalam dokumen beserta dengan
nilai tf setiap kata dan nilai conditional probability untuk tiap
kategori.
4. Stemming.java menyimpan data kata dasar serta terdapat
method untuk melakukan stemming
5. StopWord.java menyimpan data kata yang dianggap tidak
penting serta terdapat method untuk menghilangkan kata yang
dianggap tidak penting tersebut dari data yang diinputkan.
6. NaiveBayes.java memiliki method
hitungConditionalProbability() untuk menghitung nilai
condional probability, method hitungPriorProbability() untuk
menghitung nilai prior probability, setB() untuk menghitung
jumlah kata unik dari semua dokumen, dan method
startClasiffcation() untuk memulai proses klasifikasi dengan
rumus naive bayes.
7. Akurasi.java memiliki method readFold() untuk membaca data
dan membagi data kedalam partisi-partisi atau fold, method
klasifikasi() untuk melakukan proses klasifikasi terhadap data
di setiap fold, method setAkurasiPerFold() untuk menghitung
akurasi dari klasifikasi di tiap fold, dan method
setTotalAkurasi() untuk menghitung rata- rata akurasi dari
semua fold.
Kelas Stemming.java dan StopWord.java digunakan dikelas Kalimat.java
untuk melakukan prosess stemming dan penghapusan stop word. Kelas
NaïveBayes.java memiliki data kategori dalam bentuk ArrayList, dimana data
kategori menyimpan ArrayList Kalimat, dan ArrayList Kalimat menyimpan
ArrayList Word. Data tersebut yang akan digunakan di kelas NaïveBayes.java
untuk melakukan klasifikasi. Kelas Akurasi menyimpan data fold dalam
Hashtable, dimana fold menyimpan data ArrayList Objek Kategori, yang akan
digunakan untuk proses penghitungan akurasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 43
27
3.6. Diagram Kelas View
Gambar 3.6 Diagram Kelas View
Mode view sistem terdiri dari 3 kelas yaitu interfaceHome.java,
interfaceKlasifikasi,java dan interfaceAkurasi.java dengan rincian sebagai berikut:
1. interfaceHome adalah halaman utama yang muncul pertama kali ketika
program dimulai. interfaceHome.java memiliki menu item klasifikasi
untuk membuka frame interfaceKlasifikasi sekaligus mendispose atau
menutup frame interfaceHome, dan menu item akurasi untuk
membuka frame akurasi sekaligus mendispose atau menutup frame
interfaceHome.
2. InterfaceKlasifikasi memiliki menu item Home untuk kembali ke
halaman utama sekaligus menutup halaman klasifikasi, dan menu item
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 44
28
akurasi untuk membuka halaman akurasi sekaligus menutup halaman
klasifikasi. 2 tombol browse untuk mengambil direktori tempat data
training dan testing disimpan, tombol lihatData untuk menampilkan
data training dan data testing di text area training dan testing, tombol
klasifikasi untuk melakukan proses klasifikasi dan menampilkan
hasilnya di text area hasil klasifikasi.
3. InterfaceAkurasi.java memiliki menu item klasifikasi untuk membuka
halaman klasifikasi sekaligus menutup halaman akurasi, dan menu
item home untuk kembali ke halaman utama. Tombol browse untuk
mengambil direktori data training. Tombol setDataPerFold untuk input
jumlah fold. Tombol akurasi untuk melakukan proses penghitungan
akurasi.
3.7. Diagram Kelas Keseluruhan
Gambar 3.7. Diagram kelas keseluruhan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 45
29
3.8. Cara Pengujian dan Analisis Hasil
Pengujian terhadap hasil klasifikasi yang dilakukan oleh sistem bertujuan
untuk mengetahui keakuratan dari pengklasifikasian berdasar pada data training
yang ditentukan.
Pengujian dilakukan dengan membandingkan hasil klasifikasi secara
manual dengan hasil klasifikasi yang dilakukan dengan perhitungan dengan
algoritma Naïve Bayes yang dilakukan oleh sistem.
Cara pengujian dilakukan dengan menggunakan k-fold cross validation,
dengan 2 pengujian yaitu 3 fold dan 5 fold.
3.8.1. Pengujian dengan k-Fold Cross Validation
3.8.1.1. Pengujian dengan 3 Fold
Tahap 1
i. Fold 1 digunakan sebagai data testing
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data training
Tahap 2
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data testing
iii. Fold 3 digunakan sebagai data training
Tahap 3
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data testing
3.8.1.2. Pengujian dengan 5 Fold
Tahap 1
i. Fold 1 digunakan sebagai data testing
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data training
iv. Fold 4 digunakan sebagai data training
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 46
30
v. Fold 5 digunakan sebagai data training
Tahap 2
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data testing
iii. Fold 3 digunakan sebagai data training
iv. Fold 4 digunakan sebagai data training
v. Fold 5 digunakan sebagai data training
Tahap 3
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data testing
iv. Fold 4 digunakan sebagai data training
v. Fold 5 digunakan sebagai data training
Tahap 4
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data training
iv. Fold 4 digunakan sebagai data testing
v. Fold 5 digunakan sebagai data training
Tahap 5
i. Fold 1 digunakan sebagai data training
ii. Fold 2 digunakan sebagai data training
iii. Fold 3 digunakan sebagai data training
iv. Fold 4 digunakan sebagai data training
v. Fold 5 digunakan sebagai data testing
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 47
31
3.8.2. Akurasi
Akurasi dihitung dengan rumus sebagai berikut :
3.9. Contoh Klasifikasi atau Identifiaksi Kata Sabar dengan Naive Bayes
Berikut ini adalah contoh melakukan klasifikasi kata “sabar” dalam
sebuah artikel, dimana kata sabar akan diklasifikasikan ke dalam 2 kategori yaitu
sabar sebagai suatu sifat dan sabar sebagai suatu kondisi. Dalam contoh ini
terdapat 4 data training dan 1 data data testing yang akan diuji. Data training yang
digunakan adalah 2 artikel dengan kata “sabar” sebagai kondisi dan 2 artikel
dengan kata “sabar” sebagai sifat. Sedangkan data testing yang duiji adalah
artikel dengan kata “sabar” yang merupan kondisi. Hasil akhir dari contoh
klasifikasi ini adalah menentukan apakah data testing yang diuji dengan algoritma
naïve bayes masuk kedalam kategori sifat atau kondisi. Jika data testing masuk ke
dalam kategori kondisi, maka perhitungan algoritma naïve bayes untuk 4 data
training dan 1 data testing ini benar.
3.9.1. Data Training dan Data Testing
3.7.1.1. Data Training :
3.7.1.1.1. Dokumen 1 (Sabar : Kondisi)
Ya, seperti kita juga, orang dewasa, katamu. Kalau begitu, harusnya
dibawa ke dokter, lalu diberi obat, kataku. Sudah terlalu lama ia menjerit-
jerit begitu. Kau membuang napas keras-keras, tak sabar, Bisa saja bayi itu
sudah dibawa ke dokter, sudah diberi obat. Tapi bayi itu terlalu manja.
3.7.1.1.2 Dokumen 2 (Sabar : Kondisi)
Kita tidak akan lalai dari luka kita, Anakku. Namun kita mesti bersabar
sampai bunyi lonceng membungkam suara-suara adzan. Apakah engkau
tahu apa latar belakangnya?
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 48
32
3.7.1.1.3 Dokumen 3 (Sabar : Sifat)
Ia terus membisikkan di telinganya, masih ada kota-kota menyejukkan. Ia
menganjurkan agar ibunya selalu tenang, sabar, dan tabah. Garcia memang
sosok yang keras kepala. Pemandangan yang menyedihkan yang menimpa
istrinya itu tidak membuatnya terharu.
3.7.1.1.4 Dokumen 4 (Sabar : Sifat)
Roy tahu bahwa di lubuk hati mamanya hanya terukir satu nama saja,
Romi, papanya. Ada satu kekayaan yang tidak ternilai yang dimiliki
mamanya atau wanita umumnya, di mana lelaki tidak memilikinya. Yaitu,
kesabaran, ketabahan, dan kesetiaan. Oleh sebab itu mengapa Tuhan
berfirman, Surga itu ada di telapak kaki ibu, bukan di telapak kaki bapak.
Kebahagiaan itu harus diperjuangkan, bukan dengan cara mengemis minta
betas kasihan, rendah diri, dan pasrah nasib!
3.7.1.2 Data Testing :
3.7.1.2.1 Dokumen Testing
Ia hanya tertawa riang dan menghantam drum itu sejadi-jadinya. Mahar
tetap sabar menghadapi Harun dan berusaha menuntunnya pelan-pelan,
namun akhirnya kesabaran Mahar habis ketika kami membawakan lagu
Light My Fire milik The Doors. Di sepanjang lagu yang inspiratif itu Harun
menghajar hithat, tenor drum, simba, serta menginjak-injak pedal bass
drum sejadi-jadinya.
3.9.2. Pemotongan Kalimat
3.9.2.1. Pemotongan Kalimat Dokumen Training 1 (Kondisi)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 49
33
Kalimat Awal 3 Kalimat
Ya, Sudah
seperti terlalu
kita lama
juga, ia
orang
menjerit-
jerit
dewasa, begitu.
katamu. Kau
Kalau membuang
begitu, napas
harusnya keras-keras,
dibawa tak
ke sabar,
dokter, Bisa
lalu saja
diberi bayi
obat, itu
kataku. sudah
Sudah dibawa
terlalu ke
lama dokter,
ia sudah
menjerit-jerit diberi
begitu. obat.
Kau Tapi
membuang bayi
napas itu
keras-keras, terlalu
tak manja.
sabar,
Bisa
saja
bayi
itu
sudah
dibawa
ke
dokter,
sudah
diberi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 50
34
obat.
Tapi
bayi
itu
terlalu
manja.
3.9.2.2. Pemotongan Dokumen Training 2 (Kondisi)
Kalimat Awal 3 Kalimat
Kita Kita
tidak tidak
akan akan
lalai lalai
dari dari
luka luka
kita, kita,
Anakku. Anakku.
Namun Namun
kita kita
mesti mesti
bersabar bersabar
sampai sampai
bunyi bunyi
lonceng lonceng
membungkam membungkam
suara-suara suara-suara
adzan. adzan.
Apakah Apakah
engkau engkau
tahu tahu
apa apa
latar latar
belakangnya? belakangnya?
3.9.2.3. Pemotongan Dokumen Training 3 (Sifat)
Kalimat Awal 3 Kalimat
Ia Ia
terus terus
membisikkan membisikkan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 51
35
di di
telinganya, telinganya,
masih masih
ada ada
kota-kota kota-kota
menyejukkan. menyejukkan.
Ia Ia
menganjurkan menganjurkan
agar agar
ibunya ibunya
selalu selalu
tenang, tenang,
sabar, sabar,
dan dan
tabah. tabah.
Garcia Garcia
memang memang
sosok sosok
yang yang
keras keras
kepala. kepala.
Pemandangan
yang
menyedihkan
yang
menimpa
istrinya
itu
tidak
membuatnya
terharu.
3.9.2.4. Pemotongan Dokumen Training 4 (Sifat)
Kalimat Awal 3 Kalimat
Roy Ada
tahu satu
bahwa kekayaan
di yang
lubuk tidak
hati ternilai
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 52
36
mamanya yang
hanya dimiliki
terukir mamanya
satu atau
nama wanita
saja, umumnya,
Romi, di
papanya. mana
Ada lelaki
satu tidak
kekayaan memilikinya.
yang Yaitu,
tidak kesabaran,
ternilai ketabahan,
yang dan
dimiliki kesetiaan.
mamanya Oleh
atau sebab
wanita itu
umumnya, mengapa
di Tuhan
mana berfirman,
lelaki Surga
tidak itu
memilikinya. ada
Yaitu, di
kesabaran, telapak
ketabahan, kaki
dan ibu,
kesetiaan. bukan
Oleh di
sebab telapak
itu kaki
mengapa bapak.
Tuhan
berfirman,
Surga
itu
ada
di
telapak
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 53
37
kaki
ibu,
bukan
di
telapak
kaki
bapak.
Kebahagiaan
itu
harus
diperjuangkan,
bukan
dengan
cara
mengemis
minta
betas
kasihan,
rendah
diri,
dan
pasrah
nasib!
3.9.2.5. Pemotongan Dokumen Testing
Kalimat
Awal 3 Kalimat
Ia Ia
hanya hanya
tertawa tertawa
riang riang
dan dan
menghantam menghantam
drum drum
itu itu
sejadi-
jadinya.
sejadi-
jadinya.
Mahar Mahar
tetap tetap
sabar sabar
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 54
38
menghadapi menghadapi
Harun Harun
dan dan
berusaha berusaha
menuntunnya menuntunnya
pelan-pelan, pelan-pelan,
namun namun
akhirnya akhirnya
kesabaran kesabaran
Mahar Mahar
habis habis
ketika ketika
kami kami
membawakan membawakan
lagu lagu
Light Light
My My
Fire Fire
milik milik
The The
Doors. Doors.
Di Di
sepanjang sepanjang
lagu lagu
yang yang
inspiratif inspiratif
itu itu
Harun Harun
menghajar menghajar
hithat, hithat,
tenor tenor
drum, drum,
simba, simba,
serta serta
menginjak-
injak
menginjak-
injak
pedal pedal
bass bass
drum drum
sejadi-
jadinya.
sejadi-
jadinya.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 55
39
3.9.3. Prepocessing
Dalam tahap ini dilakukan penghilangan proses case folding, stop
word, stemming, dan menghitung tf (frekuensi kemunculan kata pada dokumen ).
3.7.3.1 Prepocesing Dokumen Training 1 (Kondisi)
3 Kalimat
Lower
Case Stemming
Hapus
Stopword tf
Sudah sudah sudah jerit 1
Terlalu terlalu terlalu buang 1
Lama lama lama napas 1
Ia ia ia keras 1
menjerit-
jerit
menjerit-
jerit jerit sabar 1
begitu. begitu begitu bayi 2
Kau Kau kau bawa 1
membuang membuang buang dokter 1
napas napas napas obat 1
keras-keras, keras-keras keras manja 1
tak tak tak
sabar, sabar sabar TOTAL TF 11
Bisa bisa bisa
saja saja saja
bayi bayi bayi
itu itu itu
sudah sudah sudah
dibawa dibawa bawa
Ke ke ke
dokter, dokter dokter
sudah sudah sudah
diberi diberi beri
obat. obat obat
Tapi tapi tapi
bayi bayi bayi
Itu itu itu
terlalu terlalu terlalu
manja. manja manja
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 56
40
3.7.3.2 Prepocesing Dokumen Training 2 (Kondisi)
3 Kalimat Lower Case Stemming
Hapus
Stopword tf
Kita kita kita lalai 1
Tidak tidak tidak luka 1
Akan akan akan anak 1
Lalai lalai lalai mesti 1
Dari dari dari sabar 1
Luka luka luka bunyi 1
kita, kita kita lonceng 1
Anakku. anakku anak bungkam 1
Namun namun namun suara 1
Kita kita kita adzan 1
mesti mesti mesti latar 1
bersabar bersabar sabar
sampai sampai sampai TOTAL TF 11
bunyi bunyi bunyi
lonceng lonceng lonceng
membungkam membungkam bungkam
suara-suara suara-suara suara
adzan. adzan adzan
Apakah Apakah apa
engkau engkau engkau
Tahu tahu tahu
Apa apa apa
latar latar latar
belakangnya? belakangnya belakang
3.7.3.3 Prepocesing Dokumen Training 3 (Sifat)
3 Kalimat Lower Case Stemming
Hapus
Stopword tf
Ia ia ia bisik 1
terus terus terus telinga 1
membisikkan membisikkan bisik kota 1
di di di sejuk 1
telinganya, telinganya telinga anjur 1
masih masih masih tenang 1
ada ada ada sabar 1
kota-kota kota-kota kota tabah 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 57
41
menyejukkan. menyejukkan sejuk garcia 1
Ia ia ia sosok 1
menganjurkan menganjurkan anjur keras 1
agar agar agar kepala 1
ibunya ibunya ibu
selalu selalu selalu TOTAL TF 12
tenang, tenang tenang
sabar, sabar sabar
dan dan dan
tabah. tabah tabah
Garcia garcia garcia
memang memang memang
sosok sosok sosok
yang yang yang
keras keras keras
kepala. kepala kepala
3.7.3.4 Prepocessing Dokumen Training 4 (Sifat)
3 Kalimat
Lower
Case Stemming
Hapus
Stopword tf
Ada ada ada kaya 1
satu satu satu nilai 1
kekayaan kekayaan kaya milik 2
yang yang yang mama 1
tidak tidak tidak wanita 1
ternilai ternilai nilai lelaki 1
yang yang yang sabar 1
dimiliki dimiliki milik tabah 1
mamanya mamanya mama setia 1
atau atau atau tuhan 1
wanita wanita wanita firman 1
umumnya, umumnya umum surga 1
di di di telapak 2
mana mana mana kaki 2
lelaki lelaki lelaki
tidak tidak tidak TOTAL
TF 17
memilikinya. memilikinya milik
Yaitu, yaitu yaitu
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 58
42
kesabaran, kesabaran sabar
ketabahan, ketabahan tabah
dan dan dan
kesetiaan. kesetiaan setia
Oleh oleh oleh
sebab sebab sebab
itu itu itu
mengapa mengapa mengapa
Tuhan tuhan tuhan
berfirman, berfirman firman
Surga surga surga
itu itu itu
ada ada ada
di di di
telapak telapak telapak
kaki kaki kaki
ibu, ibu ibu
bukan bukan bukan
di di di
telapak telapak telapak
kaki kaki kaki
bapak. bapak bapak
3.7.3.5 Prepocessing Dokumen Testing
3 Kalimat Lower Case Stemming
Hapus
Stopword tf
Ia ia ia tawa 1
hanya hanya hanya riang 1
tertawa tertawa tawa hantam 1
riang riang riang drum 3
dan dan dan mahar 2
menghantam menghantam hantam sabar 2
drum drum drum hadap 1
itu itu itu harun 2
sejadi-
jadinya. sejadi-jadinya jadi usaha 1
Mahar mahar mahar tuntun 1
tetap tetap tetap pelan 1
sabar sabar sabar habis 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 59
43
menghadapi menghadapi hadap bawa 1
Harun harun harun lagu 2
dan dan dan light 1
berusaha berusaha usaha my 1
menuntunnya menuntunnya tuntun fire 1
pelan-pelan, pelan-pelan pelan milik 1
namun namun namun the 1
akhirnya akhirnya akhir doors 1
kesabaran kesabaran sabar inspiratif 1
Mahar mahar mahar hajar 1
habis habis habis hithat 1
ketika ketika ketika tenor 1
kami kami kami simba 1
membawakan membawakan bawa injak 1
lagu lagu lagu pedal 1
Light light light bass 1
My my my
Fire fire fire
milik milik milik
The the the
Doors. doors doors
Di di di
sepanjang sepanjang panjang
lagu lagu lagu
yang yang yang
inspiratif inspiratif inspiratif
itu itu itu
Harun harun harun
menghajar menghajar hajar
hithat, hithat hithat
tenor tenor tenor
drum, drum drum
simba, simba simba
serta serta serta
menginjak-
injak
menginjak-
injak injak
pedal pedal pedal
bass bass bass
drum drum drum
sejadi-
jadinya. sejadi-jadinya jadi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 60
44
3.9.4. Penghitungan Total tf Tiap Kata di Tiap Kelas yang sama dengan
Kata Kata di Dokumen Testing
Kata
Kondisi
1
kondisi
2 sifat 1 sifat 2
Total Tf
Kondisi
Total Tf
Sifat
tawa 0 0 0 0 0 0
riang 0 0 0 0 0 0
hantam 0 0 0 0 0 0
drum 0 0 0 0 0 0
mahar 0 0 0 0 0 0
sabar 1 1 1 1 2 2
hadap 0 0 0 0 0 0
harun 0 0 0 0 0 0
usaha 0 0 0 0 0 0
tuntun 0 0 0 0 0 0
pelan 0 0 0 0 0 0
habis 0 0 0 0 0 0
bawa 1 0 0 0 1 0
lagu 0 0 0 0 0 0
light 0 0 0 0 0 0
my 0 0 0 0 0 0
fire 0 0 0 0 0 0
milik 0 0 0 2 0 2
the 0 0 0 0 0 0
doors 0 0 0 0 0 0
inspiratif 0 0 0 0 0 0
hajar 0 0 0 0 0 0
hithat 0 0 0 0 0 0
tenor 0 0 0 0 0 0
simba 0 0 0 0 0 0
injak 0 0 0 0 0 0
pedal 0 0 0 0 0 0
bass 0 0 0 0 0 0
3.9.5. Menghitung Jumlah Kata Unik
kata Awal Sorting Kata Jumlah kata
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 61
45
(Semua) Unik unik
jerit adzan 42
buang anak
napas anjur
keras bawa
sabar bayi
bayi bisik
bawa buang
dokter bungkam
obat bunyi
manja dokter
lalai firman
luka garcia
anak jerit
mesti kaki
sabar kaya
bunyi kepala
lonceng keras
bungkam kota
suara lalai
adzan latar
latar lelaki
bisik lonceng
telinga luka
kota mama
sejuk manja
anjur mesti
tenang milik
sabar napas
tabah nilai
garcia obat
sosok sabar
keras sejuk
kepala setia
kaya sosok
nilai suara
milik surga
mama tabah
wanita telapak
lelaki telinga
sabar tenang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 62
46
tabah tuhan
setia wanita
tuhan
firman
surga
telapak
kaki
3.9.6. Menghitung Conditional Probability dengan Menggunakan
Laplace Smoothing.
Kata
Conditional
Probobability
Kondisi
Conditional
Probobability
Sifat
tawa 0,015625 0,014084507
riang 0,015625 0,014084507
hantam 0,015625 0,014084507
drum 0,015625 0,014084507
mahar 0,015625 0,014084507
sabar 0,046875 0,042253521
hadap 0,015625 0,014084507
harun 0,015625 0,014084507
usaha 0,015625 0,014084507
tuntun 0,015625 0,014084507
pelan 0,015625 0,014084507
habis 0,015625 0,014084507
bawa 0,03125 0,014084507
lagu 0,015625 0,014084507
light 0,015625 0,014084507
my 0,015625 0,014084507
fire 0,015625 0,014084507
milik 0,015625 0,042253521
the 0,015625 0,014084507
doors 0,015625 0,014084507
inspiratif 0,015625 0,014084507
hajar 0,015625 0,014084507
hithat 0,015625 0,014084507
tenor 0,015625 0,014084507
simba 0,015625 0,014084507
injak 0,015625 0,014084507
pedal 0,015625 0,014084507
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 63
47
bass 0,015625 0,014084507
3.9.7. Menghitung Peluang atau kemungkinan untuk setiap kelas dengan
mengkalikan prior probability dengan hasil perkalian conditional
probability tiap kelas.
- Prior Probability Kondisi = jumlah dokumen kategori
kondisi / jumlah semua
dokumen training
= 2/4
= 0,5
- Prior Probability Sifat = jumlah dokumen kategori sifat /
jumlah semua dokumen training
= 2/4
= 0,5
- Hasil Kali Conditional Probability Kondisi
= 0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^3 *
0,015625^2 * 0,046875^2 * 0,015625^1 * 0,015625^2 *
0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 *
0,03125^1 * 0,015625^2 * 0,015625^1 * 0,015625^1 *
0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 *
0,015625^1 * 0,015625 ^1* 0,015625^1 * 0,015625^1 *
0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 =
7,00089218759378E-61
- Hasil Kali Conditional Probability Sifat
= 0,014084507^1 * 0,014084507^1 * 0,014084507^1 *
0,014084507^3 * 0,014084507^2 * 0,042253521^2 *
0,014084507^1 * 0,014084507^2 * 0,014084507^1 *
0,014084507^1 * 0,014084507^1 * 0,014084507^1 *
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 64
48
0,014084507^1 * 0,014084507^2 * 0,014084507^1 *
0,014084507^1 * 0,014084507^1 * 0,042253521^1 *
0,014084507^1 * 0,014084507^1 * 0,014084507^1 *
0,014084507^1 * 0,014084507^1 * 0,014084507^1 *
0,014084507^1 * 0,014084507^1 * 0,014084507^1 *
0,014084507^1 = 3,08020702991216E-62
- Menghiung Peluang untuk Tiap Kelas
P(Kondisi) = Prior Probability Kondisi * Hasil Kali
Conditional Probability Kondisi
= 0,5 * 7,00089218759378E-61
= 3,50044609379689E-61
P(Sifat) = Prior Probability Sifat * Hasil Kali Conditional
Probability Sifat
= 0,5 * 3,08020702991216E-62
= 1,54010351495608E-62
- Memilih Peluang yang Terbesar.
P(Kondisi) P(Sifat) Max ?
3,50044609379689E-
61
1,54010351495608E-
62
3,50044609379689E-
61
Dari proses perhitungan di atas, dapat dilihat peluang yang paling besar adalah
kondisi, yang berarti bahwa dokumen testing memiliki peluang lebih besar masuk
ke kategori kondisi dari pada kategori sifat.
Dengan demikian dokumen testing diklasifikasikan masuk ke kelas kategori.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 65
49
BAB IV
IMPLEMENTASI SISTEM
4.1. Spesifikasi Perangkat Keras dan Perangkat Lunak
Perangkat keras yang digunakan untuk membangun sistem adalah sebagai
berikut :
Processor : Intel core i5
Memory : 4 GB
Hardisk : 500 GB
Perangkat lunak yang digunakan untuk membangun sistem adalah sebagai
berikut :
Sistem Operasi : Windows 7 Ultimate
Aplikasi : Netbeans IDE 7.2
Bahasa Pemrograman : Java (jdk1.7.0_13)
4.2. Implementasi Antar Muka
Implementasi antar muka dibuat dengan tujuan untuk mempermudah
menggunakan sistem.
4.2.1. Antarmuka Frame Utama
Frame utama adalah frame yang pertama kali muncul ketika
aplikasi dijalankan. Frame utama memiliki menu File yang berisi submenu
Klasifikasi untuk masuk ke form klasifisikasi dan submenu Akurasi untuk
masuk ke form akurasi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 66
50
Gambar 4.1. Antar Muka Frame Utama
4.2.2. Antarmuka Frame Klasifikasi
Frame Klasifikasi adalah frame yang sebagai tempat untuk
menginputkan data training dan data testing dengan memasukan direktori
dimana folder tempat penyimpanan data tersebut berada. Tombol lihat data
adalah untuk membaca data training dan data testing, sekaligus melakukan
proses preprocessing. Tombol klasifikasi adalah tombol untuk melakukan
proses klasifikasi dengan algoritma Naïve Bayes, yang kemudian hasil
klsaifikasi di tampilkan pada teks area.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 67
51
Gambar 4.2. Antar Muka Frame Klasifikasi
4.2.3. Antarmuka Frame Akurasi
Frame akurasi adalah frame untuk menginputkan data training
yang akan dihitung akurasinya menggunakan k-fold cross validation. Data
training diinput melalui direktori tempat data tersebut disimpan. Tombol
lihat data berfungsi untuk menampilkan data training serta jumlah data
dari setiap kategorinya. Teks field Jumlah Fold adalah untuk menginputkan
jumlah fold yang akan digunakan dalam penghitungan akurasi. Tombol set
Data/Fold adalah untuk menampilkan teks field yang secara dinamis
terbentuk sesuai dengan jumlah fold yang diinputkan, teks field ini
berfungsi untuk menginputkan jumlah data tiap fold. Tombol cek hasil
berfungsi untuk menjalankan proses penghitungan akurasi, yang akan
ditampilkan hasilnya pada teks area.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 68
52
Gambar 4.3. Antar Muka Frame Akurasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 69
53
4.3. Implementasi Model Naive Bayes
4.3.1. Implementasi Hitung Tf
Gambar 4.3.1. Flowcart hitung tf
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 70
54
4.3.2. Implementasi Hitung Prior Probability
Gambar 4.3.2. Flowcart hitung prior probability
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 71
55
4.3.3. Implementasi Hitung Conditional Probability
Gambar 4.3.3. Flowcart hitung conditional probability
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 72
56
4.3.4. Implementasi Hitung Peluang (Naive Bayes)
Gambar 4.3.4. Flowcart hitung peluang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 73
57
BAB V
HASIL DAN PEMBAHASAN
5.1. Skema Pengujian
Pengujian dilakukan dengan menggunakan metode k-fold cross validation.
Dimana data training akan dibagi ke dalam sejumlah k fold. Setiap fold akan diisi
dengan data training tiap kategori secara merata.
Setiap fold akan diperlakukan sebagai data testing dan data training secara
bergantian sesuai dengan dengan tahapan penghitungan akurasi, dimana
banyaknya tahapan penghitungan akurasi sama dengan jumlah fold. Setelah semua
tahapan proses penghitungan akurasi dilakukan, maka seluruh data training yang
diuji akan terklasifikasi, kemudian dihitung persentase data yang terklasifikasi
dengan tepat (sesuai dengan kategori awal).
Dalam pengujian ini akan dilakukan pengujian terhadap 108 artikel
berbahasa Indonesia yang terbagi ke dalam 6 kelas, yaitu kondisi, komunikasi,
sifat, pekerjaan, urutan tindakan dan giliran.
Pengujian dilakukan sebanyak 3 kali sebagai berikut :
5.1.1. Pengujian 1
Dilakukan menggunakan 6 fold, sebanyak 6 tahap/ iterasi
dengan rincian data sebagai berikut
Tabel 5.1.1.1. Pengujian 1
Kelas/ Kategori Jumlah Data
giliran 23
komunikasi 15
kondisi 34
pekerjaan 6
sifat 12
urutan tindakan 20
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 74
58
Hasil Pengujian 1
Tahap Akurasi (%)
1 31.58
2 44.44
3 44.44
4 31.58
5 47.37
6 38.89
Rata- Rata
Akurasi 39.72
Tabel 5.1.1.2. Hasil Pengujian 1
5.1.2. Pengujian 2
Berdasar hasil pengujian 1 (detail lihat lampiran hal. 64-81)
kemudian diambil 10 data dengan nilai Conditional Probability
paling besar (lihat lampiran hal. 81-84 ), selanjutnya dilakukan
proses pengujian akurasi dengan 10 fold sebanyak 10 tahap atau
iterasi, dan hasilnya sebagai berikut:
Hasil Pengujian 2
Tahap
Akurasi
(%)
1 60
2 0
3 40
4 60
5 20
6 0
7 60
8 60
9 60
10 40
Rata-Rata
Akurasi 40
Tabel 5.1.2.1. Hasil Pengujian 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 75
59
5.1.3. Pengujian 3
Berdasar hasil pengujian 2 (detail lihat lampiran hal. 85-
93), kemudian diambil 6 data dengan nilai Conditional Probability
paling besar (lihat lampiran hal. 93-95), selanjutnya dilakukan
proses pengujian akurasi dengan 6 fold sebanyak 6 tahap atau
iterasi, dengan hasil sebagai berikut:
Hasil Pengujian 3
Tahap
Akurasi
(%)
1 40
2 40
3 40
4 20
5 80
6 40
Rata- Rata
Akurasi 43.33
Tabel 5.1.3.1. Hasil Pengujian 3
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 76
60
5.2. Analisa Hasil
Berdasar pada pengujian yang dilakukan dengan k-cross validation,
diperoleh hasil sebagai berikut
Pengujian Kategori
Jumlah Data
per Kategori
Jumlah
Fold
Akurasi
benar
1
Giliran 23
6 39.72%
Komunikasi 15
Kondisi 34
pekerjaan 6
Sifat 12
urutan
tindakan 20
2
giliran 10
10 40%
komunikasi 10
kondisi 10
sifat 10
urutan
tindakan 10
3
giliran 6
6 43.33%
komunikasi 6
kondisi 6
sifat 6
urutan
tindakan 6
Tabel 5.2.1 Analisa Hasil Pengujian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 77
61
Berdasar hasil pada tabel 5.2.1, terlihat bahwa pengujian yang dilakukan
pada setiap set pengujian dengan jumlah data yang berbeda menghasilkan akurasi
yang berbeda pula. Pengujian menggunakan semua kategori dan semua data
dengan 6 fold menghasilkan akurasi 39.72%. Pengujian menggunakan 5 kelas dan
jumlah data perkelas 10 data dengan 10 fold menghasilkan akurasi 40%.
Pengujian dengan 5 kelas dan jumlah data perkelas 6 data dengan 6 fold
menghasilkan akurasi 43.33%.
Nilai Conditional Probability berpengaruh pada hasil akurasi. Dengan
mengambil 10 data per kategori dari semua data dengan nilai Conditional
probability terbesar menghasilkan akurasi menjadi lebih besar, demikian juga
dengan mengambil 6 data per kategori dengan nilai Conditional Probability
terbesar juga menghasilkan akurasi yang lebih besar, seperti pada tabel 5.2.1.
Conditional Probability berarti perbandingan antara kesamaan kata tiap
kelas dibandingkan dengan jumlah kata unik dari keseluruhan dokumen dan
jumlah kata dari kelas tersebut. Sehingga semakin banyak kata yang mencirikan
kelas tersebut, maka Conditional Probability nya semakin besar.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 78
62
BAB VI
KESIMPULAN DAN SARAN
6.1. Kesimpulan
Dari hasil pembangunan sistem dan hasil proses klasifikasi serta akurasi
yang telah dilakukan terhadap algoritma Naive Bayes dalam identifikasi makna
kata dalam artikel berbahasa Indonesia, maka dapat diambil kesimpulan sebagai
berikut :
1. Jumlah data yang menjadi data training mempengaruhi hasil
klasifikasi.
2. Nilai Conditional Probability berpengaruh terhadap hasil akurasi.
3. Banyaknya kata yang mencirikan suatu kelas berpengaruh pada hasil
akurasi.
6.2. Saran
Saran yang diberikan penulis untuk memperbaiki sistem adalah :
1. Melakukan pengujian terhadap data yang digunakan menggunakan
algoritma klasifikasi yang lain, untuk membandingkan dengan
algoritma Naive Bayes yang dipakai dalam skripsi ini.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 79
63
DAFTAR PUSTAKA
Arifin A.Z., Mahendra P.A.K. and Ciptaningtyas H.T..(2014). Enhanced Confix
Stripping Stemmer and Ants Algorithm for Classifying News Document
in Indonesian Language. Surabaya, Sepuluh November Institute of
Technology, http://www.its.ac.id/personal/files/pub/2623-agusza-
baru%2021%20d%20VIP%20enhanced-confix-stripping-stem.pdf,
diakses terakhir 24 Juli 2016.
Austa, L. (2009). Perbandingan Algoritma Stemming Porter dengan Algoritma
Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia.
Indonesia, Universtas Kristen Satya Wacana,
https://yudiagusta.files.wordpress.com/2009/11/196-201-knsi09-036-
perbandingan-algoritma-stemming-porter-dengan-algoritma-nazief-
adriani-untuk-stemming-dokumen-teks-bahasa-indonesia.pdf, diakses
terakhir tanggal 23 Juli 2016.
Budi Santosa. (2007). Data Mining: Teknik Pemanfaatan Data untuk Keperluan
Bisnis. Yogyakarta: Graha Ilmu, pp. 76-86.
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze. (2009). An
Introduction to Information Retrieval. Cambridge: Cambridge University
Press.
Dwijatmoko, B.B. (2016). Ideologi Kesabaran dalam Karya Sastra Indonesia.
Buku Kumpulan Makalah Kongres Internasional Masyarakat Linguistik,
pp. 103-106.
Jiawei Han and Micheline Kamber. (2006). Data Mining: Concepts and
Techniques. 2nd Ed. San Francisco: Morgan Kaufman Publisher, pp.
614-628.
Kusrini dan T.L. Emha. (2009). Algoritma Data Mining. Yogyakarta: Andi Offset,
pp. 190-198.
Violya Y. (2015). “Klasifikasi Dokumen Bahasa Jawa Menggunakan Metode
Naive Bayesian”. Skripsi. Yogyakarta: Teknik Informatikan Sanata
Dharma.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 80
64
Lampiran 1 Tabel Hasil Pengujian
1. Hasil Pengujian 1
1.1. Tabel Hasil Pengujian 1
TAHA
P Dokumen Status Awal Status Sistem
P(Tk|C) Nilai
Akuras
i (%)
Tahap
1
10giliran.txt giliran komunikasi
giliran 1,44E-09
FALS
E
31.58
komunikasi 3,72E-09
kondisi 5,13E-11
pekerjaan 6,16E-12
sifat 1,12E-10
urutan_tindak
an 4,48E-11
11giliran.txt giliran giliran
giliran 4,13E-28 TRUE
komunikasi 3,83E-28
kondisi 4,87E-30
pekerjaan 6,28E-30
sifat 2,14E-29
urutan_tindakan 9,42E-29
12giliran.txt giliran kondisi
giliran 8,92E-15
FALS
E
komunikasi 3,70E-14
kondisi 4,67E-13
pekerjaan 2,47E-13
sifat 2,15E-13
urutan_tindak
an 5,02E-13
13giliran.txt giliran giliran
giliran 4,91E-16 TRUE
komunikasi 8,29E-18
kondisi 2,95E-17
pekerjaan 6,20E-18
sifat 4,07E-18
urutan_tindakan 4,74E-17
10komunikasi.txt komunikasi komunikasi
giliran 1,14E-31 TRUE
komunikasi 1,03E-29
kondisi 2,39E-32
pekerjaan 1,26E-31
sifat 4,36E-32
urutan_tindak
an 1,76E-31
11komunikasi.txt komunikasi urutan_tindak
an giliran 2,46E-17
FALS
E
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 81
65
komunikasi 4,15E-18
kondisi 2,95E-17
pekerjaan 6,20E-18
sifat 6,11E-18
urutan_tindak
an 5,26E-19
10kondisi.txt kondisi giliran
giliran 6,32E-05 FALSE
komunikasi 6,45E-06
kondisi 4,46E-06
pekerjaan 6,13E-06
sifat 7,76E-06
urutan_tindakan 2,12E-04
11kondisi.txt kondisi komunikasi
giliran 1,58E-04
FALS
E
komunikasi 3,87E-04
kondisi 1,79E-04
pekerjaan 6,13E-06
sifat 3,88E-06
urutan_tindak
an 1,06E-04
12kondisi.txt kondisi kondisi
giliran 8,71E-10 TRUE
komunikasi 2,31E-08
kondisi 3,05E-06
pekerjaan 4,92E-07
sifat 3,30E-09
urutan_tindakan 1,78E-07
13kondisi.txt kondisi komunikasi
giliran 5,84E-48
FALS
E
komunikasi 6,58E-47
kondisi 7,40E-49
pekerjaan 2,56E-47
sifat 6,49E-48
urutan_tindak
an 3,30E-46
14kondisi.txt kondisi komunikasi
giliran 5,20E-19
FALS
E
komunikasi 1,45E-17
kondisi 1,68E-19
pekerjaan 4,48E-19
sifat 1,04E-19
urutan_tindak
an 1,77E-20
15kondisi.txt kondisi kondisi
giliran 6,21E-38 TRUE
komunikasi 2,45E-36
kondisi 5,10E-37
pekerjaan 7,60E-38
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 82
66
sifat 4,27E-37
urutan_tindakan 3,10E-39
1pekerjaan.txt pekerjaan kondisi
giliran 4,58E-29
FALS
E
komunikasi 7,46E-29
kondisi 1,21E-26
pekerjaan 3,77E-29
sifat 1,28E-28
urutan_tindak
an 4,71E-29
1pekerjaan.txt pekerjaan kondisi
giliran 4,58E-29 FALSE
komunikasi 7,46E-29
kondisi 1,21E-26
pekerjaan 3,77E-29
sifat 1,28E-28
urutan_tindak
an 4,71E-29
10sifat.txt sifat sifat
giliran 2,99E-54 TRUE
komunikasi 2,20E-53
kondisi 7,98E-53
pekerjaan 5,14E-53
sifat 2,38E-51
urutan_tindak
an 3,10E-53
11sifat.txt sifat urutan_tindakan
giliran 4,06E-20 FALSE
komunikasi 3,71E-21
kondisi 1,34E-20
pekerjaan 1,24E-19
sifat 1,39E-19
urutan_tindak
an 2,65E-19
10urutanTindakan.t
xt
urutan_tindak
an komunikasi
giliran 1,49E-64
FALS
E
komunikasi 1,36E-63
kondisi 5,06E-66
pekerjaan 6,51E-66
sifat 5,00E-64
urutan_tindakan 2,57E-64
11urutanTindakan.t
xt
urutan_tindak
an sifat
giliran 6,71E-24
FALS
E
komunikasi 5,98E-23
kondisi 6,78E-24
pekerjaan 6,24E-25
sifat 1,42E-21
urutan_tindak
an 7,42E-23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 83
67
12urutanTindakan.txt
urutan_tindakan
giliran
giliran 3,93E-57
FALS
E
komunikasi 4,23E-59
kondisi 2,45E-60
pekerjaan 1,03E-57
sifat 1,53E-58
urutan_tindakan 1,17E-57
Tahap 2
14giliran.txt giliran kondisi
giliran 1,11E-34
FALS
E
44.44
komunikasi 2,59E-33
kondisi 7,46E-34
pekerjaan 2,65E-33
sifat 8,96E-35
urutan_tindak
an 3,22E-35
15giliran.txt giliran giliran
giliran 2,43E-39 TRUE
komunikasi 1,69E-40
kondisi 6,22E-42
pekerjaan 1,13E-40
sifat 9,09E-42
urutan_tindakan 2,58E-40
16giliran.txt giliran giliran
giliran 1,66E-12 TRUE
komunikasi 2,98E-14
kondisi 4,87E-14
pekerjaan 2,03E-13
sifat 3,87E-15
urutan_tindak
an 1,98E-13
17giliran.txt giliran giliran
giliran 1,71E-14 TRUE
komunikasi 1,68E-17
kondisi 1,74E-16
pekerjaan 2,06E-16
sifat 4,19E-17
urutan_tindak
an 6,01E-16
12komunikasi.txt komunikasi urutan_tindak
an
giliran 6,66E-05
FALS
E
komunikasi 9,01E-06
kondisi 6,05E-06
pekerjaan 9,79E-07
sifat 5,30E-06
urutan_tindak
an 1,10E-05
13komunikasi.txt komunikasi kondisi giliran 5,76E-116 FALSE
komunikasi 1,70E-114
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 84
68
kondisi 2,29E-112
pekerjaan 1,47E-113
sifat 6,85E-116
urutan_tindak
an 2,68E-112
16kondisi.txt kondisi kondisi
giliran 2,43E-20 TRUE
komunikasi 2,63E-20
kondisi 4,63E-19
pekerjaan 1,25E-18
sifat 9,43E-21
urutan_tindak
an 9,39E-21
17kondisi.txt kondisi giliran
giliran 1,46E+04 FALSE
komunikasi 4,09E+01
kondisi 3,82E+02
pekerjaan 1,91E+01
sifat 6,53E-01
urutan_tindak
an 4,62E+01
18kondisi.txt kondisi komunikasi
giliran 1,08E-61
FALS
E
komunikasi 2,79E-59
kondisi 1,61E-60
pekerjaan 4,93E-62
sifat 4,67E-62
urutan_tindak
an 1,51E-60
19kondisi.txt kondisi kondisi
giliran 7,80E-03 TRUE
komunikasi 9,59E-03
kondisi 1,52E-01
pekerjaan 9,68E-03
sifat 2,35E-02
urutan_tindak
an 1,30E-01
1kondisi.txt kondisi giliran
giliran 1,44E-118
FALS
E
komunikasi 2,93E-123
kondisi 1,23E-125
pekerjaan 7,14E-124
sifat 3,87E-124
urutan_tindakan 2,76E-122
20kondisi.txt kondisi urutan_tindak
an
giliran 1,42E-16
FALS
E
komunikasi 1,40E-16
kondisi 9,69E-18
pekerjaan 6,17E-18
sifat 2,09E-17
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 85
69
urutan_tindak
an 2,23E-16
2pekerjaan.txt pekerjaan kondisi
giliran 3,56E-17
FALS
E
komunikasi 1,40E-16
kondisi 7,27E-18
pekerjaan 2,06E-16
sifat 3,49E-18
urutan_tindak
an 5,56E-20
12sifat.txt sifat kondisi
giliran 5,55E-36 FALSE
komunikasi 9,60E-36
kondisi 2,12E-32
pekerjaan 1,11E-35
sifat 1,34E-32
urutan_tindakan 1,29E-33
1sifat.txt sifat sifat
giliran 4,37E-147 TRUE
komunikasi 3,54E-147
kondisi 3,94E-145
pekerjaan 3,78E-146
sifat 6,20E-144
urutan_tindak
an 6,76E-147
13urutanTindakan.txt
urutan_tindakan
urutan_tindakan
giliran 9,73E-33 TRUE
komunikasi 1,02E-31
kondisi 6,18E-33
pekerjaan 1,09E-31
sifat 1,24E-31
urutan_tindak
an 3,43E-30
14urutanTindakan.txt
urutan_tindakan
urutan_tindakan
giliran 6,66E-05 TRUE
komunikasi 2,70E-05
kondisi 1,21E-04
pekerjaan 9,79E-06
sifat 5,30E-06
urutan_tindakan 2,19E-04
15urutanTindakan.t
xt
urutan_tindak
an sifat
giliran 3,46E-45
FALS
E
komunikasi 9,54E-44
kondisi 1,19E-42
pekerjaan 1,37E-43
sifat 3,93E-45
urutan_tindak
an 9,66E-45
Tahap
3 18giliran.txt giliran kondisi
giliran 8,18E-15
FALS
E 44.44
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 86
70
komunikasi 2,62E-14
kondisi 8,21E-14
pekerjaan 2,54E-14
sifat 1,08E-13
urutan_tindak
an 1,72E-13
19giliran.txt giliran giliran
giliran 1,92E-36 TRUE
komunikasi 3,56E-39
kondisi 9,35E-39
pekerjaan 1,68E-37
sifat 5,71E-39
urutan_tindak
an 9,84E-38
1giliran.txt giliran giliran
giliran 1,81E-16 TRUE
komunikasi 4,50E-20
kondisi 1,79E-18
pekerjaan 4,09E-20
sifat 9,22E-21
urutan_tindakan 7,74E-20
20giliran.txt giliran urutan_tindak
an
giliran 8,85E-26
FALS
E
komunikasi 4,83E-26
kondisi 1,38E-26
pekerjaan 1,46E-25
sifat 1,18E-25
urutan_tindak
an 1,74E-24
14komunikasi.txt komunikasi komunikasi
giliran 1,18E-28 TRUE
komunikasi 3,98E-29
kondisi 4,34E-32
pekerjaan 9,39E-32
sifat 1,34E-31
urutan_tindakan 1,05E-29
15komunikasi.txt komunikasi kondisi
giliran 8,85E-26
FALS
E
komunikasi 2,90E-25
kondisi 2,08E-24
pekerjaan 1,46E-25
sifat 1,18E-26
urutan_tindak
an 2,33E-25
21kondisi.txt kondisi kondisi
giliran 2,22E-16 TRUE
komunikasi 1,21E-16
kondisi 2,50E-17
pekerjaan 1,32E-16
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 87
71
sifat 2,00E-16
urutan_tindakan 2,23E-16
22kondisi.txt kondisi kondisi
giliran 4,43E-17 TRUE
komunikasi 9,71E-17
kondisi 9,01E-16
pekerjaan 1,32E-16
sifat 8,99E-17
urutan_tindak
an 1,12E-16
23kondisi.txt kondisi giliran
giliran 2,78E+02
FALS
E
komunikasi 1,91E+01
kondisi 1,59E+02
pekerjaan 1,07E+02
sifat 1,61E+02
urutan_tindakan 2,64E+02
24kondisi.txt kondisi sifat
giliran 1,00E-10
FALS
E
komunikasi 1,41E-11
kondisi 8,07E-13
pekerjaan 3,69E-10
sifat 2,34E-11
urutan_tindak
an 4,96E-12
25kondisi.txt kondisi kondisi
giliran 7,96E-03 TRUE
komunikasi 8,87E-03
kondisi 6,08E-02
pekerjaan 1,11E-01
sifat 7,44E-03
urutan_tindakan 7,62E-03
26kondisi.txt kondisi urutan_tindak
an
giliran 1,26E+08
FALS
E
komunikasi 1,11E+07
kondisi 1,37E+08
pekerjaan 9,98E+06
sifat 9,45E+06
urutan_tindak
an 2,34E+08
3pekerjaan.txt pekerjaan urutan_tindakan
giliran 1,59E-60
FALS
E
komunikasi 1,24E-60
kondisi 1,02E-62
pekerjaan 2,21E-61
sifat 4,83E-62
urutan_tindak
an 1,88E-60
2sifat.txt sifat sifat giliran 2,75E-209 TRUE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 88
72
komunikasi 1,08E-207
kondisi 1,63E-211
pekerjaan 3,86E-207
sifat 1,07E-204
urutan_tindak
an 2,69E-210
3sifat.txt sifat kondisi
giliran 2,82E-33 FALSE
komunikasi 2,46E-33
kondisi 3,05E-30
pekerjaan 3,24E-36
sifat 2,23E-30
urutan_tindakan 3,78E-34
16urutanTindakan.t
xt
urutan_tindak
an
urutan_tindak
an
giliran 3,80E-66 TRUE
komunikasi 1,44E-64
kondisi 4,38E-66
pekerjaan 2,29E-64
sifat 2,51E-65
urutan_tindak
an 5,42E-65
17urutanTindakan.txt
urutan_tindakan
kondisi
giliran 1,03E-12 FALSE
komunikasi 1,05E-12
kondisi 1,23E-13
pekerjaan 1,27E-14
sifat 1,08E-13
urutan_tindakan 1,72E-13
18urutanTindakan.t
xt
urutan_tindak
an kondisi
giliran 6,48E-73
FALS
E
komunikasi 2,93E-71
kondisi 8,48E-69
pekerjaan 1,30E-71
sifat 2,70E-71
urutan_tindak
an 1,81E-71
Tahap
4
21giliran.txt giliran giliran
giliran 4,88E-35 TRUE
31.58
komunikasi 8,14E-37
kondisi 3,19E-35
pekerjaan 5,38E-39
sifat 7,05E-38
urutan_tindak
an 7,43E-37
22giliran.txt giliran kondisi
giliran 4,88E-05
FALS
E
komunikasi 4,40E-05
kondisi 5,98E-04
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 89
73
pekerjaan 1,38E-05
sifat 1,19E-04
urutan_tindakan 5,20E-04
23giliran.txt giliran kondisi
giliran 1,90E-12
FALS
E
komunikasi 1,03E-13
kondisi 5,28E-12
pekerjaan 1,65E-14
sifat 7,01E-14
urutan_tindak
an 2,54E-15
2giliran.txt giliran giliran
giliran 1,49E-68 TRUE
komunikasi 2,12E-69
kondisi 2,11E-71
pekerjaan 4,20E-70
sifat 7,75E-72
urutan_tindakan 7,86E-72
1komunikasi.txt komunikasi komunikasi
giliran 7,58E-09 TRUE
komunikasi 3,23E-08
kondisi 1,07E-08
pekerjaan 1,46E-07
sifat 5,36E-08
urutan_tindak
an 7,81E-09
2komunikasi.txt komunikasi pekerjaan
giliran 8,24E-89
FALS
E
komunikasi 1,36E-88
kondisi 4,05E-88
pekerjaan 2,42E-86
sifat 4,52E-89
urutan_tindakan 2,52E-88
3komunikasi.txt komunikasi kondisi
giliran 2,33E-27
FALS
E
komunikasi 1,82E-28
kondisi 1,10E-26
pekerjaan 6,72E-30
sifat 5,30E-29
urutan_tindak
an 9,03E-29
27kondisi.txt kondisi giliran
giliran 3,54E-50
FALS
E
komunikasi 9,64E-52
kondisi 9,46E-54
pekerjaan 3,64E-53
sifat 2,84E-52
urutan_tindak
an 3,29E-51
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 90
74
28kondisi.txt kondisi urutan_tindakan
giliran 7,58E-09
FALS
E
komunikasi 1,08E-08
kondisi 1,07E-07
pekerjaan 1,46E-07
sifat 5,36E-10
urutan_tindakan 2,34E-08
29kondisi.txt kondisi kondisi
giliran 1,30E-28 TRUE
komunikasi 1,82E-28
kondisi 2,75E-28
pekerjaan 2,24E-28
sifat 2,12E-28
urutan_tindak
an 4,14E-28
2kondisi.txt kondisi giliran
giliran 3,30E-23
FALS
E
komunikasi 9,55E-24
kondisi 1,42E-24
pekerjaan 1,98E-22
sifat 1,94E-24
urutan_tindakan 9,27E-24
30kondisi.txt kondisi kondisi
giliran 5,18E-31 TRUE
komunikasi 3,64E-28
kondisi 1,10E-27
pekerjaan 2,24E-28
sifat 2,12E-27
urutan_tindak
an 2,26E-28
31kondisi.txt kondisi komunikasi
giliran 1,19E-13
FALS
E
komunikasi 2,05E-13
kondisi 6,87E-15
pekerjaan 3,31E-13
sifat 4,38E-15
urutan_tindakan 6,34E-15
4pekerjaan.txt pekerjaan pekerjaan
giliran 1,96E-56 TRUE
komunikasi 2,94E-55
kondisi 8,54E-57
pekerjaan 2,32E-54
sifat 3,42E-55
urutan_tindak
an 6,47E-56
4sifat.txt sifat urutan_tindakan
giliran 1,51E-65
FALS
E
komunikasi 1,10E-63
kondisi 9,81E-67
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 91
75
pekerjaan 9,30E-65
sifat 3,79E-65
urutan_tindakan 3,48E-63
5sifat.txt sifat giliran
giliran 6,22E-28
FALS
E
komunikasi 1,82E-28
kondisi 1,10E-28
pekerjaan 4,48E-28
sifat 3,97E-28
urutan_tindak
an 9,03E-29
19urutanTindakan.t
xt
urutan_tindak
an giliran
giliran 3,00E-17
FALS
E
komunikasi 8,01E-17
kondisi 1,38E-16
pekerjaan 1,76E-16
sifat 7,92E-18
urutan_tindak
an 3,43E-16
1urutanTindakan.txt
urutan_tindakan
giliran
giliran 5,27E-50 FALSE
komunikasi 3,09E-49
kondisi 1,47E-49
pekerjaan 1,37E-48
sifat 1,57E-50
urutan_tindakan 1,63E-50
20urutanTindakan.t
xt
urutan_tindak
an komunikasi
giliran 1,87E-137
FALS
E
komunikasi 2,98E-134
kondisi 1,54E-135
pekerjaan 2,40E-135
sifat 1,01E-136
urutan_tindak
an 1,27E-136
Tahap
5
3giliran.txt giliran kondisi
giliran 1,36E+11
FALS
E
47.37
komunikasi 2,18E+11
kondisi 5,65E+11
pekerjaan 8,95E+09
sifat 2,62E+11
urutan_tindak
an 5,90E+10
4giliran.txt giliran giliran
giliran 1,68E-10 TRUE
komunikasi 4,35E-13
kondisi 2,84E-12
pekerjaan 8,73E-15
sifat 2,45E-14
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 92
76
urutan_tindak
an 5,93E-14
5giliran.txt giliran giliran
giliran 2,29E-36 TRUE
komunikasi 4,77E-40
kondisi 8,15E-39
pekerjaan 1,02E-39
sifat 2,26E-39
urutan_tindakan 1,23E-38
6giliran.txt giliran giliran
giliran 2,51E-09 TRUE
komunikasi 4,75E-11
kondisi 1,18E-09
pekerjaan 2,63E-11
sifat 1,15E-10
urutan_tindak
an 2,37E-09
4komunikasi.txt komunikasi giliran
giliran 9,61E-42 FALSE
komunikasi 1,09E-42
kondisi 1,54E-42
pekerjaan 3,39E-43
sifat 1,51E-44
urutan_tindakan 7,09E-45
5komunikasi.txt komunikasi komunikasi
giliran 3,97E-27 TRUE
komunikasi 1,54E-25
kondisi 2,36E-27
pekerjaan 1,73E-25
sifat 1,30E-27
urutan_tindak
an 3,97E-28
6komunikasi.txt komunikasi komunikasi
giliran 2,93E-37 TRUE
komunikasi 5,20E-38
kondisi 6,99E-38
pekerjaan 1,71E-37
sifat 4,14E-38
urutan_tindak
an 9,19E-38
32kondisi.txt kondisi urutan_tindak
an
giliran 3,66E-38
FALS
E
komunikasi 2,17E-37
kondisi 1,64E-38
pekerjaan 7,67E-38
sifat 8,27E-39
urutan_tindak
an 3,06E-38
33kondisi.txt kondisi sifat giliran 3,86E-23 FALSE
komunikasi 1,68E-23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 93
77
kondisi 4,10E-23
pekerjaan 1,04E-22
sifat 2,20E-22
urutan_tindak
an 9,53E-24
34kondisi.txt kondisi giliran
giliran 7,54E-27
FALS
E
komunikasi 7,04E-30
kondisi 7,25E-30
pekerjaan 1,72E-28
sifat 3,55E-29
urutan_tindakan 4,41E-30
3kondisi.txt kondisi sifat
giliran 7,11E-35
FALS
E
komunikasi 1,42E-33
kondisi 1,82E-34
pekerjaan 1,71E-34
sifat 6,51E-29
urutan_tindak
an 6,90E-36
4kondisi.txt kondisi urutan_tindak
an
giliran 7,53E-60 FALSE
komunikasi 1,27E-56
kondisi 2,19E-57
pekerjaan 1,34E-57
sifat 7,84E-58
urutan_tindak
an 1,15E-55
5pekerjaan.txt pekerjaan pekerjaan
giliran 4,62E-55 TRUE
komunikasi 1,40E-52
kondisi 8,72E-55
pekerjaan 6,72E-53
sifat 3,12E-55
urutan_tindak
an 5,13E-55
6sifat.txt sifat urutan_tindakan
giliran 3,14E-61 FALSE
komunikasi 3,54E-59
kondisi 3,42E-59
pekerjaan 8,35E-60
sifat 5,45E-60
urutan_tindak
an 2,89E-58
7sifat.txt sifat sifat
giliran 1,56E-20 TRUE
komunikasi 9,14E-21
kondisi 5,34E-22
pekerjaan 8,68E-21
sifat 3,43E-18
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 94
78
urutan_tindak
an 1,53E-19
2urutanTindakan.tx
t
urutan_tindak
an sifat
giliran 4,44E-54
FALS
E
komunikasi 1,47E-51
kondisi 1,74E-52
pekerjaan 6,72E-53
sifat 1,80E-52
urutan_tindak
an 9,24E-55
3urutanTindakan.txt
urutan_tindakan
kondisi
giliran 3,49E-12 FALSE
komunikasi 1,19E-10
kondisi 1,18E-11
pekerjaan 3,50E-11
sifat 1,73E-11
urutan_tindakan 1,98E-10
4urutanTindakan.tx
t
urutan_tindak
an
urutan_tindak
an
giliran 2,62E-29 TRUE
komunikasi 8,45E-29
kondisi 1,81E-28
pekerjaan 8,60E-30
sifat 3,33E-29
urutan_tindak
an 8,83E-29
5urutanTindakan.txt
urutan_tindakan
urutan_tindakan
giliran 3,39E-07 TRUE
komunikasi 1,30E-07
kondisi 4,16E-07
pekerjaan 8,79E-09
sifat 8,09E-08
urutan_tindak
an 1,42E-05
Tahap
6
7giliran.txt giliran giliran
giliran 3,68E-156 TRUE
38.89
komunikasi 1,07E-157
kondisi 3,40E-162
pekerjaan 6,91E-163
sifat 1,32E-164
urutan_tindak
an 1,42E-166
8giliran.txt giliran giliran
giliran 3,56E-28 TRUE
komunikasi 1,77E-27
kondisi 2,06E-27
pekerjaan 3,17E-28
sifat 2,40E-28
urutan_tindak
an 1,69E-27
9giliran.txt giliran giliran giliran 1,03E-63 TRUE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 95
79
komunikasi 3,61E-65
kondisi 3,92E-65
pekerjaan 4,98E-64
sifat 1,90E-65
urutan_tindak
an 8,30E-65
7komunikasi.txt komunikasi komunikasi
giliran 2,91E-18 TRUE
komunikasi 9,28E-17
kondisi 2,66E-19
pekerjaan 1,41E-20
sifat 5,72E-21
urutan_tindak
an 1,67E-19
8komunikasi.txt komunikasi kondisi
giliran 6,62E-11
FALS
E
komunikasi 4,35E-11
kondisi 1,54E-09
pekerjaan 5,05E-12
sifat 1,64E-10
urutan_tindak
an 1,92E-09
9komunikasi.txt komunikasi komunikasi
giliran 1,21E-19 TRUE
komunikasi 2,39E-19
kondisi 2,21E-20
pekerjaan 1,41E-19
sifat 2,86E-21
urutan_tindak
an 8,33E-21
5kondisi.txt kondisi komunikasi
giliran 7,17E-48
FALS
E
komunikasi 9,59E-46
kondisi 9,79E-48
pekerjaan 3,97E-47
sifat 1,95E-47
urutan_tindak
an 1,03E-46
6kondisi.txt kondisi urutan_tindakan
giliran 1,57E-84 FALSE
komunikasi 1,68E-85
kondisi 1,96E-86
pekerjaan 5,84E-85
sifat 5,93E-86
urutan_tindakan 2,45E-83
7kondisi.txt kondisi giliran
giliran 5,87E-39
FALS
E
komunikasi 1,62E-37
kondisi 1,77E-38
pekerjaan 1,77E-37
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 96
80
sifat 8,37E-40
urutan_tindakan 1,12E-38
8kondisi.txt kondisi kondisi
giliran 2,39E-48 TRUE
komunikasi 7,99E-47
kondisi 1,57E-46
pekerjaan 5,36E-47
sifat 2,92E-47
urutan_tindak
an 8,56E-48
9kondisi.txt kondisi giliran
giliran 6,61E-07
FALS
E
komunikasi 4,64E-08
kondisi 2,99E-07
pekerjaan 7,30E-08
sifat 1,11E-06
urutan_tindakan 1,22E-06
6pekerjaan.txt pekerjaan kondisi
giliran 2,55E-43
FALS
E
komunikasi 6,82E-43
kondisi 4,61E-41
pekerjaan 3,83E-43
sifat 5,27E-45
urutan_tindak
an 5,31E-43
8sifat.txt sifat kondisi
giliran 1,09E-18 FALSE
komunikasi 1,19E-19
kondisi 6,38E-19
pekerjaan 1,41E-19
sifat 5,14E-20
urutan_tindak
an 1,67E-19
9sifat.txt sifat kondisi
giliran 7,71E-66
FALS
E
komunikasi 1,44E-63
kondisi 5,65E-64
pekerjaan 7,47E-65
sifat 1,52E-63
urutan_tindakan 1,38E-64
6urutanTindakan.tx
t
urutan_tindak
an kondisi
giliran 1,08E-16
FALS
E
komunikasi 3,82E-18
kondisi 3,31E-16
pekerjaan 1,36E-16
sifat 6,44E-18
urutan_tindak
an 3,23E-17
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 97
81
7urutanTindakan.tx
t
urutan_tindak
an
urutan_tindak
an
giliran 2,99E-13 TRUE
komunikasi 1,36E-13
kondisi 1,03E-13
pekerjaan 1,31E-13
sifat 2,18E-13
urutan_tindak
an 4,51E-14
8urutanTindakan.tx
t
urutan_tindak
an giliran
giliran 5,79E-36 FALSE
komunikasi 1,29E-34
kondisi 1,77E-34
pekerjaan 3,42E-34
sifat 1,26E-34
urutan_tindak
an 7,83E-37
9urutanTindakan.txt
urutan_tindakan
kondisi
giliran 6,06E-17
FALS
E
komunikasi 6,12E-16
kondisi 6,62E-16
pekerjaan 1,23E-15
sifat 1,29E-17
urutan_tindakan 1,55E-15
Rata rata Akurasi 39.72
1.2. Pengambilan 10 dokumen dengan conditioanl probability tertinggi
1.2.1. Data Kategori Giliran
No GILIRAN
Conditional
Proability
1 3giliran.txt 1,36E+11
2 22giliran.txt 4,88E-05
3 6giliran.txt 2,51E-09
4 10giliran.txt 1,44E-09
5 4giliran.txt 1,68E-10
6 23giliran.txt 1,90E-12
7 16giliran.txt 1,66E-12
8 17giliran.txt 1,71E-14
9 12giliran.txt 8,92E-15
10 18giliran.txt 8,18E-15
11 13giliran.txt 4,91E-16
12 1giliran.txt 1,81E-16
13 20giliran.txt 8,85E-26
14 11giliran.txt 4,13E-28
15 8giliran.txt 3,56E-28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 98
82
16 14giliran.txt 1,11E-34
17 21giliran.txt 4,88E-35
18 5giliran.txt 2,29E-36
19 19giliran.txt 1,92E-36
20 15giliran.txt 2,43E-39
21 9giliran.txt 1,03E-63
22 2giliran.txt 1,49E-68
23 7giliran.txt 3,68E-156
1.2.2. Data Kategori Komunikasi
No KOMUNIKASI
Conditional
Probability
1 12komunikasi.txt 9,01E-06
1 1komunikasi.txt 3,23E-08
1 8komunikasi.txt 4,35E-11
1 7komunikasi.txt 9,28E-17
1 11komunikasi.txt 4,15E-18
1 9komunikasi.txt 2,39E-19
1 15komunikasi.txt 2,90E-25
1 5komunikasi.txt 1,54E-25
1 14komunikasi.txt 3,98E-29
1 10komunikasi.txt 1,03E-29
1 6komunikasi.txt 5,20E-38
1 4komunikasi.txt 1,09E-42
1 2komunikasi.txt 1,36E-88
1 13komunikasi.txt 1,70E-114
1.2.3. Data Kategori Kondisi
No KONDISI
Conditional
Probability
1 26kondisi.txt 1,37E+08
2 17kondisi.txt 3,82E+02
3 23kondisi.txt 1,59E+02
4 19kondisi.txt 1,52E-01
5 25kondisi.txt 6,08E-02
6 11kondisi.txt 1,79E-04
7 10kondisi.txt 4,46E-06
8 12kondisi.txt 3,05E-06
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 99
83
9 9kondisi.txt 2,99E-07
10 28kondisi.txt 1,07E-07
11 24kondisi.txt 8,07E-13
12 31kondisi.txt 6,87E-15
13 22kondisi.txt 9,01E-16
14 21kondisi.txt 2,50E-17
15 20kondisi.txt 9,69E-18
16 16kondisi.txt 4,63E-19
17 14kondisi.txt 1,68E-19
18 33kondisi.txt 4,10E-23
19 2kondisi.txt 1,42E-24
20 30kondisi.txt 1,10E-27
21 29kondisi.txt 2,75E-28
22 34kondisi.txt 7,25E-30
23 3kondisi.txt 1,82E-34
24 15kondisi.txt 5,10E-37
25 7kondisi.txt 1,77E-38
26 32kondisi.txt 1,64E-38
27 8kondisi.txt 1,57E-46
28 5kondisi.txt 9,79E-48
29 13kondisi.txt 7,40E-49
30 27kondisi.txt 9,46E-54
31 4kondisi.txt 2,19E-57
32 18kondisi.txt 1,61E-60
33 6kondisi.txt 1,96E-86
34 1kondisi.txt 1,23E-125
1.2.4. Data kategori Sifat
No SIFAT SumCon
1 7sifat.txt 3,43E-18
2 11sifat.txt 1,39E-19
3 8sifat.txt 5,14E-20
4 5sifat.txt 3,97E-28
5 3sifat.txt 2,23E-30
6 12sifat.txt 1,34E-32
7 10sifat.txt 2,38E-51
8 6sifat.txt 5,45E-60
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 100
84
9 9sifat.txt 1,52E-63
10 4sifat.txt 3,79E-65
11 1sifat.txt 6,20E-144
12 2sifat.txt 1,07E-204
1.2.5. Data Urutan Tindakan
No Urutan Tindakan SumCon
1 14urutanTindakan.txt 2,19E-04
2 5urutanTindakan.txt 1,42E-05
3 3urutanTindakan.txt 1,98E-10
4 17urutanTindakan.txt 1,72E-13
5 7urutanTindakan.txt 4,51E-14
6 9urutanTindakan.txt 1,55E-15
7 19urutanTindakan.txt 3,43E-16
8 6urutanTindakan.txt 3,23E-17
9 11urutanTindakan.txt 7,42E-23
10 4urutanTindakan.txt 8,83E-29
11 13urutanTindakan.txt 3,43E-30
12 8urutanTindakan.txt 7,83E-37
13 15urutanTindakan.txt 9,66E-45
14 1urutanTindakan.txt 1,63E-50
15 2urutanTindakan.txt 9,24E-55
16 12urutanTindakan.txt 1,17E-57
17 10urutanTindakan.txt 2,57E-64
18 16urutanTindakan.txt 5,42E-65
19 18urutanTindakan.txt 1,81E-71
20 20urutanTindakan.txt 1,27E-136
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 101
85
2. Pengujian 2
2.1. Tabel Hasil Pengujian 2
TAHA
P Dokumen Status Awal Status Sistem P(Tk|C) Nilai
Akurasi(
%)
TAHA
P 1
10giliran.txt giliran komunikasi
giliran
3,21E-
07
FALS
E
60
komunikasi 5,09E-07
kondisi
1,21E-
07
sifat 1,27E-07
urutan_tindak
an
5,36E-
09
10komunikasi.txt komunikasi komunikasi
giliran
4,13E-
25 TRUE
komunikasi
2,36E-
23
kondisi
2,12E-
24
sifat 3,48E-25
urutan_tindak
an
4,97E-
26
10kondisi.txt kondisi kondisi
giliran
5,79E-
03 TRUE
komunikasi
3,86E-
03
kondisi
8,74E-
03
sifat
3,03E-
04
urutan_tindak
an
4,64E-
03
10sifat.txt sifat kondisi
giliran 1,91E-43
FALSE
komunikasi
3,16E-
45
kondisi 7,40E-43
sifat
7,92E-
43
urutan_tindak
an
2,31E-
44
11urutanTindakan.
txt
urutan_tindak
an
urutan_tindak
an
giliran 2,70E-17 TRUE
komunikasi
6,37E-
19
kondisi 2,90E-17
sifat
2,25E-
18
urutan_tindak
an
7,16E-
18
TAHA
P 2 12giliran.txt giliran kondisi
giliran
7,27E-
11
FALS
E 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 102
86
komunikasi
3,59E-
10
kondisi
5,04E-
10
sifat
5,24E-
11
urutan_tindakan
1,81E-10
11komunikasi.txt komunikasi kondisi
giliran
1,77E-
12
FALS
E
komunikasi 8,15E-14
kondisi
3,24E-
13
sifat 5,16E-14
urutan_tindakan
1,05E-12
11kondisi.txt kondisi komunikasi
giliran
1,01E-
01
FALS
E
komunikasi 1,85E-01
kondisi
7,42E-
03
sifat 1,15E-02
urutan_tindakan
7,24E-03
11sifat.txt sifat kondisi
giliran
4,30E-
16
FALS
E
komunikasi 3,70E-15
kondisi
3,33E-
14
sifat 2,71E-15
urutan_tindak
an
1,46E-
14
14urutanTindakan.txt
urutan_tindakan
komunikasi
giliran
5,05E-
03
FALS
E
komunikasi
9,25E-
03
kondisi
7,42E-
03
sifat
1,15E-
02
urutan_tindak
an
3,62E-
03
TAHAP 3
16giliran.txt giliran giliran
giliran 6,39E-10 TRUE
40
komunikasi
6,42E-
11
kondisi 2,52E-10
sifat
9,46E-
12
urutan_tindak
an
9,47E-
11
12komunikasi.txt komunikasi kondisi giliran
4,96E-02
FALSE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 103
87
komunikasi
2,85E-
03
kondisi
7,42E-
04
sifat
1,21E-
03
urutan_tindakan
3,74E-03
12kondisi.txt kondisi giliran
giliran
4,82E-
05
FALS
E
komunikasi 2,55E-06
kondisi
3,81E-
05
sifat 1,44E-04
urutan_tindakan
1,74E-05
12sifat.txt sifat sifat
giliran
3,52E-
29 TRUE
komunikasi 9,15E-30
kondisi
1,87E-
27
sifat 5,49E-28
urutan_tindakan
7,08E-29
17urutanTindakan.txt
urutan_tindakan
komunikasi
giliran
2,84E-
09
FALS
E
komunikasi 5,78E-10
kondisi
5,04E-
10
sifat 1,89E-10
urutan_tindak
an
9,47E-
11
TAHAP 4
17giliran.txt giliran giliran
giliran 2,38E-12 TRUE
60
komunikasi
8,22E-
14
kondisi 8,78E-14
sifat
1,18E-
13
urutan_tindak
an
3,43E-
14
14komunikasi.txt komunikasi komunikasi
giliran 7,91E-26 TRUE
komunikasi
4,86E-
24
kondisi 4,13E-26
sifat
1,63E-
26
urutan_tindak
an
1,26E-
25
17kondisi.txt kondisi giliran giliran
5,38E+05
FALSE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 104
88
komunikasi
2,22E+0
3
kondisi
1,88E+0
4
sifat
2,76E+0
2
urutan_tindakan
6,13E+02
3sifat.txt sifat sifat
giliran
4,69E-
29 TRUE
komunikasi 6,78E-29
kondisi
1,03E-
27
sifat 1,71E-25
urutan_tindakan
1,20E-29
19urutanTindakan.txt
urutan_tindakan
giliran
giliran
2,38E-
12
FALS
E
komunikasi 5,48E-13
kondisi
2,20E-
13
sifat 2,96E-13
urutan_tindakan
8,57E-14
TAHAP 5
18giliran.txt giliran giliran
giliran
7,97E-
09 TRUE
20
komunikasi
4,63E-
10
kondisi
3,02E-
10
sifat
2,78E-
10
urutan_tindak
an
1,14E-
09
15komunikasi.txt komunikasi giliran
giliran 3,02E-20
FALSE
komunikasi
2,71E-
20
kondisi 2,84E-20
sifat
7,53E-
22
urutan_tindak
an
2,91E-
20
19kondisi.txt kondisi sifat
giliran 2,33E+01
FALSE
komunikasi
1,58E+0
1
kondisi 3,22E+00
sifat
4,61E+0
0
urutan_tindak
an
1,80E+0
1
4sifat.txt sifat kondisi giliran 4,54E-55
FALSE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 105
89
komunikasi
2,52E-
53
kondisi
7,70E-
54
sifat
2,44E-
55
urutan_tindakan
1,39E-54
3urutanTindakan.txt
urutan_tindakan kondisi
giliran
3,57E-
08
FALS
E
komunikasi 3,98E-09
kondisi
5,77E-
08
sifat 4,04E-10
urutan_tindakan
2,41E-09
TAHAP 6
22giliran.txt giliran kondisi
giliran
4,04E-
02
FALS
E
0
komunikasi
1,10E-
01
kondisi
1,60E+0
0
sifat 2,26E-02
urutan_tindak
an
1,55E-
02
1komunikasi.txt komunikasi urutan_tindakan
giliran
1,07E-
04
FALS
E
komunikasi
1,23E-
04
kondisi
1,69E-
05
sifat
4,44E-
06
urutan_tindak
an
1,81E-
04
23kondisi.txt kondisi urutan_tindak
an
giliran 7,84E+02
FALSE
komunikasi
5,54E+0
2
kondisi 2,08E+04
sifat
5,85E+0
2
urutan_tindak
an
2,11E+0
3
5sifat.txt sifat giliran
giliran 7,70E-23
FALSE
komunikasi
1,70E-
23
kondisi 2,25E-22
sifat
7,52E-
24
urutan_tindak
an
3,50E-
23
4urutanTindakan.txt
urutan_tindakan
giliran giliran
1,92E-23
FALSE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 106
90
komunikasi
1,70E-
23
kondisi
1,12E-
22
sifat
2,51E-
24
urutan_tindakan
1,40E-22
TAHAP 7
23giliran.txt giliran giliran
giliran
2,01E-
09 TRUE
60
komunikasi 5,20E-11
kondisi
1,72E-
09
sifat 5,91E-11
urutan_tindak
an
6,29E-
12
5komunikasi.txt komunikasi kondisi
giliran
7,99E-
21
FALS
E
komunikasi
3,19E-
21
kondisi
1,71E-
20
sifat 2,74E-22
urutan_tindak
an
4,16E-
21
25kondisi.txt kondisi kondisi
giliran
2,52E+0
0 TRUE
komunikasi
1,70E+0
1
kondisi
3,48E+0
0
sifat
7,97E-
02
urutan_tindak
an
1,90E+0
0
6sifat.txt sifat kondisi
giliran 4,03E-48
FALSE
komunikasi
7,80E-
51
kondisi 1,56E-47
sifat
4,20E-
50
urutan_tindak
an
1,88E-
50
5urutanTindakan.t
xt
urutan_tindak
an
urutan_tindak
an
giliran 3,18E-04 TRUE
komunikasi
9,39E-
07
kondisi 2,45E-05
sifat
1,37E-
04
urutan_tindak
an
3,50E-
03
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 107
91
TAHA
P 8
3giliran.txt giliran urutan_tindakan
giliran
5,36E+1
1
FALS
E
60
komunikasi
4,87E+0
8
kondisi
6,07E+1
0
sifat
3,68E+1
0
urutan_tindak
an
2,58E+1
2
7komunikasi.txt komunikasi komunikasi
giliran 1,89E-14 TRUE
komunikasi
1,71E-
12
kondisi 9,97E-16
sifat
7,50E-
17
urutan_tindak
an
3,80E-
16
26kondisi.txt kondisi kondisi
giliran 1,24E+08 TRUE
komunikasi
1,08E+0
9
kondisi 1,49E+09
sifat
7,07E+0
7
urutan_tindak
an
1,17E+0
9
7sifat.txt sifat sifat
giliran 4,73E-16 TRUE
komunikasi
1,34E-
15
kondisi 9,97E-16
sifat
4,50E-
15
urutan_tindak
an
1,90E-
15
6urutanTindakan.t
xt
urutan_tindak
an giliran
giliran
4,09E-
13
FALS
E
komunikasi
1,21E-
13
kondisi
4,05E-
13
sifat
2,61E-
13
urutan_tindak
an
1,67E-
12
TAHA
P 9 4giliran.txt giliran giliran
giliran
2,62E-
07 TRUE
60
komunikasi 2,88E-09
kondisi
1,09E-
09
sifat 9,09E-12
urutan_tindakan
4,06E-09
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 108
92
8komunikasi.txt komunikasi kondisi
giliran
6,24E-
08
FALS
E
komunikasi
3,17E-
08
kondisi
1,58E-
06
sifat
4,60E-
09
urutan_tindak
an
2,16E-
08
28kondisi.txt kondisi kondisi
giliran 1,28E-04 TRUE
komunikasi
6,99E-
06
kondisi 2,03E-04
sifat
2,33E-
05
urutan_tindak
an
9,22E-
06
8sifat.txt sifat giliran
giliran 2,74E-14
FALSE
komunikasi
1,85E-
16
kondisi 9,14E-16
sifat
7,10E-
17
urutan_tindak
an
2,80E-
16
7urutanTindakan.t
xt
urutan_tindak
an
urutan_tindak
an
giliran 1,53E-10 TRUE
komunikasi
3,59E-
10
kondisi 1,36E-09
sifat
1,82E-
11
urutan_tindak
an
4,06E-
09
TAHA
P 10
6giliran.txt giliran giliran
giliran
3,21E-
07 TRUE
40
komunikasi 7,79E-08
kondisi
1,24E-
06
sifat 2,74E-08
urutan_tindakan
1,03E-06
9komunikasi.txt komunikasi komunikasi
giliran
1,09E-
14 TRUE
komunikasi 1,22E-14
kondisi
1,14E-
14
sifat 6,05E-17
urutan_tindakan
3,51E-16
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 109
93
9kondisi.txt kondisi sifat
giliran
5,75E-
05
FALS
E
komunikasi
2,52E-
04
kondisi
4,70E-
04
sifat
7,97E-
05
urutan_tindak
an
2,15E-
04
9sifat.txt sifat kondisi
giliran 4,54E-55
FALSE
komunikasi
8,88E-
55
kondisi 4,76E-54
sifat
1,16E-
55
urutan_tindak
an
3,38E-
54
9urutanTindakan.t
xt
urutan_tindak
an kondisi
giliran 2,20E-13
FALSE
komunikasi
4,20E-
14
kondisi 1,73E-12
sifat
5,86E-
14
urutan_tindak
an
1,18E-
11
Total Akurasi 40
2.2. Pengambilan 6 Dokumen dengan nilai Conditional Probability
tertinggi
2.2.1. Data Kategori Giliran
No GILIRAN
Conditional
Probability
1 3giliran.txt 5,36E+11
2 22giliran.txt 4,04E-02
3 10giliran.txt 3,21E-07
4 6giliran.txt 3,21E-07
5 4giliran.txt 2,62E-07
6 18giliran.txt 7,97E-09
7 23giliran.txt 2,01E-09
8 16giliran.txt 6,39E-10
9 12giliran.txt 7,27E-11
10 17giliran.txt 2,38E-12
2.2.2. Data Kategori Komunikasi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 110
94
No KOMUNIKASI Conditional Probability
1 12komunikasi.txt 2,85E-03
2 1komunikasi.txt 1,23E-04
3 8komunikasi.txt 3,17E-08
4 7komunikasi.txt 1,71E-12
5 11komunikasi.txt 8,15E-14
6 9komunikasi.txt 1,22E-14
7 15komunikasi.txt 2,71E-20
8 5komunikasi.txt 3,19E-21
9 10komunikasi.txt 2,36E-23
10 14komunikasi.txt 4,86E-24
2.2.3. Data Kategori Kondisi
No KONDISI
Conditional
Probability
1 26kondisi.txt 1,49E+09
2 23kondisi.txt 2,08E+04
3 17kondisi.txt 1,88E+04
4 25kondisi.txt 3,48E+00
5 19kondisi.txt 3,22E+00
6 10kondisi.txt 8,74E-03
7 11kondisi.txt 7,42E-03
8 9kondisi.txt 4,70E-04
9 28kondisi.txt 2,03E-04
10 12kondisi.txt 3,81E-05
2.2.4. Data Kategori Sifat
No SIFAT
Conditional
Probability
1 7sifat.txt 4,50E-15
2 11sifat.txt 2,71E-15
3 8sifat.txt 7,10E-17
4 5sifat.txt 7,52E-24
5 3sifat.txt 1,71E-25
6 12sifat.txt 5,49E-28
7 10sifat.txt 7,92E-43
8 6sifat.txt 4,20E-50
9 4sifat.txt 2,44E-55
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 111
95
10 9sifat.txt 1,16E-55
2.2.5. Data Kategori Urutan Tindakan
No URUTAN_TINDAKAN
Conditional
Probability
1 14urutanTindakan.txt 3,62E-03
2 5urutanTindakan.txt 3,50E-03
3 7urutanTindakan.txt 4,06E-09
4 3urutanTindakan.txt 2,41E-09
5 17urutanTindakan.txt 9,47E-11
6 9urutanTindakan.txt 1,18E-11
7 6urutanTindakan.txt 1,67E-12
8 19urutanTindakan.txt 8,57E-14
9 11urutanTindakan.txt 7,16E-18
10 4urutanTindakan.txt 1,40E-22
3. Pengujian 3
3.1. Tabel pengujian 3
Dokumen Status Awal Status Sistem P(Tk|C) Nilai
Akura
si (%)
TAHAP 1
10giliran.txt giliran giliran
giliran 1,13E-03 TRUE
40
komunikasi
6,15E-
05
kondisi 6,05E-05
sifat
3,60E-
06
urutan_tindak
an
1,02E-
05
11komunikasi.txt komunikasi kondisi
giliran 4,34E-10
FALSE
komunikasi
2,49E-
09
kondisi 9,34E-10
sifat
6,93E-
11
urutan_tindak
an
2,49E-
09
10kondisi.txt kondisi kondisi
giliran 6,02E-01 TRUE
komunikasi
4,22E+0
0
kondisi 9,80E-01
sifat
1,87E+0
0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 112
96
urutan_tindak
an
4,22E+0
0
11sifat.txt sifat urutan_tindak
an
giliran 2,25E-11
FALSE
komunikasi
1,23E-
12
kondisi 5,19E-13
sifat
1,22E-
13
urutan_tindak
an
7,35E-
12
14urutanTindakan.t
xt
urutan_tindak
an kondisi
giliran 6,02E-01
FALSE
komunikasi
4,22E+0
0
kondisi 9,80E-01
sifat
1,87E-
01
urutan_tindak
an
4,22E+0
0
TAHAP 2
18giliran.txt giliran giliran
giliran
3,53E-
06 TRUE
40
komunikasi
2,48E-
07
kondisi
8,37E-
08
sifat
2,44E-
07
urutan_tindak
an
3,43E-
08
12komunikasi.txt komunikasi kondisi
giliran
4,22E-
01
FALS
E
komunikasi 2,56E-01
kondisi
6,02E-
01
sifat 1,56E+00
urutan_tindakan
3,22E-01
17kondisi.txt kondisi giliran
giliran
9,75E+0
5
FALS
E
komunikasi 2,44E+05
kondisi
2,24E+0
5
sifat 8,55E+03
urutan_tindakan
1,43E+05
12sifat.txt sifat sifat
giliran
3,55E-
23 TRUE
komunikasi 1,06E-23
kondisi
1,68E-
22
sifat 4,57E-24
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 113
97
urutan_tindak
an
7,37E-
25
17urutanTindakan.t
xt
urutan_tindak
an kondisi
giliran 5,05E-07
FALSE
komunikasi
4,95E-
09
kondisi 8,37E-08
sifat
1,22E-
08
urutan_tindak
an
6,86E-
08
TAHAP 3
22giliran.txt giliran kondisi
giliran
2,86E-
01
FALS
E
40
komunikasi
5,65E-
01
kondisi
1,07E+0
0
sifat
1,66E+0
0
urutan_tindakan
3,33E+00
1komunikasi.txt komunikasi kondisi
giliran
2,00E-
02
FALS
E
komunikasi
2,63E-
02
kondisi
3,53E-
03
sifat
7,15E-
04
urutan_tindak
an
1,59E-
02
19kondisi.txt kondisi kondisi
giliran
8,32E+0
1 TRUE
komunikasi 6,07E+00
kondisi
1,28E+0
3
sifat 1,15E+03
urutan_tindakan
7,00E+01
3sifat.txt sifat sifat
giliran
3,27E-
24 TRUE
komunikasi 2,68E-25
kondisi
1,09E-
22
sifat 1,06E-21
urutan_tindakan
2,00E-23
3urutanTindakan.txt
urutan_tindakan
kondisi
giliran
9,81E-
07
FALS
E
komunikasi 6,11E-05
kondisi
1,86E-
04
sifat 1,85E-04
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 114
98
urutan_tindak
an
7,55E-
06
TAHAP 4
3giliran.txt giliran urutan_tindak
an
giliran 1,27E+12
FALSE
20
komunikasi
1,25E+1
2
kondisi 1,52E+11
sifat
1,02E+1
2
urutan_tindak
an
2,50E+1
1
7komunikasi.txt komunikasi giliran
giliran
2,20E-
13
FALS
E
komunikasi
1,97E-
11
kondisi
1,56E-
11
sifat
2,97E-
12
urutan_tindakan
9,86E-13
23kondisi.txt kondisi urutan_tindak
an
giliran
1,25E+0
4
FALS
E
komunikasi
1,19E+0
5
kondisi
1,92E+0
5
sifat
7,23E+0
3
urutan_tindak
an
3,57E+0
5
5sifat.txt sifat giliran
giliran
2,15E-
18
FALS
E
komunikasi 4,69E-20
kondisi
1,97E-
18
sifat 8,39E-20
urutan_tindakan
4,69E-20
5urutanTindakan.tx
t
urutan_tindak
an
urutan_tindak
an
giliran
1,22E-
02 TRUE
komunikasi 1,13E-03
kondisi
2,44E-
03
sifat 1,02E-02
urutan_tindakan
9,07E-04
TAHAP 5 4giliran.txt giliran giliran
giliran
7,70E-
06 TRUE
80 komunikasi
3,27E-
08
kondisi
8,70E-
07
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 115
99
sifat
1,17E-
07
urutan_tindakan
4,15E-08
8komunikasi.txt komunikasi kondisi
giliran
2,45E-
04
FALS
E
komunikasi 6,94E-06
kondisi
4,09E-
05
sifat 2,74E-05
urutan_tindakan
8,60E-06
25kondisi.txt kondisi kondisi
giliran
9,66E+0
1 TRUE
komunikasi 6,61E+00
kondisi
1,36E+0
3
sifat 3,56E+02
urutan_tindakan
7,63E+01
7sifat.txt sifat sifat
giliran
1,56E-
11 TRUE
komunikasi 7,28E-13
kondisi
6,16E-
12
sifat 1,52E-10
urutan_tindak
an
9,69E-
13
7urutanTindakan.txt
urutan_tindakan
urutan_tindakan
giliran
1,23E-
06 TRUE
komunikasi
3,27E-
09
kondisi
1,09E-
06
sifat
2,34E-
07
urutan_tindak
an
1,66E-
06
TAHAP 6
6giliran.txt giliran giliran
giliran 1,08E-03 TRUE
40
komunikasi
1,02E-
05
kondisi 4,73E-05
sifat
6,93E-
06
urutan_tindak
an
1,17E-
05
9komunikasi.txt komunikasi giliran
giliran 4,22E-11
FALSE
komunikasi
2,45E-
12
kondisi 3,73E-12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 116
100
sifat
2,88E-
12
urutan_tindakan
1,46E-11
26kondisi.txt kondisi kondisi
giliran
8,22E+0
8 TRUE
komunikasi 7,17E+08
kondisi
9,48E+0
8
sifat 5,00E+08
urutan_tindakan
7,50E+08
8sifat.txt sifat kondisi
giliran
2,11E-
11
FALS
E
komunikasi 1,23E-11
kondisi
3,73E-
11
sifat 5,77E-15
urutan_tindakan
1,46E-11
9urutanTindakan.txt
urutan_tindakan
kondisi
giliran
4,10E-
11
FALS
E
komunikasi 2,49E-10
kondisi
2,76E-
08
sifat 6,61E-12
urutan_tindak
an
1,17E-
08
Total Akurasi 43.33
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 117
101
Lampiran 2 ListCode Program
Implementasi Pemotongan Kalimat
Proses ini berfungsi untuk melakukan pemotongan kalimat yang
mengandung sabar.
private void nKlimat(ArrayList<Word>words) {
boolean adaAwalParagraf = false;
int awalKalimat = 0;
int akhirKalimat = 0;
boolean adaAkhirKalimat = false;
int counter = 0;
int pointAwal;
int pointAkhir;
int len = words.size();
for (int i = 0; i < len; i++) {
if (!adaAwalParagraf) {
awalKalimat = i;
adaAwalParagraf = true;
counter++;
} else {
if (!adaAkhirKalimat) {
if ((words.get(i).getKata().contains(".")) || (i == len - 1)) {
akhirKalimat = i;
adaAkhirKalimat = true;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 118
102
}
} else {
awalKalimat = akhirKalimat + 1;
counter++;
adaAkhirKalimat = false;
}
}
if (adaAkhirKalimat) {
if (adaSabar(awalKalimat, akhirKalimat,words)) {
if (counter == 1) {
//sabar di awal Kategori
int pend = counter + 3;
potongKalimat(0, kalimatPendukung(pend, false,words),
1,words);
} else {
if (akhirKalimat != len - 1) {
int pend1 = counter - 1;
int pend2 = counter + 2;
potongKalimat(kalimatPendukung(pend1, true,words),
kalimatPendukung(pend2, false,words), 2,words);
} else {
//sabar di akhir Kategori
int pend = counter - 2;
potongKalimat(kalimatPendukung(pend, true,words), 0,
3,words);
}
}
}
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 119
103
}
private void potongKalimat(int index1, int index2, int letak,
ArrayList<Word> words) {
int lenW = words.size();
ArrayList<Word> temWord = new ArrayList<>();
for (int i = 0; i < lenW; i++) {
temWord.add(words.get(i));
}
if (letak == 1) {
//Untuk KALIMAT DIDEPAN
int len = (temWord.size() - 1) - index2;
for (int i = 0; i < len; i++) {
temWord.remove(index2 + 1);
}
} else if (letak == 2) {
//Untuk KALIMAT DITENGAH..
int len = (temWord.size() - 1) - index2;
for (int i = 0; i < len; i++) {
temWord.remove(index2 + 1);
}
if (index1 != 0) {
for (int j = 0; j < index1; j++) {
temWord.remove(0);
}
}
} else {
//Untuk KALIMAT DIBELAKANG
for (int j = 0; j < index1; j++) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 120
104
temWord.remove(0);
}
}
Kalimat kal = new Kalimat(temWord, status);
getKalimats().add(kal);
}
Implementasi Baca Data
Proses ini berfungsi untuk membaca data dan memasukan
ke ArrayList.
private void readFile(String fileName) {
ArrayList<Word> words = new ArrayList<>();
String currentLine;
BufferedReader br = null;
try {
br = new BufferedReader(new FileReader(fileName));
while ((currentLine = br.readLine()) != null) {
pecahKata(currentLine, words);
}
nKlimat(words);
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (br != null) {
br.close();
}
} catch (IOException ex) {
Logger.getLogger(NaiveBayesRevisi.class.getName()).log(Level.SEVERE
, null, ex);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 121
105
}
}
}
private void pecahKata(String kalimat, ArrayList words) {
String[] temp;
temp = kalimat.split(" ");
for (String kata : temp) {
Word w = new Word(kata.toLowerCase());
words.add(w);
}
}
Implementasi Stopword Filtering
Proses ini adalah untuk melakukan proses penghapusan stop
word atau penghapusan kata yang dianggap tidak penting.
public static ArrayList<Word> hapusStopWord(ArrayList<Word> words) {
int len = words.size();
int len2 = stopWord.size();
for (int i = 0; i < len; i++) {
for (int j = 0; j < len2; j++) {
if (words.get(i).getKata().equals(stopWord.get(j))) {
words.remove(i);
i--;
len--;
break;
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 122
106
}
return words;
}
Implementasi Stemming
Proses ini adalah untuk melakukan proses pengembalian
kata ke kata dasarnya.
public static String Stem(String kata) {
if (sudahKataDasar(kata)) {
return kata;
}
if (kataBerulang(kata)) {
int pemisah = kata.indexOf("-");
String kata1 = kata.substring(0, pemisah);
String kata2 = kata.substring(pemisah + 1, kata.length());
if (kata1.equals(kata2)) {
if (sudahKataDasar(kata2)) {
return kata2;
}
kata2 = Del_Inflection_Suffix(kata2);
kata2 = Del_Derivation_Suffixes(kata2);
kata2 = Del_Derivation_Prefix(kata2);
return kata2;
} else {
if (!sudahKataDasar(kata1)) {
kata1 = Del_Inflection_Suffix(kata1);
kata1 = Del_Derivation_Suffixes(kata1);
kata1 = Del_Derivation_Prefix(kata1);
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 123
107
if (!sudahKataDasar(kata2)) {
kata2 = Del_Inflection_Suffix(kata2);
kata2 = Del_Derivation_Suffixes(kata2);
kata2 = Del_Derivation_Prefix(kata2);
}
if (kata1.equals(kata2)) {
return kata2;
}
}
}
kata = Del_Inflection_Suffix(kata);
kata = Del_Derivation_Suffixes(kata);
kata = Del_Derivation_Prefix(kata);
return kata;
}
public static String Del_Inflection_Suffix(String kata) {
int len = particles.length;
for (int i = 0; i < len; i++) {
int lenAkhir = particles[i].length();
int lenAwal = kata.length() - lenAkhir;
if (lenAwal > 0) {
if (potongKata(kata, lenAwal).equals(particles[i])) {
String kataBaru = kata.substring(0, lenAwal);
if (particles[i].equals("lah") || particles[i].equals("kah")
|| particles[i].equals("tah") || particles[i].equals("pun")) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 124
108
kataBaru = Del_PPronoun(kataBaru);
return kataBaru;
}
String kataBaru2 = Del_Derivation_Prefix(kata);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
tempWord = null;
return kataBaru;
}
}
}
return kata;
}
public static String Del_PPronoun(String kata) {
String kataBaru;
int len = pPronouns.length;
for (int i = 0; i < len; i++) {
int lenAkhir = pPronouns[i].length();
int lenAwal = kata.length() - lenAkhir;
if (lenAwal > 0) {
if (potongKata(kata, lenAwal).equals(pPronouns[i])) {
kataBaru = kata.substring(0, lenAwal);
return kataBaru;
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 125
109
}
return kata;
}
public static String Del_Derivation_Suffixes(String kata) {
adaDSuffixDihapus = false;
int len = dSuffixs.length;
for (int i = 0; i < len; i++) {
int lenAkhir = dSuffixs[i].length();
int lenAwal = kata.length() - lenAkhir;
if (lenAwal > 0) {
if (potongKata(kata, lenAwal).equals(dSuffixs[i])) {
String kataBaru = kata.substring(0, lenAwal);
//System.out.println("JADI " + kataBaru);
adaDSuffixDihapus = true;
if (sudahKataDasar(kataBaru)) {
return kataBaru;
} else if ("an".equals(dSuffixs[i])) {
if (kataBaru.charAt(kataBaru.length() - 1) == 'k') {
kataBaru = potongKata(kataBaru, 0, kataBaru.length() - 1);
//System.out.println("JADI " + kataBaru);
if (sudahKataDasar(kataBaru)) {
return kataBaru;
}
}
}
}
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 126
110
return kata;
}
public static String Del_Derivation_Prefix(String kata) {
String awal2 = potongKata(kata, 0, 2);
String kataBaru = kata;
String bAwal2;
String kataBaru2 = null;
if (adaDSuffixDihapus) {
if (awalAkhirTdkDiijinkan(kata)) {
if (sudahKataDasar(kata)) {
return kata;
}
}
}
for (int i = 1; i <= 3; i++) {
if (tempWord != null) {
kataBaru = tempWord;
}
bAwal2 = potongKata(kataBaru, 0, 2);
if (bAwal2.equals("di") || bAwal2.equals("ke") ||
bAwal2.equals("se")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 127
111
}
}
if (bAwal2.equals("te")) {
if (potongKata(kataBaru, 2, 3).equals("r")) {
if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else {
if (potongKata(kataBaru, 4, 6).equals("er")
&& isVowel(potongKata(kataBaru, 6, 7))) {
if (!"r".equals(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
} else {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 128
112
if (!"er".equals(potongKata(kataBaru, 4, 6))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
}
} else if (!isVowel(potongKata(kataBaru, 2, 3))
&& potongKata(kataBaru, 3, 5).equals("er")
&& !isVowel(potongKata(kataBaru, 5, 6))) {
if (!"r".equals(potongKata(kataBaru, 2, 3))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
}
if (bAwal2.equals("me")) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 129
113
if ((potongKata(kataBaru, 2, 3).equals("l") || potongKata(kataBaru,
2, 3).equals("r")
|| potongKata(kataBaru, 2, 3).equals("w") ||
potongKata(kataBaru, 2, 3).equals("y"))
&& isVowel(kata.substring(3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (potongKata(kataBaru, 2, 3).equals("m")) {
if (potongKata(kataBaru, 3, 4).equals("b") ||
potongKata(kataBaru, 3, 4).equals("f")
|| potongKata(kataBaru, 3, 4).equals("v")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (potongKata(kataBaru, 3, 5).equals("pe")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if ((potongKata(kataBaru, 3, 4).equals("r")
&& isVowel(potongKata(kataBaru, 4, 5)))
|| isVowel(potongKata(kataBaru, 3, 4))) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 130
114
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
// Direplace ------------
kataBaru2 = potongKata(kataBaru, 2);
kataBaru2 = replaceDepan(kataBaru2, 1, "p");
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
tempWord = kataBaru2;
} else if (potongKata(kataBaru, 3, 4).equals("p")) {
if (!"e".equals(potongKata(kataBaru, 4, 5))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 131
115
} else if (potongKata(kataBaru, 2, 3).equals("n")) {
if (potongKata(kataBaru, 3, 4).equals("c") ||
potongKata(kataBaru, 3, 4).equals("d")
|| potongKata(kataBaru, 3, 4).equals("j") ||
potongKata(kataBaru, 3, 4).equals("s")
|| potongKata(kataBaru, 3, 4).equals("z")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
// Replace -----
kataBaru2 = potongKata(kataBaru, 2);
kataBaru2 = replaceDepan(kataBaru2, 1, "t");
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 132
116
tempWord = kataBaru2;
} else if (potongKata(kataBaru, 3, 4).equals("g")) {
if (potongKata(kataBaru, 4, 5).equals("g") ||
potongKata(kataBaru, 4, 5).equals("h")
|| potongKata(kataBaru, 4, 5).equals("q") ||
potongKata(kataBaru, 4, 5).equals("k")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 4,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (isVowel(potongKata(kataBaru, 4, 5))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 4,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
// Replace ----------------------
kataBaru2 = potongKata(kataBaru, 4);
kataBaru2 = "k" + kataBaru2;
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 133
117
tempWord = null;
return kataBaru2;
}
tempWord = kataBaru2;
if (potongKata(kataBaru, 4, 5).equals("e")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 5,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
} else if (potongKata(kataBaru, 3, 4).equals("y") &&
isVowel(potongKata(kataBaru, 4, 5))) {
// Replace -----------
kataBaru2 = potongKata(kataBaru, 4);
kataBaru2 = "s" + kataBaru2;
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
tempWord = kataBaru2;
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 134
118
}
if (bAwal2.equals("be")) {
if (potongKata(kataBaru, 2, 3).equals("r")) {
if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (!isVowel(potongKata(kataBaru, 3, 4))) {
if (!"r".equals(potongKata(kataBaru, 3, 4))
&& !"er".equals(potongKata(kataBaru, 5, 7))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (!"r".equals(potongKata(kataBaru, 3, 4))
&& "er".equals(potongKata(kataBaru, 5, 7))
&& isVowel(potongKata(kataBaru, 7, 8))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 135
119
tempWord = null;
return kataBaru2;
}
}
}
} else if (kataBaru.equals("belajar")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (!isVowel(potongKata(kataBaru, 2, 3)) &&
potongKata(kataBaru, 3, 5).equals("er")
&& !isVowel(potongKata(kataBaru, 5, 6))) {
if (!potongKata(kataBaru, 2, 3).equals("r") ||
!potongKata(kataBaru, 2, 3).equals("l")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
}
if (bAwal2.equals("pe")) {
if ((potongKata(kataBaru, 2, 3).equals("w") ||
potongKata(kataBaru, 2, 3).equals("y"))
&& isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 136
120
tempWord = null;
return kataBaru2;
}
} else if (potongKata(kataBaru, 2, 3).equals("r")) {
if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (!isVowel(potongKata(kataBaru, 3, 4))) {
if (!potongKata(kataBaru, 3, 4).equals("r")) {
if (!potongKata(kataBaru, 5, 7).equals("er")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (potongKata(kataBaru, 5, 7).equals("er")
&& isVowel(potongKata(kataBaru, 7, 8))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 137
121
}
}
}
}
} else if (potongKata(kataBaru, 2, 3).equals("m")) {
if (potongKata(kataBaru, 3, 4).equals("b") ||
potongKata(kataBaru, 3, 4).equals("f")
|| isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if ((potongKata(kataBaru, 3, 4).equals("r") &&
isVowel(potongKata(kataBaru, 4, 5)))
|| isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
//Replace ---
kataBaru2 = potongKata(kataBaru, 2);
kataBaru2 = replaceDepan(kataBaru2, 1, "p");
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 138
122
return kataBaru2;
}
}
} else if (potongKata(kataBaru, 2, 3).equals("n")) {
if (potongKata(kataBaru, 3, 4).equals("c") ||
potongKata(kataBaru, 3, 4).equals("d")
|| potongKata(kataBaru, 3, 4).equals("j") ||
potongKata(kataBaru, 3, 4).equals("z")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
//Replace ----
kataBaru2 = potongKata(kataBaru, 2);
kataBaru2 = replaceDepan(kataBaru2, 1, "t");
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 139
123
} else if (potongKata(kataBaru, 3, 4).equals("g")) {
if (!isVowel(potongKata(kataBaru, 4, 5))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 4,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
} else if (isVowel(potongKata(kataBaru, 4, 5))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 4,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
// Replace ---
kataBaru2 = potongKata(kataBaru, 4);
kataBaru2 = "k" + kataBaru2;
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
tempWord = kataBaru2;
if (!potongKata(kataBaru, 4, 5).equals("e")) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 140
124
kataBaru2 = hapusDepanBelakang(kataBaru2, 5,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
} else if (potongKata(kataBaru, 3, 4).equals("y")) {
if (isVowel(potongKata(kataBaru, 4, 5))) {
// Replace ---
kataBaru2 = potongKata(kataBaru, 4);
kataBaru2 = "s" + kataBaru2;
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
kataBaru2 = Del_Derivation_Suffixes(kataBaru2);
if (sudahKataDasar(kataBaru2)) {
tempWord = null;
return kataBaru2;
}
tempWord = kataBaru2;
}
}
} else if (potongKata(kataBaru, 2, 3).equals("l")) {
if (kataBaru.equals("pelajar")) {
tempWord = null;
return "ajar";
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 141
125
if (isVowel(potongKata(kataBaru, 3, 4))) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
} else if (!isVowel(potongKata(kataBaru, 2, 3))) {
if (potongKata(kataBaru, 3, 5).equals("er")
&& isVowel(potongKata(kataBaru, 5, 6))) {
if (!potongKata(kataBaru, 2, 3).equals("r") ||
!potongKata(kataBaru, 2, 3).equals("w")
|| !potongKata(kataBaru, 2, 3).equals("y") ||
!potongKata(kataBaru, 2, 3).equals("l")
|| !potongKata(kataBaru, 2, 3).equals("m") ||
!potongKata(kataBaru, 2, 3).equals("n")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 3,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
} else if (!potongKata(kataBaru, 3, 5).equals("er")) {
if (!potongKata(kataBaru, 2, 3).equals("r") ||
!potongKata(kataBaru, 2, 3).equals("w")
|| !potongKata(kataBaru, 2, 3).equals("y") ||
!potongKata(kataBaru, 2, 3).equals("l")
|| !potongKata(kataBaru, 2, 3).equals("m") ||
!potongKata(kataBaru, 2, 3).equals("n")) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 142
126
kataBaru2 = hapusDepanBelakang(kataBaru2, 2,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
} else if (potongKata(kataBaru, 3, 5).equals("er")
&& !isVowel(potongKata(kataBaru, 5, 6))) {
if (!potongKata(kataBaru, 2, 3).equals("r") ||
!potongKata(kataBaru, 2, 3).equals("w")
|| !potongKata(kataBaru, 2, 3).equals("y") ||
!potongKata(kataBaru, 2, 3).equals("l")
|| !potongKata(kataBaru, 2, 3).equals("m") ||
!potongKata(kataBaru, 2, 3).equals("n")) {
kataBaru2 = hapusDepanBelakang(kataBaru2, 2,
kataBaru);
if (kataBaru2 != null) {
tempWord = null;
return kataBaru2;
}
}
}
}
}
}
tempWord = null;
return kata;
}
Implementasi Hitung TF
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 143
127
Proses ini adalah untuk melakukan penghitungan tf
(term frequency).
private void hitungTf(){
int len= words.size();
for(int i=0;i<len;i++){
int count=1;
for(int j=i+1;j<len;j++){
if(words.get(i).getKata().toString().equals(words.get(j).getKata().toString(
))){
count++;
words.remove(words.get(j));
j--;
len--;
}
else{
}
}
words.get(i).setTf(count);
System.out.println("kata "+words.get(i).getKata().toString()+" tf =
"+count);
}
}
Implementasi Hitung Jumlah Total Data Training
public void hitungN() {
float count = 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 144
128
int len = getTraining().size();
for (int i = 0; i < len; i++) {
count = count + getTraining().get(i).getKalimats().size();
}
this.N = count;
}
Implementasi Hitung Prior Probability
public void hitungPriorProbability() {
int len3 = getKategori().length;
int len = getTraining().size();
for (int k = 0; k < len3; k++) {
float count = 0;
for (int i = 0; i < len; i++) {
int len2 = getTraining().get(i).getKalimats().size();
for (int j = 0; j < len2; j++) {
if
(getTraining().get(i).getKalimats().get(j).getStatus().equals(getKategori()[
k])) {
count++;
}
}
}
getPriorProbability()[k] = count / N;
}
}
Implementasi Hitung Conditional Probability
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 145
129
public void hitungConditionalProbaliblity() {
int len = getKategori().length;
int len2 = getTesting().size();
float[] temCon;
for (int j = 0; j < len2; j++) {
int len3 = getTesting().get(j).getKalimats().size();
System.out.println(getTesting().get(j).getNamaDokumen());
for (int k = 0; k < len3; k++) {
int len4 =
getTesting().get(j).getKalimats().get(k).getWord().size();
System.out.println("kalimat ke "+k);
for (int l = 0; l < len4; l++) {
temCon = new float[len];
for (int i = 0; i < len; i++) {
float conProb =
(getTct(getTesting().get(j).getKalimats().get(k).getWord().get(l).getKata().
toString(), i) + 1) / (getEVct()[i] + B);
temCon[i] = conProb;
System.out.println("CON PROB "+kategori[i]+"
"+getTesting().get(j).getKalimats().get(k).getWord().get(l).getKata().toStri
ng()+" : "+
"("+getTct(getTesting().get(j).getKalimats().get(k).getWord().get(l).getKat
a().toString(), i)+" + " + 1 +") / "+
"("+getEVct()[i]+"+"+B+") = "+conProb);
}
getTesting().get(j).getKalimats().get(k).getWord().get(l).setConditionalPro
b(temCon);
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 146
130
}
}
}
}
Implementasi Hitung Peluang
public void startClassificasion() {
int lenKategori = getKategori().length;
int lenTesting = getTesting().size();
for (int j = 0; j < lenTesting; j++) {
double temPel;
double[] peluang = new double[lenKategori];
double max = 0;
int indexMax = 0;
int lenKalimat = getTesting().get(j).getKalimats().size();
for (int k = 0; k < lenKalimat; k++) {
for (int i = 0; i < lenKategori; i++) {
int lenKata =
getTesting().get(j).getKalimats().get(k).getWord().size();
double sumConProb = 1;
for (int l = 0; l < lenKata; l++) {
sumConProb = sumConProb *
getTesting().get(j).getKalimats().get(k).getWord().get(l).getConditionalPr
ob(i);
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 147
131
System.out.println("sumConProb kata "+kategori[i]+" = " +
sumConProb);
temPel = getPriorProbability()[i] * sumConProb;
peluang[i] = temPel;
}
for (int m = 0; m < peluang.length; m++) {
System.out.println("peluang " + getKategori()[m] + " = " +
peluang[m]);
if (peluang[m] > max) {
max = peluang[m];
indexMax = m;
}
}
getTesting().get(j).getKalimats().get(k).setDinStatus(getKategori()[index
Max]);
System.out.println("Dokumen testing " +
getTesting().get(j).getNamaDokumen() + " kalimat " + k + " masuk ke " +
getTesting().get(j).getKalimats().get(k).getDinStatus());
System.out.println("Dengan status awal :
"+getTesting().get(j).getKalimats().get(k).getStatus());
}
}
}
Implementasi Penghitungan Akurasi
Implementasi Membagi Data Dalam Fold
Proses ini adalah untuk membaca data training dan memasukannya
ke dalam Hashtable fold sesuai dengan jumlah data per fold yang telah
ditetapkan melalui input.
public void readFold(String dirTraining) {
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 148
132
setFolds(new Hashtable());
Fold fold;
NaiveBayes nb;
File file = new File(dirTraining);
File[] listFile = file.listFiles();
int lenList = listFile.length;
int index=0;
int cekpoint = 0;
for (int i = 0; i < n; i++) {
fold = new Fold();
System.out.println("MASUK DI FOLD " + i);
nb = new NaiveBayes();
ArrayList<Kategori> training = new ArrayList<>();
String[] kategori = new String[lenList];
for (int j = 0; j < lenList; j++) {
if (listFile[j].isDirectory()) {
//DIREKTORI
String namaPath = listFile[j].getName();
kategori[j] = namaPath;
String dir2 = dirTraining + namaPath + "\\";
File file2 = new File(dir2);
File[] listFile2 = file2.listFiles();
int lenList2 = listFile2.length;
int loop = 0;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 149
133
for (int k = cekpoint; k < lenList2; k++) {
if (listFile2[k].isFile()) {
//FILE
if (loop < dataPerFold[index]) {
String namaPath2 = listFile2[k].getName();
System.out.println(namaPath2);
training.add(new Kategori(dir2 + namaPath2,
namaPath2, namaPath));
} else {
break;
}
loop++;
if (j == (lenList - 1)) {
cekpoint = k + 1;
}
}
}
index++;
}
}
fold.setTraining(training);
fold.setKategori(kategori);
getFolds().put("fold" + i, fold);
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 150
134
Implementasi Klasifikasi Data Tiap Tahapan Akurasi
Proses ini adalah untuk melakukan klasifikasi data tiap tahap
sesuai dengan jumlah fold. Dari hasil akurasi kemudian dihitung jumlah
yang terklasifikasi dengan benar(status awal sama dengan status hasil
klasifikasi), kemudian ditotal dan dibagi dengan jumlah total data training
untuk menentukan akurasi di setiap tahap, dan kemudian ditampilkan
hasilnya sebagai akurasi tiap tahap.
public void klasifikasi() {
double sumAkurasi = 0;
NaiveBayes nb = new NaiveBayes();
int lenFold = getFolds().size();
akurasiPerFold = new double[lenFold];
for (int h = 0; h < lenFold; h++) {
//PERCOBAAN FOLD KE H
ArrayList<Kategori> training;
ArrayList<Kategori> testing;
testing = new ArrayList<>();
training = new ArrayList<>();
Fold fold = (Fold) getFolds().get("fold" + h);
int lenTesting = fold.getTraining().size();
for (int h1 = 0; h1 < lenTesting; h1++) {
testing.add(fold.getTraining().get(h1));
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 151
135
for (int i = 0; i < lenFold; i++) {
//PENGELOMPOKAN BERDASAR KATEGORI UNTUK
TIAP FOLD
if (i != h) {
Fold fold1 = (Fold) getFolds().get("fold" + i);
int lenTraining = fold1.getTraining().size();
for (int j = 0; j < lenTraining; j++) {
training.add(fold1.getTraining().get(j));
}
}
}
nb.setKategori(fold.getKategori());
nb.setPriorProbability(new float[fold.getKategori().length]);
nb.setEVct(new float[fold.getKategori().length]);
nb.setTraining(training);
nb.setTesting(testing);
nb.hitungN();
nb.hitungPriorProbability();
nb.setEVTct();
nb.setB();
nb.hitungConditionalProbaliblity();
System.out.println("TAHAP " + h);
nb.startClassificasion();
double akurasinya = hitungAkurasi(nb.getTesting());
System.out.println("akurasi TAHAP " + h + " = " + akurasinya);
akurasiPerFold[h] = akurasinya;
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 152
136
sumAkurasi = sumAkurasi + akurasinya;
}
setTotalAkurasi(sumAkurasi / n);
System.out.println("HASIL TOTAL AKURASINYA = " +
totalAkurasi);
}
Implementasi Penghitungan Total Akurasi
Proses ini adalah untuk melakukan penghitungan total
akurasi, dimana semua data yang ada di tiap fold sudah
diklasifikasi dan ditemukan hasil klasifikasinya. Proses ini hampir
sama dengan penghitungan akurasi tiap tahap, namun dalam proses
ini penghitungan dilakukan untuk semua tahap (semua data
training) sehingga diperoleh hasil akurasi total.
public double hitungAkurasi(ArrayList<Kategori> testing) {
double jmlBenar = 0;
double jmlTesting = 0;
int len = testing.size();
for (int i = 0; i < len; i++) {
int len2 = testing.get(i).getKalimats().size();
for (int j = 0; j < len2; j++) {
String status = testing.get(i).getKalimats().get(j).getStatus();
String dinStatus =
testing.get(i).getKalimats().get(j).getDinStatus();
if (status.equals(dinStatus)) {
jmlBenar++;
}
jmlTesting++;
}
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Page 153
137
return (jmlBenar / jmlTesting) * 100;
}
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI