Top Banner
IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh : Klaudius Giri Priyatama 125314095 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2017 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
153

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

May 07, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar

Sarjana Komputer Program Studi Teknik Informatika

Oleh :

Klaudius Giri Priyatama

125314095

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 2: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

i

IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar

Sarjana Komputer Program Studi Teknik Informatika

Oleh :

Klaudius Giri Priyatama

125314095

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 3: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

ii

IDENTIFIED THE MEANING OF SABAR WORD IN INDONESIAN

ARTICLES USING NAIVE BAYES ALGORITHM

SKRIPSI

Presented as Partial Fullfillment of the Requirements to Obtain Sarjana

Komputer Degree in Informatics Engineering Study Program

Written by :

Klaudius Giri Priyatama

125314095

INFORMATICS ENGINEERING STUDY PROGRAM

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2017

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 4: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

iii

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 5: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

iv

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 6: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

v

HALAMAN PERSEMBAHAN

“Sometimes everything is going to be dark in your life, but it doesn’t matter,

you have to walk and believe that you will find the light”

(Lyoto Machida)

“Every teacher once was a student.

Every winner once was a loser.

Every expert once was a beginner.

But all of them have crossed

The bridge called

Learning”

(9gag.com)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 7: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

vi

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan

dalam kutipan dan daftar pustaka sebagaimana layaknya karya ilmiah.

Yogyakarta, 16 Januari 2017

Penulis

Klaudius Giri Priyatama

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 8: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

vii

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata

Dharma:

Nama : Klaudius Giri Priyatama

NIM : 125314095

Demi pengembangan ilmu pengetahuan, saya memberikan kepada

perpustakaan Universitas Sanata Dharma karya ilmiah yang berjudul:

IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya

memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk

menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk

pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di

internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari

saya maupun memberikan royalty kepada saya selama tetap mencantumkan nama

saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yogyakarta, 16 Januari 2017

Yang menyatakan

Klaudius Giri Priyatama

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 9: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

viii

IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES

ABSTRAK

Kesabaran merupakan nilai hidup yang dijunjung tinggi bangsa Indonesia.

Menurut Subandi (2011), kesabaran merupakan ajaran yang dijunjung oleh kelima

agama yang besar di Indonesia (Islam, Kristen, Katolik, Hindu, dan Budha). Lebih

lanjut disebutkan oleh Subandi bahwa dalam Al Qur'an terdapat 44 ayat yang

menggunakan kata sabar dan 14 ayat yang menggunakan kata kesabaran.

Penelusuran dalam Alkitab (Bible) Bahasa Indonesia menunjukkan 70 ayat yang

menunggunakan kata sabar, kesabaran, dan kata lain dengan lema sabar. Subandi

(2011) juga menyebutkan bahwa kesabaran merupakan bahwa kesabaran

merupakan bentuk pengendalian diri yang sangat penting dalam agama Budha dan

agama Hindu.

Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh

Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan klasifikasi atau

pengelompokan makna kata sabar kedalam 6 kategori atau kelompok, yaitu

giliran, kondisi, komunikasi, sifat, pekerjaan, dan urutan tindakan.

Dalam skripsi ini identifikasi makna kata sabar dilakukan dengan

menggunakan algoritma Naive Bayes, yang hasilnya kemudian dibandingkan

dengan hasil penelitian terdahulu oleh ahli untuk mendapatkan akurasi dari

algoritma Naive Bayes dalam klasifikasi makna kata sabar. Hasil akurasi yang

didapat adalah 39.72 % menggunakan data 108 artikel, 40% menggunakan data

50 artikel, dan 43.33% menggunakan data 30 artikel.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 10: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

ix

IDENTIFIED THE MEANING OF SABAR WORD IN INDONESIAN

ARTICLES USING NAIVE BAYES ALGORITHM

ABSTRACT

Kesabaran ‘patience’ is the value of life that hold Indonesian people.

According to Subandi (2011) kesabaran ‘patience’ is a doctrin that been held by

fifth big religions in Indonesia (Islam, Christian, Catholic, Hindu, and Budha).

Furthermore, Subandi said that in Al-Qur’an there are 44 verses use the sabar

‘patient’ word and 14 verses use kesabaran ‘patience’ word. In Bibble that been

translated into Indonesian language, there are 70 verses use patient, kesabaran

‘patience’, and another word that has same meaning with sabar ‘patient’ word.

Subbandi (2011) also said that kesabaran ‘patience’ is same with self controll that

it important in Budhism and Hinduism.

The research to indentified the meaning of sabar ‘patient’ word has been

done by Dwijatmoko, and the result is about grouping the meaning of sabar

‘patient’ word into six group, that is turn, condition, communication,

characteristic, and sequence of actions.

In this thesis, the identification of sabar ‘patient’ word is done by using

Naive Bayes Algorithm, and then compare the result of the system with the result

that according to expert to get the accuration of Naive Bayes Algorithm in

identification the meaning of sabar ‘patient’ word. The results of the system are

39.72% by 108 articles, 40% by 50 articles, and 43.44% by 30 articles.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 11: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

x

KATA PENGANTAR

Puji syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena berkat

kebaikan dan bimbingan-Nya, penulis dapat menyelesaikan tugas akhir yang

berjudul “IDENTIFIKASI MAKNA KATA SABAR DALAM ARTIKEL

BERBAHASA INDONESIA DENGAN ALGORITMA NAIVE BAYES”,

sebagai salah satu syarat memperoleh gelar sarjana komputer program studi

Teknk Informatika, Fakultas Sains dan Teknologi Universitas Sanata Dharma.

Dalam proses penulisan tugas akhir ini, penulis mengucapkan terimakasih

kepada:

1. Kedua orang tua, Bapak Paulus Marjana dan Ibu Yustina Sugiyati

yang selalu mendoakan dan memberikan motivasi kepada penulis.

2. Ibu Sri Hartati Wijono, M.kom. dan Bapak Dr. Benedictus Bherman

Dwijatmoko, M.A. selaku dosen pembimbing yang telah membimbing

penulis dengan sabar sehingga penulis dapat menyelesaikan tugas

akhir ini dengan baik.

3. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T. dan Bapak Albertus

Agung Hadhiatma, M.T. selaku dosen penguji yang telah memberikan

banyak masukan dan perbaikan terhadap tugas akhir ini.

4. Seluruh staff dan dosen program studi Teknik Informatika Universitas

Sanata Dharma yang telah memberikan bimbingan serta pengalaman

selama penulis menempuh studi.

5. Teman-teman seperjuangan Teknik Informatika angkatan 2012 yang

telah berjuang bersama dari awal hingga akhir studi.

6. Semua pihak, baik langsung maupun tidak langsung yang telah

membantu dalam proses penyelesaian tugas akhir ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 12: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

xi

DAFTAR ISI

HALAMAN JUDUL ...................................................................................... i

HALAMAN PERSETUJUAN ....................................................................... iii

HALAMAN PENGESAHAN ........................................................................ iv

HALAMAN PERSEMBAHAN ..................................................................... v

PERNYATAAN KEASLIAN KARYA ......................................................... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI ......................... vii

ABSTRAK ...................................................................................................... viii

KATA PENGANTAR .................................................................................... x

DAFTAR ISI .................................................................................................. xi

DAFTAR GAMBAR ..................................................................................... xiv

DAFTAR TABEL ......................................................................................... xv

DAFTAR POTONGAN PROGRAM ........................................................... xvi

BAB I PENDAHULUAN

1.1. Latar Belakang........................................................................ 1

1.2. Rumusan Masalah .................................................................. 2

1.3. Batasan Masalah ..................................................................... 2

1.4. Tujuan Penelitian .................................................................... 2

1.5. Metodologi Penelitian ............................................................. 3

1.6. Sistematika Penulisan ............................................................. 4

BAB II LANDASAN TEORI

2.1. Information Retrieval ............................................................. 5

2.2. Ideologi Kesabaran ................................................................ 5

2.1.1. Penerimaan Keadaan ................................................. 6

2.2.2. Penantian Giliran ....................................................... 6

2.2.3. Penerimaan Urutan Tindakan .................................... 8

2.2.4. Ketersediaan Menunggu dalam Pembicaraan ........... 9

2.2.5. Sifat Sabar ................................................................. 10

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 13: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

xii

2.2.6. Ketekunan dalam Pekerjaan ..................................... 11

2.3. Teks Prepocessing ................................................................. 12

2.3.1. Tokenizing ................................................................. 12

2.3.2. Stop Word Filtering................................................... 12

2.3.3. Stemming ................................................................... 13

2.3.3.1. Algoritma Nazief Andriani .......................... 13

2.3.4. Menghitung tf .............................................................. 17

2.4. Algoritma Naive Bayes ......................................................... 17

2.4.1. Laplace Smoothing ................................................... 18

2.5. K-fld Cross Validation .......................................................... 18

2.6. Precision ............................................................................... 19

BAB III ANALISIS DAN DESAIN

3.1. Deskripsi Sistem ................................................................. 20

3.2. Data ..................................................................................... 22

3.3. Penyimpanan Data .............................................................. 22

3.4. Struktur Data ....................................................................... 24

3.5. Diagram Kelas Model Naive Bayes..................................... 25

3.6. Diagram Kelas View ........................................................... 27

3.7. Diagram Kelas Keseluruhan ............................................... 28

3.8. Cara Pengujian dan Analisis Hasil ..................................... 29

3.8.1. Pengujian dengan K-Fold Cross Validation .......... 29

3.8.2. Akurasi ................................................................... 31

3.9. Contoh Klasifikasi dengan Algoritma Naive Bayes ........... 31

BAB IV IMPLMENTASI SISTEM

4.1. Spesifikasi Perangkat Keras dan Perangkat Lunak ............. 49

4.2. Implementasi Antar Muka ....................................................49

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 14: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

xiii

4.2.1. Antarmuka Frame Utama ....................................... 49

4.2.2. Antarmuka Frame Klasifikasi ................................ 50

4.2.3. Antarmuka Frame Akurasi .................................... 51

4.3. Implementasi Model Naive Bayes....................................... 53

4.3.1. Implementasi Hitung Tf .......................................... 53

4.3.2. Implementasi Hitung Prior Probability.................. 54

4.3.3. Implementasi Hitung Conditional Probability ...... 55

4.3.4. Implementasi Hitung Peluang ............................... 56

BAB V HASIL DAN PEMBAHASAN

5.1. Skema Pengujian ............................................................... 57

5.2. Analisa Hasil Pengujian ..................................................... 60

BAB VI KASIMPULAN DAN SARAN

6.1. Kesimpulan ........................................................................ 62

6.2. Saran .................................................................................. 62

DAFTAR PUSTAKA ................................................................................ 63

LAMPIRAN 1 ........................................................................................... 64

LAMPIRAN 2 ........................................................................................... 101

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 15: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

xiv

DAFTAR GAMBAR

Gambar 3.1.1. Skema Klasifiaksi ............................................................... 21

Gambar 3.1.2. Skema Penghitungan Akurasi ............................................. 22

Gambar 3.3. Struktur Data ......................................................................... 24

Gambar 3.5. Diagram Kelas Model Naive Bayes ...................................... 25

Gambar 3.6. Diagram Kelas View ............................................................. 27

Gambar 3.7. Diagram Kelas Keseluruhan ................................................. 28

Gambar 4.2.1. Antarmua Frame Utama .................................................... 50

Gambar 4.2.2. Antarmuka Frame Klasifikasi ........................................... 51

Gambar 4.2.3. Antarmuka Frame Akurasi ................................................ 52

Gambar 4.3.1. Flowcart Hitung Tf ............................................................ 53

Gambar 4.3.2. Flowcart Hitung Prior Probability ................................... 54

Gambar 4.3.3. Flowcart Hitung Conditional Probability ........................ 55

Gambar 4.3.4. Flowcart Hitung Peluang ................................................. 56

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 16: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

xv

DAFTAR TABEL

Tabel 2.1. Kombinasi Awalan Akhiran yang Tidak Diijinkan ........................ 14

Tabel 2.2. Aturan Penghapusan Awalan “me-” ............................................... 15

Tabel 2.3. Aturan Penghapusan Awalan “pe-” ................................................ 16

Tabel 2.4. Aturan Penghapusan Awalan “be-“ ................................................ 16

Tabel 2.5. Aturan Penghapusan Awalan “te-“ ................................................. 16

Tabel 5.1.1.1. Pengujian 1 ............................................................................... 57

Tabel 5.1.1.2. Hasil Pengujian 1....................................................................... 58

Tabel 5.1.2.1. Hasil Pengujian 2 ...................................................................... 58

Tabel 5.1.3.1. Hasil Pengujian 3....................................................................... 59

Tabel 5.3.1. Analisa Hasil Pengujian ............................................................... 60

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 17: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

1

BAB I PENDAHULUAN

1.1. Latar Belakang

Informasi merupakan hal yang penting bagi setiap orang. Seseorang

membutuhkan informasi sebagai penunjang untuk pengetahuan sampai

pengambilan keputusan. Kemajuan dunia teknologi di jaman sekarang,

berpengaruh pula dengan pertambahan informasi yang tersedia dan kecepatan

pemerolehan informasi.

Salah satu bentuk informasi adalah dalam bentuk dokumen teks. Dalam

skripsi ini akan dibahas bagaimana mengolah suatu dokumen teks dengan cara

mengidentifikasi dokumen tersebut guna memperoleh informasi termasuk ke

dalam kategori apakah dokumen tersebut.

Metode yang digunakan untuk melakukan identifikasi terhadap dokumen

teks disebut dengan metode klasifikasi. Dalam metode klasifikasi terdapat

beberapa algoritma yang dapat digunakan, dalam skripsi ini akan menggunakan

algoritma Naive Bayes, dimana dalam algoritma ini setiap kesamaan kata yang

ada pada suatu dokumen dicocokan dengan kata pada dokumen yang lain, dan

dihitung probabilitasnya, probabilitas kemiripan antar dokumen yang paling besar

menunjukan letak kategori dari dokumen tersebut.

Algoritma Naive Bayes pernah digunakan untuk klasifikasi dokumen

bahasa jawa, dengan tingkat ketepatan atau akurasi yaitu 77,5 % menggunakan

metode K-Fold Cross Validation dengan 3 fold. (Violya, 2015).

Dalam skripsi ini akan dilakukan identifikasi terhadap makna kata sabar

dalam artikel berbahasa Indonesia. Data yang digunakan adalah dokumen teks

dalam bentuk artikel berbahasa Indonesia yang diambil dari website

www.corci.org dengan jumlah 108 artikel dan telah terbagi kedalam 6 kategori,

yaitu kondisi, komunikasi, sifat, pekerjaan,giliran dan urutan tindakan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 18: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

2

1.2. Rumusan Masalah

Berdasarkan latar belakang diatas, maka dapat dirumuskan rumusan

masalah sebagai berikut :

1. Bagaimana membangun sistem untuk mengidentifikasi makna kata

sabar dalam artikel berbahasa Indonesia menggunakan metode Naïve

Bayes ?

2. Bagaimana akurasi metode Naïve Bayes dalam identifikasi makna

kata sabar dalam artikel berbahasa Indonesia ?

1.3. Batasan Masalah

Batasan masalah dalam pembuatan sistem ini adalah sebagai berikut :

1. Pengklasifikasian menggunakan informasi teks dengan ektensi .txt

2. Algoritma yang digunakan adalah algoritma Naïve Bayes.

3. Klasifikasi dilakukan dengan mengambil 3 kalimat dari sebuah artikel,

yaitu kalimat utama yang mengandung kata kunci sabar, dan 2

kalimat pendukung, yaitu kalimat yang ada di depan kalimat utama

dan kalimat yang berada di belakang kalimat utama.

1.4. Tujuan Penelitian

Tujuan yang ingin dicapai dari penelitian ini adalah :

1. Mengimplementasikan metode Naïve Bayes dalam mengidentifikasi

makna kata sabar dalam artikel.

2. Mengetahui akurasi metode Naïve Bayes dalam identifikasi makna

kata sabar dalam artikel.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 19: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

3

1.5. Metodologi Penelitian

Metodologi penelitian yang digunakan dalam penelitian ini adalah :

1. Studi Literatur

Studi literatur dilakukan dengan mencari informasi tentang

penggunaan metode Naïve Bayes dalam klasifikasi teks dari sumber-

sumber berupa buku, jurnal, maupun website.

2. Pengumpulan data

Pada tahap ini dilakukan pengumpulan data. Data di peroleh dari

situs corci.org (Corpus Of Current Indonesia) yang mana data berupa

kalimat dalam bahasa Indonesia.

3. Perancangan

Pada tahap ini dilakukan perancangan sistem.

4. Pembuatan Sistem

Setelah melakukan perancangan sistem, maka dilanjutkan dengan

pembuatan sistem.

5. Implementasi dan Pengujian

Implementasi sistem dilakukan dengan pengujian terhadap sistem,

yaitu dengan menginputkan teks ke sistem untuk selanjutnya

diklasifikasikan.

6. Evaluasi

Adalah tahap menganalisa hasil implentasi sistem dan membuat

kesimpulan terhadap penelitian yang dilakukan.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 20: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

4

1.6. Sistematika Penulisan

Tugas akhir ini disusun dalam suatu laporan yang dibagi secara sistematis

menjadi 5 bab, adapun ringkasannya sebagai berikut:

Bab 1 Penahuluan, bab ini memuat latar belakang masalah, rumusan masalah,

batsan masalah, tujuan penalitan, metodologi penelitian dan sistematika penulisan.

Bab 2 Tinjauan Pustaka, bab ini menjelaskan berbagai teori yang di

dapatkan dari sumber pustaka maupun sumber lain yang digunakan untuk

penyusunan tugas akhir.

Bab 3 Perancangan Sistem, bab ini menjelaskan proses- proses

perancangan sistem dengan teori yang telah dipilih, berisi perancangan basis

pengetahuan, alur kerja sistem, antar muka pemakai dan perancangan penelitian.

Bab 4 Implementasi dan Analisis Sistem, bab ini memuat hasil pengujian

atau implementasi dan pembahasan atau analisis dari pengujian tersebut.

Bab 5 hasil dan Pembahasan, bab ini berisi anilasa dan hasil dari pengujian

yang dilakukan.

Bab 6 Kesimpulan dan Saran, bab ini berisi kesimpulan yang menguraikan

pernyataan singkat yang dijabarkan dari hasil analisi kegiatan atau riset

implementasi dalam pemyusunan tugas akhir. Saran – saran memuat langkah-

langkah kegiatan dalam riset atau metode pengembangan yang belum dilakukan

namun dirasa akan memperbaiki kinerja sistem jika langkah- langkah tersebut

dilaksanakan pada riset mendatang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 21: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

5

BAB II

LANDASAN TEORI

2.1. Information Retrieval

Adalah suatu konsep mendapatkan kembali informasi yang tersimpan,

penyimpanan, pengorganisasian dan pengaksesan informasi.

Information Retrieval System adalah kegiatan yang bertujuan untuk

menyediakan dan memasok informasi bagi pemakai sebagai jawaban atas

permintaan atau berdasarkan kebutuhan pemakai. Dapat dinyatakan bahwa sistem

temu kembali informasi memiliki fungsi dalam menyediakan kebutuhan informasi

sesuai dengan kebutuhan dan permintaan penggunanya (Sulistyo-Basuki).

2.2. Ideologi Kesabaran

Kesabaran merupakan nilai hidup yang dijunjung tinggi bangsa Indonesia.

Menurut Subandi (2011), kesabaran merupakan ajaran yang dijunjung oleh kelima

agama yang besar di Indonesia (Islam, Kristen, Katolik, Hindu, dan Budha). Lebih

lanjut disebutkan oleh Subandi bahwa dalam Al Qur'an terdapat 44 ayat yang

menggunakan kata sabar dan 14 ayat yang menggunakan kata kesabaran.

Penelusuran dalam Alkitab (Bible) Bahasa Indonesia menunjukkan 70 ayat yang

menunggunakan kata sabar, kesabaran, dan kata lain dengan lema sabar. Subandi

(2011) juga menyebutkan bahwa kesabaran merupakan bahwa kesabaran

merupakan bentuk pengendalian diri yang sangat penting dalam agama Budha dan

agama Hindu.

Penelitian untuk mengetahui arti kesabaran dalam artikel berbahasa

Indonesia pernah dilakukan oleh B.B.Dwijatmoko (2016) dalam Kongres

Internasional Masyarakat Linguistik Indonesia, menggunakan 108 artikel

berbahasa Indonesia yang mengandung kata kunci sabar, kesabaran, bersabar,

penyabar, dan menyabarkan. Dari hasil penelitian tersebut, didapat hasil bahwa

kalimat dengan lema sabar menunjukan 6 (enam) makna, yaitu

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 22: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

6

2.2.1. Penerimaan Keadaan

Arti penerimaan keadaan muncul atas kesadaran pelaku atau

pembicara pada keadaan lawan bicara atau orang lain yang tidak baik

atau jelek. Pelaku atau pembicara karena keadaan itu tidak dapat diubah

lagi dan harus diterima saja atau ditolak.

Data (1) dan (2) berikut menunjukkan penerimaan keadaan pelaku

atau pembicara.

(1) Pun ketika ingin membentuk sebuah kalimat, bingung aku menentukan

tense-nya. Bahasa Inggrisku tak maju-maju.” “Begini, ” kata Lintang

sabar menghadapi ketololanku. Ketika itu ia sedang memaku sandal

cunghai-nya yang menganga seperti buaya lapar.

(2) "… Kamu harus mau menuntun gua, Roy!" Dengan sabar dan telaten,

Roy menuntun sobatnya. Kadangkala kalau Toni kecapekan dan

merasa sakit pada lututnya akibat bergesekan dengan kaki palsunya,

Roy tidak bosan-bosan memompa semangatnya.

Pada data (1) Lintang menunjukkan penerimaannya pada keadaan

temannya yang bahasa Inggrisnya jelek. Lintang menerima ketololan

pembicara dengan sabar. Pada data (2) Roy menerima keadaan Toni yang

memakai kaki palsu. Roy dengan sabar memapah Toni yang kecapekan

dalam menempuh perjalanan yang panjang.

Penerimaan keadaan yang dilakukan oleh Lintang dan Roy

mempunyai latar-balakang yang sama. Pembicara dan Lintang pada data

(1) dan Tony dan Roy merupakan sahabat. Sebagai sahabat mereka

menerima keadaan sahabat mereka, dan sabar menghadapi keadaan yang

tidak mungkin diubah pada sahabat mereka.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 23: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

7

2.2.2. Penantian Giliran

Kesabaran juga muncul pada penantian dari tindakan orang lain.

Pelaku atau pembicara perlu sabar untuk menunggu orang lain selesai

melakukan tindakannya atau menunggu gilirannya.

Arti penantian giliran juga terlihat pada data (3) dan (4).

(3) Penumpang berebut turun. Wajah gadis itu nampak sabar

sekali menunggu luangnya jalan. Joki memberinya kesempatan

untuk lewat.

(4) Rupanya laki-laki itu sudah menggenggam satu-satunya payung

di tangannya. Ia tak sabar menunggu istrinya berpikir. ”Jangan,

Pak. Aku saja.”

Gadis pada data (3) sabar menunggu gilirannya untuk turun. Ia

lebih aman dan nyaman menunggu sampai kesempatan untuk lewat

datang. Pada data (4), laki-laki itu tidak sabar menunggu istrinya

berpikir. Ia ingin segera melakukan apa yang akan ia kerjakan.

Alasan munculnya perilaku kesabaran pada data (3) dan (4)

berbeda. Pada data (3) wanita itu sadar akan keadaan yang ramai. Ia tidak

mungkin langsung berebut turun. Pada data (4), suami itu sudah tidak

sabar menunggu istirnya berpikir. Ia langsung mengambil payung, dan

siap pergi. Dengan ketidak-sabaran itu, ia menunjukkan kekuasaannya

atas istrinya. Kekuasaan itu juga diakui oleh istrinya dengan berkata

"Jangan, Pak. Aku saja (yang pergi)."

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 24: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

8

2.2.3. Penerimaan Urutan Tindakan

Penerimaan urutan tindakan juga merupakan kesabaran. Pelaku

atau pembicara perlu melakukan tindakan sesuai dengan urutannya. Bila

seseorang melakukan tindakan yang tidak sesuai dengan urut-urutannya

menunjukkan ketidak-sabaran orang itu.

Data (5) dan (6) menunjukkan ketidak-sabaran para sapi dan Haji

Sudung.

(5) Kami, delapan ekor sapi, yang akan tampil pada plot kedua,

gemetar menunggu aba-aba dari Mahar untuk menerjang arena.

Kami tak sabar dan rasanya kaki sudah gatal ingin

mendemonstrasikan kehebatan mamalia menari. Kami adalah

remaja-remaja kelebihan energi dan lapar akan perhatian.

(6) Tak satu baju pun yang tertinggal di almari. Seolah-olah Haji

Sudung tak akan kembali lagi ke rumah itu. Malam itu, sambil

mendekap buntalan tasnya, Haji Sudung tak sabar untuk segera

tertidur. Ia ingin berlari memburu pagi.

Karapan atau pacuan kuda mempunyai urut-urutan sendiri. Peserta

karapan harus mengikuti urut-urutan yang ditentukan sebelum mereka

akhirnya dapat berpacu di arena. Sapi-sapi pada data (5) menunjukkan

ketidak-sabarannya untuk mengikuti urutan itu. Demikian juga Haji

Sulung. Ia harus mengemasi barang-barangnya sebelum ia tidur dan

kemudian pergi pada keesokan harinya. Ia ingin segera tidur dan pergi

keesokan harinya.

Sapi-sapi pada data (5) dan Haji Sulung pada data (6) mempunyai

persamaan sifat. Sapi-sapi dan Haji Sulung menunjukkan kekuatan fisik

yang besar. Sapi-sapi itu merupakan "remaja yang kelebihan energi," dan

Haji Sulung "ingin berlari memburu pagi." Kiranya kekuatan fisik dapat

merupakan sebab ketidak-sabaran.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 25: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

9

2.2.4. Ketersedian Menunggu dalam Pembicaraan

Kesaabaran juga mempunyai arti kesediaan menunggu dalam

pembicaraan. Peserta pembicaraan perlu menunggu sampai orang yang

berbicara selesai berbicara sebelum ia memulai bicara. Menyela

pembicaraan merupakan perilaku tidak sabar.

Data (7) dan (8) menunjukkan arti kesabaran yang berkaitan

dengan kesediaan menunggu dalam pembicaraan.

(7) Cun An tercenung sebentar, kelihatannya menyerap omongan

penyamun ini untuk disari-sarikan, tapi setelah itu dengan tak

sabar berkata, "Sudah saya bilang jangan bertele-tele. Katakan

saja tawaranmu itu."

(8) Mamak berhenti sejenak. Kalan semakin tidak sabar. Sebatang

rokok keretek yang ia selai tak cukup mampu untuk

menghilangkan gundahnya. ”Maksud Mamak?

Cun An menunjukkan ketidak-sabarannya dengan memotong

pembicaraan penyamun itu, dan Kalan dengan memotong pembicaraan

Mamak.

Latar belakang ketidak-sabaran Cun An dan Kalan berbeda.

Kalimat Sudah saya bilang jangan bertele-tele. Katakan saja tawaran itu

menunjukkan bahwa Cun An mempunyai kekuatan yang lebih besar

daripada penyamun itu. Cun An tidak takut pada penyamun itu. Berbeda

dengan Cun An, Kalan merasa tidak nyaman untuk melakukan tindakan

yang dapat diartikan tidak sabar. Ia merasa terpaksa harus memotong

pembicaraan mamaknya, orang yang harus dihormatinya. Sebatang rokok

keretek yang ia selai tak cukup mampu untuk menghilangkan gundahnya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 26: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

10

2.2.5. Sifat Sabar

Sifat sabar merupakan sifat baik yang dipunyai oleh orang yang

diidamkan. Sifat itu sejajar dengan sifat-sifat baik yang lain seperti

bijaksana, baik, tabah, dan setia.

Data (9) dan (10) menunjukkan sifat sabar yang dimilik oleh

pelaku, pembiara, atau orang ketiga yang dibicarakan.

(9) Perempuan memang bukan persoalan baginya. Hanya

masalahnya sampai sekarang dia baru bisa memahami seorang

perempuan saja, mamanya, wanita yang sabar, setia, bijaksana,

dan penuh kasih sayang.

(10) ”Kata orangtua saya, sebagai istri saya mesti menghormati

suami, saya tidak boleh membantah kata suami. Hanya orang

yang baik dan sabar yang akan bisa masuk surga.”

Data (9) membicarakan mama pelaku yang mempunyai sifat sabar,

dan data (10) menunjukkan pembicara sendiri yang mempunyai sifat

sabar. Sifat sabar pada data (9) disertai dengan sifat yang baik lainnya

yaitu setia, bijaksana, dan penuh kasih sayang, dan pada data (10) sifat

itu disertai dengan sifat baik.

Pengakuan pelaku bahwa ibu pelaku itu mempunyai sifat sabar

yang belum ia jumpai pada wanita lain pada data (9) dan pengakuan

pembicara bahwa sifat sabarnya ia kembangkan karena kata orangtuanya

menunjukkan peran orang tua dalam penanaman sifat sabar. Mereka

melihat sosok orang tua sebagai orang yang dapat mereka tauladani

dalam kesabaran.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 27: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

11

Akan tetapi perilaku sabar pada data (10) menunjukkan jalan

pemikiran yang berbeda. Kesabaran pada wanita itu merupakan

kesabaran yang dipaksakan. Seorang istri tidak boleh membantah kata

suaminya apapun yang dikatakan suaminya. Bila ia melanggar aturan itu,

ia diancam untuk tidak dapat masuk surga.

2.2.6. Ketekunan dalam Pekerjaan

Arti kesabaran yang terakhir adalah ketekunan dalam pekerjaan.

Orang yang sabar adalah orang yang dapat menghadapi situasi yang sulit

untuk dihadapi atau melakukan pekerjaannya dengan tekun. Ia tidak

mudah menyerah menghadapi keadaan yang sulit dan terus tekun untuk

mencapai tujuannya.

Data (11) dan (12) menunjukkan (ketiadaan) ketabahan dan

ketekunan itu.

(11) "Bagaimana aku bisa sabar, kalau harus membuang tenaga,

waktu, dan pikiran cuma untuk beberapa ratus Indian rupee!"

(12) Uang itu ditolak Emak. Tetapi, setelah dibujuk berulang-ulang

oleh Si Pelukis dengan sabar dan manis, akhirnya uang yang

cukup banyak itu diterima Emak.

Pembicara pada data (11) tidak sabar atau tabah menghadapi

keadaan yang sulit. Ia tidak mau membuang tenaga, waktu, dan

pikirannya karena uang yang diterimanya sangat sedikitnya. Sebaliknya,

Si Pelukis dengan gigih atau tekun terus membujuk ibu pembicara

sehingga wanita itu mau menerima uang yang ingin diberikannya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 28: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

12

Latar belakangnya munculnya kesabaran atau ketidak-sabaran pada

(11) dan (12) berbeda. Pembicara pada (11) tidak sabar atas perilaku

pemilik pekerjaan atau orang yang memberinya pekerjaan. Ia merasa

diperlakukan tidak sebanding antara tenaga, waktu, dan pikiran yang

dikeluarkannya dengan uang yang diterimanya. Pemilik uang, modal,

atau pekerjaan dapat memperlakukan orang yang dipekerjakannya

dengan tidak sepantasnya. Pada data (12) faktor kedudukan dan usia

Emak menuntut pelukis itu untuk bertindak gigih untuk meyakinkan

wanita itu agar mau menerima uang.

2.3. Teks Preprocessing

Merupakan tahapan awal dalam mengolah data input. Pada tahap teks

preprocessing terdapat beberapa langkah, yaitu tokenizing, stopword filtering,

stemming, dan menghitung tf (term frequency).

2.3.1. Tokenizing

Adalah proses menguraikan kalimat kedalam kata kata yang

terpisah tanpa memperhatikan keterhubungan antar kata. Selanjutnya

adalah mengubah setiap kata yang berhuruf besar menjadi huruf kecil

(lower case).

2.3.2. Stop Word Filtering

Adalah proses memeriksa kata yang seharusnya dihilangkan

untuk efisiensi proses klasifikasi karena kata tersebut tidak banyak

berpengaruh. Daftar kata yang seharusnya dihilangkan disimpan dalam

stopword list. Kata yang dapat dihilangkan misalnya adalah kata

sambung yaitu : dan, yang, untuk.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 29: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

13

2.3.3. Stemming

Stemming merupakan suatu proses yang terdapat dalam sistem

Information Retrieval yang mengubah kata-kata yang terdapat dalam

suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan

aturan-aturan tertentu. Sebagai contoh kata bersama, kebersamaan,

menyamai, akan distem ke root wordnya, yaitu “sama”.

Proses stemming bisa dilakukan dengan beberapa algoritma, salah

satu algoritma stemming yang digunakan dalam skripsi ini adalah

algoritma Nazief Adriani.

2.3.3.1. Agoritma Nazief Adriani (Algoritma Stemming)

Adalah algoritma untuk melakukan proses stemming pada kata

berbahasa Indonesia yang dibuat oleh Bobby Nazief dan Mirna

Adriani. Algoritma Nazief Adriani memiliki tahap-tahap sebagai

berikut :

1. Cari kata yang akan distem dikamus, jika ditemukan maka

diasumsikan bahwa kata tersebut adalah root word. Maka algoritma

berhenti.

2. Inflections Suffixes (“-lah”, ”-kah”, ”-ku”, ”-mu”, atau “-nya”)

dibuang. Jika berupa particles (“-lah”, ”-kah”, “-tah”, atau “-pun”)

maka langkah ini diulang lagi untuk menghapus Possesive Pronouns

(“-ku”, “-mu”, -“nya”), jika ada.

3. Hapus Derivation Suffixes (“-I”, “-an”, atau “-kan”). Jika kata

ditemukan dikamus, maka algoritma berhenti. Jika tidak maka ke

langkah 3a

a. Jika “-an” telah dihapus dan huruf terakhir dari kata

tersebut adalah “-k” maka “-k” juga ikt dihapus. Jika kata

terseburt ditemukan dikamus maka algoritma berhenti. Jika

tidak maka lakukan langkah 3b.

b. Akhiran yang dihapus (“-i”, “-an” atau “-kan”)

dikembalikan lanjut kelangkah 4.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 30: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

14

4. Hapus Derrivation Prefix. Jika pada langkah 3 ada suffiks

yang dihapus pergi ke langkah 4a, jika tidak pergi k langkah 4b.

a. Periksa tabel kombinasi awalan-akhiran yang tidak

diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak

pergi ke langkah 4b.

b. For i=0 to 3, tentukan tipe awalan kemudian hapus

awalan. Jika root word belum juga ditemukan lakukan langkah

5, jika sudah maka algoritma berhenti. Catatan: jika awalan

kedua sama dengan awalan pertama maka algoritma berhenti.

5. Melakukan recording.

6. Jika semua langkah telah selesai tetapi tidak juga berhasil

maka kata awal diasumsikan sebagai root word. Proses selesai.

Tipe Awalan ditentukan melalui langkah-langkah berikut:

1. Jika Awalannya adalah: “di-”, “ke-“, atau “se-“ maka tipe

awalannya secara berturut-turut adalah “di-”, “ke-“, atau “se-“.

2. Jika awalannya adalah “te-“, “me-“ , “be-” atau “pe-“ maka

dibuthkan sebuah proses tambahan untuk menentukan tipe awalannya.

3. Jika dua karakter pertamanya bukan “di-“, “ke-“, “se-“, “te-

“,”be-“,”me-“, atau “pe-“ maka proses berhenti.

Berikut adalah atura untuk melakukan penghapusan awalan.

Dengan keterangan C adalah huruf konsonan, V adalah huruf hidup, A

adalah semua huruf, dan P adalah karakter tertentu, misal ‘er’.

Awalan Akhiran yng tidak diijinkan

be- -i

di- -an

ke- -i, -kan

me- -an

se- -i, -kan

Tabel 2.1 Kombinasi Awalan Akhiran Yang Tidak Diijinkan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 31: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

15

Aturan Kontruksi Prefix yang dihapus

1 me{l|r|w|y}V… me-

2 mem{b|f|v}… mem-

3 mempe… mem-pe

4 mem{rV|V}… me-m

me-p

5 men{c|d|j|s|z}… men-{ c|d|j|s|z }…

6 mengV… meng-V… | meng-kV… |

(mengV-… ifV=’e’)

7 meng{g|h|q|k}… meng-

8 mengV… meng-

9 menyV… mensy-s

10 mempA… mem-pA… where A!=’e’

Tabel 2.2. Aturan Penghapusan Awalan, Untuk Awalan “me-“

Aturan Kontruksi Prefix yang dihapus

1 pe{w|y}V… pe-{w|y}V...

2 perV… per-V... | pe-rV...

3 perCAP per-CAP... where C!= ‘r’ and

P!= “er”

4 per CAerV… per-CAerV... where C!= ‘r’

5 pem{b|f|V}… pem-{b|f|V}...

6 pem{rV|V}… pe-m{rV|V}... |

pe-p{rV|V}...

7 pen{c|d|j|z}… pen-{c|d|j|z}...

8 penV… pe-nV... | pe-tV...

9 pengC… peng-C...

10 pengV… peng-V... | peng-kV... |

(pengV-... if V=‘e’)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 32: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

16

11 penyV… peny-sV...

12 pelV… pe-lV... except “pelajar”,

return “ajar”

13 peCerV… per-erV… where

C!={r|w|y|l|m|n}

14 peCP… pe-CP… where

C!={r|w|y|l|m|n} and P!=’er’

15 peC1erC2… pe-C1erC2… where C1

!={r|w|y|l|m|n}

Tabel 2.3. Aturan Penghapusan Awalan, Untuk Awalan “pe-“

Aturan Kontruksi Prefix yang dihapus

1 berV... ber-V... | be-rV...

2 berCAP... ber-CAP... where C!= ‘r’ and

P!= “er”

3 berCAerV... ber-CaerV... where C!= ‘r’

4 belajar bel-ajar

5 beC1erC2…

be-C1erC2... where C1!={

‘r’|‘l’}

Tabel 2.4. Aturan Penghapusan Awalan, Untuk Awalan “be-”

Aturan Kontruksi Prefix yang dihapus

1 terV... ter-V... | te-rV...

2 terCerV... ter-CerV... where C!= ‘r’

3 terCP...

ter-CP... where C!= ‘r’ and

P!= ‘er’

4 teC1erC2…

te-C1erC2… where C1=’r’

Tabel 2.5. Aturan Penghapusan Awalan, Untuk Awalan “te-”

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 33: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

17

2.3.4. Menghitung tf (term frequency)

Langkah terakhir dari peoses preprocessing adalah menghitung tf.

Tf (term frequency) adalah banyaknya kemunculan sebuah kata dalam

sebuah dokumen.

2.4. Naïve Bayes

Algoritma Naïve Bayes merupakan salah satu algoritma yang terdapat pada

teknik klasifikasi. Naïve Bayes merupakan pengklasifikasian dengan metode

probabalitias.

Probabilitas sebuah dokumen d termasuk dalam kategori atau kelas c dapat

dihitung dengan rumus sebagai berikut.

Dimana adalah conditional probability dari kata tk dalam dokumen

yang termasuk dalam kelas c. merupakan ukuran besarnya kontribusi kata

tk terhadap kelas c, sehingga kelas c merupakan kelas yang tepat. adalah

prior probability dari dokumen yang termasuk dalam kelas c.

Untuk menentukan nilai dari prior probability digunakan rumus berikut

Dimana adalah jumlah dari dokumen yang termasuk dalam kelas c dan N

adalah jumlah total dari seluruh dokumen.

Conditional probability adalah frekuensi relatif dari kata t dalam dokumen

yang berada dalam kelas c, dan dapat dihitung dengan rumus :

Dimana adalah banyaknya kata t dalam dokumen training dari kelas c.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 34: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

18

2.4.1. Laplace Smoothing

Pada proses penghitungan Naïve Bayes terdapat masalah apabila

ada peluang yang bernilai 0. Oleh karena itu digunakan laplace smoothing

yaitu penambahan dengan angka 1 sehingga tidak ada peluang yang akan

bernilai 0.

Penerapan laplace smoothing dalam klasifikasi Naïve Bayes adalah

sebagai berikut:

Perhitungan teknik smoothing ini dilakukan agar tidak ada nilai

peluang yang bernilai 0. B adalah banyaknya kata unik dalam keseluruhan

dokumen.

2.5. K-fold Cross Validation

k-Fold Cross Validation merupakan salah satu metode yang bisa

digunakan untuk mengukur kinerja sebuah sistem. Dalam k-fold Cross validation,

data akan dipartisi secara acak ke dalam k partisi (D1, D2, …, Dk, masing-masing

D memiliki jumlah yang kira-kira sama). Pada iterasi pertama, partisi D1

digunakan sebagai data testing, sedangkan sisa partisi digunakan sebagai data

training. Maka dari itu pada iterasi pertama, D1 digunakan sebagai data testing

dan D2, D3, …, Dk digunakan sebagai data training. Pada iterasi kedua, D2

digunakan sebagai data testing, sedangkan D1, D3, …, Dk digunakan sebagai data

training. Pada iterasi ketiga, D3 digunakan sebagai data testing, sedangkan D1,

D2, … Dk digunakan sebagai data training dan seterusnya. Setiap sample D,

hanya digunakan sekali sebagai testing dan berkali-kali sebagai training

(Han&Kamber,2006).

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 35: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

19

2.6. Precision

Precision adalah tingkat ketepatan atau akurasi dari hasil proses

klasisifikasi. Rumus menghitung precision adalah sebagai berikut :

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 36: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

20

BAB III

ANALISIS DAN DESAIN

3.1. Deskripsi Sistem

Sistem yang dibangun berupa sistem pemerolehan informasi, yang

mempunyai fungsi untuk melakukan identifikasi makna kata sabar pada artikel

berbahasa Indonesia. Proses identifikasi yang dilakukan oleh sistem menggunakan

salah satu algoritma klasifikasi yaitu algoritma Naïve Bayes.

Data yang digunakan dalam proses ini berupa file dalam format .txt,

dimana data tersebut terbagi menjadi 2 yaitu untuk data training dan data testing.

Setiap file training dimasukan dalam folder dengan nama sesuai dengan

kategori atau kelasnya, sedangkan data testing dimasukan dalam sebuah folder

bernama testing. Sistem kemudian akan mengambil file-file tersebut dan

memprosesnya.

Secara garis besar, sistem dibagi menjadi 2 fungsi. Fungsi yang pertama

adalah untuk melakukan identifikasi makna kata dalam suatu artikel, keluaran dari

proses identifikasi ini adalah kata tersebut dikategorikan atau masuk ke kelas yang

mana berdasar kategori yang telah ditentukan. Dalam proses ini terdapat beberapa

tahapan, yaitu tahap pemotongan kalimat yang mengandung kata atau keyword

yang ingin dicari maknanya, selanjutnya adalah tahap preprocessing yang

bertujuan untuk membuat model dari data yang diinputkan, dalam tahap

preprocessing ini data diproses sebagai berikut : tokenisasi (pemenggalan kata

dan penghapusan tanda baca), case folding (mengubah kata kedalam huruf kecil),

stopword (penghapusan kata kata yang tidak penting), stemming (pengembalian

kata ke bentuk dasar), dan menghitung tf (jumlah kemunculan kata yang sama

dalam sebuah dokumen). Proses preprocessing ini digunakan untuk mengolah

input data training dan data testing. Setelah tahap preprocessing, selanjutnya

adalah tahap pengklasifikasian menggunakan algoritma Naïve Bayes. Berikut

adalah skema proses klasifikasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 37: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

21

Gambar 3.1.1 Skema Klasifikasi

Fungsi yang kedua adalah penghitungan akurasi. Dalam proses

penghitungan akurasi ini, sistem menggunakan metode k-fold cross validation,

dimana data training dibagi menjadi beberapa fold, yang kemudian dilakukan

proses klasifikasi pada satu fold terhadap fold yang lain sampai semua fold

terklasifikasi, dan hasil klasifikasi tersebut di cocokan apakah klasifikasinya

benar atau salah, setelah itu dihitung persentase kebenaran dari proses klasifikasi

yang telah dilakukan. Berikut adalah skema proses penghitungan akurasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 38: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

22

Gambar 3.1.2. Skema Penghitungan Akurasi

3.2. Data

Data yang digunakan adalah dalam bentuk artikel berbahasa Indonesia

yang diambil dari website corci.org dengan jumlah data 108 artikel, untuk setiap

artikel dibagi menjadi kalimat-kalimat. Setiap kalimat digolongkan menjadi 6

kategori yaitu sifat, kondisi, urutan tindakan, giliran, pekerjaan, dan komunikasi.

Keyword yang digunakan dalam kalimat tersebut adalah kata “sabar”.

3.3. Penyimpanan Data

Media penyimpanan data yang digunakan oleh sistem adalah berbentuk

format .txt untuk data testing, data training, data stopword, dan data kata dasar.

Untuk data yang akan dilakukan pemrosesan, disimpan dalam bentuk ArrayList,

yaitu kata-kata yang terbentuk setelah melalui proses prepocessing.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 39: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

23

3.3.1. Daftar media penyimpanan dalam .txt :

3.3.1.1 StopwordList.txt : adalah file yang berisi mengenai

daftar stopword atau kata yang

dianggap tidak penting.

3.3.1.2 Kata Dasar.txt : adalah file yang berisi tentang

daftar kata dasar dalam bahasa

Indonesia.

3.3.2. Daftar media penyimpanan dalam array :

3.3.2.1. ArrayList<>Training : adalah ArrayList yang menyimpan

dokumen- dokumen training setelah

dilakukan prepocessing.

3.3.2.2. ArrayList<>Testing : adalah ArrayList yang menyimpan

dokumen testing setelah dilakukan

prepocessing.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 40: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

24

3.4. Struktur Data

Struktur data dalam sistem ini menggunakan ArrayList sebagai media

penyimpanan data sementara untuk data yang akan dilakukan pemrosesan.

Strukturnya sebagai berikut, ArrayList objek Kategori menyimpan ArrayList

objek Kalimat dan ArrayList objek Kalimat menyimpan ArrayList objek Word.

Gambar 3.4. Struktur Data

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 41: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

25

3.5. Diagram Kelas Model Naive Bayes

Gambar 3.5. Diagram Kelas Model Naive Bayes

Model Naive Bayes dalam sistem terdiri dari 8 kelas yaitu Word.java,

Kalimat.java, Kategori.java, StopWord.java, Stemming.java, NaiveBayes.java,

Fold.java, Akurasi.java, dengan rincian sebagai berikut :

1. Kelas Kategori.java memiliki method untuk pemotongan

kalimat yang mengandung kata yang akan di identifikasi

menggunakan rumus (n-1)+n+(n+1) dan menyimpan hasilnya

ke dalam ArrayList objek Kalimat.java.

2. Kalimat.java terdapat method untuk melakukan preprocessing

dan penghitungan tf, kemudian hasilnya disimpan di ArrayList

Objek Word.java.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 42: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

26

3. Word.java berisi kata- kata dalam dokumen beserta dengan

nilai tf setiap kata dan nilai conditional probability untuk tiap

kategori.

4. Stemming.java menyimpan data kata dasar serta terdapat

method untuk melakukan stemming

5. StopWord.java menyimpan data kata yang dianggap tidak

penting serta terdapat method untuk menghilangkan kata yang

dianggap tidak penting tersebut dari data yang diinputkan.

6. NaiveBayes.java memiliki method

hitungConditionalProbability() untuk menghitung nilai

condional probability, method hitungPriorProbability() untuk

menghitung nilai prior probability, setB() untuk menghitung

jumlah kata unik dari semua dokumen, dan method

startClasiffcation() untuk memulai proses klasifikasi dengan

rumus naive bayes.

7. Akurasi.java memiliki method readFold() untuk membaca data

dan membagi data kedalam partisi-partisi atau fold, method

klasifikasi() untuk melakukan proses klasifikasi terhadap data

di setiap fold, method setAkurasiPerFold() untuk menghitung

akurasi dari klasifikasi di tiap fold, dan method

setTotalAkurasi() untuk menghitung rata- rata akurasi dari

semua fold.

Kelas Stemming.java dan StopWord.java digunakan dikelas Kalimat.java

untuk melakukan prosess stemming dan penghapusan stop word. Kelas

NaïveBayes.java memiliki data kategori dalam bentuk ArrayList, dimana data

kategori menyimpan ArrayList Kalimat, dan ArrayList Kalimat menyimpan

ArrayList Word. Data tersebut yang akan digunakan di kelas NaïveBayes.java

untuk melakukan klasifikasi. Kelas Akurasi menyimpan data fold dalam

Hashtable, dimana fold menyimpan data ArrayList Objek Kategori, yang akan

digunakan untuk proses penghitungan akurasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 43: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

27

3.6. Diagram Kelas View

Gambar 3.6 Diagram Kelas View

Mode view sistem terdiri dari 3 kelas yaitu interfaceHome.java,

interfaceKlasifikasi,java dan interfaceAkurasi.java dengan rincian sebagai berikut:

1. interfaceHome adalah halaman utama yang muncul pertama kali ketika

program dimulai. interfaceHome.java memiliki menu item klasifikasi

untuk membuka frame interfaceKlasifikasi sekaligus mendispose atau

menutup frame interfaceHome, dan menu item akurasi untuk

membuka frame akurasi sekaligus mendispose atau menutup frame

interfaceHome.

2. InterfaceKlasifikasi memiliki menu item Home untuk kembali ke

halaman utama sekaligus menutup halaman klasifikasi, dan menu item

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 44: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

28

akurasi untuk membuka halaman akurasi sekaligus menutup halaman

klasifikasi. 2 tombol browse untuk mengambil direktori tempat data

training dan testing disimpan, tombol lihatData untuk menampilkan

data training dan data testing di text area training dan testing, tombol

klasifikasi untuk melakukan proses klasifikasi dan menampilkan

hasilnya di text area hasil klasifikasi.

3. InterfaceAkurasi.java memiliki menu item klasifikasi untuk membuka

halaman klasifikasi sekaligus menutup halaman akurasi, dan menu

item home untuk kembali ke halaman utama. Tombol browse untuk

mengambil direktori data training. Tombol setDataPerFold untuk input

jumlah fold. Tombol akurasi untuk melakukan proses penghitungan

akurasi.

3.7. Diagram Kelas Keseluruhan

Gambar 3.7. Diagram kelas keseluruhan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 45: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

29

3.8. Cara Pengujian dan Analisis Hasil

Pengujian terhadap hasil klasifikasi yang dilakukan oleh sistem bertujuan

untuk mengetahui keakuratan dari pengklasifikasian berdasar pada data training

yang ditentukan.

Pengujian dilakukan dengan membandingkan hasil klasifikasi secara

manual dengan hasil klasifikasi yang dilakukan dengan perhitungan dengan

algoritma Naïve Bayes yang dilakukan oleh sistem.

Cara pengujian dilakukan dengan menggunakan k-fold cross validation,

dengan 2 pengujian yaitu 3 fold dan 5 fold.

3.8.1. Pengujian dengan k-Fold Cross Validation

3.8.1.1. Pengujian dengan 3 Fold

Tahap 1

i. Fold 1 digunakan sebagai data testing

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data training

Tahap 2

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data testing

iii. Fold 3 digunakan sebagai data training

Tahap 3

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data testing

3.8.1.2. Pengujian dengan 5 Fold

Tahap 1

i. Fold 1 digunakan sebagai data testing

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data training

iv. Fold 4 digunakan sebagai data training

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 46: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

30

v. Fold 5 digunakan sebagai data training

Tahap 2

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data testing

iii. Fold 3 digunakan sebagai data training

iv. Fold 4 digunakan sebagai data training

v. Fold 5 digunakan sebagai data training

Tahap 3

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data testing

iv. Fold 4 digunakan sebagai data training

v. Fold 5 digunakan sebagai data training

Tahap 4

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data training

iv. Fold 4 digunakan sebagai data testing

v. Fold 5 digunakan sebagai data training

Tahap 5

i. Fold 1 digunakan sebagai data training

ii. Fold 2 digunakan sebagai data training

iii. Fold 3 digunakan sebagai data training

iv. Fold 4 digunakan sebagai data training

v. Fold 5 digunakan sebagai data testing

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 47: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

31

3.8.2. Akurasi

Akurasi dihitung dengan rumus sebagai berikut :

3.9. Contoh Klasifikasi atau Identifiaksi Kata Sabar dengan Naive Bayes

Berikut ini adalah contoh melakukan klasifikasi kata “sabar” dalam

sebuah artikel, dimana kata sabar akan diklasifikasikan ke dalam 2 kategori yaitu

sabar sebagai suatu sifat dan sabar sebagai suatu kondisi. Dalam contoh ini

terdapat 4 data training dan 1 data data testing yang akan diuji. Data training yang

digunakan adalah 2 artikel dengan kata “sabar” sebagai kondisi dan 2 artikel

dengan kata “sabar” sebagai sifat. Sedangkan data testing yang duiji adalah

artikel dengan kata “sabar” yang merupan kondisi. Hasil akhir dari contoh

klasifikasi ini adalah menentukan apakah data testing yang diuji dengan algoritma

naïve bayes masuk kedalam kategori sifat atau kondisi. Jika data testing masuk ke

dalam kategori kondisi, maka perhitungan algoritma naïve bayes untuk 4 data

training dan 1 data testing ini benar.

3.9.1. Data Training dan Data Testing

3.7.1.1. Data Training :

3.7.1.1.1. Dokumen 1 (Sabar : Kondisi)

Ya, seperti kita juga, orang dewasa, katamu. Kalau begitu, harusnya

dibawa ke dokter, lalu diberi obat, kataku. Sudah terlalu lama ia menjerit-

jerit begitu. Kau membuang napas keras-keras, tak sabar, Bisa saja bayi itu

sudah dibawa ke dokter, sudah diberi obat. Tapi bayi itu terlalu manja.

3.7.1.1.2 Dokumen 2 (Sabar : Kondisi)

Kita tidak akan lalai dari luka kita, Anakku. Namun kita mesti bersabar

sampai bunyi lonceng membungkam suara-suara adzan. Apakah engkau

tahu apa latar belakangnya?

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 48: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

32

3.7.1.1.3 Dokumen 3 (Sabar : Sifat)

Ia terus membisikkan di telinganya, masih ada kota-kota menyejukkan. Ia

menganjurkan agar ibunya selalu tenang, sabar, dan tabah. Garcia memang

sosok yang keras kepala. Pemandangan yang menyedihkan yang menimpa

istrinya itu tidak membuatnya terharu.

3.7.1.1.4 Dokumen 4 (Sabar : Sifat)

Roy tahu bahwa di lubuk hati mamanya hanya terukir satu nama saja,

Romi, papanya. Ada satu kekayaan yang tidak ternilai yang dimiliki

mamanya atau wanita umumnya, di mana lelaki tidak memilikinya. Yaitu,

kesabaran, ketabahan, dan kesetiaan. Oleh sebab itu mengapa Tuhan

berfirman, Surga itu ada di telapak kaki ibu, bukan di telapak kaki bapak.

Kebahagiaan itu harus diperjuangkan, bukan dengan cara mengemis minta

betas kasihan, rendah diri, dan pasrah nasib!

3.7.1.2 Data Testing :

3.7.1.2.1 Dokumen Testing

Ia hanya tertawa riang dan menghantam drum itu sejadi-jadinya. Mahar

tetap sabar menghadapi Harun dan berusaha menuntunnya pelan-pelan,

namun akhirnya kesabaran Mahar habis ketika kami membawakan lagu

Light My Fire milik The Doors. Di sepanjang lagu yang inspiratif itu Harun

menghajar hithat, tenor drum, simba, serta menginjak-injak pedal bass

drum sejadi-jadinya.

3.9.2. Pemotongan Kalimat

3.9.2.1. Pemotongan Kalimat Dokumen Training 1 (Kondisi)

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 49: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

33

Kalimat Awal 3 Kalimat

Ya, Sudah

seperti terlalu

kita lama

juga, ia

orang

menjerit-

jerit

dewasa, begitu.

katamu. Kau

Kalau membuang

begitu, napas

harusnya keras-keras,

dibawa tak

ke sabar,

dokter, Bisa

lalu saja

diberi bayi

obat, itu

kataku. sudah

Sudah dibawa

terlalu ke

lama dokter,

ia sudah

menjerit-jerit diberi

begitu. obat.

Kau Tapi

membuang bayi

napas itu

keras-keras, terlalu

tak manja.

sabar,

Bisa

saja

bayi

itu

sudah

dibawa

ke

dokter,

sudah

diberi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 50: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

34

obat.

Tapi

bayi

itu

terlalu

manja.

3.9.2.2. Pemotongan Dokumen Training 2 (Kondisi)

Kalimat Awal 3 Kalimat

Kita Kita

tidak tidak

akan akan

lalai lalai

dari dari

luka luka

kita, kita,

Anakku. Anakku.

Namun Namun

kita kita

mesti mesti

bersabar bersabar

sampai sampai

bunyi bunyi

lonceng lonceng

membungkam membungkam

suara-suara suara-suara

adzan. adzan.

Apakah Apakah

engkau engkau

tahu tahu

apa apa

latar latar

belakangnya? belakangnya?

3.9.2.3. Pemotongan Dokumen Training 3 (Sifat)

Kalimat Awal 3 Kalimat

Ia Ia

terus terus

membisikkan membisikkan

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 51: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

35

di di

telinganya, telinganya,

masih masih

ada ada

kota-kota kota-kota

menyejukkan. menyejukkan.

Ia Ia

menganjurkan menganjurkan

agar agar

ibunya ibunya

selalu selalu

tenang, tenang,

sabar, sabar,

dan dan

tabah. tabah.

Garcia Garcia

memang memang

sosok sosok

yang yang

keras keras

kepala. kepala.

Pemandangan

yang

menyedihkan

yang

menimpa

istrinya

itu

tidak

membuatnya

terharu.

3.9.2.4. Pemotongan Dokumen Training 4 (Sifat)

Kalimat Awal 3 Kalimat

Roy Ada

tahu satu

bahwa kekayaan

di yang

lubuk tidak

hati ternilai

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 52: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

36

mamanya yang

hanya dimiliki

terukir mamanya

satu atau

nama wanita

saja, umumnya,

Romi, di

papanya. mana

Ada lelaki

satu tidak

kekayaan memilikinya.

yang Yaitu,

tidak kesabaran,

ternilai ketabahan,

yang dan

dimiliki kesetiaan.

mamanya Oleh

atau sebab

wanita itu

umumnya, mengapa

di Tuhan

mana berfirman,

lelaki Surga

tidak itu

memilikinya. ada

Yaitu, di

kesabaran, telapak

ketabahan, kaki

dan ibu,

kesetiaan. bukan

Oleh di

sebab telapak

itu kaki

mengapa bapak.

Tuhan

berfirman,

Surga

itu

ada

di

telapak

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 53: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

37

kaki

ibu,

bukan

di

telapak

kaki

bapak.

Kebahagiaan

itu

harus

diperjuangkan,

bukan

dengan

cara

mengemis

minta

betas

kasihan,

rendah

diri,

dan

pasrah

nasib!

3.9.2.5. Pemotongan Dokumen Testing

Kalimat

Awal 3 Kalimat

Ia Ia

hanya hanya

tertawa tertawa

riang riang

dan dan

menghantam menghantam

drum drum

itu itu

sejadi-

jadinya.

sejadi-

jadinya.

Mahar Mahar

tetap tetap

sabar sabar

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 54: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

38

menghadapi menghadapi

Harun Harun

dan dan

berusaha berusaha

menuntunnya menuntunnya

pelan-pelan, pelan-pelan,

namun namun

akhirnya akhirnya

kesabaran kesabaran

Mahar Mahar

habis habis

ketika ketika

kami kami

membawakan membawakan

lagu lagu

Light Light

My My

Fire Fire

milik milik

The The

Doors. Doors.

Di Di

sepanjang sepanjang

lagu lagu

yang yang

inspiratif inspiratif

itu itu

Harun Harun

menghajar menghajar

hithat, hithat,

tenor tenor

drum, drum,

simba, simba,

serta serta

menginjak-

injak

menginjak-

injak

pedal pedal

bass bass

drum drum

sejadi-

jadinya.

sejadi-

jadinya.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 55: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

39

3.9.3. Prepocessing

Dalam tahap ini dilakukan penghilangan proses case folding, stop

word, stemming, dan menghitung tf (frekuensi kemunculan kata pada dokumen ).

3.7.3.1 Prepocesing Dokumen Training 1 (Kondisi)

3 Kalimat

Lower

Case Stemming

Hapus

Stopword tf

Sudah sudah sudah jerit 1

Terlalu terlalu terlalu buang 1

Lama lama lama napas 1

Ia ia ia keras 1

menjerit-

jerit

menjerit-

jerit jerit sabar 1

begitu. begitu begitu bayi 2

Kau Kau kau bawa 1

membuang membuang buang dokter 1

napas napas napas obat 1

keras-keras, keras-keras keras manja 1

tak tak tak

sabar, sabar sabar TOTAL TF 11

Bisa bisa bisa

saja saja saja

bayi bayi bayi

itu itu itu

sudah sudah sudah

dibawa dibawa bawa

Ke ke ke

dokter, dokter dokter

sudah sudah sudah

diberi diberi beri

obat. obat obat

Tapi tapi tapi

bayi bayi bayi

Itu itu itu

terlalu terlalu terlalu

manja. manja manja

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 56: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

40

3.7.3.2 Prepocesing Dokumen Training 2 (Kondisi)

3 Kalimat Lower Case Stemming

Hapus

Stopword tf

Kita kita kita lalai 1

Tidak tidak tidak luka 1

Akan akan akan anak 1

Lalai lalai lalai mesti 1

Dari dari dari sabar 1

Luka luka luka bunyi 1

kita, kita kita lonceng 1

Anakku. anakku anak bungkam 1

Namun namun namun suara 1

Kita kita kita adzan 1

mesti mesti mesti latar 1

bersabar bersabar sabar

sampai sampai sampai TOTAL TF 11

bunyi bunyi bunyi

lonceng lonceng lonceng

membungkam membungkam bungkam

suara-suara suara-suara suara

adzan. adzan adzan

Apakah Apakah apa

engkau engkau engkau

Tahu tahu tahu

Apa apa apa

latar latar latar

belakangnya? belakangnya belakang

3.7.3.3 Prepocesing Dokumen Training 3 (Sifat)

3 Kalimat Lower Case Stemming

Hapus

Stopword tf

Ia ia ia bisik 1

terus terus terus telinga 1

membisikkan membisikkan bisik kota 1

di di di sejuk 1

telinganya, telinganya telinga anjur 1

masih masih masih tenang 1

ada ada ada sabar 1

kota-kota kota-kota kota tabah 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 57: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

41

menyejukkan. menyejukkan sejuk garcia 1

Ia ia ia sosok 1

menganjurkan menganjurkan anjur keras 1

agar agar agar kepala 1

ibunya ibunya ibu

selalu selalu selalu TOTAL TF 12

tenang, tenang tenang

sabar, sabar sabar

dan dan dan

tabah. tabah tabah

Garcia garcia garcia

memang memang memang

sosok sosok sosok

yang yang yang

keras keras keras

kepala. kepala kepala

3.7.3.4 Prepocessing Dokumen Training 4 (Sifat)

3 Kalimat

Lower

Case Stemming

Hapus

Stopword tf

Ada ada ada kaya 1

satu satu satu nilai 1

kekayaan kekayaan kaya milik 2

yang yang yang mama 1

tidak tidak tidak wanita 1

ternilai ternilai nilai lelaki 1

yang yang yang sabar 1

dimiliki dimiliki milik tabah 1

mamanya mamanya mama setia 1

atau atau atau tuhan 1

wanita wanita wanita firman 1

umumnya, umumnya umum surga 1

di di di telapak 2

mana mana mana kaki 2

lelaki lelaki lelaki

tidak tidak tidak TOTAL

TF 17

memilikinya. memilikinya milik

Yaitu, yaitu yaitu

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 58: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

42

kesabaran, kesabaran sabar

ketabahan, ketabahan tabah

dan dan dan

kesetiaan. kesetiaan setia

Oleh oleh oleh

sebab sebab sebab

itu itu itu

mengapa mengapa mengapa

Tuhan tuhan tuhan

berfirman, berfirman firman

Surga surga surga

itu itu itu

ada ada ada

di di di

telapak telapak telapak

kaki kaki kaki

ibu, ibu ibu

bukan bukan bukan

di di di

telapak telapak telapak

kaki kaki kaki

bapak. bapak bapak

3.7.3.5 Prepocessing Dokumen Testing

3 Kalimat Lower Case Stemming

Hapus

Stopword tf

Ia ia ia tawa 1

hanya hanya hanya riang 1

tertawa tertawa tawa hantam 1

riang riang riang drum 3

dan dan dan mahar 2

menghantam menghantam hantam sabar 2

drum drum drum hadap 1

itu itu itu harun 2

sejadi-

jadinya. sejadi-jadinya jadi usaha 1

Mahar mahar mahar tuntun 1

tetap tetap tetap pelan 1

sabar sabar sabar habis 1

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 59: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

43

menghadapi menghadapi hadap bawa 1

Harun harun harun lagu 2

dan dan dan light 1

berusaha berusaha usaha my 1

menuntunnya menuntunnya tuntun fire 1

pelan-pelan, pelan-pelan pelan milik 1

namun namun namun the 1

akhirnya akhirnya akhir doors 1

kesabaran kesabaran sabar inspiratif 1

Mahar mahar mahar hajar 1

habis habis habis hithat 1

ketika ketika ketika tenor 1

kami kami kami simba 1

membawakan membawakan bawa injak 1

lagu lagu lagu pedal 1

Light light light bass 1

My my my

Fire fire fire

milik milik milik

The the the

Doors. doors doors

Di di di

sepanjang sepanjang panjang

lagu lagu lagu

yang yang yang

inspiratif inspiratif inspiratif

itu itu itu

Harun harun harun

menghajar menghajar hajar

hithat, hithat hithat

tenor tenor tenor

drum, drum drum

simba, simba simba

serta serta serta

menginjak-

injak

menginjak-

injak injak

pedal pedal pedal

bass bass bass

drum drum drum

sejadi-

jadinya. sejadi-jadinya jadi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 60: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

44

3.9.4. Penghitungan Total tf Tiap Kata di Tiap Kelas yang sama dengan

Kata Kata di Dokumen Testing

Kata

Kondisi

1

kondisi

2 sifat 1 sifat 2

Total Tf

Kondisi

Total Tf

Sifat

tawa 0 0 0 0 0 0

riang 0 0 0 0 0 0

hantam 0 0 0 0 0 0

drum 0 0 0 0 0 0

mahar 0 0 0 0 0 0

sabar 1 1 1 1 2 2

hadap 0 0 0 0 0 0

harun 0 0 0 0 0 0

usaha 0 0 0 0 0 0

tuntun 0 0 0 0 0 0

pelan 0 0 0 0 0 0

habis 0 0 0 0 0 0

bawa 1 0 0 0 1 0

lagu 0 0 0 0 0 0

light 0 0 0 0 0 0

my 0 0 0 0 0 0

fire 0 0 0 0 0 0

milik 0 0 0 2 0 2

the 0 0 0 0 0 0

doors 0 0 0 0 0 0

inspiratif 0 0 0 0 0 0

hajar 0 0 0 0 0 0

hithat 0 0 0 0 0 0

tenor 0 0 0 0 0 0

simba 0 0 0 0 0 0

injak 0 0 0 0 0 0

pedal 0 0 0 0 0 0

bass 0 0 0 0 0 0

3.9.5. Menghitung Jumlah Kata Unik

kata Awal Sorting Kata Jumlah kata

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 61: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

45

(Semua) Unik unik

jerit adzan 42

buang anak

napas anjur

keras bawa

sabar bayi

bayi bisik

bawa buang

dokter bungkam

obat bunyi

manja dokter

lalai firman

luka garcia

anak jerit

mesti kaki

sabar kaya

bunyi kepala

lonceng keras

bungkam kota

suara lalai

adzan latar

latar lelaki

bisik lonceng

telinga luka

kota mama

sejuk manja

anjur mesti

tenang milik

sabar napas

tabah nilai

garcia obat

sosok sabar

keras sejuk

kepala setia

kaya sosok

nilai suara

milik surga

mama tabah

wanita telapak

lelaki telinga

sabar tenang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 62: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

46

tabah tuhan

setia wanita

tuhan

firman

surga

telapak

kaki

3.9.6. Menghitung Conditional Probability dengan Menggunakan

Laplace Smoothing.

Kata

Conditional

Probobability

Kondisi

Conditional

Probobability

Sifat

tawa 0,015625 0,014084507

riang 0,015625 0,014084507

hantam 0,015625 0,014084507

drum 0,015625 0,014084507

mahar 0,015625 0,014084507

sabar 0,046875 0,042253521

hadap 0,015625 0,014084507

harun 0,015625 0,014084507

usaha 0,015625 0,014084507

tuntun 0,015625 0,014084507

pelan 0,015625 0,014084507

habis 0,015625 0,014084507

bawa 0,03125 0,014084507

lagu 0,015625 0,014084507

light 0,015625 0,014084507

my 0,015625 0,014084507

fire 0,015625 0,014084507

milik 0,015625 0,042253521

the 0,015625 0,014084507

doors 0,015625 0,014084507

inspiratif 0,015625 0,014084507

hajar 0,015625 0,014084507

hithat 0,015625 0,014084507

tenor 0,015625 0,014084507

simba 0,015625 0,014084507

injak 0,015625 0,014084507

pedal 0,015625 0,014084507

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 63: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

47

bass 0,015625 0,014084507

3.9.7. Menghitung Peluang atau kemungkinan untuk setiap kelas dengan

mengkalikan prior probability dengan hasil perkalian conditional

probability tiap kelas.

- Prior Probability Kondisi = jumlah dokumen kategori

kondisi / jumlah semua

dokumen training

= 2/4

= 0,5

- Prior Probability Sifat = jumlah dokumen kategori sifat /

jumlah semua dokumen training

= 2/4

= 0,5

- Hasil Kali Conditional Probability Kondisi

= 0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^3 *

0,015625^2 * 0,046875^2 * 0,015625^1 * 0,015625^2 *

0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 *

0,03125^1 * 0,015625^2 * 0,015625^1 * 0,015625^1 *

0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 *

0,015625^1 * 0,015625 ^1* 0,015625^1 * 0,015625^1 *

0,015625^1 * 0,015625^1 * 0,015625^1 * 0,015625^1 =

7,00089218759378E-61

- Hasil Kali Conditional Probability Sifat

= 0,014084507^1 * 0,014084507^1 * 0,014084507^1 *

0,014084507^3 * 0,014084507^2 * 0,042253521^2 *

0,014084507^1 * 0,014084507^2 * 0,014084507^1 *

0,014084507^1 * 0,014084507^1 * 0,014084507^1 *

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 64: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

48

0,014084507^1 * 0,014084507^2 * 0,014084507^1 *

0,014084507^1 * 0,014084507^1 * 0,042253521^1 *

0,014084507^1 * 0,014084507^1 * 0,014084507^1 *

0,014084507^1 * 0,014084507^1 * 0,014084507^1 *

0,014084507^1 * 0,014084507^1 * 0,014084507^1 *

0,014084507^1 = 3,08020702991216E-62

- Menghiung Peluang untuk Tiap Kelas

P(Kondisi) = Prior Probability Kondisi * Hasil Kali

Conditional Probability Kondisi

= 0,5 * 7,00089218759378E-61

= 3,50044609379689E-61

P(Sifat) = Prior Probability Sifat * Hasil Kali Conditional

Probability Sifat

= 0,5 * 3,08020702991216E-62

= 1,54010351495608E-62

- Memilih Peluang yang Terbesar.

P(Kondisi) P(Sifat) Max ?

3,50044609379689E-

61

1,54010351495608E-

62

3,50044609379689E-

61

Dari proses perhitungan di atas, dapat dilihat peluang yang paling besar adalah

kondisi, yang berarti bahwa dokumen testing memiliki peluang lebih besar masuk

ke kategori kondisi dari pada kategori sifat.

Dengan demikian dokumen testing diklasifikasikan masuk ke kelas kategori.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 65: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

49

BAB IV

IMPLEMENTASI SISTEM

4.1. Spesifikasi Perangkat Keras dan Perangkat Lunak

Perangkat keras yang digunakan untuk membangun sistem adalah sebagai

berikut :

Processor : Intel core i5

Memory : 4 GB

Hardisk : 500 GB

Perangkat lunak yang digunakan untuk membangun sistem adalah sebagai

berikut :

Sistem Operasi : Windows 7 Ultimate

Aplikasi : Netbeans IDE 7.2

Bahasa Pemrograman : Java (jdk1.7.0_13)

4.2. Implementasi Antar Muka

Implementasi antar muka dibuat dengan tujuan untuk mempermudah

menggunakan sistem.

4.2.1. Antarmuka Frame Utama

Frame utama adalah frame yang pertama kali muncul ketika

aplikasi dijalankan. Frame utama memiliki menu File yang berisi submenu

Klasifikasi untuk masuk ke form klasifisikasi dan submenu Akurasi untuk

masuk ke form akurasi.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 66: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

50

Gambar 4.1. Antar Muka Frame Utama

4.2.2. Antarmuka Frame Klasifikasi

Frame Klasifikasi adalah frame yang sebagai tempat untuk

menginputkan data training dan data testing dengan memasukan direktori

dimana folder tempat penyimpanan data tersebut berada. Tombol lihat data

adalah untuk membaca data training dan data testing, sekaligus melakukan

proses preprocessing. Tombol klasifikasi adalah tombol untuk melakukan

proses klasifikasi dengan algoritma Naïve Bayes, yang kemudian hasil

klsaifikasi di tampilkan pada teks area.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 67: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

51

Gambar 4.2. Antar Muka Frame Klasifikasi

4.2.3. Antarmuka Frame Akurasi

Frame akurasi adalah frame untuk menginputkan data training

yang akan dihitung akurasinya menggunakan k-fold cross validation. Data

training diinput melalui direktori tempat data tersebut disimpan. Tombol

lihat data berfungsi untuk menampilkan data training serta jumlah data

dari setiap kategorinya. Teks field Jumlah Fold adalah untuk menginputkan

jumlah fold yang akan digunakan dalam penghitungan akurasi. Tombol set

Data/Fold adalah untuk menampilkan teks field yang secara dinamis

terbentuk sesuai dengan jumlah fold yang diinputkan, teks field ini

berfungsi untuk menginputkan jumlah data tiap fold. Tombol cek hasil

berfungsi untuk menjalankan proses penghitungan akurasi, yang akan

ditampilkan hasilnya pada teks area.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 68: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

52

Gambar 4.3. Antar Muka Frame Akurasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 69: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

53

4.3. Implementasi Model Naive Bayes

4.3.1. Implementasi Hitung Tf

Gambar 4.3.1. Flowcart hitung tf

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 70: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

54

4.3.2. Implementasi Hitung Prior Probability

Gambar 4.3.2. Flowcart hitung prior probability

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 71: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

55

4.3.3. Implementasi Hitung Conditional Probability

Gambar 4.3.3. Flowcart hitung conditional probability

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 72: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

56

4.3.4. Implementasi Hitung Peluang (Naive Bayes)

Gambar 4.3.4. Flowcart hitung peluang

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 73: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

57

BAB V

HASIL DAN PEMBAHASAN

5.1. Skema Pengujian

Pengujian dilakukan dengan menggunakan metode k-fold cross validation.

Dimana data training akan dibagi ke dalam sejumlah k fold. Setiap fold akan diisi

dengan data training tiap kategori secara merata.

Setiap fold akan diperlakukan sebagai data testing dan data training secara

bergantian sesuai dengan dengan tahapan penghitungan akurasi, dimana

banyaknya tahapan penghitungan akurasi sama dengan jumlah fold. Setelah semua

tahapan proses penghitungan akurasi dilakukan, maka seluruh data training yang

diuji akan terklasifikasi, kemudian dihitung persentase data yang terklasifikasi

dengan tepat (sesuai dengan kategori awal).

Dalam pengujian ini akan dilakukan pengujian terhadap 108 artikel

berbahasa Indonesia yang terbagi ke dalam 6 kelas, yaitu kondisi, komunikasi,

sifat, pekerjaan, urutan tindakan dan giliran.

Pengujian dilakukan sebanyak 3 kali sebagai berikut :

5.1.1. Pengujian 1

Dilakukan menggunakan 6 fold, sebanyak 6 tahap/ iterasi

dengan rincian data sebagai berikut

Tabel 5.1.1.1. Pengujian 1

Kelas/ Kategori Jumlah Data

giliran 23

komunikasi 15

kondisi 34

pekerjaan 6

sifat 12

urutan tindakan 20

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 74: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

58

Hasil Pengujian 1

Tahap Akurasi (%)

1 31.58

2 44.44

3 44.44

4 31.58

5 47.37

6 38.89

Rata- Rata

Akurasi 39.72

Tabel 5.1.1.2. Hasil Pengujian 1

5.1.2. Pengujian 2

Berdasar hasil pengujian 1 (detail lihat lampiran hal. 64-81)

kemudian diambil 10 data dengan nilai Conditional Probability

paling besar (lihat lampiran hal. 81-84 ), selanjutnya dilakukan

proses pengujian akurasi dengan 10 fold sebanyak 10 tahap atau

iterasi, dan hasilnya sebagai berikut:

Hasil Pengujian 2

Tahap

Akurasi

(%)

1 60

2 0

3 40

4 60

5 20

6 0

7 60

8 60

9 60

10 40

Rata-Rata

Akurasi 40

Tabel 5.1.2.1. Hasil Pengujian 2

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 75: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

59

5.1.3. Pengujian 3

Berdasar hasil pengujian 2 (detail lihat lampiran hal. 85-

93), kemudian diambil 6 data dengan nilai Conditional Probability

paling besar (lihat lampiran hal. 93-95), selanjutnya dilakukan

proses pengujian akurasi dengan 6 fold sebanyak 6 tahap atau

iterasi, dengan hasil sebagai berikut:

Hasil Pengujian 3

Tahap

Akurasi

(%)

1 40

2 40

3 40

4 20

5 80

6 40

Rata- Rata

Akurasi 43.33

Tabel 5.1.3.1. Hasil Pengujian 3

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 76: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

60

5.2. Analisa Hasil

Berdasar pada pengujian yang dilakukan dengan k-cross validation,

diperoleh hasil sebagai berikut

Pengujian Kategori

Jumlah Data

per Kategori

Jumlah

Fold

Akurasi

benar

1

Giliran 23

6 39.72%

Komunikasi 15

Kondisi 34

pekerjaan 6

Sifat 12

urutan

tindakan 20

2

giliran 10

10 40%

komunikasi 10

kondisi 10

sifat 10

urutan

tindakan 10

3

giliran 6

6 43.33%

komunikasi 6

kondisi 6

sifat 6

urutan

tindakan 6

Tabel 5.2.1 Analisa Hasil Pengujian

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 77: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

61

Berdasar hasil pada tabel 5.2.1, terlihat bahwa pengujian yang dilakukan

pada setiap set pengujian dengan jumlah data yang berbeda menghasilkan akurasi

yang berbeda pula. Pengujian menggunakan semua kategori dan semua data

dengan 6 fold menghasilkan akurasi 39.72%. Pengujian menggunakan 5 kelas dan

jumlah data perkelas 10 data dengan 10 fold menghasilkan akurasi 40%.

Pengujian dengan 5 kelas dan jumlah data perkelas 6 data dengan 6 fold

menghasilkan akurasi 43.33%.

Nilai Conditional Probability berpengaruh pada hasil akurasi. Dengan

mengambil 10 data per kategori dari semua data dengan nilai Conditional

probability terbesar menghasilkan akurasi menjadi lebih besar, demikian juga

dengan mengambil 6 data per kategori dengan nilai Conditional Probability

terbesar juga menghasilkan akurasi yang lebih besar, seperti pada tabel 5.2.1.

Conditional Probability berarti perbandingan antara kesamaan kata tiap

kelas dibandingkan dengan jumlah kata unik dari keseluruhan dokumen dan

jumlah kata dari kelas tersebut. Sehingga semakin banyak kata yang mencirikan

kelas tersebut, maka Conditional Probability nya semakin besar.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 78: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

62

BAB VI

KESIMPULAN DAN SARAN

6.1. Kesimpulan

Dari hasil pembangunan sistem dan hasil proses klasifikasi serta akurasi

yang telah dilakukan terhadap algoritma Naive Bayes dalam identifikasi makna

kata dalam artikel berbahasa Indonesia, maka dapat diambil kesimpulan sebagai

berikut :

1. Jumlah data yang menjadi data training mempengaruhi hasil

klasifikasi.

2. Nilai Conditional Probability berpengaruh terhadap hasil akurasi.

3. Banyaknya kata yang mencirikan suatu kelas berpengaruh pada hasil

akurasi.

6.2. Saran

Saran yang diberikan penulis untuk memperbaiki sistem adalah :

1. Melakukan pengujian terhadap data yang digunakan menggunakan

algoritma klasifikasi yang lain, untuk membandingkan dengan

algoritma Naive Bayes yang dipakai dalam skripsi ini.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 79: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

63

DAFTAR PUSTAKA

Arifin A.Z., Mahendra P.A.K. and Ciptaningtyas H.T..(2014). Enhanced Confix

Stripping Stemmer and Ants Algorithm for Classifying News Document

in Indonesian Language. Surabaya, Sepuluh November Institute of

Technology, http://www.its.ac.id/personal/files/pub/2623-agusza-

baru%2021%20d%20VIP%20enhanced-confix-stripping-stem.pdf,

diakses terakhir 24 Juli 2016.

Austa, L. (2009). Perbandingan Algoritma Stemming Porter dengan Algoritma

Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia.

Indonesia, Universtas Kristen Satya Wacana,

https://yudiagusta.files.wordpress.com/2009/11/196-201-knsi09-036-

perbandingan-algoritma-stemming-porter-dengan-algoritma-nazief-

adriani-untuk-stemming-dokumen-teks-bahasa-indonesia.pdf, diakses

terakhir tanggal 23 Juli 2016.

Budi Santosa. (2007). Data Mining: Teknik Pemanfaatan Data untuk Keperluan

Bisnis. Yogyakarta: Graha Ilmu, pp. 76-86.

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schutze. (2009). An

Introduction to Information Retrieval. Cambridge: Cambridge University

Press.

Dwijatmoko, B.B. (2016). Ideologi Kesabaran dalam Karya Sastra Indonesia.

Buku Kumpulan Makalah Kongres Internasional Masyarakat Linguistik,

pp. 103-106.

Jiawei Han and Micheline Kamber. (2006). Data Mining: Concepts and

Techniques. 2nd Ed. San Francisco: Morgan Kaufman Publisher, pp.

614-628.

Kusrini dan T.L. Emha. (2009). Algoritma Data Mining. Yogyakarta: Andi Offset,

pp. 190-198.

Violya Y. (2015). “Klasifikasi Dokumen Bahasa Jawa Menggunakan Metode

Naive Bayesian”. Skripsi. Yogyakarta: Teknik Informatikan Sanata

Dharma.

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 80: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

64

Lampiran 1 Tabel Hasil Pengujian

1. Hasil Pengujian 1

1.1. Tabel Hasil Pengujian 1

TAHA

P Dokumen Status Awal Status Sistem

P(Tk|C) Nilai

Akuras

i (%)

Tahap

1

10giliran.txt giliran komunikasi

giliran 1,44E-09

FALS

E

31.58

komunikasi 3,72E-09

kondisi 5,13E-11

pekerjaan 6,16E-12

sifat 1,12E-10

urutan_tindak

an 4,48E-11

11giliran.txt giliran giliran

giliran 4,13E-28 TRUE

komunikasi 3,83E-28

kondisi 4,87E-30

pekerjaan 6,28E-30

sifat 2,14E-29

urutan_tindakan 9,42E-29

12giliran.txt giliran kondisi

giliran 8,92E-15

FALS

E

komunikasi 3,70E-14

kondisi 4,67E-13

pekerjaan 2,47E-13

sifat 2,15E-13

urutan_tindak

an 5,02E-13

13giliran.txt giliran giliran

giliran 4,91E-16 TRUE

komunikasi 8,29E-18

kondisi 2,95E-17

pekerjaan 6,20E-18

sifat 4,07E-18

urutan_tindakan 4,74E-17

10komunikasi.txt komunikasi komunikasi

giliran 1,14E-31 TRUE

komunikasi 1,03E-29

kondisi 2,39E-32

pekerjaan 1,26E-31

sifat 4,36E-32

urutan_tindak

an 1,76E-31

11komunikasi.txt komunikasi urutan_tindak

an giliran 2,46E-17

FALS

E

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 81: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

65

komunikasi 4,15E-18

kondisi 2,95E-17

pekerjaan 6,20E-18

sifat 6,11E-18

urutan_tindak

an 5,26E-19

10kondisi.txt kondisi giliran

giliran 6,32E-05 FALSE

komunikasi 6,45E-06

kondisi 4,46E-06

pekerjaan 6,13E-06

sifat 7,76E-06

urutan_tindakan 2,12E-04

11kondisi.txt kondisi komunikasi

giliran 1,58E-04

FALS

E

komunikasi 3,87E-04

kondisi 1,79E-04

pekerjaan 6,13E-06

sifat 3,88E-06

urutan_tindak

an 1,06E-04

12kondisi.txt kondisi kondisi

giliran 8,71E-10 TRUE

komunikasi 2,31E-08

kondisi 3,05E-06

pekerjaan 4,92E-07

sifat 3,30E-09

urutan_tindakan 1,78E-07

13kondisi.txt kondisi komunikasi

giliran 5,84E-48

FALS

E

komunikasi 6,58E-47

kondisi 7,40E-49

pekerjaan 2,56E-47

sifat 6,49E-48

urutan_tindak

an 3,30E-46

14kondisi.txt kondisi komunikasi

giliran 5,20E-19

FALS

E

komunikasi 1,45E-17

kondisi 1,68E-19

pekerjaan 4,48E-19

sifat 1,04E-19

urutan_tindak

an 1,77E-20

15kondisi.txt kondisi kondisi

giliran 6,21E-38 TRUE

komunikasi 2,45E-36

kondisi 5,10E-37

pekerjaan 7,60E-38

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 82: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

66

sifat 4,27E-37

urutan_tindakan 3,10E-39

1pekerjaan.txt pekerjaan kondisi

giliran 4,58E-29

FALS

E

komunikasi 7,46E-29

kondisi 1,21E-26

pekerjaan 3,77E-29

sifat 1,28E-28

urutan_tindak

an 4,71E-29

1pekerjaan.txt pekerjaan kondisi

giliran 4,58E-29 FALSE

komunikasi 7,46E-29

kondisi 1,21E-26

pekerjaan 3,77E-29

sifat 1,28E-28

urutan_tindak

an 4,71E-29

10sifat.txt sifat sifat

giliran 2,99E-54 TRUE

komunikasi 2,20E-53

kondisi 7,98E-53

pekerjaan 5,14E-53

sifat 2,38E-51

urutan_tindak

an 3,10E-53

11sifat.txt sifat urutan_tindakan

giliran 4,06E-20 FALSE

komunikasi 3,71E-21

kondisi 1,34E-20

pekerjaan 1,24E-19

sifat 1,39E-19

urutan_tindak

an 2,65E-19

10urutanTindakan.t

xt

urutan_tindak

an komunikasi

giliran 1,49E-64

FALS

E

komunikasi 1,36E-63

kondisi 5,06E-66

pekerjaan 6,51E-66

sifat 5,00E-64

urutan_tindakan 2,57E-64

11urutanTindakan.t

xt

urutan_tindak

an sifat

giliran 6,71E-24

FALS

E

komunikasi 5,98E-23

kondisi 6,78E-24

pekerjaan 6,24E-25

sifat 1,42E-21

urutan_tindak

an 7,42E-23

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 83: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

67

12urutanTindakan.txt

urutan_tindakan

giliran

giliran 3,93E-57

FALS

E

komunikasi 4,23E-59

kondisi 2,45E-60

pekerjaan 1,03E-57

sifat 1,53E-58

urutan_tindakan 1,17E-57

Tahap 2

14giliran.txt giliran kondisi

giliran 1,11E-34

FALS

E

44.44

komunikasi 2,59E-33

kondisi 7,46E-34

pekerjaan 2,65E-33

sifat 8,96E-35

urutan_tindak

an 3,22E-35

15giliran.txt giliran giliran

giliran 2,43E-39 TRUE

komunikasi 1,69E-40

kondisi 6,22E-42

pekerjaan 1,13E-40

sifat 9,09E-42

urutan_tindakan 2,58E-40

16giliran.txt giliran giliran

giliran 1,66E-12 TRUE

komunikasi 2,98E-14

kondisi 4,87E-14

pekerjaan 2,03E-13

sifat 3,87E-15

urutan_tindak

an 1,98E-13

17giliran.txt giliran giliran

giliran 1,71E-14 TRUE

komunikasi 1,68E-17

kondisi 1,74E-16

pekerjaan 2,06E-16

sifat 4,19E-17

urutan_tindak

an 6,01E-16

12komunikasi.txt komunikasi urutan_tindak

an

giliran 6,66E-05

FALS

E

komunikasi 9,01E-06

kondisi 6,05E-06

pekerjaan 9,79E-07

sifat 5,30E-06

urutan_tindak

an 1,10E-05

13komunikasi.txt komunikasi kondisi giliran 5,76E-116 FALSE

komunikasi 1,70E-114

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 84: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

68

kondisi 2,29E-112

pekerjaan 1,47E-113

sifat 6,85E-116

urutan_tindak

an 2,68E-112

16kondisi.txt kondisi kondisi

giliran 2,43E-20 TRUE

komunikasi 2,63E-20

kondisi 4,63E-19

pekerjaan 1,25E-18

sifat 9,43E-21

urutan_tindak

an 9,39E-21

17kondisi.txt kondisi giliran

giliran 1,46E+04 FALSE

komunikasi 4,09E+01

kondisi 3,82E+02

pekerjaan 1,91E+01

sifat 6,53E-01

urutan_tindak

an 4,62E+01

18kondisi.txt kondisi komunikasi

giliran 1,08E-61

FALS

E

komunikasi 2,79E-59

kondisi 1,61E-60

pekerjaan 4,93E-62

sifat 4,67E-62

urutan_tindak

an 1,51E-60

19kondisi.txt kondisi kondisi

giliran 7,80E-03 TRUE

komunikasi 9,59E-03

kondisi 1,52E-01

pekerjaan 9,68E-03

sifat 2,35E-02

urutan_tindak

an 1,30E-01

1kondisi.txt kondisi giliran

giliran 1,44E-118

FALS

E

komunikasi 2,93E-123

kondisi 1,23E-125

pekerjaan 7,14E-124

sifat 3,87E-124

urutan_tindakan 2,76E-122

20kondisi.txt kondisi urutan_tindak

an

giliran 1,42E-16

FALS

E

komunikasi 1,40E-16

kondisi 9,69E-18

pekerjaan 6,17E-18

sifat 2,09E-17

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 85: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

69

urutan_tindak

an 2,23E-16

2pekerjaan.txt pekerjaan kondisi

giliran 3,56E-17

FALS

E

komunikasi 1,40E-16

kondisi 7,27E-18

pekerjaan 2,06E-16

sifat 3,49E-18

urutan_tindak

an 5,56E-20

12sifat.txt sifat kondisi

giliran 5,55E-36 FALSE

komunikasi 9,60E-36

kondisi 2,12E-32

pekerjaan 1,11E-35

sifat 1,34E-32

urutan_tindakan 1,29E-33

1sifat.txt sifat sifat

giliran 4,37E-147 TRUE

komunikasi 3,54E-147

kondisi 3,94E-145

pekerjaan 3,78E-146

sifat 6,20E-144

urutan_tindak

an 6,76E-147

13urutanTindakan.txt

urutan_tindakan

urutan_tindakan

giliran 9,73E-33 TRUE

komunikasi 1,02E-31

kondisi 6,18E-33

pekerjaan 1,09E-31

sifat 1,24E-31

urutan_tindak

an 3,43E-30

14urutanTindakan.txt

urutan_tindakan

urutan_tindakan

giliran 6,66E-05 TRUE

komunikasi 2,70E-05

kondisi 1,21E-04

pekerjaan 9,79E-06

sifat 5,30E-06

urutan_tindakan 2,19E-04

15urutanTindakan.t

xt

urutan_tindak

an sifat

giliran 3,46E-45

FALS

E

komunikasi 9,54E-44

kondisi 1,19E-42

pekerjaan 1,37E-43

sifat 3,93E-45

urutan_tindak

an 9,66E-45

Tahap

3 18giliran.txt giliran kondisi

giliran 8,18E-15

FALS

E 44.44

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 86: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

70

komunikasi 2,62E-14

kondisi 8,21E-14

pekerjaan 2,54E-14

sifat 1,08E-13

urutan_tindak

an 1,72E-13

19giliran.txt giliran giliran

giliran 1,92E-36 TRUE

komunikasi 3,56E-39

kondisi 9,35E-39

pekerjaan 1,68E-37

sifat 5,71E-39

urutan_tindak

an 9,84E-38

1giliran.txt giliran giliran

giliran 1,81E-16 TRUE

komunikasi 4,50E-20

kondisi 1,79E-18

pekerjaan 4,09E-20

sifat 9,22E-21

urutan_tindakan 7,74E-20

20giliran.txt giliran urutan_tindak

an

giliran 8,85E-26

FALS

E

komunikasi 4,83E-26

kondisi 1,38E-26

pekerjaan 1,46E-25

sifat 1,18E-25

urutan_tindak

an 1,74E-24

14komunikasi.txt komunikasi komunikasi

giliran 1,18E-28 TRUE

komunikasi 3,98E-29

kondisi 4,34E-32

pekerjaan 9,39E-32

sifat 1,34E-31

urutan_tindakan 1,05E-29

15komunikasi.txt komunikasi kondisi

giliran 8,85E-26

FALS

E

komunikasi 2,90E-25

kondisi 2,08E-24

pekerjaan 1,46E-25

sifat 1,18E-26

urutan_tindak

an 2,33E-25

21kondisi.txt kondisi kondisi

giliran 2,22E-16 TRUE

komunikasi 1,21E-16

kondisi 2,50E-17

pekerjaan 1,32E-16

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 87: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

71

sifat 2,00E-16

urutan_tindakan 2,23E-16

22kondisi.txt kondisi kondisi

giliran 4,43E-17 TRUE

komunikasi 9,71E-17

kondisi 9,01E-16

pekerjaan 1,32E-16

sifat 8,99E-17

urutan_tindak

an 1,12E-16

23kondisi.txt kondisi giliran

giliran 2,78E+02

FALS

E

komunikasi 1,91E+01

kondisi 1,59E+02

pekerjaan 1,07E+02

sifat 1,61E+02

urutan_tindakan 2,64E+02

24kondisi.txt kondisi sifat

giliran 1,00E-10

FALS

E

komunikasi 1,41E-11

kondisi 8,07E-13

pekerjaan 3,69E-10

sifat 2,34E-11

urutan_tindak

an 4,96E-12

25kondisi.txt kondisi kondisi

giliran 7,96E-03 TRUE

komunikasi 8,87E-03

kondisi 6,08E-02

pekerjaan 1,11E-01

sifat 7,44E-03

urutan_tindakan 7,62E-03

26kondisi.txt kondisi urutan_tindak

an

giliran 1,26E+08

FALS

E

komunikasi 1,11E+07

kondisi 1,37E+08

pekerjaan 9,98E+06

sifat 9,45E+06

urutan_tindak

an 2,34E+08

3pekerjaan.txt pekerjaan urutan_tindakan

giliran 1,59E-60

FALS

E

komunikasi 1,24E-60

kondisi 1,02E-62

pekerjaan 2,21E-61

sifat 4,83E-62

urutan_tindak

an 1,88E-60

2sifat.txt sifat sifat giliran 2,75E-209 TRUE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 88: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

72

komunikasi 1,08E-207

kondisi 1,63E-211

pekerjaan 3,86E-207

sifat 1,07E-204

urutan_tindak

an 2,69E-210

3sifat.txt sifat kondisi

giliran 2,82E-33 FALSE

komunikasi 2,46E-33

kondisi 3,05E-30

pekerjaan 3,24E-36

sifat 2,23E-30

urutan_tindakan 3,78E-34

16urutanTindakan.t

xt

urutan_tindak

an

urutan_tindak

an

giliran 3,80E-66 TRUE

komunikasi 1,44E-64

kondisi 4,38E-66

pekerjaan 2,29E-64

sifat 2,51E-65

urutan_tindak

an 5,42E-65

17urutanTindakan.txt

urutan_tindakan

kondisi

giliran 1,03E-12 FALSE

komunikasi 1,05E-12

kondisi 1,23E-13

pekerjaan 1,27E-14

sifat 1,08E-13

urutan_tindakan 1,72E-13

18urutanTindakan.t

xt

urutan_tindak

an kondisi

giliran 6,48E-73

FALS

E

komunikasi 2,93E-71

kondisi 8,48E-69

pekerjaan 1,30E-71

sifat 2,70E-71

urutan_tindak

an 1,81E-71

Tahap

4

21giliran.txt giliran giliran

giliran 4,88E-35 TRUE

31.58

komunikasi 8,14E-37

kondisi 3,19E-35

pekerjaan 5,38E-39

sifat 7,05E-38

urutan_tindak

an 7,43E-37

22giliran.txt giliran kondisi

giliran 4,88E-05

FALS

E

komunikasi 4,40E-05

kondisi 5,98E-04

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 89: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

73

pekerjaan 1,38E-05

sifat 1,19E-04

urutan_tindakan 5,20E-04

23giliran.txt giliran kondisi

giliran 1,90E-12

FALS

E

komunikasi 1,03E-13

kondisi 5,28E-12

pekerjaan 1,65E-14

sifat 7,01E-14

urutan_tindak

an 2,54E-15

2giliran.txt giliran giliran

giliran 1,49E-68 TRUE

komunikasi 2,12E-69

kondisi 2,11E-71

pekerjaan 4,20E-70

sifat 7,75E-72

urutan_tindakan 7,86E-72

1komunikasi.txt komunikasi komunikasi

giliran 7,58E-09 TRUE

komunikasi 3,23E-08

kondisi 1,07E-08

pekerjaan 1,46E-07

sifat 5,36E-08

urutan_tindak

an 7,81E-09

2komunikasi.txt komunikasi pekerjaan

giliran 8,24E-89

FALS

E

komunikasi 1,36E-88

kondisi 4,05E-88

pekerjaan 2,42E-86

sifat 4,52E-89

urutan_tindakan 2,52E-88

3komunikasi.txt komunikasi kondisi

giliran 2,33E-27

FALS

E

komunikasi 1,82E-28

kondisi 1,10E-26

pekerjaan 6,72E-30

sifat 5,30E-29

urutan_tindak

an 9,03E-29

27kondisi.txt kondisi giliran

giliran 3,54E-50

FALS

E

komunikasi 9,64E-52

kondisi 9,46E-54

pekerjaan 3,64E-53

sifat 2,84E-52

urutan_tindak

an 3,29E-51

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 90: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

74

28kondisi.txt kondisi urutan_tindakan

giliran 7,58E-09

FALS

E

komunikasi 1,08E-08

kondisi 1,07E-07

pekerjaan 1,46E-07

sifat 5,36E-10

urutan_tindakan 2,34E-08

29kondisi.txt kondisi kondisi

giliran 1,30E-28 TRUE

komunikasi 1,82E-28

kondisi 2,75E-28

pekerjaan 2,24E-28

sifat 2,12E-28

urutan_tindak

an 4,14E-28

2kondisi.txt kondisi giliran

giliran 3,30E-23

FALS

E

komunikasi 9,55E-24

kondisi 1,42E-24

pekerjaan 1,98E-22

sifat 1,94E-24

urutan_tindakan 9,27E-24

30kondisi.txt kondisi kondisi

giliran 5,18E-31 TRUE

komunikasi 3,64E-28

kondisi 1,10E-27

pekerjaan 2,24E-28

sifat 2,12E-27

urutan_tindak

an 2,26E-28

31kondisi.txt kondisi komunikasi

giliran 1,19E-13

FALS

E

komunikasi 2,05E-13

kondisi 6,87E-15

pekerjaan 3,31E-13

sifat 4,38E-15

urutan_tindakan 6,34E-15

4pekerjaan.txt pekerjaan pekerjaan

giliran 1,96E-56 TRUE

komunikasi 2,94E-55

kondisi 8,54E-57

pekerjaan 2,32E-54

sifat 3,42E-55

urutan_tindak

an 6,47E-56

4sifat.txt sifat urutan_tindakan

giliran 1,51E-65

FALS

E

komunikasi 1,10E-63

kondisi 9,81E-67

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 91: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

75

pekerjaan 9,30E-65

sifat 3,79E-65

urutan_tindakan 3,48E-63

5sifat.txt sifat giliran

giliran 6,22E-28

FALS

E

komunikasi 1,82E-28

kondisi 1,10E-28

pekerjaan 4,48E-28

sifat 3,97E-28

urutan_tindak

an 9,03E-29

19urutanTindakan.t

xt

urutan_tindak

an giliran

giliran 3,00E-17

FALS

E

komunikasi 8,01E-17

kondisi 1,38E-16

pekerjaan 1,76E-16

sifat 7,92E-18

urutan_tindak

an 3,43E-16

1urutanTindakan.txt

urutan_tindakan

giliran

giliran 5,27E-50 FALSE

komunikasi 3,09E-49

kondisi 1,47E-49

pekerjaan 1,37E-48

sifat 1,57E-50

urutan_tindakan 1,63E-50

20urutanTindakan.t

xt

urutan_tindak

an komunikasi

giliran 1,87E-137

FALS

E

komunikasi 2,98E-134

kondisi 1,54E-135

pekerjaan 2,40E-135

sifat 1,01E-136

urutan_tindak

an 1,27E-136

Tahap

5

3giliran.txt giliran kondisi

giliran 1,36E+11

FALS

E

47.37

komunikasi 2,18E+11

kondisi 5,65E+11

pekerjaan 8,95E+09

sifat 2,62E+11

urutan_tindak

an 5,90E+10

4giliran.txt giliran giliran

giliran 1,68E-10 TRUE

komunikasi 4,35E-13

kondisi 2,84E-12

pekerjaan 8,73E-15

sifat 2,45E-14

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 92: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

76

urutan_tindak

an 5,93E-14

5giliran.txt giliran giliran

giliran 2,29E-36 TRUE

komunikasi 4,77E-40

kondisi 8,15E-39

pekerjaan 1,02E-39

sifat 2,26E-39

urutan_tindakan 1,23E-38

6giliran.txt giliran giliran

giliran 2,51E-09 TRUE

komunikasi 4,75E-11

kondisi 1,18E-09

pekerjaan 2,63E-11

sifat 1,15E-10

urutan_tindak

an 2,37E-09

4komunikasi.txt komunikasi giliran

giliran 9,61E-42 FALSE

komunikasi 1,09E-42

kondisi 1,54E-42

pekerjaan 3,39E-43

sifat 1,51E-44

urutan_tindakan 7,09E-45

5komunikasi.txt komunikasi komunikasi

giliran 3,97E-27 TRUE

komunikasi 1,54E-25

kondisi 2,36E-27

pekerjaan 1,73E-25

sifat 1,30E-27

urutan_tindak

an 3,97E-28

6komunikasi.txt komunikasi komunikasi

giliran 2,93E-37 TRUE

komunikasi 5,20E-38

kondisi 6,99E-38

pekerjaan 1,71E-37

sifat 4,14E-38

urutan_tindak

an 9,19E-38

32kondisi.txt kondisi urutan_tindak

an

giliran 3,66E-38

FALS

E

komunikasi 2,17E-37

kondisi 1,64E-38

pekerjaan 7,67E-38

sifat 8,27E-39

urutan_tindak

an 3,06E-38

33kondisi.txt kondisi sifat giliran 3,86E-23 FALSE

komunikasi 1,68E-23

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 93: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

77

kondisi 4,10E-23

pekerjaan 1,04E-22

sifat 2,20E-22

urutan_tindak

an 9,53E-24

34kondisi.txt kondisi giliran

giliran 7,54E-27

FALS

E

komunikasi 7,04E-30

kondisi 7,25E-30

pekerjaan 1,72E-28

sifat 3,55E-29

urutan_tindakan 4,41E-30

3kondisi.txt kondisi sifat

giliran 7,11E-35

FALS

E

komunikasi 1,42E-33

kondisi 1,82E-34

pekerjaan 1,71E-34

sifat 6,51E-29

urutan_tindak

an 6,90E-36

4kondisi.txt kondisi urutan_tindak

an

giliran 7,53E-60 FALSE

komunikasi 1,27E-56

kondisi 2,19E-57

pekerjaan 1,34E-57

sifat 7,84E-58

urutan_tindak

an 1,15E-55

5pekerjaan.txt pekerjaan pekerjaan

giliran 4,62E-55 TRUE

komunikasi 1,40E-52

kondisi 8,72E-55

pekerjaan 6,72E-53

sifat 3,12E-55

urutan_tindak

an 5,13E-55

6sifat.txt sifat urutan_tindakan

giliran 3,14E-61 FALSE

komunikasi 3,54E-59

kondisi 3,42E-59

pekerjaan 8,35E-60

sifat 5,45E-60

urutan_tindak

an 2,89E-58

7sifat.txt sifat sifat

giliran 1,56E-20 TRUE

komunikasi 9,14E-21

kondisi 5,34E-22

pekerjaan 8,68E-21

sifat 3,43E-18

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 94: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

78

urutan_tindak

an 1,53E-19

2urutanTindakan.tx

t

urutan_tindak

an sifat

giliran 4,44E-54

FALS

E

komunikasi 1,47E-51

kondisi 1,74E-52

pekerjaan 6,72E-53

sifat 1,80E-52

urutan_tindak

an 9,24E-55

3urutanTindakan.txt

urutan_tindakan

kondisi

giliran 3,49E-12 FALSE

komunikasi 1,19E-10

kondisi 1,18E-11

pekerjaan 3,50E-11

sifat 1,73E-11

urutan_tindakan 1,98E-10

4urutanTindakan.tx

t

urutan_tindak

an

urutan_tindak

an

giliran 2,62E-29 TRUE

komunikasi 8,45E-29

kondisi 1,81E-28

pekerjaan 8,60E-30

sifat 3,33E-29

urutan_tindak

an 8,83E-29

5urutanTindakan.txt

urutan_tindakan

urutan_tindakan

giliran 3,39E-07 TRUE

komunikasi 1,30E-07

kondisi 4,16E-07

pekerjaan 8,79E-09

sifat 8,09E-08

urutan_tindak

an 1,42E-05

Tahap

6

7giliran.txt giliran giliran

giliran 3,68E-156 TRUE

38.89

komunikasi 1,07E-157

kondisi 3,40E-162

pekerjaan 6,91E-163

sifat 1,32E-164

urutan_tindak

an 1,42E-166

8giliran.txt giliran giliran

giliran 3,56E-28 TRUE

komunikasi 1,77E-27

kondisi 2,06E-27

pekerjaan 3,17E-28

sifat 2,40E-28

urutan_tindak

an 1,69E-27

9giliran.txt giliran giliran giliran 1,03E-63 TRUE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 95: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

79

komunikasi 3,61E-65

kondisi 3,92E-65

pekerjaan 4,98E-64

sifat 1,90E-65

urutan_tindak

an 8,30E-65

7komunikasi.txt komunikasi komunikasi

giliran 2,91E-18 TRUE

komunikasi 9,28E-17

kondisi 2,66E-19

pekerjaan 1,41E-20

sifat 5,72E-21

urutan_tindak

an 1,67E-19

8komunikasi.txt komunikasi kondisi

giliran 6,62E-11

FALS

E

komunikasi 4,35E-11

kondisi 1,54E-09

pekerjaan 5,05E-12

sifat 1,64E-10

urutan_tindak

an 1,92E-09

9komunikasi.txt komunikasi komunikasi

giliran 1,21E-19 TRUE

komunikasi 2,39E-19

kondisi 2,21E-20

pekerjaan 1,41E-19

sifat 2,86E-21

urutan_tindak

an 8,33E-21

5kondisi.txt kondisi komunikasi

giliran 7,17E-48

FALS

E

komunikasi 9,59E-46

kondisi 9,79E-48

pekerjaan 3,97E-47

sifat 1,95E-47

urutan_tindak

an 1,03E-46

6kondisi.txt kondisi urutan_tindakan

giliran 1,57E-84 FALSE

komunikasi 1,68E-85

kondisi 1,96E-86

pekerjaan 5,84E-85

sifat 5,93E-86

urutan_tindakan 2,45E-83

7kondisi.txt kondisi giliran

giliran 5,87E-39

FALS

E

komunikasi 1,62E-37

kondisi 1,77E-38

pekerjaan 1,77E-37

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 96: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

80

sifat 8,37E-40

urutan_tindakan 1,12E-38

8kondisi.txt kondisi kondisi

giliran 2,39E-48 TRUE

komunikasi 7,99E-47

kondisi 1,57E-46

pekerjaan 5,36E-47

sifat 2,92E-47

urutan_tindak

an 8,56E-48

9kondisi.txt kondisi giliran

giliran 6,61E-07

FALS

E

komunikasi 4,64E-08

kondisi 2,99E-07

pekerjaan 7,30E-08

sifat 1,11E-06

urutan_tindakan 1,22E-06

6pekerjaan.txt pekerjaan kondisi

giliran 2,55E-43

FALS

E

komunikasi 6,82E-43

kondisi 4,61E-41

pekerjaan 3,83E-43

sifat 5,27E-45

urutan_tindak

an 5,31E-43

8sifat.txt sifat kondisi

giliran 1,09E-18 FALSE

komunikasi 1,19E-19

kondisi 6,38E-19

pekerjaan 1,41E-19

sifat 5,14E-20

urutan_tindak

an 1,67E-19

9sifat.txt sifat kondisi

giliran 7,71E-66

FALS

E

komunikasi 1,44E-63

kondisi 5,65E-64

pekerjaan 7,47E-65

sifat 1,52E-63

urutan_tindakan 1,38E-64

6urutanTindakan.tx

t

urutan_tindak

an kondisi

giliran 1,08E-16

FALS

E

komunikasi 3,82E-18

kondisi 3,31E-16

pekerjaan 1,36E-16

sifat 6,44E-18

urutan_tindak

an 3,23E-17

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 97: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

81

7urutanTindakan.tx

t

urutan_tindak

an

urutan_tindak

an

giliran 2,99E-13 TRUE

komunikasi 1,36E-13

kondisi 1,03E-13

pekerjaan 1,31E-13

sifat 2,18E-13

urutan_tindak

an 4,51E-14

8urutanTindakan.tx

t

urutan_tindak

an giliran

giliran 5,79E-36 FALSE

komunikasi 1,29E-34

kondisi 1,77E-34

pekerjaan 3,42E-34

sifat 1,26E-34

urutan_tindak

an 7,83E-37

9urutanTindakan.txt

urutan_tindakan

kondisi

giliran 6,06E-17

FALS

E

komunikasi 6,12E-16

kondisi 6,62E-16

pekerjaan 1,23E-15

sifat 1,29E-17

urutan_tindakan 1,55E-15

Rata rata Akurasi 39.72

1.2. Pengambilan 10 dokumen dengan conditioanl probability tertinggi

1.2.1. Data Kategori Giliran

No GILIRAN

Conditional

Proability

1 3giliran.txt 1,36E+11

2 22giliran.txt 4,88E-05

3 6giliran.txt 2,51E-09

4 10giliran.txt 1,44E-09

5 4giliran.txt 1,68E-10

6 23giliran.txt 1,90E-12

7 16giliran.txt 1,66E-12

8 17giliran.txt 1,71E-14

9 12giliran.txt 8,92E-15

10 18giliran.txt 8,18E-15

11 13giliran.txt 4,91E-16

12 1giliran.txt 1,81E-16

13 20giliran.txt 8,85E-26

14 11giliran.txt 4,13E-28

15 8giliran.txt 3,56E-28

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 98: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

82

16 14giliran.txt 1,11E-34

17 21giliran.txt 4,88E-35

18 5giliran.txt 2,29E-36

19 19giliran.txt 1,92E-36

20 15giliran.txt 2,43E-39

21 9giliran.txt 1,03E-63

22 2giliran.txt 1,49E-68

23 7giliran.txt 3,68E-156

1.2.2. Data Kategori Komunikasi

No KOMUNIKASI

Conditional

Probability

1 12komunikasi.txt 9,01E-06

1 1komunikasi.txt 3,23E-08

1 8komunikasi.txt 4,35E-11

1 7komunikasi.txt 9,28E-17

1 11komunikasi.txt 4,15E-18

1 9komunikasi.txt 2,39E-19

1 15komunikasi.txt 2,90E-25

1 5komunikasi.txt 1,54E-25

1 14komunikasi.txt 3,98E-29

1 10komunikasi.txt 1,03E-29

1 6komunikasi.txt 5,20E-38

1 4komunikasi.txt 1,09E-42

1 2komunikasi.txt 1,36E-88

1 13komunikasi.txt 1,70E-114

1.2.3. Data Kategori Kondisi

No KONDISI

Conditional

Probability

1 26kondisi.txt 1,37E+08

2 17kondisi.txt 3,82E+02

3 23kondisi.txt 1,59E+02

4 19kondisi.txt 1,52E-01

5 25kondisi.txt 6,08E-02

6 11kondisi.txt 1,79E-04

7 10kondisi.txt 4,46E-06

8 12kondisi.txt 3,05E-06

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 99: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

83

9 9kondisi.txt 2,99E-07

10 28kondisi.txt 1,07E-07

11 24kondisi.txt 8,07E-13

12 31kondisi.txt 6,87E-15

13 22kondisi.txt 9,01E-16

14 21kondisi.txt 2,50E-17

15 20kondisi.txt 9,69E-18

16 16kondisi.txt 4,63E-19

17 14kondisi.txt 1,68E-19

18 33kondisi.txt 4,10E-23

19 2kondisi.txt 1,42E-24

20 30kondisi.txt 1,10E-27

21 29kondisi.txt 2,75E-28

22 34kondisi.txt 7,25E-30

23 3kondisi.txt 1,82E-34

24 15kondisi.txt 5,10E-37

25 7kondisi.txt 1,77E-38

26 32kondisi.txt 1,64E-38

27 8kondisi.txt 1,57E-46

28 5kondisi.txt 9,79E-48

29 13kondisi.txt 7,40E-49

30 27kondisi.txt 9,46E-54

31 4kondisi.txt 2,19E-57

32 18kondisi.txt 1,61E-60

33 6kondisi.txt 1,96E-86

34 1kondisi.txt 1,23E-125

1.2.4. Data kategori Sifat

No SIFAT SumCon

1 7sifat.txt 3,43E-18

2 11sifat.txt 1,39E-19

3 8sifat.txt 5,14E-20

4 5sifat.txt 3,97E-28

5 3sifat.txt 2,23E-30

6 12sifat.txt 1,34E-32

7 10sifat.txt 2,38E-51

8 6sifat.txt 5,45E-60

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 100: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

84

9 9sifat.txt 1,52E-63

10 4sifat.txt 3,79E-65

11 1sifat.txt 6,20E-144

12 2sifat.txt 1,07E-204

1.2.5. Data Urutan Tindakan

No Urutan Tindakan SumCon

1 14urutanTindakan.txt 2,19E-04

2 5urutanTindakan.txt 1,42E-05

3 3urutanTindakan.txt 1,98E-10

4 17urutanTindakan.txt 1,72E-13

5 7urutanTindakan.txt 4,51E-14

6 9urutanTindakan.txt 1,55E-15

7 19urutanTindakan.txt 3,43E-16

8 6urutanTindakan.txt 3,23E-17

9 11urutanTindakan.txt 7,42E-23

10 4urutanTindakan.txt 8,83E-29

11 13urutanTindakan.txt 3,43E-30

12 8urutanTindakan.txt 7,83E-37

13 15urutanTindakan.txt 9,66E-45

14 1urutanTindakan.txt 1,63E-50

15 2urutanTindakan.txt 9,24E-55

16 12urutanTindakan.txt 1,17E-57

17 10urutanTindakan.txt 2,57E-64

18 16urutanTindakan.txt 5,42E-65

19 18urutanTindakan.txt 1,81E-71

20 20urutanTindakan.txt 1,27E-136

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 101: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

85

2. Pengujian 2

2.1. Tabel Hasil Pengujian 2

TAHA

P Dokumen Status Awal Status Sistem P(Tk|C) Nilai

Akurasi(

%)

TAHA

P 1

10giliran.txt giliran komunikasi

giliran

3,21E-

07

FALS

E

60

komunikasi 5,09E-07

kondisi

1,21E-

07

sifat 1,27E-07

urutan_tindak

an

5,36E-

09

10komunikasi.txt komunikasi komunikasi

giliran

4,13E-

25 TRUE

komunikasi

2,36E-

23

kondisi

2,12E-

24

sifat 3,48E-25

urutan_tindak

an

4,97E-

26

10kondisi.txt kondisi kondisi

giliran

5,79E-

03 TRUE

komunikasi

3,86E-

03

kondisi

8,74E-

03

sifat

3,03E-

04

urutan_tindak

an

4,64E-

03

10sifat.txt sifat kondisi

giliran 1,91E-43

FALSE

komunikasi

3,16E-

45

kondisi 7,40E-43

sifat

7,92E-

43

urutan_tindak

an

2,31E-

44

11urutanTindakan.

txt

urutan_tindak

an

urutan_tindak

an

giliran 2,70E-17 TRUE

komunikasi

6,37E-

19

kondisi 2,90E-17

sifat

2,25E-

18

urutan_tindak

an

7,16E-

18

TAHA

P 2 12giliran.txt giliran kondisi

giliran

7,27E-

11

FALS

E 0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 102: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

86

komunikasi

3,59E-

10

kondisi

5,04E-

10

sifat

5,24E-

11

urutan_tindakan

1,81E-10

11komunikasi.txt komunikasi kondisi

giliran

1,77E-

12

FALS

E

komunikasi 8,15E-14

kondisi

3,24E-

13

sifat 5,16E-14

urutan_tindakan

1,05E-12

11kondisi.txt kondisi komunikasi

giliran

1,01E-

01

FALS

E

komunikasi 1,85E-01

kondisi

7,42E-

03

sifat 1,15E-02

urutan_tindakan

7,24E-03

11sifat.txt sifat kondisi

giliran

4,30E-

16

FALS

E

komunikasi 3,70E-15

kondisi

3,33E-

14

sifat 2,71E-15

urutan_tindak

an

1,46E-

14

14urutanTindakan.txt

urutan_tindakan

komunikasi

giliran

5,05E-

03

FALS

E

komunikasi

9,25E-

03

kondisi

7,42E-

03

sifat

1,15E-

02

urutan_tindak

an

3,62E-

03

TAHAP 3

16giliran.txt giliran giliran

giliran 6,39E-10 TRUE

40

komunikasi

6,42E-

11

kondisi 2,52E-10

sifat

9,46E-

12

urutan_tindak

an

9,47E-

11

12komunikasi.txt komunikasi kondisi giliran

4,96E-02

FALSE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 103: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

87

komunikasi

2,85E-

03

kondisi

7,42E-

04

sifat

1,21E-

03

urutan_tindakan

3,74E-03

12kondisi.txt kondisi giliran

giliran

4,82E-

05

FALS

E

komunikasi 2,55E-06

kondisi

3,81E-

05

sifat 1,44E-04

urutan_tindakan

1,74E-05

12sifat.txt sifat sifat

giliran

3,52E-

29 TRUE

komunikasi 9,15E-30

kondisi

1,87E-

27

sifat 5,49E-28

urutan_tindakan

7,08E-29

17urutanTindakan.txt

urutan_tindakan

komunikasi

giliran

2,84E-

09

FALS

E

komunikasi 5,78E-10

kondisi

5,04E-

10

sifat 1,89E-10

urutan_tindak

an

9,47E-

11

TAHAP 4

17giliran.txt giliran giliran

giliran 2,38E-12 TRUE

60

komunikasi

8,22E-

14

kondisi 8,78E-14

sifat

1,18E-

13

urutan_tindak

an

3,43E-

14

14komunikasi.txt komunikasi komunikasi

giliran 7,91E-26 TRUE

komunikasi

4,86E-

24

kondisi 4,13E-26

sifat

1,63E-

26

urutan_tindak

an

1,26E-

25

17kondisi.txt kondisi giliran giliran

5,38E+05

FALSE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 104: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

88

komunikasi

2,22E+0

3

kondisi

1,88E+0

4

sifat

2,76E+0

2

urutan_tindakan

6,13E+02

3sifat.txt sifat sifat

giliran

4,69E-

29 TRUE

komunikasi 6,78E-29

kondisi

1,03E-

27

sifat 1,71E-25

urutan_tindakan

1,20E-29

19urutanTindakan.txt

urutan_tindakan

giliran

giliran

2,38E-

12

FALS

E

komunikasi 5,48E-13

kondisi

2,20E-

13

sifat 2,96E-13

urutan_tindakan

8,57E-14

TAHAP 5

18giliran.txt giliran giliran

giliran

7,97E-

09 TRUE

20

komunikasi

4,63E-

10

kondisi

3,02E-

10

sifat

2,78E-

10

urutan_tindak

an

1,14E-

09

15komunikasi.txt komunikasi giliran

giliran 3,02E-20

FALSE

komunikasi

2,71E-

20

kondisi 2,84E-20

sifat

7,53E-

22

urutan_tindak

an

2,91E-

20

19kondisi.txt kondisi sifat

giliran 2,33E+01

FALSE

komunikasi

1,58E+0

1

kondisi 3,22E+00

sifat

4,61E+0

0

urutan_tindak

an

1,80E+0

1

4sifat.txt sifat kondisi giliran 4,54E-55

FALSE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 105: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

89

komunikasi

2,52E-

53

kondisi

7,70E-

54

sifat

2,44E-

55

urutan_tindakan

1,39E-54

3urutanTindakan.txt

urutan_tindakan kondisi

giliran

3,57E-

08

FALS

E

komunikasi 3,98E-09

kondisi

5,77E-

08

sifat 4,04E-10

urutan_tindakan

2,41E-09

TAHAP 6

22giliran.txt giliran kondisi

giliran

4,04E-

02

FALS

E

0

komunikasi

1,10E-

01

kondisi

1,60E+0

0

sifat 2,26E-02

urutan_tindak

an

1,55E-

02

1komunikasi.txt komunikasi urutan_tindakan

giliran

1,07E-

04

FALS

E

komunikasi

1,23E-

04

kondisi

1,69E-

05

sifat

4,44E-

06

urutan_tindak

an

1,81E-

04

23kondisi.txt kondisi urutan_tindak

an

giliran 7,84E+02

FALSE

komunikasi

5,54E+0

2

kondisi 2,08E+04

sifat

5,85E+0

2

urutan_tindak

an

2,11E+0

3

5sifat.txt sifat giliran

giliran 7,70E-23

FALSE

komunikasi

1,70E-

23

kondisi 2,25E-22

sifat

7,52E-

24

urutan_tindak

an

3,50E-

23

4urutanTindakan.txt

urutan_tindakan

giliran giliran

1,92E-23

FALSE

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 106: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

90

komunikasi

1,70E-

23

kondisi

1,12E-

22

sifat

2,51E-

24

urutan_tindakan

1,40E-22

TAHAP 7

23giliran.txt giliran giliran

giliran

2,01E-

09 TRUE

60

komunikasi 5,20E-11

kondisi

1,72E-

09

sifat 5,91E-11

urutan_tindak

an

6,29E-

12

5komunikasi.txt komunikasi kondisi

giliran

7,99E-

21

FALS

E

komunikasi

3,19E-

21

kondisi

1,71E-

20

sifat 2,74E-22

urutan_tindak

an

4,16E-

21

25kondisi.txt kondisi kondisi

giliran

2,52E+0

0 TRUE

komunikasi

1,70E+0

1

kondisi

3,48E+0

0

sifat

7,97E-

02

urutan_tindak

an

1,90E+0

0

6sifat.txt sifat kondisi

giliran 4,03E-48

FALSE

komunikasi

7,80E-

51

kondisi 1,56E-47

sifat

4,20E-

50

urutan_tindak

an

1,88E-

50

5urutanTindakan.t

xt

urutan_tindak

an

urutan_tindak

an

giliran 3,18E-04 TRUE

komunikasi

9,39E-

07

kondisi 2,45E-05

sifat

1,37E-

04

urutan_tindak

an

3,50E-

03

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 107: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

91

TAHA

P 8

3giliran.txt giliran urutan_tindakan

giliran

5,36E+1

1

FALS

E

60

komunikasi

4,87E+0

8

kondisi

6,07E+1

0

sifat

3,68E+1

0

urutan_tindak

an

2,58E+1

2

7komunikasi.txt komunikasi komunikasi

giliran 1,89E-14 TRUE

komunikasi

1,71E-

12

kondisi 9,97E-16

sifat

7,50E-

17

urutan_tindak

an

3,80E-

16

26kondisi.txt kondisi kondisi

giliran 1,24E+08 TRUE

komunikasi

1,08E+0

9

kondisi 1,49E+09

sifat

7,07E+0

7

urutan_tindak

an

1,17E+0

9

7sifat.txt sifat sifat

giliran 4,73E-16 TRUE

komunikasi

1,34E-

15

kondisi 9,97E-16

sifat

4,50E-

15

urutan_tindak

an

1,90E-

15

6urutanTindakan.t

xt

urutan_tindak

an giliran

giliran

4,09E-

13

FALS

E

komunikasi

1,21E-

13

kondisi

4,05E-

13

sifat

2,61E-

13

urutan_tindak

an

1,67E-

12

TAHA

P 9 4giliran.txt giliran giliran

giliran

2,62E-

07 TRUE

60

komunikasi 2,88E-09

kondisi

1,09E-

09

sifat 9,09E-12

urutan_tindakan

4,06E-09

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 108: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

92

8komunikasi.txt komunikasi kondisi

giliran

6,24E-

08

FALS

E

komunikasi

3,17E-

08

kondisi

1,58E-

06

sifat

4,60E-

09

urutan_tindak

an

2,16E-

08

28kondisi.txt kondisi kondisi

giliran 1,28E-04 TRUE

komunikasi

6,99E-

06

kondisi 2,03E-04

sifat

2,33E-

05

urutan_tindak

an

9,22E-

06

8sifat.txt sifat giliran

giliran 2,74E-14

FALSE

komunikasi

1,85E-

16

kondisi 9,14E-16

sifat

7,10E-

17

urutan_tindak

an

2,80E-

16

7urutanTindakan.t

xt

urutan_tindak

an

urutan_tindak

an

giliran 1,53E-10 TRUE

komunikasi

3,59E-

10

kondisi 1,36E-09

sifat

1,82E-

11

urutan_tindak

an

4,06E-

09

TAHA

P 10

6giliran.txt giliran giliran

giliran

3,21E-

07 TRUE

40

komunikasi 7,79E-08

kondisi

1,24E-

06

sifat 2,74E-08

urutan_tindakan

1,03E-06

9komunikasi.txt komunikasi komunikasi

giliran

1,09E-

14 TRUE

komunikasi 1,22E-14

kondisi

1,14E-

14

sifat 6,05E-17

urutan_tindakan

3,51E-16

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 109: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

93

9kondisi.txt kondisi sifat

giliran

5,75E-

05

FALS

E

komunikasi

2,52E-

04

kondisi

4,70E-

04

sifat

7,97E-

05

urutan_tindak

an

2,15E-

04

9sifat.txt sifat kondisi

giliran 4,54E-55

FALSE

komunikasi

8,88E-

55

kondisi 4,76E-54

sifat

1,16E-

55

urutan_tindak

an

3,38E-

54

9urutanTindakan.t

xt

urutan_tindak

an kondisi

giliran 2,20E-13

FALSE

komunikasi

4,20E-

14

kondisi 1,73E-12

sifat

5,86E-

14

urutan_tindak

an

1,18E-

11

Total Akurasi 40

2.2. Pengambilan 6 Dokumen dengan nilai Conditional Probability

tertinggi

2.2.1. Data Kategori Giliran

No GILIRAN

Conditional

Probability

1 3giliran.txt 5,36E+11

2 22giliran.txt 4,04E-02

3 10giliran.txt 3,21E-07

4 6giliran.txt 3,21E-07

5 4giliran.txt 2,62E-07

6 18giliran.txt 7,97E-09

7 23giliran.txt 2,01E-09

8 16giliran.txt 6,39E-10

9 12giliran.txt 7,27E-11

10 17giliran.txt 2,38E-12

2.2.2. Data Kategori Komunikasi

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 110: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

94

No KOMUNIKASI Conditional Probability

1 12komunikasi.txt 2,85E-03

2 1komunikasi.txt 1,23E-04

3 8komunikasi.txt 3,17E-08

4 7komunikasi.txt 1,71E-12

5 11komunikasi.txt 8,15E-14

6 9komunikasi.txt 1,22E-14

7 15komunikasi.txt 2,71E-20

8 5komunikasi.txt 3,19E-21

9 10komunikasi.txt 2,36E-23

10 14komunikasi.txt 4,86E-24

2.2.3. Data Kategori Kondisi

No KONDISI

Conditional

Probability

1 26kondisi.txt 1,49E+09

2 23kondisi.txt 2,08E+04

3 17kondisi.txt 1,88E+04

4 25kondisi.txt 3,48E+00

5 19kondisi.txt 3,22E+00

6 10kondisi.txt 8,74E-03

7 11kondisi.txt 7,42E-03

8 9kondisi.txt 4,70E-04

9 28kondisi.txt 2,03E-04

10 12kondisi.txt 3,81E-05

2.2.4. Data Kategori Sifat

No SIFAT

Conditional

Probability

1 7sifat.txt 4,50E-15

2 11sifat.txt 2,71E-15

3 8sifat.txt 7,10E-17

4 5sifat.txt 7,52E-24

5 3sifat.txt 1,71E-25

6 12sifat.txt 5,49E-28

7 10sifat.txt 7,92E-43

8 6sifat.txt 4,20E-50

9 4sifat.txt 2,44E-55

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 111: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

95

10 9sifat.txt 1,16E-55

2.2.5. Data Kategori Urutan Tindakan

No URUTAN_TINDAKAN

Conditional

Probability

1 14urutanTindakan.txt 3,62E-03

2 5urutanTindakan.txt 3,50E-03

3 7urutanTindakan.txt 4,06E-09

4 3urutanTindakan.txt 2,41E-09

5 17urutanTindakan.txt 9,47E-11

6 9urutanTindakan.txt 1,18E-11

7 6urutanTindakan.txt 1,67E-12

8 19urutanTindakan.txt 8,57E-14

9 11urutanTindakan.txt 7,16E-18

10 4urutanTindakan.txt 1,40E-22

3. Pengujian 3

3.1. Tabel pengujian 3

Dokumen Status Awal Status Sistem P(Tk|C) Nilai

Akura

si (%)

TAHAP 1

10giliran.txt giliran giliran

giliran 1,13E-03 TRUE

40

komunikasi

6,15E-

05

kondisi 6,05E-05

sifat

3,60E-

06

urutan_tindak

an

1,02E-

05

11komunikasi.txt komunikasi kondisi

giliran 4,34E-10

FALSE

komunikasi

2,49E-

09

kondisi 9,34E-10

sifat

6,93E-

11

urutan_tindak

an

2,49E-

09

10kondisi.txt kondisi kondisi

giliran 6,02E-01 TRUE

komunikasi

4,22E+0

0

kondisi 9,80E-01

sifat

1,87E+0

0

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 112: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

96

urutan_tindak

an

4,22E+0

0

11sifat.txt sifat urutan_tindak

an

giliran 2,25E-11

FALSE

komunikasi

1,23E-

12

kondisi 5,19E-13

sifat

1,22E-

13

urutan_tindak

an

7,35E-

12

14urutanTindakan.t

xt

urutan_tindak

an kondisi

giliran 6,02E-01

FALSE

komunikasi

4,22E+0

0

kondisi 9,80E-01

sifat

1,87E-

01

urutan_tindak

an

4,22E+0

0

TAHAP 2

18giliran.txt giliran giliran

giliran

3,53E-

06 TRUE

40

komunikasi

2,48E-

07

kondisi

8,37E-

08

sifat

2,44E-

07

urutan_tindak

an

3,43E-

08

12komunikasi.txt komunikasi kondisi

giliran

4,22E-

01

FALS

E

komunikasi 2,56E-01

kondisi

6,02E-

01

sifat 1,56E+00

urutan_tindakan

3,22E-01

17kondisi.txt kondisi giliran

giliran

9,75E+0

5

FALS

E

komunikasi 2,44E+05

kondisi

2,24E+0

5

sifat 8,55E+03

urutan_tindakan

1,43E+05

12sifat.txt sifat sifat

giliran

3,55E-

23 TRUE

komunikasi 1,06E-23

kondisi

1,68E-

22

sifat 4,57E-24

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 113: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

97

urutan_tindak

an

7,37E-

25

17urutanTindakan.t

xt

urutan_tindak

an kondisi

giliran 5,05E-07

FALSE

komunikasi

4,95E-

09

kondisi 8,37E-08

sifat

1,22E-

08

urutan_tindak

an

6,86E-

08

TAHAP 3

22giliran.txt giliran kondisi

giliran

2,86E-

01

FALS

E

40

komunikasi

5,65E-

01

kondisi

1,07E+0

0

sifat

1,66E+0

0

urutan_tindakan

3,33E+00

1komunikasi.txt komunikasi kondisi

giliran

2,00E-

02

FALS

E

komunikasi

2,63E-

02

kondisi

3,53E-

03

sifat

7,15E-

04

urutan_tindak

an

1,59E-

02

19kondisi.txt kondisi kondisi

giliran

8,32E+0

1 TRUE

komunikasi 6,07E+00

kondisi

1,28E+0

3

sifat 1,15E+03

urutan_tindakan

7,00E+01

3sifat.txt sifat sifat

giliran

3,27E-

24 TRUE

komunikasi 2,68E-25

kondisi

1,09E-

22

sifat 1,06E-21

urutan_tindakan

2,00E-23

3urutanTindakan.txt

urutan_tindakan

kondisi

giliran

9,81E-

07

FALS

E

komunikasi 6,11E-05

kondisi

1,86E-

04

sifat 1,85E-04

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 114: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

98

urutan_tindak

an

7,55E-

06

TAHAP 4

3giliran.txt giliran urutan_tindak

an

giliran 1,27E+12

FALSE

20

komunikasi

1,25E+1

2

kondisi 1,52E+11

sifat

1,02E+1

2

urutan_tindak

an

2,50E+1

1

7komunikasi.txt komunikasi giliran

giliran

2,20E-

13

FALS

E

komunikasi

1,97E-

11

kondisi

1,56E-

11

sifat

2,97E-

12

urutan_tindakan

9,86E-13

23kondisi.txt kondisi urutan_tindak

an

giliran

1,25E+0

4

FALS

E

komunikasi

1,19E+0

5

kondisi

1,92E+0

5

sifat

7,23E+0

3

urutan_tindak

an

3,57E+0

5

5sifat.txt sifat giliran

giliran

2,15E-

18

FALS

E

komunikasi 4,69E-20

kondisi

1,97E-

18

sifat 8,39E-20

urutan_tindakan

4,69E-20

5urutanTindakan.tx

t

urutan_tindak

an

urutan_tindak

an

giliran

1,22E-

02 TRUE

komunikasi 1,13E-03

kondisi

2,44E-

03

sifat 1,02E-02

urutan_tindakan

9,07E-04

TAHAP 5 4giliran.txt giliran giliran

giliran

7,70E-

06 TRUE

80 komunikasi

3,27E-

08

kondisi

8,70E-

07

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 115: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

99

sifat

1,17E-

07

urutan_tindakan

4,15E-08

8komunikasi.txt komunikasi kondisi

giliran

2,45E-

04

FALS

E

komunikasi 6,94E-06

kondisi

4,09E-

05

sifat 2,74E-05

urutan_tindakan

8,60E-06

25kondisi.txt kondisi kondisi

giliran

9,66E+0

1 TRUE

komunikasi 6,61E+00

kondisi

1,36E+0

3

sifat 3,56E+02

urutan_tindakan

7,63E+01

7sifat.txt sifat sifat

giliran

1,56E-

11 TRUE

komunikasi 7,28E-13

kondisi

6,16E-

12

sifat 1,52E-10

urutan_tindak

an

9,69E-

13

7urutanTindakan.txt

urutan_tindakan

urutan_tindakan

giliran

1,23E-

06 TRUE

komunikasi

3,27E-

09

kondisi

1,09E-

06

sifat

2,34E-

07

urutan_tindak

an

1,66E-

06

TAHAP 6

6giliran.txt giliran giliran

giliran 1,08E-03 TRUE

40

komunikasi

1,02E-

05

kondisi 4,73E-05

sifat

6,93E-

06

urutan_tindak

an

1,17E-

05

9komunikasi.txt komunikasi giliran

giliran 4,22E-11

FALSE

komunikasi

2,45E-

12

kondisi 3,73E-12

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 116: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

100

sifat

2,88E-

12

urutan_tindakan

1,46E-11

26kondisi.txt kondisi kondisi

giliran

8,22E+0

8 TRUE

komunikasi 7,17E+08

kondisi

9,48E+0

8

sifat 5,00E+08

urutan_tindakan

7,50E+08

8sifat.txt sifat kondisi

giliran

2,11E-

11

FALS

E

komunikasi 1,23E-11

kondisi

3,73E-

11

sifat 5,77E-15

urutan_tindakan

1,46E-11

9urutanTindakan.txt

urutan_tindakan

kondisi

giliran

4,10E-

11

FALS

E

komunikasi 2,49E-10

kondisi

2,76E-

08

sifat 6,61E-12

urutan_tindak

an

1,17E-

08

Total Akurasi 43.33

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 117: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

101

Lampiran 2 ListCode Program

Implementasi Pemotongan Kalimat

Proses ini berfungsi untuk melakukan pemotongan kalimat yang

mengandung sabar.

private void nKlimat(ArrayList<Word>words) {

boolean adaAwalParagraf = false;

int awalKalimat = 0;

int akhirKalimat = 0;

boolean adaAkhirKalimat = false;

int counter = 0;

int pointAwal;

int pointAkhir;

int len = words.size();

for (int i = 0; i < len; i++) {

if (!adaAwalParagraf) {

awalKalimat = i;

adaAwalParagraf = true;

counter++;

} else {

if (!adaAkhirKalimat) {

if ((words.get(i).getKata().contains(".")) || (i == len - 1)) {

akhirKalimat = i;

adaAkhirKalimat = true;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 118: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

102

}

} else {

awalKalimat = akhirKalimat + 1;

counter++;

adaAkhirKalimat = false;

}

}

if (adaAkhirKalimat) {

if (adaSabar(awalKalimat, akhirKalimat,words)) {

if (counter == 1) {

//sabar di awal Kategori

int pend = counter + 3;

potongKalimat(0, kalimatPendukung(pend, false,words),

1,words);

} else {

if (akhirKalimat != len - 1) {

int pend1 = counter - 1;

int pend2 = counter + 2;

potongKalimat(kalimatPendukung(pend1, true,words),

kalimatPendukung(pend2, false,words), 2,words);

} else {

//sabar di akhir Kategori

int pend = counter - 2;

potongKalimat(kalimatPendukung(pend, true,words), 0,

3,words);

}

}

}

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 119: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

103

}

private void potongKalimat(int index1, int index2, int letak,

ArrayList<Word> words) {

int lenW = words.size();

ArrayList<Word> temWord = new ArrayList<>();

for (int i = 0; i < lenW; i++) {

temWord.add(words.get(i));

}

if (letak == 1) {

//Untuk KALIMAT DIDEPAN

int len = (temWord.size() - 1) - index2;

for (int i = 0; i < len; i++) {

temWord.remove(index2 + 1);

}

} else if (letak == 2) {

//Untuk KALIMAT DITENGAH..

int len = (temWord.size() - 1) - index2;

for (int i = 0; i < len; i++) {

temWord.remove(index2 + 1);

}

if (index1 != 0) {

for (int j = 0; j < index1; j++) {

temWord.remove(0);

}

}

} else {

//Untuk KALIMAT DIBELAKANG

for (int j = 0; j < index1; j++) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 120: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

104

temWord.remove(0);

}

}

Kalimat kal = new Kalimat(temWord, status);

getKalimats().add(kal);

}

Implementasi Baca Data

Proses ini berfungsi untuk membaca data dan memasukan

ke ArrayList.

private void readFile(String fileName) {

ArrayList<Word> words = new ArrayList<>();

String currentLine;

BufferedReader br = null;

try {

br = new BufferedReader(new FileReader(fileName));

while ((currentLine = br.readLine()) != null) {

pecahKata(currentLine, words);

}

nKlimat(words);

} catch (IOException e) {

e.printStackTrace();

} finally {

try {

if (br != null) {

br.close();

}

} catch (IOException ex) {

Logger.getLogger(NaiveBayesRevisi.class.getName()).log(Level.SEVERE

, null, ex);

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 121: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

105

}

}

}

private void pecahKata(String kalimat, ArrayList words) {

String[] temp;

temp = kalimat.split(" ");

for (String kata : temp) {

Word w = new Word(kata.toLowerCase());

words.add(w);

}

}

Implementasi Stopword Filtering

Proses ini adalah untuk melakukan proses penghapusan stop

word atau penghapusan kata yang dianggap tidak penting.

public static ArrayList<Word> hapusStopWord(ArrayList<Word> words) {

int len = words.size();

int len2 = stopWord.size();

for (int i = 0; i < len; i++) {

for (int j = 0; j < len2; j++) {

if (words.get(i).getKata().equals(stopWord.get(j))) {

words.remove(i);

i--;

len--;

break;

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 122: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

106

}

return words;

}

Implementasi Stemming

Proses ini adalah untuk melakukan proses pengembalian

kata ke kata dasarnya.

public static String Stem(String kata) {

if (sudahKataDasar(kata)) {

return kata;

}

if (kataBerulang(kata)) {

int pemisah = kata.indexOf("-");

String kata1 = kata.substring(0, pemisah);

String kata2 = kata.substring(pemisah + 1, kata.length());

if (kata1.equals(kata2)) {

if (sudahKataDasar(kata2)) {

return kata2;

}

kata2 = Del_Inflection_Suffix(kata2);

kata2 = Del_Derivation_Suffixes(kata2);

kata2 = Del_Derivation_Prefix(kata2);

return kata2;

} else {

if (!sudahKataDasar(kata1)) {

kata1 = Del_Inflection_Suffix(kata1);

kata1 = Del_Derivation_Suffixes(kata1);

kata1 = Del_Derivation_Prefix(kata1);

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 123: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

107

if (!sudahKataDasar(kata2)) {

kata2 = Del_Inflection_Suffix(kata2);

kata2 = Del_Derivation_Suffixes(kata2);

kata2 = Del_Derivation_Prefix(kata2);

}

if (kata1.equals(kata2)) {

return kata2;

}

}

}

kata = Del_Inflection_Suffix(kata);

kata = Del_Derivation_Suffixes(kata);

kata = Del_Derivation_Prefix(kata);

return kata;

}

public static String Del_Inflection_Suffix(String kata) {

int len = particles.length;

for (int i = 0; i < len; i++) {

int lenAkhir = particles[i].length();

int lenAwal = kata.length() - lenAkhir;

if (lenAwal > 0) {

if (potongKata(kata, lenAwal).equals(particles[i])) {

String kataBaru = kata.substring(0, lenAwal);

if (particles[i].equals("lah") || particles[i].equals("kah")

|| particles[i].equals("tah") || particles[i].equals("pun")) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 124: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

108

kataBaru = Del_PPronoun(kataBaru);

return kataBaru;

}

String kataBaru2 = Del_Derivation_Prefix(kata);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

tempWord = null;

return kataBaru;

}

}

}

return kata;

}

public static String Del_PPronoun(String kata) {

String kataBaru;

int len = pPronouns.length;

for (int i = 0; i < len; i++) {

int lenAkhir = pPronouns[i].length();

int lenAwal = kata.length() - lenAkhir;

if (lenAwal > 0) {

if (potongKata(kata, lenAwal).equals(pPronouns[i])) {

kataBaru = kata.substring(0, lenAwal);

return kataBaru;

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 125: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

109

}

return kata;

}

public static String Del_Derivation_Suffixes(String kata) {

adaDSuffixDihapus = false;

int len = dSuffixs.length;

for (int i = 0; i < len; i++) {

int lenAkhir = dSuffixs[i].length();

int lenAwal = kata.length() - lenAkhir;

if (lenAwal > 0) {

if (potongKata(kata, lenAwal).equals(dSuffixs[i])) {

String kataBaru = kata.substring(0, lenAwal);

//System.out.println("JADI " + kataBaru);

adaDSuffixDihapus = true;

if (sudahKataDasar(kataBaru)) {

return kataBaru;

} else if ("an".equals(dSuffixs[i])) {

if (kataBaru.charAt(kataBaru.length() - 1) == 'k') {

kataBaru = potongKata(kataBaru, 0, kataBaru.length() - 1);

//System.out.println("JADI " + kataBaru);

if (sudahKataDasar(kataBaru)) {

return kataBaru;

}

}

}

}

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 126: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

110

return kata;

}

public static String Del_Derivation_Prefix(String kata) {

String awal2 = potongKata(kata, 0, 2);

String kataBaru = kata;

String bAwal2;

String kataBaru2 = null;

if (adaDSuffixDihapus) {

if (awalAkhirTdkDiijinkan(kata)) {

if (sudahKataDasar(kata)) {

return kata;

}

}

}

for (int i = 1; i <= 3; i++) {

if (tempWord != null) {

kataBaru = tempWord;

}

bAwal2 = potongKata(kataBaru, 0, 2);

if (bAwal2.equals("di") || bAwal2.equals("ke") ||

bAwal2.equals("se")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 127: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

111

}

}

if (bAwal2.equals("te")) {

if (potongKata(kataBaru, 2, 3).equals("r")) {

if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else {

if (potongKata(kataBaru, 4, 6).equals("er")

&& isVowel(potongKata(kataBaru, 6, 7))) {

if (!"r".equals(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

} else {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 128: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

112

if (!"er".equals(potongKata(kataBaru, 4, 6))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

}

} else if (!isVowel(potongKata(kataBaru, 2, 3))

&& potongKata(kataBaru, 3, 5).equals("er")

&& !isVowel(potongKata(kataBaru, 5, 6))) {

if (!"r".equals(potongKata(kataBaru, 2, 3))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

}

if (bAwal2.equals("me")) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 129: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

113

if ((potongKata(kataBaru, 2, 3).equals("l") || potongKata(kataBaru,

2, 3).equals("r")

|| potongKata(kataBaru, 2, 3).equals("w") ||

potongKata(kataBaru, 2, 3).equals("y"))

&& isVowel(kata.substring(3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (potongKata(kataBaru, 2, 3).equals("m")) {

if (potongKata(kataBaru, 3, 4).equals("b") ||

potongKata(kataBaru, 3, 4).equals("f")

|| potongKata(kataBaru, 3, 4).equals("v")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (potongKata(kataBaru, 3, 5).equals("pe")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if ((potongKata(kataBaru, 3, 4).equals("r")

&& isVowel(potongKata(kataBaru, 4, 5)))

|| isVowel(potongKata(kataBaru, 3, 4))) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 130: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

114

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

// Direplace ------------

kataBaru2 = potongKata(kataBaru, 2);

kataBaru2 = replaceDepan(kataBaru2, 1, "p");

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

tempWord = kataBaru2;

} else if (potongKata(kataBaru, 3, 4).equals("p")) {

if (!"e".equals(potongKata(kataBaru, 4, 5))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 131: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

115

} else if (potongKata(kataBaru, 2, 3).equals("n")) {

if (potongKata(kataBaru, 3, 4).equals("c") ||

potongKata(kataBaru, 3, 4).equals("d")

|| potongKata(kataBaru, 3, 4).equals("j") ||

potongKata(kataBaru, 3, 4).equals("s")

|| potongKata(kataBaru, 3, 4).equals("z")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

// Replace -----

kataBaru2 = potongKata(kataBaru, 2);

kataBaru2 = replaceDepan(kataBaru2, 1, "t");

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 132: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

116

tempWord = kataBaru2;

} else if (potongKata(kataBaru, 3, 4).equals("g")) {

if (potongKata(kataBaru, 4, 5).equals("g") ||

potongKata(kataBaru, 4, 5).equals("h")

|| potongKata(kataBaru, 4, 5).equals("q") ||

potongKata(kataBaru, 4, 5).equals("k")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 4,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (isVowel(potongKata(kataBaru, 4, 5))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 4,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

// Replace ----------------------

kataBaru2 = potongKata(kataBaru, 4);

kataBaru2 = "k" + kataBaru2;

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 133: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

117

tempWord = null;

return kataBaru2;

}

tempWord = kataBaru2;

if (potongKata(kataBaru, 4, 5).equals("e")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 5,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

} else if (potongKata(kataBaru, 3, 4).equals("y") &&

isVowel(potongKata(kataBaru, 4, 5))) {

// Replace -----------

kataBaru2 = potongKata(kataBaru, 4);

kataBaru2 = "s" + kataBaru2;

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

tempWord = kataBaru2;

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 134: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

118

}

if (bAwal2.equals("be")) {

if (potongKata(kataBaru, 2, 3).equals("r")) {

if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (!isVowel(potongKata(kataBaru, 3, 4))) {

if (!"r".equals(potongKata(kataBaru, 3, 4))

&& !"er".equals(potongKata(kataBaru, 5, 7))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (!"r".equals(potongKata(kataBaru, 3, 4))

&& "er".equals(potongKata(kataBaru, 5, 7))

&& isVowel(potongKata(kataBaru, 7, 8))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 135: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

119

tempWord = null;

return kataBaru2;

}

}

}

} else if (kataBaru.equals("belajar")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (!isVowel(potongKata(kataBaru, 2, 3)) &&

potongKata(kataBaru, 3, 5).equals("er")

&& !isVowel(potongKata(kataBaru, 5, 6))) {

if (!potongKata(kataBaru, 2, 3).equals("r") ||

!potongKata(kataBaru, 2, 3).equals("l")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

}

if (bAwal2.equals("pe")) {

if ((potongKata(kataBaru, 2, 3).equals("w") ||

potongKata(kataBaru, 2, 3).equals("y"))

&& isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 136: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

120

tempWord = null;

return kataBaru2;

}

} else if (potongKata(kataBaru, 2, 3).equals("r")) {

if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (!isVowel(potongKata(kataBaru, 3, 4))) {

if (!potongKata(kataBaru, 3, 4).equals("r")) {

if (!potongKata(kataBaru, 5, 7).equals("er")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (potongKata(kataBaru, 5, 7).equals("er")

&& isVowel(potongKata(kataBaru, 7, 8))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 137: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

121

}

}

}

}

} else if (potongKata(kataBaru, 2, 3).equals("m")) {

if (potongKata(kataBaru, 3, 4).equals("b") ||

potongKata(kataBaru, 3, 4).equals("f")

|| isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if ((potongKata(kataBaru, 3, 4).equals("r") &&

isVowel(potongKata(kataBaru, 4, 5)))

|| isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

//Replace ---

kataBaru2 = potongKata(kataBaru, 2);

kataBaru2 = replaceDepan(kataBaru2, 1, "p");

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 138: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

122

return kataBaru2;

}

}

} else if (potongKata(kataBaru, 2, 3).equals("n")) {

if (potongKata(kataBaru, 3, 4).equals("c") ||

potongKata(kataBaru, 3, 4).equals("d")

|| potongKata(kataBaru, 3, 4).equals("j") ||

potongKata(kataBaru, 3, 4).equals("z")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

//Replace ----

kataBaru2 = potongKata(kataBaru, 2);

kataBaru2 = replaceDepan(kataBaru2, 1, "t");

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 139: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

123

} else if (potongKata(kataBaru, 3, 4).equals("g")) {

if (!isVowel(potongKata(kataBaru, 4, 5))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 4,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

} else if (isVowel(potongKata(kataBaru, 4, 5))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 4,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

// Replace ---

kataBaru2 = potongKata(kataBaru, 4);

kataBaru2 = "k" + kataBaru2;

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

tempWord = kataBaru2;

if (!potongKata(kataBaru, 4, 5).equals("e")) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 140: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

124

kataBaru2 = hapusDepanBelakang(kataBaru2, 5,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

} else if (potongKata(kataBaru, 3, 4).equals("y")) {

if (isVowel(potongKata(kataBaru, 4, 5))) {

// Replace ---

kataBaru2 = potongKata(kataBaru, 4);

kataBaru2 = "s" + kataBaru2;

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

kataBaru2 = Del_Derivation_Suffixes(kataBaru2);

if (sudahKataDasar(kataBaru2)) {

tempWord = null;

return kataBaru2;

}

tempWord = kataBaru2;

}

}

} else if (potongKata(kataBaru, 2, 3).equals("l")) {

if (kataBaru.equals("pelajar")) {

tempWord = null;

return "ajar";

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 141: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

125

if (isVowel(potongKata(kataBaru, 3, 4))) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2, kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

} else if (!isVowel(potongKata(kataBaru, 2, 3))) {

if (potongKata(kataBaru, 3, 5).equals("er")

&& isVowel(potongKata(kataBaru, 5, 6))) {

if (!potongKata(kataBaru, 2, 3).equals("r") ||

!potongKata(kataBaru, 2, 3).equals("w")

|| !potongKata(kataBaru, 2, 3).equals("y") ||

!potongKata(kataBaru, 2, 3).equals("l")

|| !potongKata(kataBaru, 2, 3).equals("m") ||

!potongKata(kataBaru, 2, 3).equals("n")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 3,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

} else if (!potongKata(kataBaru, 3, 5).equals("er")) {

if (!potongKata(kataBaru, 2, 3).equals("r") ||

!potongKata(kataBaru, 2, 3).equals("w")

|| !potongKata(kataBaru, 2, 3).equals("y") ||

!potongKata(kataBaru, 2, 3).equals("l")

|| !potongKata(kataBaru, 2, 3).equals("m") ||

!potongKata(kataBaru, 2, 3).equals("n")) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 142: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

126

kataBaru2 = hapusDepanBelakang(kataBaru2, 2,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

} else if (potongKata(kataBaru, 3, 5).equals("er")

&& !isVowel(potongKata(kataBaru, 5, 6))) {

if (!potongKata(kataBaru, 2, 3).equals("r") ||

!potongKata(kataBaru, 2, 3).equals("w")

|| !potongKata(kataBaru, 2, 3).equals("y") ||

!potongKata(kataBaru, 2, 3).equals("l")

|| !potongKata(kataBaru, 2, 3).equals("m") ||

!potongKata(kataBaru, 2, 3).equals("n")) {

kataBaru2 = hapusDepanBelakang(kataBaru2, 2,

kataBaru);

if (kataBaru2 != null) {

tempWord = null;

return kataBaru2;

}

}

}

}

}

}

tempWord = null;

return kata;

}

Implementasi Hitung TF

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 143: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

127

Proses ini adalah untuk melakukan penghitungan tf

(term frequency).

private void hitungTf(){

int len= words.size();

for(int i=0;i<len;i++){

int count=1;

for(int j=i+1;j<len;j++){

if(words.get(i).getKata().toString().equals(words.get(j).getKata().toString(

))){

count++;

words.remove(words.get(j));

j--;

len--;

}

else{

}

}

words.get(i).setTf(count);

System.out.println("kata "+words.get(i).getKata().toString()+" tf =

"+count);

}

}

Implementasi Hitung Jumlah Total Data Training

public void hitungN() {

float count = 0;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 144: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

128

int len = getTraining().size();

for (int i = 0; i < len; i++) {

count = count + getTraining().get(i).getKalimats().size();

}

this.N = count;

}

Implementasi Hitung Prior Probability

public void hitungPriorProbability() {

int len3 = getKategori().length;

int len = getTraining().size();

for (int k = 0; k < len3; k++) {

float count = 0;

for (int i = 0; i < len; i++) {

int len2 = getTraining().get(i).getKalimats().size();

for (int j = 0; j < len2; j++) {

if

(getTraining().get(i).getKalimats().get(j).getStatus().equals(getKategori()[

k])) {

count++;

}

}

}

getPriorProbability()[k] = count / N;

}

}

Implementasi Hitung Conditional Probability

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 145: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

129

public void hitungConditionalProbaliblity() {

int len = getKategori().length;

int len2 = getTesting().size();

float[] temCon;

for (int j = 0; j < len2; j++) {

int len3 = getTesting().get(j).getKalimats().size();

System.out.println(getTesting().get(j).getNamaDokumen());

for (int k = 0; k < len3; k++) {

int len4 =

getTesting().get(j).getKalimats().get(k).getWord().size();

System.out.println("kalimat ke "+k);

for (int l = 0; l < len4; l++) {

temCon = new float[len];

for (int i = 0; i < len; i++) {

float conProb =

(getTct(getTesting().get(j).getKalimats().get(k).getWord().get(l).getKata().

toString(), i) + 1) / (getEVct()[i] + B);

temCon[i] = conProb;

System.out.println("CON PROB "+kategori[i]+"

"+getTesting().get(j).getKalimats().get(k).getWord().get(l).getKata().toStri

ng()+" : "+

"("+getTct(getTesting().get(j).getKalimats().get(k).getWord().get(l).getKat

a().toString(), i)+" + " + 1 +") / "+

"("+getEVct()[i]+"+"+B+") = "+conProb);

}

getTesting().get(j).getKalimats().get(k).getWord().get(l).setConditionalPro

b(temCon);

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 146: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

130

}

}

}

}

Implementasi Hitung Peluang

public void startClassificasion() {

int lenKategori = getKategori().length;

int lenTesting = getTesting().size();

for (int j = 0; j < lenTesting; j++) {

double temPel;

double[] peluang = new double[lenKategori];

double max = 0;

int indexMax = 0;

int lenKalimat = getTesting().get(j).getKalimats().size();

for (int k = 0; k < lenKalimat; k++) {

for (int i = 0; i < lenKategori; i++) {

int lenKata =

getTesting().get(j).getKalimats().get(k).getWord().size();

double sumConProb = 1;

for (int l = 0; l < lenKata; l++) {

sumConProb = sumConProb *

getTesting().get(j).getKalimats().get(k).getWord().get(l).getConditionalPr

ob(i);

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 147: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

131

System.out.println("sumConProb kata "+kategori[i]+" = " +

sumConProb);

temPel = getPriorProbability()[i] * sumConProb;

peluang[i] = temPel;

}

for (int m = 0; m < peluang.length; m++) {

System.out.println("peluang " + getKategori()[m] + " = " +

peluang[m]);

if (peluang[m] > max) {

max = peluang[m];

indexMax = m;

}

}

getTesting().get(j).getKalimats().get(k).setDinStatus(getKategori()[index

Max]);

System.out.println("Dokumen testing " +

getTesting().get(j).getNamaDokumen() + " kalimat " + k + " masuk ke " +

getTesting().get(j).getKalimats().get(k).getDinStatus());

System.out.println("Dengan status awal :

"+getTesting().get(j).getKalimats().get(k).getStatus());

}

}

}

Implementasi Penghitungan Akurasi

Implementasi Membagi Data Dalam Fold

Proses ini adalah untuk membaca data training dan memasukannya

ke dalam Hashtable fold sesuai dengan jumlah data per fold yang telah

ditetapkan melalui input.

public void readFold(String dirTraining) {

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 148: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

132

setFolds(new Hashtable());

Fold fold;

NaiveBayes nb;

File file = new File(dirTraining);

File[] listFile = file.listFiles();

int lenList = listFile.length;

int index=0;

int cekpoint = 0;

for (int i = 0; i < n; i++) {

fold = new Fold();

System.out.println("MASUK DI FOLD " + i);

nb = new NaiveBayes();

ArrayList<Kategori> training = new ArrayList<>();

String[] kategori = new String[lenList];

for (int j = 0; j < lenList; j++) {

if (listFile[j].isDirectory()) {

//DIREKTORI

String namaPath = listFile[j].getName();

kategori[j] = namaPath;

String dir2 = dirTraining + namaPath + "\\";

File file2 = new File(dir2);

File[] listFile2 = file2.listFiles();

int lenList2 = listFile2.length;

int loop = 0;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 149: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

133

for (int k = cekpoint; k < lenList2; k++) {

if (listFile2[k].isFile()) {

//FILE

if (loop < dataPerFold[index]) {

String namaPath2 = listFile2[k].getName();

System.out.println(namaPath2);

training.add(new Kategori(dir2 + namaPath2,

namaPath2, namaPath));

} else {

break;

}

loop++;

if (j == (lenList - 1)) {

cekpoint = k + 1;

}

}

}

index++;

}

}

fold.setTraining(training);

fold.setKategori(kategori);

getFolds().put("fold" + i, fold);

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 150: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

134

Implementasi Klasifikasi Data Tiap Tahapan Akurasi

Proses ini adalah untuk melakukan klasifikasi data tiap tahap

sesuai dengan jumlah fold. Dari hasil akurasi kemudian dihitung jumlah

yang terklasifikasi dengan benar(status awal sama dengan status hasil

klasifikasi), kemudian ditotal dan dibagi dengan jumlah total data training

untuk menentukan akurasi di setiap tahap, dan kemudian ditampilkan

hasilnya sebagai akurasi tiap tahap.

public void klasifikasi() {

double sumAkurasi = 0;

NaiveBayes nb = new NaiveBayes();

int lenFold = getFolds().size();

akurasiPerFold = new double[lenFold];

for (int h = 0; h < lenFold; h++) {

//PERCOBAAN FOLD KE H

ArrayList<Kategori> training;

ArrayList<Kategori> testing;

testing = new ArrayList<>();

training = new ArrayList<>();

Fold fold = (Fold) getFolds().get("fold" + h);

int lenTesting = fold.getTraining().size();

for (int h1 = 0; h1 < lenTesting; h1++) {

testing.add(fold.getTraining().get(h1));

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 151: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

135

for (int i = 0; i < lenFold; i++) {

//PENGELOMPOKAN BERDASAR KATEGORI UNTUK

TIAP FOLD

if (i != h) {

Fold fold1 = (Fold) getFolds().get("fold" + i);

int lenTraining = fold1.getTraining().size();

for (int j = 0; j < lenTraining; j++) {

training.add(fold1.getTraining().get(j));

}

}

}

nb.setKategori(fold.getKategori());

nb.setPriorProbability(new float[fold.getKategori().length]);

nb.setEVct(new float[fold.getKategori().length]);

nb.setTraining(training);

nb.setTesting(testing);

nb.hitungN();

nb.hitungPriorProbability();

nb.setEVTct();

nb.setB();

nb.hitungConditionalProbaliblity();

System.out.println("TAHAP " + h);

nb.startClassificasion();

double akurasinya = hitungAkurasi(nb.getTesting());

System.out.println("akurasi TAHAP " + h + " = " + akurasinya);

akurasiPerFold[h] = akurasinya;

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 152: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

136

sumAkurasi = sumAkurasi + akurasinya;

}

setTotalAkurasi(sumAkurasi / n);

System.out.println("HASIL TOTAL AKURASINYA = " +

totalAkurasi);

}

Implementasi Penghitungan Total Akurasi

Proses ini adalah untuk melakukan penghitungan total

akurasi, dimana semua data yang ada di tiap fold sudah

diklasifikasi dan ditemukan hasil klasifikasinya. Proses ini hampir

sama dengan penghitungan akurasi tiap tahap, namun dalam proses

ini penghitungan dilakukan untuk semua tahap (semua data

training) sehingga diperoleh hasil akurasi total.

public double hitungAkurasi(ArrayList<Kategori> testing) {

double jmlBenar = 0;

double jmlTesting = 0;

int len = testing.size();

for (int i = 0; i < len; i++) {

int len2 = testing.get(i).getKalimats().size();

for (int j = 0; j < len2; j++) {

String status = testing.get(i).getKalimats().get(j).getStatus();

String dinStatus =

testing.get(i).getKalimats().get(j).getDinStatus();

if (status.equals(dinStatus)) {

jmlBenar++;

}

jmlTesting++;

}

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

Page 153: PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI · 2017-04-26 · Penelitian untuk mengidentifikasi makna kata sabar telah dilakukan oleh Dr. Benedictus Bherman Dwijatmoko, M.A yang menghasilkan

137

return (jmlBenar / jmlTesting) * 100;

}

PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI