Top Banner

of 19

flowchart tugas

Oct 09, 2015

Download

Documents

Tiara Arait

flowchart tugas
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

PowerPoint Presentation

Data Twitter (mentah)PreprocessingMetodeLexicon-BasedData training (SVM)Hasil Klasifikasi tweet Metode SVMData hasil preprocessingumum1Data Twitter (mentah)Data cleansingtokenizeKata dengan label part of speech nyaData bersihPOS Tagging (HMM Tagging)Potongan String Mengubah kata tidak bakuData bersihpreprocessing

2Data Hasil PreprocessingMenyimpan keseluruhan tweet beserta label nyaPerhitungan gabungan polaritas fitur & opini dalam satu tweetKalimat dengan orientasi nya (positif/negatif)Kata opini dengan nilai polaritasnya (+1 / -1)Menghilangkan Stopwords

Kata-kata PentingOpinion LexiconData Latih(SVM)MetodeSVM

Kata-kata PentingLexicon-based3Data Training (hasil Lexicon-based)Mencari nilai Hyperplane terbaikMemasukan data UjiKlasifikasi data hasil Lexicon-based dan SVMHitung TF-IDF(Unigram)Kata dengan bobotnyaMendapatkan Pola atau model dataSVM4Menghilangkan pengulangan Mengubah bahasa tidak baku / singkatan menjadi bahasa bakuMenghilangkan username, dan Retweet Tweet MentahKalimat dengan bahasa bakuHilangnya rendundancy kalimatBentuk Kalimat biasaKamus :KBBA (Kamus Besar Bahasa Alay)Melihat dariAlur Tokenisasi Tweet List kata (wordlist) dengan total kemunculannyaPembacaan karakter teksPemisahan kata bergantung dengan spasiMengabaikan huruf-huruf atau simbol selain (huruf a-z), dan spasiPenggolongan teks (simbol, alfabet, dan spasi) Kata-kata pembentuk kalimat, tanpa simbol6List kata (wordlist)Kata-kata penting Pembacaan kamus StopwordsMenghapus stopwords yang ada pada list kataMencocokkan list kata dengan kamus stopwords StopwordsKata Inputan Perhitungan urutan pos tag (bigram & trigram)Urutan Pos TagTagged CorpusMaximum Likehood ProbabilitiesProbability zero transition Estimasi peluang dari emission dan trasition Jelinec-Mercer Smoothing Deleted linier interpolation method Penanganan sparse problemTrigram

Bigram

Underlying processInputan WordsInputan WordsInputan WordsInputan WordsInputan WordsPerhitungan urutan pos tag (bigram & trigram)Perhitungan urutan pos tag (bigram & trigram)Perhitungan urutan pos tag (bigram & trigram)Perhitungan urutan pos tag (bigram & trigram)Perhitungan urutan pos tag (bigram & trigram)Perhitungan urutan pos tag (bigram & trigram)Affix TreePOS tag AEmission probability vectorPOS tag A tetap disimpan pada probability vectorPOS tag A dibuang dari probability vectorPencocokan dengan category tablePos Tag A dari emission = KBBI-Kateglo?Tidak

YaKBBI - KategloSucceeding processInputan WordsPerhitungan urutan pos tag (bigram & trigram)Urutan Pos TagNilai baru dari transition probabilityInputan WordsProbability emission vectorTidak ada prosesSucceeding POS tagAffix TreeFirst PassCurrent word = OOV?YesNoSecond PassPOS tag yang sama pada hasil underlying model dengan KBBI-KategloDicocokkan dengan Lexicon dari KKBI - KategloProbability emission & transitionSucceeding POS tagInputan WordsUnderlying ModelProbability emission for OOV wordsUrutan POS tagMetode Affix TreeNilai baru dari transition probabilityGeneral HMM12Kata Inputan Perhitungan urutan pos tag (bigram & trigram)Urutan Pos TagMaximum Likehood ProbabilitiesTagged CorpusProbability zero transition Estimasi peluang dari emission dan trasition Jelinec-Mercer Smoothing Deleted linier interpolation method Penanganan sparse problemTrigram

Bigram

Augmented-lexicon basedMendeteksi Tipe kalimatTweet tanpa kalimat tanyatweet hasil preprocessingKalimat dihapusDeteksi tipe kalimatif kalimat tanya ditemukan YaTidakOpinion Lexicon Tweet tanpa kalimat tanyaKata positif dengan nilai +1Kata diberikan polaritas positifMencocokan opini words (adj, adv, vb, nn)if opinion words = kamus positifKamus :PositifKamus :NegatifMelihat dariif opinion words = kamus negatifMelihat dariKata diberikan polaritas negatifKata negatif dengan nilai -1yatidakyatidakTweet tanpa kalimat tanyaif orientasi >0Orientasi Kalimat = positifKalimat berorientasi positifif orientasi 0Orientasi Kalimat = negatifKalimat berorientasi negatifMenghitung hasil orientasi dari tiap fiturif orientasi negatifNegatif -> positifNilai orientasi diubahDeteksi negasi If ketemu kata negasi Penanganan Negasi Tweet tanpa kalimat tanyaNilai orientasi diubahyatidakKalimat berorientasi positif / negatifIndikator opini tambahan Calon indikator opiniKalimat berorientasi positif / negatifCalon indikator dijadikan tambahan indikator opiniSet null hipotesis pada calon opini indikatorMengekstrak indokator opiniIf hasil chi square >= 6.63Perhitungan Chi SquareCalon indikator tidak dijadikan tambahan indikator opiniYatidakNilai Indikator opini = nullPerhitungan chi square