Skip to content

Aplikasi Data Mining Dengan Menggunakan Metode Decision Tree


PENGERTIAN WEKA

Waikato Environment for Knowledge Analysis (Weka) adalah perangkat lunak pembelajaran mesin yang ditulis di Java, dikembangkan di University of Waikato, Selandia Baru. Ini adalah perangkat lunak bebas yang berlisensi di bawah Lisensi Publik Umum GNU.

Weka berisi kumpulan alat visualisasi dan algoritme untuk analisis data dan pemodelan prediktif, bersama dengan antarmuka pengguna grafis untuk memudahkan akses ke fungsi-fungsi ini. sekarang digunakan dalam banyak aplikasi yang berbeda bidang, khususnya untuk tujuan pendidikan dan penelitian. Keuntungan dari Weka termasuk:

  • Ketersediaan gratis di bawah Lisensi Publik Umum GNU.
  • Portabilitas, karena sepenuhnya diimplementasikan dalam bahasa pemrograman Java dan dengan demikian berjalan di hampir semua platform komputasi modern.
  • Sebuah koleksi komprehensif teknik preprocessing dan pemodelan data.
  • Kemudahan penggunaan karena antarmuka pengguna grafisnya.

Weka mendukung beberapa tugas data mining standar, lebih khusus lagi, data preprocessing, pengelompokan, klasifikasi, regresi, visualisasi, dan pemilihan fitur. Semua teknik Weka didasarkan pada asumsi bahwa data tersedia sebagai satu file atau relasi datar, di mana setiap titik data dijelaskan oleh sejumlah atribut tetap (biasanya, atribut numerik atau nominal, tetapi beberapa jenis atribut lainnya juga didukung). Weka menyediakan akses ke database SQL menggunakan Java Database Connectivity dan dapat memproses hasil yang dikembalikan oleh kueri basis data. Weka menyediakan akses ke pembelajaran mendalam dengan Deeplearning4j. Ia tidak mampu melakukan penambangan data multi-relasional, tetapi ada perangkat lunak terpisah untuk mengubah kumpulan tabel basis data yang terhubung ke dalam satu tabel yang cocok untuk diproses menggunakan Weka.


ANTAR MUKA WEKA


WK1

Antarmuka halaman utama Weka adalah Explorer, tetapi pada dasarnya fungsi yang sama dapat diakses melalui antarmuka Arus Pengetahuan berbasis komponen dan dari baris perintah. Ada juga Experimenter, yang memungkinkan perbandingan sistematis dari kinerja prediksi algoritma pembelajaran mesin Weka pada koleksi dataset. Antarmuka Explorer memiliki beberapa panel yang menyediakan akses ke komponen utama meja kerja: Panel Preprocess memiliki fasilitas untuk mengimpor data dari database, file comma-separated values ​​(CSV), dll., Dan untuk preprocessing data ini menggunakan apa yang disebut algoritma penyaringan. Filter ini dapat digunakan untuk mengubah data (mis., Mengubah atribut numerik menjadi atribut yang terpisah) dan memungkinkan untuk menghapus instance dan atribut sesuai dengan kriteria tertentu.

Popular:   Contoh Aplikasi Layanan Server Softswitch Berbasis Sip

Panel Klasifikasi memungkinkan penerapan klasifikasi dan algoritma regresi (pengklasifikasian yang tidak pandang bulu disebut di Weka) ke dataset yang dihasilkan, untuk memperkirakan akurasi model prediksi yang dihasilkan, dan untuk memvisualisasikan prediksi yang keliru, kurva karakteristik pengoperasian receiver (ROC), dll., Atau model itu sendiri (jika model tersebut setuju dengan visualisasi seperti, misalnya, pohon keputusan). Panel Associate menyediakan akses ke aturan asosiasi pembelajar yang berusaha mengidentifikasi semua keterkaitan penting antara atribut dalam data. Panel Cluster memberikan akses ke teknik pengelompokan di Weka, misalnya, algoritma k-means sederhana. Ada juga implementasi dari algoritma pemaksimalan harapan untuk mempelajari campuran distribusi normal. Panel atribut Pilih menyediakan algoritme untuk mengidentifikasi atribut yang paling prediktif dalam kumpulan data. Panel Visualisasikan menunjukkan matriks plot pencar, di mana plot pencar individu dapat dipilih dan diperbesar, dan dianalisis lebih lanjut menggunakan berbagai operator seleksi.


PENGERTIAN DECISION TREE

Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Decision Tree adalah node akar (root) yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan diuji dengan cara melacak jalur dari node akar (root) sampai node akhir (daun) dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru tertentu.

Decision Tree menggunakan algoritma ID3 atau C4.5, yang diperkenalkan dan dikembangkan pertama kali oleh Quinlan yang merupakan singkatan dari Iterative Dichotomiser 3 atau Induction of Decision “3″ (baca: Tree). Algoritma ID3 membentuk pohon keputusan dengan metode divide-and-conquer data secara rekursif dari atas ke bawah. Strategi pembentukan Decision Tree dengan algoritma ID3 adalah:

  • Pohon dimulai sebagai node tunggal (akar/root) yang merepr
  • esentasikan semua data.
  • Sesudah node root dibentuk, maka data pada node akar akan diukur dengan information gain untuk dipilih atribut mana yang akan dijadikan atribut pembaginya.
  • Sebuah cabang dibentuk dari atribut yang dipilih menjadi pembagi dan data akan didistribusikan ke dalam cabang masing-masing.
  • Algoritma ini akan terus menggunakan proses yang sama atau bersifat rekursif untuk dapat membentuk sebuah Decision Tree. Ketika sebuah atribut telah dipilih menjadi node pembagi atau cabang, maka atribut tersebut tidak diikutkan lagi dalam penghitungan nilai information gain.
  • Proses pembagian rekursif akan berhenti jika salah satu dari kondisi dibawah ini terpenuhi:

    • Semua data dari anak cabang telah termasuk dalam kelas yang sama.
    • Semua atribut telah dipakai, tetapi masih tersisa data dalam kelas yang berbeda. Dalam kasus ini, diambil data yang mewakili
    • kelas yang terbanyak untuk menjadi label kelas pada node daun.
    • Tidak terdapat data pada anak cabang yang baru. Dalam kasus ini, node daun akan dipilih pada cabang sebelumnya dan diambil data yang mewakili kelas terbanyak untuk dijadikan label kelas.
Popular:   Menerapkan Fitur Dan Fungsi Perangkat Lunak Aplikasi Perkantoran

Beberapa contoh pemakaian Decision Tree yaitu :

  • Diagnosa penyakit tertentu, seperti hipertensi, kanker, stroke dan lain-lain
  • Pemilihan produk seperti rumah, kendaraan, komputerdanlain-lain
  • Pemilihan pegawai teladan sesuai dengan kriteria tertentu
  • Deteksi gangguan pada computer atau jaringan computer seperti Deteksi Entrusi, deteksi virus (Trojan dan varians),dan lain-lain.


PENGERTIAN NAÏVE BAYES


Naive bayesian
adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). Dalam hal ini, diasumsikan bahwa kehadiran atau ketiadaan dari suatu kejadian tertentu dari suatu kelompok tidak berhubungan dengan kehadiran atau ketiadaan dari kejadian lainnya.

Naive Bayesian dapat digunakan untuk berbagai macam keperluan antara lain untuk klasifikasi dokumen, deteksi spam atau filtering spam, dan masalah klasifikasi lainnya. Dalam hal ini lebih disorot mengenai penggunaan teorema Naive Bayesian untuk spam filtering


Kelebihan Naive Bayesian


  1. Menangani kuantitatif dan data diskrit
  2. Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata – ratakan ketika mengestimasi peluang bersyarat data.
  3. Hanya memerlukan sejumlah kecil data pelatihan untuk
  4. mengestimasi parameter (rata – rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi.
  5. Menangani nilai yang hilang dengan mengabaikan instansi selama perhitungan estimasi peluang
  6. Cepat dan efisiensi ruang
  7. Kokoh terhadap atribut yang tidak relevan


Kekurangan Naive Bayesian
:

  1. Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga
  2. Mengasumsikan variabel bebas


PENGGUNAAN WEKA

  1. Download WEKA disini
  2. Install WEKA
  3. Copy Datasets Lenses ini ke notepad andaWK2
  4. Ubah menjadi seperti dibawah ini lalu save as .csvWK3
  5. Buka file csv maka akan menjadi seperti di bawah iniwk4
  6. Ubah file csv menjadi seperti iniwk5
  7. Ubah file .csv menjadi .arff dengan weka
  8. Lalu buka aplikasi weka, klik explorer->open file->pilih file .csv->open. maka akan tampil seperti dibawah ini, lalu save.wk6
  9. kemudian buka file .arff, klik open file->pilih file .arff->open.
  10. lalu coba menggunakan metode naive bayes, dengan cara klik classify>choose>bayes>naive bayes. maka akan tampil seperti dibawah ini. dengan percentage split 60% maka diperoleh hasil keberhasilannya 30% dengan error 70%.wk10
  11. kemudian coba dengan metode decision tree, dengan cara klik classify->choose->trees->j48. dengan percentage split dengan 80% maka diperoleh tingkat keberhasilannya 100% dengan error 0%.wkwkwk.png
    wk8
  12. dari data diatas dapat dibaca :

    • jika tear production rate reduced maka none (pasien tidak harus menggunakan dengan lensa kontak).
    • tear production rate normal (tidak ada perubahan).
    • jika astigmatic no maka pasien harus menggunakan dengan lensa kontak soft.
    • jika astigmatic nya yes maka di lihat spectacle prescription atau kondisinya. jika pasien myope berarti pasien harus dilengkapi dengan lensa kontak hard. namun jika pasien hypermetrope maka pasien tidak harus menggunakan lensa kontak.
  13. lalu visualisasikan data yang kita masukkan tadi dengan klik kanan pada trees.j48, lalu pilih visualize tree. maka akan tampil seperti dibawah ini.wk9
Popular:   Aplikasi Motor Dc Dalam Kehidupan Sehari Hari

KESIMPULAN

Setelah melakukan percobaan dengan dua metode yaitu naive bayes dan decision tree pada dataset LENSES, daat disimpulkan bahwa lebih baik menggunakan metode decision tree pada dataset ini, karena tingkat keberhasilannya 100%, sedangkan jika menggunakan naive bayes tingkat keberhasilannya hanya 30%.

REFERENSI

  1. https://en.wikipedia.org/wiki/Weka_(machine_learning)
  2. https://en.wikipedia.org/wiki/Decision_tree
  3. https://en.wikipedia.org/wiki/Naive_Bayes_classifier
  4. https://shgracias.wordpress.com/2017/05/13/tutorial-klasifikasi-data-dengan-menggunakan-weka/
  5. https://steemit.com/programming/@alfarisi/klasifikasi-data-menggunakan-metode-naive-bayes-weka-java-gui-chooser-version-3-8-0
  6. https://firmanrosdiansyah.blogspot.co.id/2013/05/memakai-weka-untuk-klasifikasi-dalam.html
  7. https://archive.ics.uci.edu/ml/datasets.html
  8. Witten, dkk. (2017).”Data Mining Practical Machine Learning Tools and Techniques” Ed.4th, Cambridge: United States: Cambridge, pp.467-478
  9. Hall, dkk. (2013). “Performance analysis ofNaive Bayesand J48 classification algorithm for data classification”, International Journal of Computer Science.



Aplikasi Data Mining Dengan Menggunakan Metode Decision Tree

Source: https://rivaneresha.wordpress.com/2018/05/18/decisiontree-naivebayes/