Materi II Praktikum Data Mining Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id PENDAHULUAN Praktikum ini berkaitan dengan penggunaan software data mining, Weka (http://www.cs.waikato.ac.nz/ml/weka/), penulisan data dalam format arff, dan pengklasifikasian menggunakan KNN. Tujuan dari praktikum ini adalah: a. Meningkatkan pemahaman mahasiswa terhadap software Weka. b. Mengetahui cara dan aturan pembentukan data dalam format arff. c. Melatih mahasiswa menyelesaikan menggunakan metode KNN. masalah-masalah klasifikasi sederhana PRAKTIKUM 1. Pelajari training set dari data segmentation yang disimpan dalam file segmentchallenge.arff dalam direktori data dimana software Weka diinstal, sebagai contoh: /home/tfa/weka-3-6-8/data Buka file tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan pelajari bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas file tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut: @relation segment @attribute region-centroid-col numeric @attribute region-centroid-row numeric @attribute region-pixel-count numeric @attribute short-line-density-5 numeric @attribute short-line-density-2 numeric : : @attribute hue-mean numeric @attribute class {brickface,sky,foliage,cement,window,path,grass} @data Praktikum Data Mining © Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si 1 Perhatikan pula bagian @data dan bagaimana data disusun dibawahnya. Diskusi dengan teman dan pahami maksudnya. 2. Setelah anda memahami bagaimana data dalam format arff disusun, pelajari testing set data segmentation yang disimpan dalam file segment-test.arff dalam direktori yang sama. Lakukan proses klasifikasi menggunakan metode KNN untuk k=3, k=5, k=7, k=9 dan k=11. Lakukan analisa, untuk nilai k berapa metode KNN memberikan akurasi yang paling tinggi? Sebagai acuan, berikut snapshot dari Weka setelah file segment-test.arff dibuka. Lakukan observasi dan lanjutkan proses klasifikasi (classify) menggunakan metode KNN (dalam software Weka disebut sebagai metode lazy). Diskusi dengan asisten bila anda mengalami kesulitan dalam memahami praktikum tentang klasifikasi menggunakan KNN (lazy classifier) ini. - - - Happy Mining - - - Praktikum Data Mining © Dr. Taufik Fuadi Abidin, S.Si., M.Tech dan Dr. Muhammad Subianto, M.Si 2