ABSTRAK Musik erat kaitannya dengan psikologi manusia, kenyataan ini mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/ suasana hati tertentu pada manusia. setiap musik yang telah tercipta memiliki energi emosi tersendiri yang terpancar maka dari itu mulai banyak penelitian yang telah dilakukan pada pengenalan emosi musik tersebut. Music Information Retrieval (MIR) adalah salah satu bagian dalam Data Mining dimana informasi yang akan digali dari sumber data berupa musik yang diperoleh dari dataset training dan dataset testing menggunakan referensi musik Audio Network. Penelitian ini mnghasilkan sebuah rekayasa sistem pengelompokan suasana hati terhadap musik dengan menggunakan algoritma K-NN dan K-Means dimana sistem ini memiliki 3 komponen utama yaitu komponen input, sistem pengelompokan mood musik, serta komponen output. Sistem akan menerima input data berupa file musik format mono *.wav, yang selanjutnya melakukan proses pengelompokan terhadap musik dengan mengggunakan klasifikasi K-NN dan KMeans clustering. Kemudian sistem menghasilkan output berupa jenis mood yaitu, contentment/ kepuasan, exuberance/ gembira, depression/ depresi dan anxious/ cemas; kalut. Secara umum hasil akurasi sistem dengan menggunakan algoritma klasifikasi lebih baik dibandingkan dengan algoritma clustering, diantaranya K-NN (86,55%), SVM (63,95%), ID3 (59,33%) dan K-Means (24,51%). Serta waktu pemrosesan data berurut-urut K-NN (0,01021 detik), ID3 (0,05091 detik), SVM (0,14118 detik) dan K-Means (0,1425 detik). Kata Kunci : Musik, Mood, Klasifikasi, K-NN, K-Means viii ABSTRACT Music is closely related to human psychology, this fact indicates that music can be associated with emotion and mood / certain mood in humans. any music that has been created has its own emotional energy is shown, therefore started a lot of research has been done on the introduction of the emotion of the music. Music Information Retrieval (MIR) is one piece in the Data Mining where the information will be extracted from the data source in the form of music derived from the training dataset and testing dataset using musical references Audio Network. This study builds systems engineering grouping mood to music using K-NN algorithm and K-Means where the system has three main components, namely input components, systems grouping mood music, and component outputs. The system will receive input data including music files mono * .wav format, which then do the grouping of music by using a classification K-NN and K-Means clustering. Then the system to produce output that kind of mood, contentment, Exuberance, depression and anxious. As the results of system accuracy by using a classification algorithm is better than the clustering algorithm, among K-NN (86,55%), SVM (63,95%), ID3 (59,33%) and K-Means (24,51%). As well as the data processing time in K-NN (0,01021 seconds), ID3 (0,05091seconds), SVM (0,14118 seconds) and K-Means (0,1425 seconds) Keywords : Music, Mood, Classification, K-NN, K-Means ix DAFTAR ISI Lembar Persetujuan Pembimbing ..................................................................... iv Tesis Ini Telah Diuji pada .....................................................................................v UCAPAN TERIMAKASIH ............................................................................... vii ABSTRAK .......................................................................................................... viii ABSTRACT .......................................................................................................... ix DAFTAR ISI ..........................................................................................................x DAFTAR GAMBAR.......................................................................................... xiii DAFTAR TABEL ................................................................................................xv BAB I PENDAHULUAN.......................................................................................1 1.1 Latar Belakang .............................................................................................1 1.2 Rumusan Masalah .......................................................................................7 1.3 Tujuan Penelitian .........................................................................................7 1.4 Manfaat Penelitian .......................................................................................7 1.5 Ruang Lingkup Penelitian ..........................................................................8 1.6 Keaslian Penelitian......................................................................................9 BAB II KAJIAN PUSTAKA ...............................................................................11 2.1 State of The Art Review ..............................................................................11 2.2 Music Information Retrieval (MIR) ...........................................................22 2.3 Emosi dan Suasana Hati pada Musik ......................................................22 2.3.1 Definisi Emosi ......................................................................................23 2.3.2 Definisi Suasana Hati/ Mood ................................................................23 2.4 Evaluasi Model Musik Terhadap Mood ..................................................27 2.5 Fast Fourier Transform ............................................................................29 2.6 Feature Extraction .....................................................................................31 2.6.1 Spectral Centroid ..................................................................................32 2.6.2 Spectral Skewness.................................................................................33 2.6.3 Spectral Rolloff .....................................................................................33 2.6.4 Spectral Slope .......................................................................................34 2.6.5 Spectral Kurtosis ...................................................................................34 2.6.6 Spectral Spread .....................................................................................34 2.6.7 Spectral Decrease ..................................................................................35 2.6.8 Spectral Flux .........................................................................................35 2.6.9 Spectral Flatness ...................................................................................35 2.7 Data Mining ................................................................................................36 2.8 K-Nearest Neighbor ....................................................................................39 2.9 K-Means Clustering ...................................................................................42 2.10 Support Vector Machine .........................................................................45 x 2.10.1 Karakteristik SVM ...............................................................................46 2.10.2 Kelebihan dan Kekurangan SVM ........................................................47 2.10.3 Maximum Margin Hyperplanes ..........................................................50 2.10.4 Linear Support Vector Machine..........................................................51 2.10.5 Nonlinier Support Vector Machine .....................................................59 2.10.6 Multi Class SVM .................................................................................61 2.11 Decision Tree ............................................................................................62 2.10.1 Algoritma ID3 .....................................................................................63 2.10.2 Entropy & Information Gain ............................................................65 2.12 Pengujian Accuracy untuk Sistem Klasifikasi .......................................67 2.13 Pengujian Silhouette Coefficient untuk Sistem Clustering K-Means ...69 BAB III METODE PENELITIAN .....................................................................71 3.1 Tempat Penelitian ......................................................................................71 3.2 Alur Analisis ...............................................................................................72 3.2.1 Pendefinisian Masalah ..........................................................................75 3.2.2 Studi Literatur .......................................................................................75 3.2.3 Akuisisi Data.........................................................................................75 3.2.4 Pra-pengolahan File Musik ...................................................................76 3.2.5 Ekstraksi Fitur .......................................................................................78 3.2.6 Analisis Data .........................................................................................78 3.2.7 Pengujian Sistem...................................................................................90 BAB IV ..................................................................................................................93 HASIL DAN PEMBAHASAN ............................................................................93 4.1 Antarmuka Sistem .....................................................................................93 4.2 Antarmuka Training Data ........................................................................93 4.2.1 Antarmuka Masukkan File .wav ...........................................................97 4.2.2 Antarmuka Ekstraksi Fitur dengan Fast Fourier Transform .................98 4.2.3 Antarmuka Spectral Analysis ...............................................................99 4.2.4 Pengelompokan Dataset Training .......................................................101 4.3 Antarmuka Sistem Klasifikasi K-Nearest Neighbor ..............................107 4.3.1 Load File .............................................................................................108 4.3.2 Ekstraksi Fitur FFT .............................................................................109 4.3.3 Spectral Analysis ................................................................................110 4.3.4 Input Data Training .............................................................................111 4.3.5 Klasifikasi Mood Musik Menggunakan K-NN...................................112 4.4 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan SVM .....113 4.5 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan ID3 ........119 4.6 Antarmuka Sistem Pengelompokan Mood Musik Menggunakan KMeans ..............................................................................................................126 4.7 Hasil Pengujian Menggunakan K-Nearest Neighbor ............................129 xi 4.8 Hasil Pengujian Menggunakan SVM .....................................................137 4.9 Hasil Pengujian Menggunakan ID3 .......................................................140 4.10 Hasil Pengujian Menggunakan K-Means ............................................144 BAB V .................................................................................................................155 KESIMPULAN DAN SARAN ..........................................................................155 5.1 Kesimpulan ...............................................................................................155 5.2 Saran .........................................................................................................156 DAFTAR PUSTAKA .........................................................................................157 xii DAFTAR GAMBAR Gambar 2. 1 Diagram Fishbone penelitian ............................................................21 Gambar 2. 2 Lingkaran kata sifat model emosi Hevner ........................................25 Gambar 2. 3 Model dimensi emosi Thayer ............................................................26 Gambar 2. 4 Diagram model emosi arousal-valence Thayer .................................27 Gambar 2. 5 Diagram alir proses clustering K-Means ..........................................45 Gambar 2. 6 Kemungkinan hyperplane untuk memisahkan kumpulan data linear ........................................................................................................................50 Gambar 2. 7 Margin batas kemungkinan ...............................................................51 Gambar 2. 8 Batas kemungkinan dan margin dari SVM .......................................53 Gambar 2. 9 Data dikotomis yang dipetakan kembali menggunakan Kernel Dasar Radial .............................................................................................................60 Gambar 3. 1 Blok diagram sistem pengelompokan suasana hati terhadap musik .72 Gambar 3. 2 Alur Analisis Penelitian ....................................................................74 Gambar 3. 3 Tahapan prapengolahan file musik ...................................................77 Gambar 3. 4 Tahapan penyusunan data latih/training data mood musik ...............80 Gambar 3. 5 Tahapan klasifikasi mood musik menggunakan algoritma KNN .....81 Gambar 3. 6 Diagram alir proses klasifikasi KNN ................................................82 Gambar 3. 7 Alur klasifikasi SVM ........................................................................84 Gambar 3. 8 Alur klasifikasi Decision Tree (ID3) ................................................86 Gambar 3. 9 Diagram alir clustering K-Means ......................................................89 Gambar 3. 10 Alur proses pengujian sistem ..........................................................91 Gambar 4. 1 Antarmuka Training Data .................................................................94 Gambar 4. 2 Panel pengolahan data latih...............................................................95 Gambar 4. 3 Diagram sampling sinyal audio asli ..................................................95 Gambar 4. 4 Diagram sampling sinyal audio FFT .................................................96 Gambar 4. 5 Diagram spectrogram file audio masukan ........................................97 Gambar 4. 6 Masukkan File .wav ..........................................................................97 Gambar 4. 7 Diagram sampling sinyal audio asli ..................................................98 Gambar 4. 8 Antarmuka sistem ekstraksi FFT ......................................................99 Gambar 4. 9 Proses pembentukan dataset pelatihan mood music .......................100 Gambar 4. 10 Grafik nilai feature set mood 1. Contentment/Menenangkan .......104 Gambar 4. 11 Grafik nilai feature set mood 2. Exuberance/Bersemangat...........104 Gambar 4. 12 Grafik nilai feature set mood 3. Depression/Depresi ....................105 Gambar 4. 13 Grafik nilai feature set mood 4. Anxious/Kacau...........................105 Gambar 4. 14 Perbandingan 9 nilai spectral feature terhadap 4 kategori mood ..106 Gambar 4. 15 Perbandingan 4 kategori mood terhadap 9 nilai spectral feature ..107 Gambar 4. 16 Antarmuka sistem klasifikasi K-NN .............................................108 Gambar 4. 17 Antarmuka Load File untuk memuat file musik ...........................109 Gambar 4. 18 Antarmuka hasil ekstraksi fitur FFT .............................................109 Gambar 4. 19 Antarmuka Spectral Analysis........................................................110 Gambar 4. 20 Antarmuka Load Data Training ....................................................111 xiii Gambar 4. 21 Antarmuka input nilai k untuk klasifikasi K-NN ..........................112 Gambar 4. 22 Antarmuka hasil klasifikasi K-NN berupa jenis mood .................113 Gambar 4. 23 Antarmuka sistem klasifikasi SVM ..............................................114 Gambar 4. 24 Antarmuka Load File Audio sebagai input data ...........................115 Gambar 4. 25 Antarmuka ekstraksi FFT..............................................................116 Gambar 4. 26 Antarmuka Spectral Analysis........................................................117 Gambar 4. 27 Antarmuka input dataset training SVM ........................................118 Gambar 4. 28 Antarmuka hasil klasifikasi SVM berupa jenis mood ..................119 Gambar 4. 29 sistem klasifikasi ID3 ....................................................................120 Gambar 4. 30 Antarmuka Load File Audio sebagai input data ...........................121 Gambar 4. 31 Antarmuka hasil Ekstraksi FFT ....................................................122 Gambar 4. 32 Antarmuka Spectral Analysis........................................................123 Gambar 4. 33 Antarmuka input dataset training ID3 ...........................................124 Gambar 4. 34 Antarmuka hasil klasifikasi ID3 berupa jenis mood .....................125 Gambar 4. 35 Antarmuka proses clustering data menggunakan K-Means ..........127 Gambar 4. 36 Antarmuka input file uji untuk clustering .....................................128 Gambar 4. 37 Antarmuka input nilai k sebagai jumlah cluster............................128 Gambar 4. 38 Antarmuka hasil clustering data uji ..............................................129 Gambar 4. 39 Hasil akurasi klasifikasi mood menggunakan K-NN ....................135 Gambar 4. 40 Rata-rata waktu proses klasifikasi K-NN terhadap jumlah data uji ......................................................................................................................136 Gambar 4. 41 Hasil akurasi klasifikasi mood musik menggunakan SVM ..........138 Gambar 4. 42 Rata-rata waktu proses klasifikasi SVM terhadap sejumlah data uji ......................................................................................................................140 Gambar 4. 43 Hasil akurasi klasifikasi mood musik menggunakan ID3 .............142 Gambar 4. 44 Rata-rata waktu proses klasifikasi ID3 terhadap sejumlah data uji ......................................................................................................................143 Gambar 4. 45 Nilai silhouette coefficient untuk setiap jumlah data uji...............146 Gambar 4. 46 Total sum of distance pada K-Means ............................................147 Gambar 4. 47 Waktu yang diperlukan untuk mengelompokkan sejumlah data uji ......................................................................................................................149 Gambar 4. 48 Persentase hasil akurasi K-Means clustering mood musik ...........150 Gambar 4. 49 Perbandingan persentase akurasi sistem pengelompokan musik terhadap mood ..............................................................................................151 Gambar 4. 50 Perbandingan waktu proses sistem pengelompokan musik terhadap mood ............................................................................................................152 xiv DAFTAR TABEL Tabel 2. 1 Rangkuman State of The Art .................................................................16 Tabel 3. 1 Pembagian kategori mood musik untuk training dataset ......................79 Tabel 4. 1 Kode untuk setiap jenis mood musik ..................................................100 Tabel 4. 2 Data Latih mood musik kategori 1) Contentment/Menenangkan .......101 Tabel 4. 3 Data Latih mood musik kategori 2) Exuberance/Bersemangat ..........102 Tabel 4. 4 Data Latih mood musik kategori 3) Depression/Depresi....................102 Tabel 4. 5 Data Latih mood musik kategori 4) Anxious/Kacau ..........................103 Tabel 4. 6 Hasil akurasi K-NN klasifikasi 40 file musik .....................................130 Tabel 4. 7 Hasil akurasi K-NN klasifikasi 80 file musik .....................................130 Tabel 4. 8 Hasil akurasi K-NN klasifikasi 120 file musik ...................................131 Tabel 4. 9 Hasil akurasi K-NN klasifikasi 160 file musik ...................................131 Tabel 4. 10 Hasil akurasi K-NN klasifikasi 200 file musik .................................132 Tabel 4. 11 Hasil akurasi K-NN klasifikasi 240 file musik .................................132 Tabel 4. 12 Hasil akurasi K-NN klasifikasi 280 file musik .................................133 Tabel 4. 13 Hasil akurasi K-NN klasifikasi 320 file musik .................................133 Tabel 4. 14 Hasil akurasi K-NN klasifikasi 360 file musik .................................134 Tabel 4. 15 Hasil akurasi K-NN klasifikasi 400 file musik .................................134 Tabel 4. 16 Persentase hasil akurasi total klasifikasi mood musik menggunakan K-NN berdasarkan nilai ketetanggaan k (1-16) ...........................................135 Tabel 4. 17 Rata-rata waktu proses klasifikasi K-NN .........................................136 Tabel 4. 18 Persentase hasil akurasi total klasifikasi mood musik menggunakan algoritma SVM.............................................................................................138 Tabel 4. 19 Rata-rata waktu proses klasifikasi SVM ...........................................139 Tabel 4. 20 Persentase hasil akurasi total klasifikasi mood musik menggunakan algoritma ID3 ...............................................................................................141 Tabel 4. 21 Rata-rata waktu proses klasifikasi ID3 .............................................143 Tabel 4. 22 Nilai Silhouette Coefficient ..............................................................145 Tabel 4. 23 Nilai sum of distance berdasarkan jumlah data uji ...........................146 Tabel 4. 24 Waktu pemrosesan K-Means ............................................................148 Tabel 4. 25 Persentase akurasi K-Means clustering mood musik .......................149 Tabel 4. 26 Perbandingan persentase akurasi sistem dan waktu proses untuk masing-masing algoritma .............................................................................151 xv BAB I PENDAHULUAN 1.1 Latar Belakang Musik merupakan sarana yang ampuh dan memiliki banyak kebaikan bagi tubuh dan jiwa manusia, musik dapat menenangkan bahkan membangkitkan semangat seseorang yang mendengarkan musik. Para ahli psikologi menyatakan bahwa terdapat bagian pada otak manusia yang merasakan musik dekat dengan bagian otak yang berhubungan dengan ekspresi emosional manusia. Maka dari itu terdapat hubungan langsung antara musik dan emosi (Samira Pouyanfar, dkk, 2014). Terdapat dua kelompok peneliti yang mempelajari hubungan antara musik dengan emosi, yaitu ; 1) Psikolog Musik, mereka yang mempelajari hubungan antara isyarat akustik (beat, tempo, tingkat suara, dll.) dengan berbagai ekspresi emosi (marah, sedih, senang, tenang, dll.) dan sebagian besar mereka yang mengembangkan model emosional. 2) Peneliti bidang komputer, yaitu mereka yang mengembangkan algoritma untuk mendeteksi emosi terhadap musik secara otomatis. Mereka mencoba menggunakan emosi selain untuk mendapatkan metadata konvensional seperti genre/jenis musik, musik mood, yang juga sebagai penelitian dalam bidang Music Information Retrieval. Musik erat kaitannya dengan psikologi manusia, kenyataan ini mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/suasana hati tertentu pada manusia. Berbagai penelitian yang telah dilakukan memperkuat pernyataan tersebut. Dalam penelitian yang dilakukan oleh Song et al, (2012) 1 menyatakan “Because music conveys and evokes feelings, a wealth of research has been performed on music emotion recognition”, melalui pernyataan tersebut dapat disimpulkan bahwa setiap musik yang telah tercipta memiliki energi emosi tersendiri yang terpancar, maka dari itu mulai banyak penelitian yang telah dilakukan pada pengenalan emosi musik. Dari sudut pandang psikologi musik, elemen yang paling penting dalam penggolongan musik itu sendiri adalah pada emosi apa yang tersirat dari musik tersebut. Banyak sekali upaya yang telah dilakukan oleh para penulis dan pemusik dalam mencoba menjelaskan hubungan antara musik dengan suasana hati, namun tidak menghasilkan suatu standar dan kesepakatan mengenai hal tersebut. Hal ini yang memicu ketertarikan dan semakin bertambahnya penelitian yang berkaitan seputar musik dan kaitannya dengan suasana hati. Hevner dalam penelitiannya berjudul Experimental studies of the elements of expression in music (Hevner K, 1936) melakukan eksperimen dimana pendengar musik diminta untuk menuliskan kata sifat yang muncul di pikiran mereka yang paling deskriptif terhadap musik yang didengarkan. Eksperimen ini dilakukan untuk memperkuat hipotesis bahwa musik benar-benar membawa arti emosional. Dia juga menemukan dalam sebuah kelompok yang mempunyai latar belakang budaya yang sama memiliki pelabelan mood musik cenderung konsisten antar individunya. Hevner membagi klasifikasi emosi menjadi 64 kata sifat dan mengelompokkannya menjadi 8 cluster yaitu sober/memabukkan, gloomy/murung, longing/hasrat, lyrical/lirik, sprightly/lincah, joyous/gembira, restless/gelisah dan robust/kuat. Selanjutnya pengelompokan tersebut diperbaiki oleh penelitian 2 Farnsworth pada tahun 1958 dimana beliau menyusun ulang emosi menjadi 10 cluster, diantaranya : cheerful/ceria, fanciful/fantastis, delicate/ halus, leisurely/ santai, pathetic/ mengenaskan, depressing/ depresi, spiritual/ rohani, dramatic/ dramatis, exciting/ menarik, dan frustated/ frustasi (Tao Li, 2003). Pengelompokan yang lebih sederhana sebenarnya telah dilakukan pada tahun 1989-an, Thayer melakukan penelitian dengan judul The biopsychology of mood and arousal, muncul pendekatan lain yang lebih sederhana terhadap kategorisasi pada suasana hati dalam musik. Thayer mengajukan model 2 dimensi yang memetakan suasana hati dalam musik, pendekatan 2 dimensi ini mengangkat teori yang menyatakan bahwa emosi dan suasana hati disebabkan oleh dua faktor, yaitu stress (senang dan cemas) dan energy (santai dan energetik). Selanjutnya dari model 2 dimensi ini dibagi menjadi 4 cluster yaitu contentment/kepuasan, exuberance/gembira, depression/depresi, dan anxious/cemas;kalut, (Thayer, 1989). Menentukan emosi atau suasana hati apa yang terkandung sebuah lagu merupakan tantangan dalam penelitian ini. Untuk mengetahui lebih efektif mengenai suasana hati yang muncul dalam sebuah lagu, dapat diketahui pada saat mendengarkan lagu tersebut pada bagian intro dan refrain lagu (Seungwon Oh, dkk., 2013). Bagian intro merupakan bagian awal yang dapat menentukan atmosfer lagu, intro juga secara intuitif memiliki kata-kata dan nada-nada yang intensif untuk memberikan informasi mengenai suasana hati. Bagian refrain merupakan bagian dengan kata-kata atau nada-nada yang paling sering diulang-ulang dalam sebuah lagu. Secara umum bagian refrain adalah bagian dengan pengulangan kata dan nada 3 yang paling sering dan hal ini yang menjadi bagian refrain yang paling menentukan mood apa yang terkandung dalam lagu tersebut. Dalam hal menentukan jenis mood yang terkandung dalam lagu diperlukan metode khusus yang menggabungkan komputasi numerik dengan penambangan data berupa fitur-fitur unik dalam sebuah lagu, hal ini dikenal sebagai Music Information Retrieval (MIR). MIR adalah salah satu bagian dalam data mining dimana informasi yang akan digali dari sumber data berupa musik. Banyak penelitian yang telah dilakukan mengenai MIR khususnya pada klasifikasi emosi dan mood dalam bidang musik, psikologi, pemrosesan sinyal, machine learning maupun kombinasi dari beberapa model penelitian tersebut. MIR menggunakan berbagai macam metode data mining untuk pengelompokan termasuk di dalamnya klasifikasi dan clustering data seperti K-NN, C4.5, decission tree, Support Vector Model (SVM), Artificial Neural Network, Self Organization Map, K-Means dan lain sebagainya. Dalam proses data mining, sebelum berbagai jenis lagu tersebut dikelompokkan berdasarkan mood, maka harus melewati tahap awal pengolahan data (preprocessing). Tahapan preprocessing ini dikenal dengan feature selection (Samira Pouyanfar, dkk, 2014). Tahapan selanjutnya dari feature selection adalah proses feature extraction atau ekstraksi citi dari sebuah file lagu untuk menemukan ciri yang untuk masuk ke tahapan pengolahan data berikutnya, perlu dilakukan pengolahan sinyal dengan menggunakan transformasi fourier yang berfungsi mengubah fungsi atau sinyal dalam domain waktu ke domain frekuensi. Tahapan feature extraction terdiri dari tiga proses, yaitu pengambilan sampel lagu (bagian 4 refrain), penerapan fast fourier transform dan spectral analysis untuk mendapatkan nilai spectral feature yang menjadi atribut dasar untuk dilakukannya klasifikasi mood. Dalam tahapan klasifikasi, K-Nearest Neighbor (K-NN) merupakan suatu metode klasifikasi dengan supervisi (supervised learning) dimana hasil dari query data yang baru diklasifikasikan berdasarkan kategori pada K-NN. Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru berdasarkan atribut dan training sample. Pada berbagai penelitian dibidang lain dengan memanfaatkan KNN misalnya pada pengolahan sinyal suara, pengolahan citra digital, sistem pendukung keputusan dan berbagai sistem kecerdasan buatan lainnya, dan terbukti K-NN dapat bekerja dengan baik. Metode klasifikasi lainnya yaitu Support vector machine (SVM) juga merupakan suatu teknik pemodelan supervised learning yang relatif baru (1995) untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang sangat populer belakangan ini. Baik para ilmuwan maupun praktisi telah banyak menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam kehidupan sehari-hari. Terbukti dalam beberapa implementasi terkait klasifikasi musik terhadap mood, SVM memberi hasil yang lebih baik dari algoritma klasifikasi lainnya, terutama dalam hal solusi yang dicapai (Samira Pouyanfar, 2014). SVM berusaha untuk menemukan fungsi pemisah (classifier) yang optimal yang bisa memisahkan multi set data dari multi class yang berbeda. Pohon keputusan atau dikenal dengan Decision Tree merupakan salah satu algortima klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh 5 manusia. Dengan kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih sederhana. Pohon keputusan juga dapat menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Dalam penelitian terkait menggunakan algoritma ini dalam klasifikasi musik terhadap mood menghasilkan hasil klasifikasi yang cukup baik (Braja Gopal, 2013) Untuk proses clustering dalam penelitian ini menggunakan algoritma KMeans, dimana algoritma data mining ini melakukan proses pemodelan tanpa supervisi (unsupervised learning) dan merupakan salah satu algoritma yang melakukan pengelompokan data dengan sistem partisi. Metode K-Means berusaha mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain, algoritma ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster lainnya. Berdasarkan pemaparan penjelasan latar belakang tersebut maka penelitian ini dilakukan untuk dapat membangun sebuah rekayasa sistem yang dapat mengelompokkan musik ke dalam empat parameter mood atau suasana hati yang terdapat dalam musik. Sistem ini akan dibangun berdasarkan pengelompokkan parameter mood yang diperoleh dengan menggunakan algoritma K-Nearest Neighbor dan K-Means, serta sebagai pembanding pengujian menggunakan algoritma Support Vector Machine dan Decision Tree. Sistem ini nantinya 6 diharapkan dapat membantu penggunanya untuk menemukan kategori mood apa yang terkandung dalam sebuah file musik. Perlu diperhatikan juga bahwa file musik yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal. Koleksi musik yang digunakan dalam proses pelatihan dan pengujian ini diperoleh dari situs www.audionetwork.com. 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah disebutkan di atas, maka rumusan masalah dalam penelitian ini adalah bagaimana membangun sistem pengelompokan musik terhadap suasana hati dan mengetahui unjuk kerja algoritma K-Nearest Neighbor dengan K-Means serta membandingkan dengan algoritma Support Vector Machine, dan Iterative Dichotomiser 3. 1.3 Tujuan Penelitian Tujuan yang ingin dicapai melalui penelitian ini adalah untuk memperoleh perbandingan persentase hasil akurasi terbaik dan waktu pemrosesan tercepat dalam hal pengelompokan musik terhadap suasana hati/mood diantara algoritma KNN, K-Means, SVM, dan ID3. 1.4 Manfaat Penelitian Secara praktis, hasil dari penelitian ini diharapkan memberikan manfaat sebagai berikut : 1. Menghasilkan sebuah sistem yang dapat melakukan pengelompokan musik terhadap suasana hati/mood menggunakan algoritma K-Nearest Neighbor, K-Means, SVM, dan ID3. 7 2. Memperoleh hasil persentase akurasi pengelompokan musik terbaik dan waktu pemrosesan tercepat diantara keempat algoritma tersebut dalam hal pengelompokan musik terhadap suasana hati/mood. Secara akademis penelitian ini diharapkan dapat memberikan manfaat diantaranya : 1. Dapat memberikan suatu karya penelitian yang dapat mendukung dalam pengembangan penelitian yang terkait dengan Music Information Retrieval. 2. Bagi peneliti, dapat menambah wawasan dalam menerapkan algoritma data mining dalam hal pengelompokan musik terhadap suasana hati/mood, yang dapat menjadi acuan terhadap pengembangan penelitian sejenis. 1.5 Ruang Lingkup Penelitian Sehubungan dengan luasnya cakupan yang dapat diambil dari penelitian ini, maka perlu dibuat batasan-batasan dalam penelitian ini, antara lain: a. Sistem ini menggunakan model pengelompokan suasana hati/mood model Thayer yaitu 1) Contentment/ ketenangan; nyaman; relaksasi, 2) Exuberance/bersemangat; riuh; 3) Depression/depresi; sedih, dan 4) Anxious/cemas; kalut; kacau. b. File musik yang digunakan dalam proses pelatihan maupun pengujian adalah file musik format mono .wav pada bagian intro atau refrain berdurasi 30 detik. c. Metode ekstraksi fitur yang digunakan adalah Fast Fourier Transform dimana hasil dari metode ini akan dianalisis lebih lanjut dengan 8 menggunakan 9 metode spectral analysis (spectral centroid, spectral skewness, spectral rolloff, spectral slope, spectral kurtosis, spectral spread, spectral decrease, spectral flux, dan spectral flatness) untuk memperoleh karakter musik dengan ciri yang lebih tepat. d. Proses klasifikasi mood/suasana hati terhadap musik musik dilakukan dengan menggunakan algoritma K-Nearest Neighbor, K-Means, Support Vector Machine dan Iterative Dichotomiser 3. e. Kategori musik yang akan digunakan sebagai data latih/training dan data uji untuk proses klasifikasi adalah dataset yang bersumber dari situs www.audionetwork.com, yang telah memiliki label mood/suasana hati berdasarkan anotasi/tag dari pakar musik. File musik yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal. f. Pembuatan sistem dilakukan dengan menggunakan Matlab R2015a sebagai aplikasi utama. g. Modul pemrograman pada bagian spectral analysis menggunakan modul yang bersumber dari penelitian “An Introduction to Audio Content Analysis, Applications in Signal Processing and Music Informatics” (Alexander Lerch, 2012) 1.6 Keaslian Penelitian Berdasarkan penelitian yang akan diambil, penulis mengkaji banyak topik yang berhubungan dengan Music Information Retrieval diantaranya jurnal, artikel, paper, white paper, buku, dan penelitian yang sudah ada sebelumnya. 9 Penelitian mengenai MIR telah dilakukan dengan menggunakan beberapa metode pada aplikasi yang berbeda-beda. Metode yang digunakan sebagai machine learning dalam penelitian-penelitian tersebut antara lain seperti K-Nearest Neighbor, K-Means, Support Vector Machine (SVM), Decision Tree, Naïve Bayes, Neural Network, Backpropagation, dan lain sebagainya. Berdasarkan beberapa penelitian yang telah dilakukan, telah ada beberapa penelitian sejenis yang dilakukan untuk mengelompokkan musik berdasarkan mood/suasana hati dengan menggunakan berbagai algoritma data mining, maka dalam penelitian ini penulis mengusulkan pendekatan baru dalam hal perbandingan hasil kinerja algoritma dalam mengelompokan musik terhadap suasana hati menggunakan metode K-Nearest Neighbor dan K-Means dan pembanding pengujian sistem menggunakan Support Vector Machine dan Decision Tree. Serta dalam proses mendapatkan nilai fitur dengan ekstraksi fitur dengan menggunakan metode Fast Fourier Transform dan sembilan jenis Spectral Analysis Features. Penelitian terkait yang menggunakan berbagai pendekatan data mining lainnya dirangkum pada state of the art pada Bab II. 10