viii ABSTRAK Musik erat kaitannya dengan psikologi manusia

advertisement
ABSTRAK
Musik erat kaitannya dengan psikologi manusia, kenyataan ini
mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/ suasana hati
tertentu pada manusia. setiap musik yang telah tercipta memiliki energi emosi
tersendiri yang terpancar maka dari itu mulai banyak penelitian yang telah
dilakukan pada pengenalan emosi musik tersebut. Music Information Retrieval
(MIR) adalah salah satu bagian dalam Data Mining dimana informasi yang akan
digali dari sumber data berupa musik yang diperoleh dari dataset training dan
dataset testing menggunakan referensi musik Audio Network.
Penelitian ini mnghasilkan sebuah rekayasa sistem pengelompokan suasana
hati terhadap musik dengan menggunakan algoritma K-NN dan K-Means dimana
sistem ini memiliki 3 komponen utama yaitu komponen input, sistem
pengelompokan mood musik, serta komponen output. Sistem akan menerima input
data berupa file musik format mono *.wav, yang selanjutnya melakukan proses
pengelompokan terhadap musik dengan mengggunakan klasifikasi K-NN dan KMeans clustering. Kemudian sistem menghasilkan output berupa jenis mood yaitu,
contentment/ kepuasan, exuberance/ gembira, depression/ depresi dan anxious/
cemas; kalut. Secara umum hasil akurasi sistem dengan menggunakan algoritma
klasifikasi lebih baik dibandingkan dengan algoritma clustering, diantaranya K-NN
(86,55%), SVM (63,95%), ID3 (59,33%) dan K-Means (24,51%). Serta waktu
pemrosesan data berurut-urut K-NN (0,01021 detik), ID3 (0,05091 detik), SVM
(0,14118 detik) dan K-Means (0,1425 detik).
Kata Kunci : Musik, Mood, Klasifikasi, K-NN, K-Means
viii
ABSTRACT
Music is closely related to human psychology, this fact indicates that music
can be associated with emotion and mood / certain mood in humans. any music that
has been created has its own emotional energy is shown, therefore started a lot of
research has been done on the introduction of the emotion of the music. Music
Information Retrieval (MIR) is one piece in the Data Mining where the information
will be extracted from the data source in the form of music derived from the training
dataset and testing dataset using musical references Audio Network.
This study builds systems engineering grouping mood to music using K-NN
algorithm and K-Means where the system has three main components, namely input
components, systems grouping mood music, and component outputs. The system
will receive input data including music files mono * .wav format, which then do the
grouping of music by using a classification K-NN and K-Means clustering. Then
the system to produce output that kind of mood, contentment, Exuberance,
depression and anxious. As the results of system accuracy by using a classification
algorithm is better than the clustering algorithm, among K-NN (86,55%), SVM
(63,95%), ID3 (59,33%) and K-Means (24,51%). As well as the data processing
time in K-NN (0,01021 seconds), ID3 (0,05091seconds), SVM (0,14118 seconds)
and K-Means (0,1425 seconds)
Keywords : Music, Mood, Classification, K-NN, K-Means
ix
DAFTAR ISI
Lembar Persetujuan Pembimbing ..................................................................... iv
Tesis Ini Telah Diuji pada .....................................................................................v
UCAPAN TERIMAKASIH ............................................................................... vii
ABSTRAK .......................................................................................................... viii
ABSTRACT .......................................................................................................... ix
DAFTAR ISI ..........................................................................................................x
DAFTAR GAMBAR.......................................................................................... xiii
DAFTAR TABEL ................................................................................................xv
BAB I PENDAHULUAN.......................................................................................1
1.1 Latar Belakang .............................................................................................1
1.2 Rumusan Masalah .......................................................................................7
1.3 Tujuan Penelitian .........................................................................................7
1.4 Manfaat Penelitian .......................................................................................7
1.5 Ruang Lingkup Penelitian ..........................................................................8
1.6 Keaslian Penelitian......................................................................................9
BAB II KAJIAN PUSTAKA ...............................................................................11
2.1 State of The Art Review ..............................................................................11
2.2 Music Information Retrieval (MIR) ...........................................................22
2.3 Emosi dan Suasana Hati pada Musik ......................................................22
2.3.1 Definisi Emosi ......................................................................................23
2.3.2 Definisi Suasana Hati/ Mood ................................................................23
2.4 Evaluasi Model Musik Terhadap Mood ..................................................27
2.5 Fast Fourier Transform ............................................................................29
2.6 Feature Extraction .....................................................................................31
2.6.1 Spectral Centroid ..................................................................................32
2.6.2 Spectral Skewness.................................................................................33
2.6.3 Spectral Rolloff .....................................................................................33
2.6.4 Spectral Slope .......................................................................................34
2.6.5 Spectral Kurtosis ...................................................................................34
2.6.6 Spectral Spread .....................................................................................34
2.6.7 Spectral Decrease ..................................................................................35
2.6.8 Spectral Flux .........................................................................................35
2.6.9 Spectral Flatness ...................................................................................35
2.7 Data Mining ................................................................................................36
2.8 K-Nearest Neighbor ....................................................................................39
2.9 K-Means Clustering ...................................................................................42
2.10 Support Vector Machine .........................................................................45
x
2.10.1 Karakteristik SVM ...............................................................................46
2.10.2 Kelebihan dan Kekurangan SVM ........................................................47
2.10.3 Maximum Margin Hyperplanes ..........................................................50
2.10.4 Linear Support Vector Machine..........................................................51
2.10.5 Nonlinier Support Vector Machine .....................................................59
2.10.6 Multi Class SVM .................................................................................61
2.11 Decision Tree ............................................................................................62
2.10.1 Algoritma ID3 .....................................................................................63
2.10.2 Entropy & Information Gain ............................................................65
2.12 Pengujian Accuracy untuk Sistem Klasifikasi .......................................67
2.13 Pengujian Silhouette Coefficient untuk Sistem Clustering K-Means ...69
BAB III METODE PENELITIAN .....................................................................71
3.1 Tempat Penelitian ......................................................................................71
3.2 Alur Analisis ...............................................................................................72
3.2.1 Pendefinisian Masalah ..........................................................................75
3.2.2 Studi Literatur .......................................................................................75
3.2.3 Akuisisi Data.........................................................................................75
3.2.4 Pra-pengolahan File Musik ...................................................................76
3.2.5 Ekstraksi Fitur .......................................................................................78
3.2.6 Analisis Data .........................................................................................78
3.2.7 Pengujian Sistem...................................................................................90
BAB IV ..................................................................................................................93
HASIL DAN PEMBAHASAN ............................................................................93
4.1 Antarmuka Sistem .....................................................................................93
4.2 Antarmuka Training Data ........................................................................93
4.2.1 Antarmuka Masukkan File .wav ...........................................................97
4.2.2 Antarmuka Ekstraksi Fitur dengan Fast Fourier Transform .................98
4.2.3 Antarmuka Spectral Analysis ...............................................................99
4.2.4 Pengelompokan Dataset Training .......................................................101
4.3 Antarmuka Sistem Klasifikasi K-Nearest Neighbor ..............................107
4.3.1 Load File .............................................................................................108
4.3.2 Ekstraksi Fitur FFT .............................................................................109
4.3.3 Spectral Analysis ................................................................................110
4.3.4 Input Data Training .............................................................................111
4.3.5 Klasifikasi Mood Musik Menggunakan K-NN...................................112
4.4 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan SVM .....113
4.5 Antarmuka Sistem Klasifikasi Mood Musik Menggunakan ID3 ........119
4.6 Antarmuka Sistem Pengelompokan Mood Musik Menggunakan KMeans ..............................................................................................................126
4.7 Hasil Pengujian Menggunakan K-Nearest Neighbor ............................129
xi
4.8 Hasil Pengujian Menggunakan SVM .....................................................137
4.9 Hasil Pengujian Menggunakan ID3 .......................................................140
4.10 Hasil Pengujian Menggunakan K-Means ............................................144
BAB V .................................................................................................................155
KESIMPULAN DAN SARAN ..........................................................................155
5.1 Kesimpulan ...............................................................................................155
5.2 Saran .........................................................................................................156
DAFTAR PUSTAKA .........................................................................................157
xii
DAFTAR GAMBAR
Gambar 2. 1 Diagram Fishbone penelitian ............................................................21 Gambar 2. 2 Lingkaran kata sifat model emosi Hevner ........................................25 Gambar 2. 3 Model dimensi emosi Thayer ............................................................26 Gambar 2. 4 Diagram model emosi arousal-valence Thayer .................................27 Gambar 2. 5 Diagram alir proses clustering K-Means ..........................................45 Gambar 2. 6 Kemungkinan hyperplane untuk memisahkan kumpulan data linear
........................................................................................................................50 Gambar 2. 7 Margin batas kemungkinan ...............................................................51 Gambar 2. 8 Batas kemungkinan dan margin dari SVM .......................................53 Gambar 2. 9 Data dikotomis yang dipetakan kembali menggunakan Kernel Dasar
Radial .............................................................................................................60 Gambar 3. 1 Blok diagram sistem pengelompokan suasana hati terhadap musik .72 Gambar 3. 2 Alur Analisis Penelitian ....................................................................74 Gambar 3. 3 Tahapan prapengolahan file musik ...................................................77 Gambar 3. 4 Tahapan penyusunan data latih/training data mood musik ...............80 Gambar 3. 5 Tahapan klasifikasi mood musik menggunakan algoritma KNN .....81 Gambar 3. 6 Diagram alir proses klasifikasi KNN ................................................82 Gambar 3. 7 Alur klasifikasi SVM ........................................................................84 Gambar 3. 8 Alur klasifikasi Decision Tree (ID3) ................................................86 Gambar 3. 9 Diagram alir clustering K-Means ......................................................89 Gambar 3. 10 Alur proses pengujian sistem ..........................................................91 Gambar 4. 1 Antarmuka Training Data .................................................................94 Gambar 4. 2 Panel pengolahan data latih...............................................................95 Gambar 4. 3 Diagram sampling sinyal audio asli ..................................................95 Gambar 4. 4 Diagram sampling sinyal audio FFT .................................................96 Gambar 4. 5 Diagram spectrogram file audio masukan ........................................97 Gambar 4. 6 Masukkan File .wav ..........................................................................97 Gambar 4. 7 Diagram sampling sinyal audio asli ..................................................98 Gambar 4. 8 Antarmuka sistem ekstraksi FFT ......................................................99 Gambar 4. 9 Proses pembentukan dataset pelatihan mood music .......................100 Gambar 4. 10 Grafik nilai feature set mood 1. Contentment/Menenangkan .......104 Gambar 4. 11 Grafik nilai feature set mood 2. Exuberance/Bersemangat...........104 Gambar 4. 12 Grafik nilai feature set mood 3. Depression/Depresi ....................105 Gambar 4. 13 Grafik nilai feature set mood 4. Anxious/Kacau...........................105 Gambar 4. 14 Perbandingan 9 nilai spectral feature terhadap 4 kategori mood ..106 Gambar 4. 15 Perbandingan 4 kategori mood terhadap 9 nilai spectral feature ..107 Gambar 4. 16 Antarmuka sistem klasifikasi K-NN .............................................108 Gambar 4. 17 Antarmuka Load File untuk memuat file musik ...........................109 Gambar 4. 18 Antarmuka hasil ekstraksi fitur FFT .............................................109 Gambar 4. 19 Antarmuka Spectral Analysis........................................................110 Gambar 4. 20 Antarmuka Load Data Training ....................................................111 xiii
Gambar 4. 21 Antarmuka input nilai k untuk klasifikasi K-NN ..........................112 Gambar 4. 22 Antarmuka hasil klasifikasi K-NN berupa jenis mood .................113 Gambar 4. 23 Antarmuka sistem klasifikasi SVM ..............................................114 Gambar 4. 24 Antarmuka Load File Audio sebagai input data ...........................115 Gambar 4. 25 Antarmuka ekstraksi FFT..............................................................116 Gambar 4. 26 Antarmuka Spectral Analysis........................................................117 Gambar 4. 27 Antarmuka input dataset training SVM ........................................118 Gambar 4. 28 Antarmuka hasil klasifikasi SVM berupa jenis mood ..................119 Gambar 4. 29 sistem klasifikasi ID3 ....................................................................120 Gambar 4. 30 Antarmuka Load File Audio sebagai input data ...........................121 Gambar 4. 31 Antarmuka hasil Ekstraksi FFT ....................................................122 Gambar 4. 32 Antarmuka Spectral Analysis........................................................123 Gambar 4. 33 Antarmuka input dataset training ID3 ...........................................124 Gambar 4. 34 Antarmuka hasil klasifikasi ID3 berupa jenis mood .....................125 Gambar 4. 35 Antarmuka proses clustering data menggunakan K-Means ..........127 Gambar 4. 36 Antarmuka input file uji untuk clustering .....................................128 Gambar 4. 37 Antarmuka input nilai k sebagai jumlah cluster............................128 Gambar 4. 38 Antarmuka hasil clustering data uji ..............................................129 Gambar 4. 39 Hasil akurasi klasifikasi mood menggunakan K-NN ....................135 Gambar 4. 40 Rata-rata waktu proses klasifikasi K-NN terhadap jumlah data uji
......................................................................................................................136 Gambar 4. 41 Hasil akurasi klasifikasi mood musik menggunakan SVM ..........138 Gambar 4. 42 Rata-rata waktu proses klasifikasi SVM terhadap sejumlah data uji
......................................................................................................................140 Gambar 4. 43 Hasil akurasi klasifikasi mood musik menggunakan ID3 .............142 Gambar 4. 44 Rata-rata waktu proses klasifikasi ID3 terhadap sejumlah data uji
......................................................................................................................143 Gambar 4. 45 Nilai silhouette coefficient untuk setiap jumlah data uji...............146 Gambar 4. 46 Total sum of distance pada K-Means ............................................147 Gambar 4. 47 Waktu yang diperlukan untuk mengelompokkan sejumlah data uji
......................................................................................................................149 Gambar 4. 48 Persentase hasil akurasi K-Means clustering mood musik ...........150 Gambar 4. 49 Perbandingan persentase akurasi sistem pengelompokan musik
terhadap mood ..............................................................................................151 Gambar 4. 50 Perbandingan waktu proses sistem pengelompokan musik terhadap
mood ............................................................................................................152 xiv
DAFTAR TABEL
Tabel 2. 1 Rangkuman State of The Art .................................................................16 Tabel 3. 1 Pembagian kategori mood musik untuk training dataset ......................79 Tabel 4. 1 Kode untuk setiap jenis mood musik ..................................................100 Tabel 4. 2 Data Latih mood musik kategori 1) Contentment/Menenangkan .......101 Tabel 4. 3 Data Latih mood musik kategori 2) Exuberance/Bersemangat ..........102 Tabel 4. 4 Data Latih mood musik kategori 3) Depression/Depresi....................102 Tabel 4. 5 Data Latih mood musik kategori 4) Anxious/Kacau ..........................103 Tabel 4. 6 Hasil akurasi K-NN klasifikasi 40 file musik .....................................130 Tabel 4. 7 Hasil akurasi K-NN klasifikasi 80 file musik .....................................130 Tabel 4. 8 Hasil akurasi K-NN klasifikasi 120 file musik ...................................131 Tabel 4. 9 Hasil akurasi K-NN klasifikasi 160 file musik ...................................131 Tabel 4. 10 Hasil akurasi K-NN klasifikasi 200 file musik .................................132 Tabel 4. 11 Hasil akurasi K-NN klasifikasi 240 file musik .................................132 Tabel 4. 12 Hasil akurasi K-NN klasifikasi 280 file musik .................................133 Tabel 4. 13 Hasil akurasi K-NN klasifikasi 320 file musik .................................133 Tabel 4. 14 Hasil akurasi K-NN klasifikasi 360 file musik .................................134 Tabel 4. 15 Hasil akurasi K-NN klasifikasi 400 file musik .................................134 Tabel 4. 16 Persentase hasil akurasi total klasifikasi mood musik menggunakan
K-NN berdasarkan nilai ketetanggaan k (1-16) ...........................................135 Tabel 4. 17 Rata-rata waktu proses klasifikasi K-NN .........................................136 Tabel 4. 18 Persentase hasil akurasi total klasifikasi mood musik menggunakan
algoritma SVM.............................................................................................138 Tabel 4. 19 Rata-rata waktu proses klasifikasi SVM ...........................................139 Tabel 4. 20 Persentase hasil akurasi total klasifikasi mood musik menggunakan
algoritma ID3 ...............................................................................................141 Tabel 4. 21 Rata-rata waktu proses klasifikasi ID3 .............................................143 Tabel 4. 22 Nilai Silhouette Coefficient ..............................................................145 Tabel 4. 23 Nilai sum of distance berdasarkan jumlah data uji ...........................146 Tabel 4. 24 Waktu pemrosesan K-Means ............................................................148 Tabel 4. 25 Persentase akurasi K-Means clustering mood musik .......................149 Tabel 4. 26 Perbandingan persentase akurasi sistem dan waktu proses untuk
masing-masing algoritma .............................................................................151 xv
BAB I
PENDAHULUAN
1.1 Latar Belakang
Musik merupakan sarana yang ampuh dan memiliki banyak kebaikan bagi
tubuh dan jiwa manusia, musik dapat menenangkan bahkan membangkitkan
semangat seseorang yang mendengarkan musik. Para ahli psikologi menyatakan
bahwa terdapat bagian pada otak manusia yang merasakan musik dekat dengan
bagian otak yang berhubungan dengan ekspresi emosional manusia. Maka dari itu
terdapat hubungan langsung antara musik dan emosi (Samira Pouyanfar, dkk,
2014). Terdapat dua kelompok peneliti yang mempelajari hubungan antara musik
dengan emosi, yaitu ; 1) Psikolog Musik, mereka yang mempelajari hubungan
antara isyarat akustik (beat, tempo, tingkat suara, dll.) dengan berbagai ekspresi
emosi (marah, sedih, senang, tenang, dll.) dan sebagian besar mereka yang
mengembangkan model emosional. 2) Peneliti bidang komputer, yaitu mereka yang
mengembangkan algoritma untuk mendeteksi emosi terhadap musik secara
otomatis. Mereka mencoba menggunakan emosi selain untuk mendapatkan
metadata konvensional seperti genre/jenis musik, musik mood, yang juga sebagai
penelitian dalam bidang Music Information Retrieval.
Musik erat kaitannya dengan psikologi manusia, kenyataan ini
mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/suasana hati
tertentu pada manusia. Berbagai penelitian yang telah dilakukan memperkuat
pernyataan tersebut. Dalam penelitian yang dilakukan oleh Song et al, (2012)
1
menyatakan “Because music conveys and evokes feelings, a wealth of research has
been performed on music emotion recognition”, melalui pernyataan tersebut dapat
disimpulkan bahwa setiap musik yang telah tercipta memiliki energi emosi
tersendiri yang terpancar, maka dari itu mulai banyak penelitian yang telah
dilakukan pada pengenalan emosi musik. Dari sudut pandang psikologi musik,
elemen yang paling penting dalam penggolongan musik itu sendiri adalah pada
emosi apa yang tersirat dari musik tersebut.
Banyak sekali upaya yang telah dilakukan oleh para penulis dan pemusik
dalam mencoba menjelaskan hubungan antara musik dengan suasana hati, namun
tidak menghasilkan suatu standar dan kesepakatan mengenai hal tersebut. Hal ini
yang memicu ketertarikan dan semakin bertambahnya penelitian yang berkaitan
seputar musik dan kaitannya dengan suasana hati. Hevner dalam penelitiannya
berjudul Experimental studies of the elements of expression in music (Hevner K,
1936) melakukan eksperimen dimana pendengar musik diminta untuk menuliskan
kata sifat yang muncul di pikiran mereka yang paling deskriptif terhadap musik
yang didengarkan. Eksperimen ini dilakukan untuk memperkuat hipotesis bahwa
musik benar-benar membawa arti emosional. Dia juga menemukan dalam sebuah
kelompok yang mempunyai latar belakang budaya yang sama memiliki pelabelan
mood musik cenderung konsisten antar individunya.
Hevner membagi klasifikasi emosi menjadi 64 kata sifat dan
mengelompokkannya menjadi 8 cluster yaitu sober/memabukkan, gloomy/murung,
longing/hasrat, lyrical/lirik, sprightly/lincah, joyous/gembira, restless/gelisah dan
robust/kuat. Selanjutnya pengelompokan tersebut diperbaiki oleh penelitian
2
Farnsworth pada tahun 1958 dimana beliau menyusun ulang emosi menjadi 10
cluster, diantaranya : cheerful/ceria, fanciful/fantastis, delicate/ halus, leisurely/
santai, pathetic/ mengenaskan, depressing/ depresi, spiritual/ rohani, dramatic/
dramatis, exciting/ menarik, dan frustated/ frustasi (Tao Li, 2003).
Pengelompokan yang lebih sederhana sebenarnya telah dilakukan pada
tahun 1989-an, Thayer melakukan penelitian dengan judul The biopsychology of
mood and arousal, muncul pendekatan lain yang lebih sederhana terhadap
kategorisasi pada suasana hati dalam musik. Thayer mengajukan model 2 dimensi
yang memetakan suasana hati dalam musik, pendekatan 2 dimensi ini mengangkat
teori yang menyatakan bahwa emosi dan suasana hati disebabkan oleh dua faktor,
yaitu stress (senang dan cemas) dan energy (santai dan energetik). Selanjutnya dari
model 2 dimensi ini dibagi menjadi 4 cluster yaitu contentment/kepuasan,
exuberance/gembira, depression/depresi, dan anxious/cemas;kalut, (Thayer, 1989).
Menentukan emosi atau suasana hati apa yang terkandung sebuah lagu
merupakan tantangan dalam penelitian ini. Untuk mengetahui lebih efektif
mengenai suasana hati yang muncul dalam sebuah lagu, dapat diketahui pada saat
mendengarkan lagu tersebut pada bagian intro dan refrain lagu (Seungwon Oh,
dkk., 2013). Bagian intro merupakan bagian awal yang dapat menentukan atmosfer
lagu, intro juga secara intuitif memiliki kata-kata dan nada-nada yang intensif untuk
memberikan informasi mengenai suasana hati. Bagian refrain merupakan bagian
dengan kata-kata atau nada-nada yang paling sering diulang-ulang dalam sebuah
lagu. Secara umum bagian refrain adalah bagian dengan pengulangan kata dan nada
3
yang paling sering dan hal ini yang menjadi bagian refrain yang paling menentukan
mood apa yang terkandung dalam lagu tersebut.
Dalam hal menentukan jenis mood yang terkandung dalam lagu diperlukan
metode khusus yang menggabungkan komputasi numerik dengan penambangan
data berupa fitur-fitur unik dalam sebuah lagu, hal ini dikenal sebagai Music
Information Retrieval (MIR). MIR adalah salah satu bagian dalam data mining
dimana informasi yang akan digali dari sumber data berupa musik. Banyak
penelitian yang telah dilakukan mengenai MIR khususnya pada klasifikasi emosi
dan mood dalam bidang musik, psikologi, pemrosesan sinyal, machine learning
maupun kombinasi dari beberapa model penelitian tersebut. MIR menggunakan
berbagai macam metode data mining untuk pengelompokan termasuk di dalamnya
klasifikasi dan clustering data seperti K-NN, C4.5, decission tree, Support Vector
Model (SVM), Artificial Neural Network, Self Organization Map, K-Means dan lain
sebagainya.
Dalam proses data mining, sebelum berbagai jenis lagu tersebut
dikelompokkan berdasarkan mood, maka harus melewati tahap awal pengolahan
data (preprocessing). Tahapan preprocessing ini dikenal dengan feature selection
(Samira Pouyanfar, dkk, 2014). Tahapan selanjutnya dari feature selection adalah
proses feature extraction atau ekstraksi citi dari sebuah file lagu untuk menemukan
ciri yang untuk masuk ke tahapan pengolahan data berikutnya, perlu dilakukan
pengolahan sinyal dengan menggunakan transformasi fourier yang berfungsi
mengubah fungsi atau sinyal dalam domain waktu ke domain frekuensi. Tahapan
feature extraction terdiri dari tiga proses, yaitu pengambilan sampel lagu (bagian
4
refrain), penerapan fast fourier transform dan spectral analysis untuk mendapatkan
nilai spectral feature yang menjadi atribut dasar untuk dilakukannya klasifikasi
mood.
Dalam tahapan klasifikasi, K-Nearest Neighbor (K-NN) merupakan suatu
metode klasifikasi dengan supervisi (supervised learning) dimana hasil dari query
data yang baru diklasifikasikan berdasarkan kategori pada K-NN. Tujuan dari
algoritma ini adalah mengklasifikasikan obyek baru berdasarkan atribut dan
training sample. Pada berbagai penelitian dibidang lain dengan memanfaatkan KNN misalnya pada pengolahan sinyal suara, pengolahan citra digital, sistem
pendukung keputusan dan berbagai sistem kecerdasan buatan lainnya, dan terbukti
K-NN dapat bekerja dengan baik.
Metode klasifikasi lainnya yaitu Support vector machine (SVM) juga
merupakan suatu teknik pemodelan supervised learning yang relatif baru (1995)
untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang
sangat populer belakangan ini. Baik para ilmuwan maupun praktisi telah banyak
menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam
kehidupan sehari-hari. Terbukti dalam beberapa implementasi terkait klasifikasi
musik terhadap mood, SVM memberi hasil yang lebih baik dari algoritma klasifikasi
lainnya, terutama dalam hal solusi yang dicapai (Samira Pouyanfar, 2014). SVM
berusaha untuk menemukan fungsi pemisah (classifier) yang optimal yang bisa
memisahkan multi set data dari multi class yang berbeda.
Pohon keputusan atau dikenal dengan Decision Tree merupakan salah satu
algortima klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh
5
manusia. Dengan kemampuannya untuk mem-break down proses pengambilan
keputusan yang kompleks menjadi lebih sederhana. Pohon keputusan juga dapat
menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan
sebuah variabel target. Dalam penelitian terkait menggunakan algoritma ini dalam
klasifikasi musik terhadap mood menghasilkan hasil klasifikasi yang cukup baik
(Braja Gopal, 2013)
Untuk proses clustering dalam penelitian ini menggunakan algoritma KMeans, dimana algoritma data mining ini melakukan proses pemodelan tanpa
supervisi (unsupervised learning) dan merupakan salah satu algoritma yang
melakukan pengelompokan data dengan sistem partisi. Metode K-Means berusaha
mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam
satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan
mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok
yang lain. Dengan kata lain, algoritma ini berusaha untuk meminimalkan variasi
antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data
yang ada di cluster lainnya.
Berdasarkan pemaparan penjelasan latar belakang tersebut maka penelitian
ini dilakukan untuk dapat membangun sebuah rekayasa sistem yang dapat
mengelompokkan musik ke dalam empat parameter mood atau suasana hati yang
terdapat dalam musik. Sistem ini akan dibangun berdasarkan pengelompokkan
parameter mood yang diperoleh dengan menggunakan algoritma K-Nearest
Neighbor dan K-Means, serta sebagai pembanding pengujian menggunakan
algoritma Support Vector Machine dan Decision Tree. Sistem ini nantinya
6
diharapkan dapat membantu penggunanya untuk menemukan kategori mood apa
yang terkandung dalam sebuah file musik. Perlu diperhatikan juga bahwa file musik
yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal.
Koleksi musik yang digunakan dalam proses pelatihan dan pengujian ini diperoleh
dari situs www.audionetwork.com.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah disebutkan di atas, maka rumusan
masalah dalam penelitian ini adalah bagaimana membangun sistem pengelompokan
musik terhadap suasana hati dan mengetahui unjuk kerja algoritma K-Nearest
Neighbor dengan K-Means serta membandingkan dengan algoritma Support Vector
Machine, dan Iterative Dichotomiser 3.
1.3 Tujuan Penelitian
Tujuan yang ingin dicapai melalui penelitian ini adalah untuk memperoleh
perbandingan persentase hasil akurasi terbaik dan waktu pemrosesan tercepat
dalam hal pengelompokan musik terhadap suasana hati/mood diantara algoritma KNN, K-Means, SVM, dan ID3.
1.4 Manfaat Penelitian
Secara praktis, hasil dari penelitian ini diharapkan memberikan manfaat
sebagai berikut :
1. Menghasilkan sebuah sistem yang dapat melakukan pengelompokan musik
terhadap suasana hati/mood menggunakan algoritma K-Nearest Neighbor,
K-Means, SVM, dan ID3.
7
2. Memperoleh hasil persentase akurasi pengelompokan musik terbaik dan
waktu pemrosesan tercepat diantara keempat algoritma tersebut dalam hal
pengelompokan musik terhadap suasana hati/mood.
Secara akademis penelitian ini diharapkan dapat memberikan manfaat
diantaranya :
1. Dapat memberikan suatu karya penelitian yang dapat mendukung dalam
pengembangan penelitian yang terkait dengan Music Information Retrieval.
2. Bagi peneliti, dapat menambah wawasan dalam menerapkan algoritma data
mining dalam hal pengelompokan musik terhadap suasana hati/mood, yang
dapat menjadi acuan terhadap pengembangan penelitian sejenis.
1.5 Ruang Lingkup Penelitian
Sehubungan dengan luasnya cakupan yang dapat diambil dari penelitian ini,
maka perlu dibuat batasan-batasan dalam penelitian ini, antara lain:
a. Sistem ini menggunakan model pengelompokan suasana hati/mood
model Thayer yaitu 1) Contentment/ ketenangan; nyaman; relaksasi, 2)
Exuberance/bersemangat; riuh; 3) Depression/depresi; sedih, dan 4)
Anxious/cemas; kalut; kacau.
b. File musik yang digunakan dalam proses pelatihan maupun pengujian
adalah file musik format mono .wav pada bagian intro atau refrain
berdurasi 30 detik.
c. Metode ekstraksi fitur yang digunakan adalah Fast Fourier Transform
dimana hasil dari metode ini akan dianalisis lebih lanjut dengan
8
menggunakan 9 metode spectral analysis (spectral centroid, spectral
skewness, spectral rolloff, spectral slope, spectral kurtosis, spectral
spread, spectral decrease, spectral flux, dan spectral flatness) untuk
memperoleh karakter musik dengan ciri yang lebih tepat.
d. Proses klasifikasi mood/suasana hati terhadap musik musik dilakukan
dengan menggunakan algoritma K-Nearest Neighbor, K-Means,
Support Vector Machine dan Iterative Dichotomiser 3.
e. Kategori musik yang akan digunakan sebagai data latih/training dan
data uji untuk proses klasifikasi adalah dataset yang bersumber dari situs
www.audionetwork.com, yang telah memiliki label mood/suasana hati
berdasarkan anotasi/tag dari pakar musik. File musik yang digunakan
ini hanya instrumental musik saja tanpa mengandung lirik vokal.
f. Pembuatan sistem dilakukan dengan menggunakan Matlab R2015a
sebagai aplikasi utama.
g. Modul pemrograman pada bagian spectral analysis menggunakan
modul yang bersumber dari penelitian “An Introduction to Audio
Content Analysis, Applications in Signal Processing and Music
Informatics” (Alexander Lerch, 2012)
1.6 Keaslian Penelitian
Berdasarkan penelitian yang akan diambil, penulis mengkaji banyak topik
yang berhubungan dengan Music Information Retrieval diantaranya jurnal, artikel,
paper, white paper, buku, dan penelitian yang sudah ada sebelumnya.
9
Penelitian mengenai MIR telah dilakukan dengan menggunakan beberapa
metode pada aplikasi yang berbeda-beda. Metode yang digunakan sebagai machine
learning dalam penelitian-penelitian tersebut antara lain seperti K-Nearest
Neighbor, K-Means, Support Vector Machine (SVM), Decision Tree, Naïve Bayes,
Neural Network, Backpropagation, dan lain sebagainya.
Berdasarkan beberapa penelitian yang telah dilakukan, telah ada beberapa
penelitian sejenis yang dilakukan untuk mengelompokkan musik berdasarkan
mood/suasana hati dengan menggunakan berbagai algoritma data mining, maka
dalam penelitian ini penulis mengusulkan pendekatan baru dalam hal perbandingan
hasil kinerja algoritma dalam mengelompokan musik terhadap suasana hati
menggunakan metode K-Nearest Neighbor dan K-Means dan pembanding
pengujian sistem menggunakan Support Vector Machine dan Decision Tree. Serta
dalam proses mendapatkan nilai fitur dengan ekstraksi fitur dengan menggunakan
metode Fast Fourier Transform dan sembilan jenis Spectral Analysis Features.
Penelitian terkait yang menggunakan berbagai pendekatan data mining lainnya
dirangkum pada state of the art pada Bab II.
10
Download