1 BAB I PENDAHULUAN 1.1 Latar Belakang Musik merupakan

advertisement
BAB I
PENDAHULUAN
1.1 Latar Belakang
Musik merupakan sarana yang ampuh dan memiliki banyak kebaikan bagi
tubuh dan jiwa manusia, musik dapat menenangkan bahkan membangkitkan
semangat seseorang yang mendengarkan musik. Para ahli psikologi menyatakan
bahwa terdapat bagian pada otak manusia yang merasakan musik dekat dengan
bagian otak yang berhubungan dengan ekspresi emosional manusia. Maka dari itu
terdapat hubungan langsung antara musik dan emosi (Samira Pouyanfar, dkk,
2014). Terdapat dua kelompok peneliti yang mempelajari hubungan antara musik
dengan emosi, yaitu ; 1) Psikolog Musik, mereka yang mempelajari hubungan
antara isyarat akustik (beat, tempo, tingkat suara, dll.) dengan berbagai ekspresi
emosi (marah, sedih, senang, tenang, dll.) dan sebagian besar mereka yang
mengembangkan model emosional. 2) Peneliti bidang komputer, yaitu mereka yang
mengembangkan algoritma untuk mendeteksi emosi terhadap musik secara
otomatis. Mereka mencoba menggunakan emosi selain untuk mendapatkan
metadata konvensional seperti genre/jenis musik, musik mood, yang juga sebagai
penelitian dalam bidang Music Information Retrieval.
Musik erat kaitannya dengan psikologi manusia, kenyataan ini
mengindikasikan bahwa musik dapat terkait dengan emosi dan mood/suasana hati
tertentu pada manusia. Berbagai penelitian yang telah dilakukan memperkuat
pernyataan tersebut. Dalam penelitian yang dilakukan oleh Song et al, (2012)
1
menyatakan “Because music conveys and evokes feelings, a wealth of research has
been performed on music emotion recognition”, melalui pernyataan tersebut dapat
disimpulkan bahwa setiap musik yang telah tercipta memiliki energi emosi
tersendiri yang terpancar, maka dari itu mulai banyak penelitian yang telah
dilakukan pada pengenalan emosi musik. Dari sudut pandang psikologi musik,
elemen yang paling penting dalam penggolongan musik itu sendiri adalah pada
emosi apa yang tersirat dari musik tersebut.
Banyak sekali upaya yang telah dilakukan oleh para penulis dan pemusik
dalam mencoba menjelaskan hubungan antara musik dengan suasana hati, namun
tidak menghasilkan suatu standar dan kesepakatan mengenai hal tersebut. Hal ini
yang memicu ketertarikan dan semakin bertambahnya penelitian yang berkaitan
seputar musik dan kaitannya dengan suasana hati. Hevner dalam penelitiannya
berjudul Experimental studies of the elements of expression in music (Hevner K,
1936) melakukan eksperimen dimana pendengar musik diminta untuk menuliskan
kata sifat yang muncul di pikiran mereka yang paling deskriptif terhadap musik
yang didengarkan. Eksperimen ini dilakukan untuk memperkuat hipotesis bahwa
musik benar-benar membawa arti emosional. Dia juga menemukan dalam sebuah
kelompok yang mempunyai latar belakang budaya yang sama memiliki pelabelan
mood musik cenderung konsisten antar individunya.
Hevner
membagi klasifikasi emosi menjadi 64 kata sifat
dan
mengelompokkannya menjadi 8 cluster yaitu sober/memabukkan, gloomy/murung,
longing/hasrat, lyrical/lirik, sprightly/lincah, joyous/gembira, restless/gelisah dan
robust/kuat. Selanjutnya pengelompokan tersebut diperbaiki oleh penelitian
2
Farnsworth pada tahun 1958 dimana beliau menyusun ulang emosi menjadi 10
cluster, diantaranya : cheerful/ceria, fanciful/fantastis, delicate/ halus, leisurely/
santai, pathetic/ mengenaskan, depressing/ depresi, spiritual/ rohani, dramatic/
dramatis, exciting/ menarik, dan frustated/ frustasi (Tao Li, 2003).
Pengelompokan yang lebih sederhana sebenarnya telah dilakukan pada
tahun 1989-an, Thayer melakukan penelitian dengan judul The biopsychology of
mood and arousal, muncul pendekatan lain yang lebih sederhana terhadap
kategorisasi pada suasana hati dalam musik. Thayer mengajukan model 2 dimensi
yang memetakan suasana hati dalam musik, pendekatan 2 dimensi ini mengangkat
teori yang menyatakan bahwa emosi dan suasana hati disebabkan oleh dua faktor,
yaitu stress (senang dan cemas) dan energy (santai dan energetik). Selanjutnya dari
model 2 dimensi ini dibagi menjadi 4 cluster yaitu contentment/kepuasan,
exuberance/gembira, depression/depresi, dan anxious/cemas;kalut, (Thayer, 1989).
Menentukan emosi atau suasana hati apa yang terkandung sebuah lagu
merupakan tantangan dalam penelitian ini. Untuk mengetahui lebih efektif
mengenai suasana hati yang muncul dalam sebuah lagu, dapat diketahui pada saat
mendengarkan lagu tersebut pada bagian intro dan refrain lagu (Seungwon Oh,
dkk., 2013). Bagian intro merupakan bagian awal yang dapat menentukan atmosfer
lagu, intro juga secara intuitif memiliki kata-kata dan nada-nada yang intensif untuk
memberikan informasi mengenai suasana hati. Bagian refrain merupakan bagian
dengan kata-kata atau nada-nada yang paling sering diulang-ulang dalam sebuah
lagu. Secara umum bagian refrain adalah bagian dengan pengulangan kata dan nada
3
yang paling sering dan hal ini yang menjadi bagian refrain yang paling menentukan
mood apa yang terkandung dalam lagu tersebut.
Dalam hal menentukan jenis mood yang terkandung dalam lagu diperlukan
metode khusus yang menggabungkan komputasi numerik dengan penambangan
data berupa fitur-fitur unik dalam sebuah lagu, hal ini dikenal sebagai Music
Information Retrieval (MIR). MIR adalah salah satu bagian dalam data mining
dimana informasi yang akan digali dari sumber data berupa musik. Banyak
penelitian yang telah dilakukan mengenai MIR khususnya pada klasifikasi emosi
dan mood dalam bidang musik, psikologi, pemrosesan sinyal, machine learning
maupun kombinasi dari beberapa model penelitian tersebut. MIR menggunakan
berbagai macam metode data mining untuk pengelompokan termasuk di dalamnya
klasifikasi dan clustering data seperti K-NN, C4.5, decission tree, Support Vector
Model (SVM), Artificial Neural Network, Self Organization Map, K-Means dan lain
sebagainya.
Dalam proses data mining, sebelum berbagai jenis lagu tersebut
dikelompokkan berdasarkan mood, maka harus melewati tahap awal pengolahan
data (preprocessing). Tahapan preprocessing ini dikenal dengan feature selection
(Samira Pouyanfar, dkk, 2014). Tahapan selanjutnya dari feature selection adalah
proses feature extraction atau ekstraksi citi dari sebuah file lagu untuk menemukan
ciri yang untuk masuk ke tahapan pengolahan data berikutnya, perlu dilakukan
pengolahan sinyal dengan menggunakan transformasi fourier yang berfungsi
mengubah fungsi atau sinyal dalam domain waktu ke domain frekuensi. Tahapan
feature extraction terdiri dari tiga proses, yaitu pengambilan sampel lagu (bagian
4
refrain), penerapan fast fourier transform dan spectral analysis untuk mendapatkan
nilai spectral feature yang menjadi atribut dasar untuk dilakukannya klasifikasi
mood.
Dalam tahapan klasifikasi, K-Nearest Neighbor (K-NN) merupakan suatu
metode klasifikasi dengan supervisi (supervised learning) dimana hasil dari query
data yang baru diklasifikasikan berdasarkan kategori pada K-NN. Tujuan dari
algoritma ini adalah mengklasifikasikan obyek baru berdasarkan atribut dan
training sample. Pada berbagai penelitian dibidang lain dengan memanfaatkan KNN misalnya pada pengolahan sinyal suara, pengolahan citra digital, sistem
pendukung keputusan dan berbagai sistem kecerdasan buatan lainnya, dan terbukti
K-NN dapat bekerja dengan baik.
Metode klasifikasi lainnya yaitu Support vector machine (SVM) juga
merupakan suatu teknik pemodelan supervised learning yang relatif baru (1995)
untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi, yang
sangat populer belakangan ini. Baik para ilmuwan maupun praktisi telah banyak
menerapkan teknik ini dalam menyelesaikan masalah-masalah nyata dalam
kehidupan sehari-hari. Terbukti dalam beberapa implementasi terkait klasifikasi
musik terhadap mood, SVM memberi hasil yang lebih baik dari algoritma klasifikasi
lainnya, terutama dalam hal solusi yang dicapai (Samira Pouyanfar, 2014). SVM
berusaha untuk menemukan fungsi pemisah (classifier) yang optimal yang bisa
memisahkan multi set data dari multi class yang berbeda.
Pohon keputusan atau dikenal dengan Decision Tree merupakan salah satu
algortima klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh
5
manusia. Dengan kemampuannya untuk mem-break down proses pengambilan
keputusan yang kompleks menjadi lebih sederhana. Pohon keputusan juga dapat
menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan
sebuah variabel target. Dalam penelitian terkait menggunakan algoritma ini dalam
klasifikasi musik terhadap mood menghasilkan hasil klasifikasi yang cukup baik
(Braja Gopal, 2013)
Untuk proses clustering dalam penelitian ini menggunakan algoritma KMeans, dimana algoritma data mining ini melakukan proses pemodelan tanpa
supervisi (unsupervised learning) dan merupakan salah satu algoritma yang
melakukan pengelompokan data dengan sistem partisi. Metode K-Means berusaha
mengelompokkan data yang ada ke dalam beberapa kelompok, dimana data dalam
satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan
mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok
yang lain. Dengan kata lain, algoritma ini berusaha untuk meminimalkan variasi
antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data
yang ada di cluster lainnya.
Berdasarkan pemaparan penjelasan latar belakang tersebut maka penelitian
ini dilakukan untuk dapat membangun sebuah rekayasa sistem yang dapat
mengelompokkan musik ke dalam empat parameter mood atau suasana hati yang
terdapat dalam musik. Sistem ini akan dibangun berdasarkan pengelompokkan
parameter mood yang diperoleh dengan menggunakan algoritma K-Nearest
Neighbor dan K-Means, serta sebagai pembanding pengujian menggunakan
algoritma Support Vector Machine dan Decision Tree. Sistem ini nantinya
6
diharapkan dapat membantu penggunanya untuk menemukan kategori mood apa
yang terkandung dalam sebuah file musik. Perlu diperhatikan juga bahwa file musik
yang digunakan ini hanya instrumental musik saja tanpa mengandung lirik vokal.
Koleksi musik yang digunakan dalam proses pelatihan dan pengujian ini diperoleh
dari situs www.audionetwork.com.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah disebutkan di atas, maka rumusan
masalah dalam penelitian ini adalah bagaimana membangun sistem pengelompokan
musik terhadap suasana hati dan mengetahui unjuk kerja algoritma K-Nearest
Neighbor dengan K-Means serta membandingkan dengan algoritma Support Vector
Machine, dan Iterative Dichotomiser 3.
1.3 Tujuan Penelitian
Tujuan yang ingin dicapai melalui penelitian ini adalah untuk memperoleh
perbandingan persentase hasil akurasi terbaik dan waktu pemrosesan tercepat
dalam hal pengelompokan musik terhadap suasana hati/mood diantara algoritma KNN, K-Means, SVM, dan ID3.
1.4 Manfaat Penelitian
Secara praktis, hasil dari penelitian ini diharapkan memberikan manfaat
sebagai berikut :
1. Menghasilkan sebuah sistem yang dapat melakukan pengelompokan musik
terhadap suasana hati/mood menggunakan algoritma K-Nearest Neighbor,
K-Means, SVM, dan ID3.
7
2. Memperoleh hasil persentase akurasi pengelompokan musik terbaik dan
waktu pemrosesan tercepat diantara keempat algoritma tersebut dalam hal
pengelompokan musik terhadap suasana hati/mood.
Secara akademis penelitian ini diharapkan dapat memberikan manfaat
diantaranya :
1. Dapat memberikan suatu karya penelitian yang dapat mendukung dalam
pengembangan penelitian yang terkait dengan Music Information Retrieval.
2. Bagi peneliti, dapat menambah wawasan dalam menerapkan algoritma data
mining dalam hal pengelompokan musik terhadap suasana hati/mood, yang
dapat menjadi acuan terhadap pengembangan penelitian sejenis.
1.5 Ruang Lingkup Penelitian
Sehubungan dengan luasnya cakupan yang dapat diambil dari penelitian ini,
maka perlu dibuat batasan-batasan dalam penelitian ini, antara lain:
a. Sistem ini menggunakan model pengelompokan suasana hati/mood
model Thayer yaitu 1) Contentment/ ketenangan; nyaman; relaksasi, 2)
Exuberance/bersemangat; riuh; 3) Depression/depresi; sedih, dan 4)
Anxious/cemas; kalut; kacau.
b. File musik yang digunakan dalam proses pelatihan maupun pengujian
adalah file musik format mono .wav pada bagian intro atau refrain
berdurasi 30 detik.
c. Metode ekstraksi fitur yang digunakan adalah Fast Fourier Transform
dimana hasil dari metode ini akan dianalisis lebih lanjut dengan
8
menggunakan 9 metode spectral analysis (spectral centroid, spectral
skewness, spectral rolloff, spectral slope, spectral kurtosis, spectral
spread, spectral decrease, spectral flux, dan spectral flatness) untuk
memperoleh karakter musik dengan ciri yang lebih tepat.
d. Proses klasifikasi mood/suasana hati terhadap musik musik dilakukan
dengan menggunakan algoritma K-Nearest Neighbor, K-Means,
Support Vector Machine dan Iterative Dichotomiser 3.
e. Kategori musik yang akan digunakan sebagai data latih/training dan
data uji untuk proses klasifikasi adalah dataset yang bersumber dari situs
www.audionetwork.com, yang telah memiliki label mood/suasana hati
berdasarkan anotasi/tag dari pakar musik. File musik yang digunakan
ini hanya instrumental musik saja tanpa mengandung lirik vokal.
f. Pembuatan sistem dilakukan dengan menggunakan Matlab R2015a
sebagai aplikasi utama.
g. Modul pemrograman pada bagian spectral analysis menggunakan
modul yang bersumber dari penelitian “An Introduction to Audio
Content Analysis, Applications in Signal Processing and Music
Informatics” (Alexander Lerch, 2012)
1.6 Keaslian Penelitian
Berdasarkan penelitian yang akan diambil, penulis mengkaji banyak topik
yang berhubungan dengan Music Information Retrieval diantaranya jurnal, artikel,
paper, white paper, buku, dan penelitian yang sudah ada sebelumnya.
9
Penelitian mengenai MIR telah dilakukan dengan menggunakan beberapa
metode pada aplikasi yang berbeda-beda. Metode yang digunakan sebagai machine
learning dalam penelitian-penelitian tersebut antara lain seperti K-Nearest
Neighbor, K-Means, Support Vector Machine (SVM), Decision Tree, Naïve Bayes,
Neural Network, Backpropagation, dan lain sebagainya.
Berdasarkan beberapa penelitian yang telah dilakukan, telah ada beberapa
penelitian sejenis yang dilakukan untuk mengelompokkan musik berdasarkan
mood/suasana hati dengan menggunakan berbagai algoritma data mining, maka
dalam penelitian ini penulis mengusulkan pendekatan baru dalam hal perbandingan
hasil kinerja algoritma dalam mengelompokan musik terhadap suasana hati
menggunakan metode K-Nearest Neighbor dan K-Means dan pembanding
pengujian sistem menggunakan Support Vector Machine dan Decision Tree. Serta
dalam proses mendapatkan nilai fitur dengan ekstraksi fitur dengan menggunakan
metode Fast Fourier Transform dan sembilan jenis Spectral Analysis Features.
Penelitian terkait yang menggunakan berbagai pendekatan data mining lainnya
dirangkum pada state of the art pada Bab II.
10
Download