BAB I PENDAHULUAN 1.1. Latar Belakang Kata “genre” berasal dari bahasa Perancis yang artinya jenis atau kelas (Chandler, 1997). Genre dalam musik dapat diartikan sebagai suatu terminologi untuk menyebutkan gaya, jenis atau aliran musik yang ada dan berkembang di masyarakat (Djohan, 2006). Kaminskas dan Ricci (2012) menyatakan karakteristik dari suatu genre musik masih belum jelas atau bersifat ambigu. Sampai saat ini, tidak ada definisi taksonomi secara umum dari genre pada musik. Genre pada musik juga selalu berkembang sehingga pada umumnya setiap library musik populer memiliki hirarki genrenya sendiri. Fenomena ini menyebabkan para peneliti cenderung menggunakan taksonomi genre yang disederhanakan yaitu mencakup kurang lebih 10 genre. Penggunaan genre pada musik sudah sangat umum digunakan bagi para pengguna musik. Suatu genre pada musik akan mengacu pada suatu style musik tertentu dan setiap orang memiliki kecenderungan untuk hanya menyukai musik dengan style tertentu pula. Hal ini menunjukkan pentingnya pemberian label genre pada koleksi musik. Pemberian label genre pada musik akan sangat memudahkan para pengguna musik dalam pencarian koleksi musik yang diinginkan atau disukai. Lee dan Downie (2004) menyebutkan bahwa pengguna musik saat ini memiliki kecenderungan untuk mencari musik yang disukai berdasarkan genre daripada berdasarkan rekomendasi ataupun kesamaan artis. Penggunaan genre pada musik sangat mudah ditemukan dalam kehidupan sehari-hari, salah satunya adalah pembuatan play list musik berdasarkan genre. Setiap orang akan membuat play list musik berdasarkan apa yang disukai atau apa yang ingin didengar, oleh karena itu seseorang akan memilih musik-musik tertentu saja sesuai dengan genre yang diinginkan untuk dimasukkan ke 1 2 dalam play list-nya. Kesukaan tiap orang akan genre tertentu juga membuat banyak stasiun radio menyediakan program acara musik yang khusus memperdengarkan satu genre tertentu saja pada segmen acaranya. Pelabelan genre terhadap koleksi musik yang dimiliki akan mempermudah dalam pemilihan lagu atau musik yang diinginkan dalam play list. Genre musik juga digunakan dalam bidang terapi musik. Djohan (2006) menyatakan terapi musik dapat dilakukan dengan berbagai strategi menggunakan aneka macam alat musik dan genre musik. Selera dan rasa suka atau tidak suka seseorang terhadap musik tertentu membuat efek yang dihasilkan menjadi bervariasi. Prosedur pelaksanaan terapi musik diawali dengan melakukan survei musik terhadap pasien. Hal ini dilakukan salah satunya adalah untuk mengetahui genre musik yang disukai pasien sehingga dapat ditentukan genre musik apa yang nantinya akan diperdengarkan kepada pasien saat terapi dilakukan. Pelabelan genre pada file musik juga merupakan hal yang penting dalam bidang Music Information Retrieval (MIR). Fu dkk. (2011) menyatakan bahwa kunci utama dalam membangun MIR adalah klasifikasi, yaitu bagaimana memberikan label kepada suatu file musik berdasarkan genre, mood ataupun nama artis yang menampilkan musik tersebut. Kemudahan dalam menambah jumlah koleksi file musik digital khususnya melalui melalui internet menyebabkan pelabelan genre terhadap koleksi musik dalam jumlah besar secara manual sangat tidak efisien, oleh karena itu perlu dibangun suatu sistem yang dapat melakukan pelabelan atau klasifikasi genre pada file musik secara otomatis. Klasifikasi atau pemberian label pada suatu file musik ini diharapkan akan mempercepat temu kembali suatu file musik karena dapat mempersempit ruang pencarian hanya pada label tertentu, misalnya pada genre tertentu. Menurut Scaringella (2005), terdapat tiga pendekatan yang mungkin diterapkan untuk membangun sistem klasifikasi genre otomatis, yaitu sistem pakar, klasifikasi tidak terbimbing (unsupervised) dan klasifikasi terbimbing (supervised). Kontribusi yang paling signifikan untuk penelitian klasifikasi genre pada musik diberikan oleh teknik yang mengggunakan pendekatan klasifikasi secara supervised (Kaminskas dan Ricci, 2012). 3 Sistem pakar didasarkan pada seperangkat aturan yang didefinisikan oleh pakar untuk meklasifikasikan musik ke dalam genre yang sesuai. Sistem klasifikasi otomatis dengan pendekatan menggunakan sistem pakar kurang realistis untuk digunakan karena sangat sulit untuk membuat aturan tanpa adanya taksonomi dan definisi karakteristik genre yang jelas. Pendekatan klasifikasi genre musik secara unsupervised atau metode clustering salah satunya digunakan oleh de Leon dan Inesta (2002). Dewi dan Harjoko (2010) serta Yanuarti (2012) juga menggunakan pendekatan unsupervised untuk mengklasifikasi mood dari musik. Pendekatan klasifikasi menggunakan teknik clustering bertujuan mengelompokkan data sedemikian hingga klasifikasi akan tercipta dengan sendirinya berdasarkan pada pengukuran kemiripan (similarity measure) pada data. Keuntungan dari pendekatan ini adalah tidak diperlukannya batasan yang pasti dari taksonomi yang diinginkan, sehingga taksonomi dari genre atau mood dari musik tidak diperlukan. Kelemahan utama dari pendekatan secara unsupervised adalah hasil clustering yang tidak memiliki label kelas. Klasifikasi menggunakan pendekatan unsupervised, misalnya menggunakan Self Organizing Map (SOM), memerlukan langkah lebih lanjut untuk menganalisis atau mendeskripsikan cluster yang terbentuk untuk diberikan label yang sesuai (Kohonen, 1990; de Leon dan Inesta, 2002). Pendekatan klasifikasi secara supervised adalah yang paling sering digunakan (Tzanetakis dan Cook, 2002; Li dkk., 2003; Nopthaisong dan Hasan 2007; Fansuri, 2011; Goulart dkk., 2012). Pendekatan secara supervised memetakan data ke dalam taksonomi klasifikasi yang telah diberikan menggunakan algoritma machine learning. Proses klasifikasi diawali dengan melakukan proses pelatihan menggunakan sejumlah data yang telah dilabeli secara manual, kemudian dilanjutkan dengan mengklasifikasikan data yang belum terlabeli berdasarkan hasil dari proses pelatihan. Perbedaan dari sistem pakar dan pendekatan supervised adalah pada taksonomi kelas dalam hal ini genre musik, tidak harus digambarkan secara eksplisit. Classifier akan berusaha menemukan keterkaitan antara fitur yang 4 digunakan dalam data pelatihan dengan taksonomi kelas yang diberikan secara otomatis. Learning Vector Quantization (LVQ) merupakan salah satu bagian dari model Jaringan Syaraf Tiruan dengan algoritma pembelajaran kompetitif yang bersifat supervised. Penelitian untuk klasifikasi genre musik menggunakan metode LVQ masih sangat terbatas, antara lain adalah (Nopthaisong dan Hasan, 2007) dan (Fansuri, 2011), dengan jumlah genre yang masih sedikit yaitu 5 dan 4 genre. Keserderhanaan, fleksibilitas dan efisiensi merupakan beberapa alasan mengapa LVQ yang telah diperkenalkan oleh Kohonen digunakan di berbagai bidang (Ghosh dkk., 2006). Kelemahan dari metode ini adalah sangat bergantung atau sensitif terhadap pemilihan vektor acuan (reference vector) yang juga digunakan sebagai bobot awal jaringan dalam proses pelatihan LVQ. Vektor acuan merupakan perwakilan dari masing-masing kelas yang dianggap sebagai representasi dari suatu kelas dalam jaringan LVQ. Penentuan vektor acuan yang paling mudah dan umum digunakan adalah dengan memilih langsung sejumlah vektor input sebagai perwakilan dari masingmasing kelas pada proses pelatihan (Fausett, 1994). Inisialisasi vektor acuan (bobot awal) dengan cara ini sangat sensitif terhadap tingkat akurasi karena ketidaktepatan dalam pemilihannya dapat menghasilkan akurasi yang buruk. Alternatif lain untuk penentuan vektor acuan adalah dengan menggunakan SOM (Kohonen, 1990; Fausett, 1994). Penentuan label kelas dari bobot jaringan dilakukan setelah proses pelatihan yaitu berdasarkan label kelas terbanyak (majority voting) dari vektor input yang menjadi anggota cluster (vektor bobot) tersebut. Penelitian ini akan mencoba mengkombinasikan LVQ dengan SOM dalam menentukan vektor acuan untuk klasifikasi genre musik sehingga dapat diketahui pengaruhnya terhadap akurasi yang dihasilkan. Penelitian untuk klasifikasi genre pada musik mulai banyak diperhatikan sejak penelitian yang dilakukan oleh Tzanetakis dan Cook (2002). Fitur audio yang digunakan pada penelitian tersebut cukup beragam mencakup fitur dari domain waktu maupun domain frekuensi, namun akurasi yang dihasilkan belum 5 memuaskan. Tzanetakis dan Cook (2002) melakukan klasifikasi genre pada musik ke dalam 10 jenis genre dan menghasilkan akurasi sebesar 61%. Penelitian di bidang ini kemudian mulai berkembang dengan mengkombinasikan berbagai fitur yang telah digunakan pada penelitian sebelumnya ataupun dengan mengusulkan fitur-fitur baru. Fu dkk. (2011) menyatakan industri musik saat ini berkembang dengan pesat, oleh karena itu diperlukan sistem klasifikasi genre musik yang mampu menangani kumpulan data dalam skala besar. Skalabilitas merupakan isu yang penting untuk diperhatikan terkait dengan waktu pemrosesan dan penyimpanan. Salah satu cara yang dapat digunakan untuk mempercepat proses klasifikasi dan mereduksi ruang penyimpanan pada data dalam jumlah besar adalah menemukan fitur yang cukup ringkas dengan proses ekstraksi fitur yang sederhana namun dapat merepresentasikan data dengan baik. Goulart dkk. (2012) melakukan klasifikasi genre musik berdasarkan fitur entropi. Ekstraksi fitur diawali dengan melakukan proses framing terhadap file musik, kemudian dilanjutkan dengan mentransformasi tiap frame ke domain frekuensi dengan Discrete Wavelet Transform (DWT) untuk kemudian dihitung nilai entropi dari koefisien wavelet yang dihasilkan. Vektor fitur yang terbentuk memiliki dimensi cukup ringkas. Komponennya diperoleh berdasarkan statistik dari entropi frame yang terdiri atas nilai mean, nilai standard deviasi, nilai maksimum, nilai minimum serta beda maksimum dari entropi frame yang bersebelahan. Vektor fitur ini kemudian digunakan sebagai dasar untuk mengklasifikasikan file musik ke dalam 3 buah genre. Tingkat akurasi yang dihasilkan cukup baik, yaitu mencapai 85% untuk masing-masing kelas. Penelitian ini akan menggunakan fitur entropi seperti yang diusulkan oleh (Goulart dkk., 2012) sebagai dasar untuk melakukan klasifikasi genre musik. Fitur ini digunakan karena dimensinya yang ringkas dan proses ekstraksi fitur yang sederhana. Penelitian ini akan mencoba menggunakan fitur entropi ini untuk melakukan klasifikasi ke dalam jumlah kelas yang lebih besar, yaitu 10 genre musik dengan menggunakan kombinasi metode LVQ dan SOM sebagai classifiernya. 6 1.2. Rumusan Masalah Rumusan permasalahan dalam penelitian ini adalah apakah penggunaan fitur entropi serta kombinasi classifier Learning Vector Quantization (LVQ) dan Self Organizing Map (SOM) dapat meningkatkan akurasi dalam melakukan klasifikasi genre musik. 1.3. Batasan Masalah 1) Data yang dipakai sebagai data pelatihan adalah data set GTZAN. Data set terdiri atas 1000 potongan file musik berdurasi ±30 detik dalam format AU dengan sampling rate 22050 Hz yang terbagi ke dalam10 macam genre. 2) Data uji yang digunakan dalam penelitian adalah file musik digital dalam format MP3 dengan sampling rate 44100 Hz dan channel stereo. 3) Sebelum digunakan data uji akan dikonversi terlebih dahulu ke dalam format data set GTZAN, yaitu dikonversi menjadi format AU menggunakan aplikasi LAME, serta di-resampling menggunakan aplikasi SoX. 1.4. Tujuan dan Manfaat Penelitian Penelitian ini bertujuan untuk mengetahui kinerja (akurasi) yang dihasilkan oleh penggunaan fitur entropi serta kombinasi classifier Learning Vector Quantization (LVQ) dan Self Organizing Map (SOM) dalam melakukan klasifikasi genre musik. Hasil dari penelitian ini diharapkan dapat bermanfaat bagi pengguna musik untuk dapat memberikan pelabelan genre terhadap file musik digital yang dimiliki secara otomatis sehingga memudahkan dalam mengorganisir koleksi file musik dan mempercepat proses pencarian file musik. Selain itu hasil penelitian ini juga diharapkan dapat digunakan lebih lanjut untuk pembangunan sistem Music Information Retrieval (MIR). 1.5. Keaslian Penelitian Penelitian untuk mengklasifikasikan genre musik yang telah banyak dilakukan. Perbedaan penelitian ini dengan penelitian-penelitian sebelumnya terletak pada classifier yang digunakan, yaitu kombinasi Learning Vector 7 Quatization (LVQ) dan Self Organizing Map (SOM). Fitur yang digunakan adalah fitur entropi koefisien wavelet. Fitur entropi sudah pernah digunakan pada penelitian klasifikasi genre musik sebelumnya, namun pada jumlah kelas yang lebih sedikit dan classifier yang berbeda dari penelitian ini. 1.6. Metodologi Penelitian Tahapan-tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut: 1. Studi pustaka dan literatur Tahapan ini dilakukan dengan mengumpulkan, membaca dan memahami berbagai pustaka dan literatur yang berkaitan dengan penelitian ini, antara lain mengenai klasifikasi genre musik, ekstraksi fitur entropi, Learning Vector Quantization dan Self Organizing Map. 2. Pengumpulan data Tahapan ini dilakukan dengan mengumpulkan data yang digunakan dalam penelitian ini, yaitu data set GTZAN. Penggunaan data set GTZAN dalam penelitian ini bertujuan agar kinerja klasifikasi genre musik yang dihasilkan dalam penelitian ini dapat dibandingkan dengan penelitian-penelitian sebelumnya yang juga menggunakan data set ini. 3. Analisis dan perancangan Tahapan ini merupakan tahap perancangan proses yang akan digunakan untuk mengklasifikasikan genre musik beserta langkah-langkah dari masing-masing proses. Proses-proses tersebut antara lain preprocessing, proses ekstraksi fitur, proses klasifikasi menggunakan LVQ dan SOM serta proses evaluasi. 4. Implementasi Tahapan ini merupakan tahap implementasi dari rancangan yang telah dihasilkan pada tahap sebelumnya, yaitu untuk melakukan klasifikasi genre musik menggunakan metode LVQ dan SOM dengan bahasa pemograman MATLAB. 5. Evaluasi dan pembahasan Hasil implementasi proses ekstraksi fitur dan proses klasifikasi genre musik dievaluasi menggunakan k-fold cross validation sehingga dapat diketahui 8 akurasinya. Hasil evaluasi kemudian dibandingkan untuk mengetahui nilai parameter terbaik dalam melakukan proses ekstaksi fitur dan pembangunan classifier. Proses evaluasi juga dilakukan untuk membandingkan kinerja classifier hasil penelitian dengan classifier lainnya serta pengaruh penggunaan fitur entropi terhadap hasil klasifikasi genre-genre tertentu dari 10 jenis genre musik dalam data set. 1.7. Sistematika Penelitian Sistematika penulisan dalam penelitian ini adalah sebagai berikut: BAB I PENDAHULUAN Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan dan manfaat penelitian, metodologi penelitian dan sistematika penulisan dalam penelitian ini. BAB II TINJAUAN PUSTAKA Bab ini berisi kajian terhadap penelitian-penelitian sebelumnya yang berkaitan dengan klasifikasi genre musik sebagai bahan acuan dan perbandingan dalam penelitian ini. BAB III LANDASAN TEORI Bab ini berisi uraian dasar teori yang berkaitan dengan ekstraksi fitur dan classifier yang digunakan untuk klasifikasi genre musik. Teori-teori ini digunakan sebagai referensi untuk menyelesaikan permasalahan dalam penelitian ini. BAB IV ANALISIS DAN PERANCANGAN SISTEM Bab ini menjabarkan perancangan proses yang akan digunakan untuk mengklasifikasikan genre musik serta proses evaluasi yang akan dilakukan. Rancangan dari masing-masing proses dijelaskan secara terperinci langkah demi langkah disertai contoh perhitungan untuk proses-proses tertentu. BAB V IMPLEMENTASI Bab ini berisi implementasi dari rancangan yang telah dihasilkan pada bab sebelumnya. 9 BAB VI HASIL DAN PEMBAHASAN Bab ini menjabarkan hasil dari penelitian dan pembahasannya, yaitu hasil evaluasi yang diperoleh terhadap implementasi yang telah dilakukan. BAB VII KESIMPULAN DAN SARAN Bab ini berisi kesimpulan yang memuat hasil penelitian yang diperoleh disesuaikan dengan tujuan penelitian dan saran untuk penelitian selanjutnya.