BAB 1 PENDAHULUAN 1.1 Latar Belakang Dewasa ini, perkembangan teknologi sangat pesat. Salah satu perkembangan teknologi yang saat ini sedang berkembang adalah teknologi pengolahan sinyal digital. Teknologi pengolahan sinyal memang sangat menarik terutama bagi para ahli teknologi. Banyak aplikasi-aplikasi yang telah berhasil digunakan untuk membantu manusia dalam berbagai macam hal. Salah satunya dimanfaatkan untuk rekognisi berbasis audio seperti mengenali suara pembicara atau dikenal dengan istilah Speaker Recognition. Perlu diketahui bahwa speaker recognition berbeda dengan speech recognition. Speech recognition difokuskan pada pengenalan suara pada kata yang diucapkan pembicara (speaker), sedangkan speaker recognition berperan mengidentifikasi pembicara (speaker) melalui suara yang diucapkan. Speaker recognition dan speech recognition merupakan biometrik manusia yang bersifat unik pada setiap orang, artinya setiap orang memiliki ciri khas suara masing-masing. Biometrik lainnya seperti sidik jari, wajah, dan iris mata. Speaker recognition banyak digunakan dalam aplikasi-aplikasi keamanan yang membutuhkan suara manusia sebagai kunci atau yang kita kenal ID-Card dengan suara manusia. Dalam speaker recognition suara manusia akan dianalisa pola atau pattern yang menjadi ciri unik dari setiap orang yang mengucapkan, kemudian pola atau pattern yang didapat akan dibandingkan dengan pola pada 1 2 database yang dimiliki. Tujuan utama speaker recognition adalah untuk menentukan identitas seseorang dari pola suara yang didapat berdasarkan database yang dimiliki. Saat ini telah banyak metode-metode yang dapat digunakan untuk melakukan speaker recognition. Metode-metode yang dapat digunakan untuk pengenalan suara pembicara (speaker recognition) yaitu : - Fourier Transform (FT) - Linear Predictive Coding (LPC) - Mel Frequency Cepstrum Coefficient (MFCC) - Neural Predictive Coding (NPC) - Wavelet Transform (WT) Metode LPC, MFCC, dan NPC berbasiskan alih ragam Fourier (Fourier transform), dan tingkat identifikasinya ada yang telah mencapai 100%. Namun, masih banyak kelemahan yang dimiliki alih ragam Fourier diantaranya, kurang mampu memberikan informasi sinyal dalam domain waktu dan frekuensi secara bersamaan dan menganalisis sinyal yang tidak stationer, untuk ingin dikembangkan suatu konsep atau pendekatan lain dalam pemrosesan sinyal tanpa berbasiskan alih ragam Fourier yaitu dengan alih ragam gelombang singkat (Wavelet transform). Metode alih ragam gelombang singkat merupakan metode atau sarana yang mulai popular untuk pemrosesan sinyal, seperti citra dan suara, dan alih ragam ini belum banyak diaplikasikan untuk analisis suara, khususnya untuk 3 rekognisi berbasis audio ini menggunakan teks berbahasa Indonesia. Alih ragam gelombang singkat menghasilkan resolusi waktu yang baik pada frekuensi tinggi dalam menentukan awal suara dan parameterisasi ciri suara durasi pendek serta mampu menganalisis sinyal diskontinu (non stationary) secara akurat. Alih ragam gelombang singkat terbagi menjadi Alih Ragam Gelombang Singkat Diskrit digunakan bila sinyal yang diproses merupkan sinyal diskrit dan Alih Ragam Gelombang Singkat Kontinyu digunakan bila sinyal yang diproses merupakan sinyal kontinu (berlanjut). Dalam penelitian ini digunakan Alih Ragam Gelombang Singkat Diskrit karena menggunakan sinyal yang diskrit. 1.2 Ruang Lingkup Speaker recognition ini digunakan metode Alih Ragam Gelombang Singkat Diskrit (ARGSD). Batasan-batasan pada sistem pengenalan ini sebagai berikut : - Suara yang digunakan adalah suara manusia. - Pengucapan kata harus jelas. - Suara inputan harus bebas dari noise. - Speaker recognition ini dilakukan untuk mengenal nama pembicara yang melakukan masukan (input) suara. - Proses memasukkan data ke dalam database sudah dilakukan terlebih dahulu (insert to database dilakukan secara offline). Penginputan kata telah ditentukan (keyword). 4 1.3 Tujuan dan Manfaat Dalam penelitian ini, tentunya ada beberapa tujuan yang ingin dicapai. Tujuan-tujuan itu antara lain : - Merancang sistem rekognisi berbasis audio dengan metode Alih Ragam Gelombang Singkat Diskrit (ARGSD) yang memiliki kinerja efektif, efisien dan akurat dalam pengenalan suara seseorang. - Mendapatkan hasil yang paling maksimal dengan meminimalkan kemungkinan untuk terjadi kesalahan dalam pengenalan pembicara (speaker). Dengan tujuan yang telah dipaparkan di atas, tentunya besar harapan sistem pengenalan pembicara (speaker) ini dapat bermanfaat untuk : - Dapat meningkatkan sistem keamanan (security system) jika diproses lebih lanjut. - 1.4 Sebagai acuan untuk penelitian berikutnya. Metodologi Penelitian Metodologi penelitian dalam skripsi ini menggunakan : 1. Metode Analisis Studi pustaka dan analisa terhadap berbagai literatur dilakukan untuk mendapatkan informasi yang berguna dalam perancangan sistem ini. Studi 5 pustaka diarahkan kepada informasi mengenai berbagai metode yang mendukung kerja speaker recognition serta beberapa teori aplikasi yang mengubah suara menjadi vektor serta materi lainnya yang mendukung proses penulisan skripsi ini. 2. Metode Perancangan Pengujian dilakukan terhadap kinerja sistem speaker recognition dengan proses melakukan masukan, feature extraction, penyimpanan, dan kemudian dianalisa kemiripannya dengan persentase keakuratannya. Pada tahap ini, akan dianalisa setiap teori yang mendukung kinerja penelitian sehingga mendapatkan suatu metode yang baik. 3. Pengembangan Sistem Proses ini dilakukan pemrograman (coding). Setelah selesai dibuat sebuah prototype sederhana kemudian diuji coba (testing). Jika masih terdapat kesalahan (bug), maka akan dilakukan pengecekan kembali pada kesalahan yang terjadi. 4. Evaluasi Setelah sistem diuji, maka dilakukan evaluasi. Hasil dari evaluasi menentukan apakah program yang telah dibuat sesuai dan dapat memecahkan masalah tersebut. Jika masih terdapat banyak kekurangan, maka kembali ke tahap pengembangan sistem dan diproses kembali sampai mampu memecahkan masalah dengan baik. 6 1.5 Sistematika Penulisan BAB 1 : Pendahuluan Bab ini berisi latar belakang penelitian, ruang lingkup penelitian, tujuan dan manfaat penelitian, serta metode penelitian. BAB 2 : Landasan Teori Bab ini berisi dasar-dasar teori yang digunakan dalam penelitian. BAB 3 : Prosedur dan Metodologi Bab ini berisi analisa metode-metode yang digunakan dalam penelitian guna membantu proses pengklasifikasian serta tahapan-tahapan proses dalam speaker recognition. BAB 4 : Implementasi dan Evaluasi Bab ini berisi pembahasan mengenai spesifikasi sistem, prosedur operasional, implementasi, dan evaluasi dari hasil penelitian. BAB 5 : Kesimpulan dan Saran Bab ini berisi kesimpulan dan saran dari hasil penelitian yang telah diujikan.