BAB 1 PENDAHULUAN 1.1 Latar Belakang Dewasa ini

advertisement
BAB 1
PENDAHULUAN
1.1
Latar Belakang
Dewasa ini, perkembangan teknologi sangat pesat. Salah satu
perkembangan teknologi yang saat ini sedang berkembang adalah teknologi
pengolahan sinyal digital. Teknologi pengolahan sinyal memang sangat menarik
terutama bagi para ahli teknologi.
Banyak aplikasi-aplikasi yang telah berhasil digunakan untuk membantu
manusia dalam berbagai macam hal. Salah satunya dimanfaatkan untuk rekognisi
berbasis audio seperti mengenali suara pembicara atau dikenal dengan istilah
Speaker Recognition. Perlu diketahui bahwa speaker recognition berbeda
dengan speech recognition. Speech recognition difokuskan pada pengenalan
suara pada kata yang diucapkan pembicara (speaker), sedangkan speaker
recognition berperan mengidentifikasi pembicara (speaker) melalui suara yang
diucapkan. Speaker recognition dan speech recognition merupakan biometrik
manusia yang bersifat unik pada setiap orang, artinya setiap orang memiliki ciri
khas suara masing-masing. Biometrik lainnya seperti sidik jari, wajah, dan iris
mata. Speaker recognition banyak digunakan dalam aplikasi-aplikasi keamanan
yang membutuhkan suara manusia sebagai kunci atau yang kita kenal ID-Card
dengan suara manusia. Dalam speaker recognition suara manusia akan dianalisa
pola atau pattern yang menjadi ciri unik dari setiap orang yang mengucapkan,
kemudian pola atau pattern yang didapat akan dibandingkan dengan pola pada
1 2 database yang dimiliki. Tujuan utama speaker recognition adalah untuk
menentukan identitas seseorang dari pola suara yang didapat berdasarkan
database yang dimiliki. Saat ini telah banyak metode-metode yang dapat digunakan untuk
melakukan speaker recognition. Metode-metode yang dapat digunakan untuk
pengenalan suara pembicara (speaker recognition) yaitu :
-
Fourier Transform (FT)
-
Linear Predictive Coding (LPC)
-
Mel Frequency Cepstrum Coefficient (MFCC)
-
Neural Predictive Coding (NPC)
-
Wavelet Transform (WT)
Metode LPC, MFCC, dan NPC berbasiskan alih ragam Fourier (Fourier
transform), dan tingkat identifikasinya ada yang telah mencapai 100%. Namun,
masih banyak kelemahan yang dimiliki alih ragam Fourier diantaranya, kurang
mampu memberikan informasi sinyal dalam domain waktu dan frekuensi secara
bersamaan dan menganalisis sinyal yang tidak stationer, untuk ingin
dikembangkan suatu konsep atau pendekatan lain dalam pemrosesan sinyal tanpa
berbasiskan alih ragam Fourier yaitu dengan alih ragam gelombang singkat
(Wavelet transform).
Metode alih ragam gelombang singkat merupakan metode atau sarana
yang mulai popular untuk pemrosesan sinyal, seperti citra dan suara, dan alih
ragam ini belum banyak diaplikasikan untuk analisis suara, khususnya untuk
3 rekognisi berbasis audio ini menggunakan teks berbahasa Indonesia. Alih ragam
gelombang singkat menghasilkan resolusi waktu yang baik pada frekuensi tinggi
dalam menentukan awal suara dan parameterisasi ciri suara durasi pendek serta
mampu menganalisis sinyal diskontinu (non stationary) secara akurat.
Alih ragam gelombang singkat terbagi menjadi Alih Ragam Gelombang
Singkat Diskrit digunakan bila sinyal yang diproses merupkan sinyal diskrit dan
Alih Ragam Gelombang Singkat Kontinyu digunakan bila sinyal yang diproses
merupakan sinyal kontinu (berlanjut). Dalam penelitian ini digunakan Alih
Ragam Gelombang Singkat Diskrit karena menggunakan sinyal yang diskrit.
1.2
Ruang Lingkup
Speaker recognition ini digunakan metode Alih Ragam Gelombang
Singkat Diskrit (ARGSD). Batasan-batasan pada sistem pengenalan ini sebagai
berikut :
-
Suara yang digunakan adalah suara manusia.
-
Pengucapan kata harus jelas.
-
Suara inputan harus bebas dari noise.
-
Speaker recognition ini dilakukan untuk mengenal nama pembicara yang
melakukan masukan (input) suara.
-
Proses memasukkan data ke dalam database sudah dilakukan terlebih
dahulu (insert to database dilakukan secara offline).
Penginputan kata telah ditentukan (keyword).
4 1.3
Tujuan dan Manfaat
Dalam penelitian ini, tentunya ada beberapa tujuan yang ingin dicapai.
Tujuan-tujuan itu antara lain :
-
Merancang sistem rekognisi berbasis audio dengan metode Alih Ragam
Gelombang Singkat Diskrit (ARGSD) yang memiliki kinerja efektif, efisien
dan akurat dalam pengenalan suara seseorang.
-
Mendapatkan
hasil
yang
paling
maksimal
dengan
meminimalkan
kemungkinan untuk terjadi kesalahan dalam pengenalan pembicara (speaker).
Dengan tujuan yang telah dipaparkan di atas, tentunya besar harapan
sistem pengenalan pembicara (speaker) ini dapat bermanfaat untuk :
-
Dapat meningkatkan sistem keamanan (security system) jika diproses lebih
lanjut.
-
1.4
Sebagai acuan untuk penelitian berikutnya.
Metodologi Penelitian
Metodologi penelitian dalam skripsi ini menggunakan :
1. Metode Analisis
Studi pustaka dan analisa terhadap berbagai literatur dilakukan untuk
mendapatkan informasi yang berguna dalam perancangan sistem ini. Studi
5 pustaka diarahkan kepada informasi mengenai berbagai metode yang
mendukung kerja speaker recognition serta beberapa teori aplikasi yang
mengubah suara menjadi vektor serta materi lainnya yang mendukung proses
penulisan skripsi ini.
2. Metode Perancangan
Pengujian dilakukan terhadap kinerja sistem speaker recognition dengan
proses melakukan masukan, feature extraction, penyimpanan, dan kemudian
dianalisa kemiripannya dengan persentase keakuratannya. Pada tahap ini,
akan dianalisa setiap teori yang mendukung kinerja penelitian sehingga
mendapatkan suatu metode yang baik.
3. Pengembangan Sistem
Proses ini dilakukan pemrograman (coding). Setelah selesai dibuat
sebuah prototype sederhana kemudian diuji coba (testing). Jika masih
terdapat kesalahan (bug), maka akan dilakukan pengecekan kembali pada
kesalahan yang terjadi.
4. Evaluasi
Setelah sistem diuji, maka dilakukan evaluasi. Hasil dari evaluasi
menentukan apakah program yang telah dibuat sesuai dan dapat memecahkan
masalah tersebut. Jika masih terdapat banyak kekurangan, maka kembali ke
tahap pengembangan sistem dan diproses kembali sampai mampu
memecahkan masalah dengan baik.
6 1.5
Sistematika Penulisan
BAB 1 : Pendahuluan
Bab ini berisi latar belakang penelitian, ruang lingkup penelitian, tujuan
dan manfaat penelitian, serta metode penelitian.
BAB 2 : Landasan Teori
Bab ini berisi dasar-dasar teori yang digunakan dalam penelitian.
BAB 3 : Prosedur dan Metodologi
Bab ini berisi analisa metode-metode yang digunakan dalam penelitian
guna membantu proses pengklasifikasian serta tahapan-tahapan proses
dalam speaker recognition.
BAB 4 : Implementasi dan Evaluasi
Bab ini berisi pembahasan mengenai spesifikasi sistem, prosedur
operasional, implementasi, dan evaluasi dari hasil penelitian.
BAB 5 : Kesimpulan dan Saran
Bab ini berisi kesimpulan dan saran dari hasil penelitian yang telah
diujikan.
Download