30_Sistem TTS dalam Bahasa Indonesia2

SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
SISTEM TTS DALAM BAHASA INDONESIA MENGGUNAKAN
METODE FSA DAN DATABASE DIPHONE
Ely Setyo Astuti, ST, MT
1)
2)
3)
, DR. Eng. Agus Naba, MT , Ir.Wahyu Adi Prijono, MT.
1)
2) 3)
Staf pengajar STT STIKMA Internasional Malang.
Staf Pengajar Magister Teknik Elektro Pasca Sarjana Universitas Brawijaya Malang.
ABSTRAK Pemenggalan suku kata adalah salah satu bagian dari mata pelajaran Bahasa
Indonesia. Salah satu cara agar lebih mudah mempelajari pemenggalan suku kata dan mengetahui
bagaimana pengucapan suatu kata dalam Bahasa Indonesia dengan menggunakan teknologi TTS
(Text to Speech). TTS merupakan suatu sistem yang melakukan dua konversi yaitu konversi dari
teks ke fonem dan konversi dari fonem ke ucapan. Penelitian ini bertujuan untuk merancang dan
membuat perangkat lunak sistem TTS. Sistem dibangun dengan metode FSA (Finite State
Automata) untuk pemenggalan suku kata Bahasa Indonesia sesuai dengan Ejaan Yang
Disempurnakan. Metode FSA dua tingkat - yang merupakan perbaikan dari metode FSA tiga
tingkat dari penelitian Anung (2000) - untuk pemenggalan suku kata. Proses penggabungan suku
kata dan konversinya menjadi ucapan dalam sistem TTS menggunakan teknik Diphone
Concatenation. Teknik ini bekerja dengan cara menggabung-gabungkan segmen-segmen bunyi
suku kata yang telah direkam sebelumnya berupa file suara berekstensi *.wav. Hasil ujicoba
membuktikan bahwa metode FSA dua tingkat bisa mengenali suku kata Bahasa Indonesia dengan
tingkat keberhasilan 96%, kesalahan 3,94% untuk kata dasar, sedangkan untuk kata berimbuhan
dengan tingkat keberhasilan 69%, kesalahan 30,88%. Semua pasangan vokal ‘au’, ‘ai’ dan ‘oi’
akan dikenali sebagai diftong.Teknik diphone concatenation dapat menggabung-gabungkan file
suara diphone menjadi ucapan suatu kata/kalimat. Sistem TTS ini hanya bisa memilih satu
diphone.
Kata kunci: Text to speech, Suku kata, Bahasa Indonesia, Finite-State Automata, Database
Diphone
1. Pendahuluan
Bahasa Indonesia adalah bahasa resmi
Republik Indonesia sebagaimana disebutkan dalam
Undang-Undang Dasar RI 1945, Pasal 36. Ia juga
merupakan bahasa persatuan bangsa Indonesia
seperti disiratkan dalam Sumpah Pemuda 28
Oktober 1928. Bahasa Indonesia adalah sebuah
dialek bahasa Melayu yang dinamis dan terus
menghasilkan kata-kata baru, baik melalui
penciptaan maupun penyerapan dari bahasa daerah
dan asing (Wikipedia Ensiklopedia Indonesia, Ejaan
Yang disempurnakan).
Salah satu bagian dalam mata pelajaran
bahasa Indonesia adalah pemenggalan suku kata.
Menurut Anung (2000), setidaknya ada dua
kegunaan pemenggalan suku kata, yaitu : a)
Jika
kita melihat peranan suku kata dalam bahasa
tulisan, maka pemenggalan suku kata perlu
dilakukan ketika kata yang kita tulis panjangnya
melebihi batas kanan kertas, b)Jika kita melihat
peranan suku kata dalam bahasa lisan, maka
pemenggalan
suku
kata
diperlukan
untuk
mengetahui bagaimana cara mengucapkan suatu
kata.
Agar
lebih
mudah
mempelajari
pemenggalan suku kata dan mengetahui bagaimana
pengucapan suatu kata dalam Bahasa Indonesia
dapat menggunakan teknologi Text to Speech
(TTS). TTS merupakan suatu sistem yang
melakukan dua konversi yaitu konversi dari teks ke
fonem dan konversi dari fonem ke ucapan yang
dilakukan secara berurutan dengan input teks dan
menghasilkan output ucapan.
Para
pengembang
teknologi
sudah
membangun sistem TTS pada sistem komputer.
Akan tetapi, penggunaan TTS masih terbatas pada
Bahasa Inggris atau bahasa asing lainnya. Bladon
dan Carlson (1987), melakukan penelitian sistem
TTS dengan gaya dan dialek bahasa Inggris.
Emorine dan Martin (1988) dalam bahasa Perancis.
Borkar (2004) melakukan penelitian TTS synthesizer
dengan sistem berbasis komputer dalam bahasa
Konkani (Goan).
Rao et.al (2005) melakukan
penelitian TTS synthesis menggunakan unit-unit
daftar suku kata dalam bahasa India. Jayavardhana
et.al (2001) mengembangkan penelitian sistem TTS
synthesis untuk membaca input berupa teks (novel)
ke dalam bentuk ucapan dalam bahasa Tamil.
Khishore dan Alan (2005) mengembangkan sistem
TTS pada Universal Digital Library yang bertujuan
untuk menjadikan sistem baca perpustakaan dalam
format digital dengan menggunakan bahasa India.
Pada tahun 2000 Anung melakukan
penelitian yang mengenali suku kata Bahasa
Indonesia menggunakan Finite-State automata tiga
tingkat. Secara khusus
penelitian tersebut
membahas tentang cara pemenggalan suku kata
Bahasa Indonesia sesuai dengan aturan persukuan
menurut Kamus Besar Bahasa Indonesia. Penelitian
sistem TTS bahasa Indonesia sudah dilakukan
Arman pada tahun 2000 dengan nama IndoTTS.
Rommel (2005) mengimplementasikan sistem
IndoTTS pada telepon selular dengan sistem
operasi symbian.
B1-139
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
FSA adalah salah suatu sistem pemodelan
matematika yang khusus mempelajari tentang
bahasa, yaitu Teori Bahasa Formal (TBF). Bahasa
yang dibahas pada TBF adalah bahasa tulisan
dengan masukan dan keluaran berupa diskrit. FSA
dapat berfungsi sebagai pengenal (recognizer)
suatu bahasa dengan melakukan pengelolaan dari
masukan-masukan yang berupa string
dan
mengeluarkan suatu keputusan YA jika string
masukan termasuk dalam bahasa dan TIDAK jika
string masukan tidak termasuk dalam bahasa
(Hariyanto, 2004).
Synthesizer yang menggunakan teknik
diphone concatenation bekerja dengan cara
menggabung beberapa segmen bunyi yang telah
direkam sebelumnya. Setiap segmen berupa
diphone (gabungan dua buah fonem) yang disimpan
dalam diphone database. (Arman, 2002).
Dalam penelitian ini, penulis mengembangkan
dari penelitian sebelumnya (Anung, 2000) yaitu
pengenalan suku kata Bahasa Indonesia dengan
Algoritma FSA tiga tingkat menjadi sistem TTS
Bahasa Indonesia dengan algoritma FSA dua
tingkat dan database diphone. Metode FSA dua
tingkat digunakan untuk pemenggalan suku kata
dalam bahasa Indonesia. Proses penggabungan
suku kata dan konversinya menjadi ucapan dalam
sistem TTS ini menggunakan teknik diphone
concatenation. Teknik ini bekerja dengan cara
menggabungkan segmen-segmen bunyi suku kata
yang telah diidentifikasi dan direkam sebelumnya.
Setiap segmen berupa suku kata (diphone)
disimpan dalam Database Diphone.
Penelitian “Sistem TTS dalam Bahasa
Indonesia menggunakan metode Finite State
Automata dan database diphone” diharapkan bisa
membantu anak-anak dalam mempelajari suku kata
dalam Bahasa Indonesia dan cara pengucapannya,
membantu orang buta dalam mempelajari cara
pengucapan kata yang ditulis dengan huruf alfabet
(braille) dalam bahasa Indonesia, membantu orang
asing dalam mempelajari bahasa Indonesia secara
otodidak, dan membantu komunikasi orang tuna
wicara dan orang yang tidak diperbolehkan
berbicara karena sakit.
2. Tinjauan Pustaka
Bahasa formal adalah kumpulan kalimat. Dalam
pembicaraan selanjutnya ‘bahasa formal’ akan
disebut ‘bahasa’ saja. Bahasa dalam bentuk tulisan
sebenarnya terdiri atas simbol-simbol yang bisa
digunakan dalam sebuah bahasa membentuk
sebuah himpunan dan disebut sebagai abjad.
Deretan karakter membentuk string. Bahasa
didefinisikan sebagai himpunan semua string yang
dapat dibentuk dari suatu abjad. Kaidah/aturan
pembentukan kata/kalimat disebut grammar (tata
bahasa).
Otomata berasal dari bahasa Yunani automatos,
yang berarti sesuatu yang bekerja secara otomatis
(mesin). Otomata merupakan suatu sistem yang
terdiri atas sejumlah berhingga state, dimana state
menyatakan informasi mengenai input yang lalu,
B1-140
dan dapat pula dianggap sebagai memori mesin.
Input pada mesin otomata adalah bahasa yang
harus dikenali oleh mesin. Selanjutnya mesin
otomata membuat keputusan yang mengindikasikan
apakah input ini diterima atau tidak.
q0
a
q1
d
a
q2
d
q
u
q
q5
Gambar 2.1. Mesin otomata sederhana
Contoh sebuah mesin otomata sederhana
diberikan dalam Gambar 2.1. Bila mesin mendapat
untai/ string input: Ada, adu, add maka keputusan
mesin adalah diterima, diterima, ditolak.
0
Even/
Genapl
0
1
Odd/
Ganjil
1
Gambar 2.2. Diagram State untuk FSA
Keterangan Gambar 2.2:
• Lingkaran menyatakan state/kedudukan
• Label pada lingkaran adalah nama state
tersebut
• Busur menyatakan transisi yaitu perpindahan
kedudukan/state
• Lingkaran didahului sebuah busur tanpa label
menyatakan state awal
• Lingkaran ganda menyatakan state akhir/final
Menurut Arman (2000), sistem TTS pada
prinsipnya terdiri dari dua sub sistem, yaitu :
1) Bagian Konverter Teks ke Fonem (Text to
Phoneme), serta
2) Bagian Konverter Fonem to Ucapan
(Phoneme to Speech).
Teks
Konversi
Teks ke
fonem
Konversi
fonem ke
ucapan
Ucapan
Kode-kode
fonem,
durasi dan
pitch,
Gambar 2.3 Blok Diagram sistem TTS
Gambar 2.3 menunjukkan blok diagram sistem
TTS. Bagian Konverter Teks ke Fonem berfungsi
untuk mengubah kalimat masukan dalam suatu
bahasa tertentu yang berbentuk teks menjadi
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
rangkaian kode-kode bunyi. Konverter Fonem ke
Ucapan akan menghasilkan bunyi atau sinyal
ucapan yang sesuai dengan kalimat yang ingin
diucapkan. Dua teknik yang banyak digunakan
adalah formant synthesizer
serta diphone
concatenation. Konversi dari teks ke fonem sangat
dipengaruhi oleh aturan-aturan yang berlaku dalam
suatu bahasa.
Bahasa Indonesia mengenal bahasa tulisan
maupun bahasa lisan. Dalam bahasa lisan, dikenal
istilah fonem, yang merupakan kesatuan bahasa
terkecil yang dapat membedakan arti. Dalam
bahasa tulisan, fonem dilambangkan dengan huruf.
Dengan kata lain, huruf adalah tulisan dari fonem.
Seringkali istilah fonem disamakan dengan huruf,
padahal tidak selamanya berlaku demikian. Fonem
dibagi menjadi vokal dan konsonan. Bahasa
Indonesia mengenal 5 vokal yaitu : a, e, i ,o, u, dan
25 konsonan yaitu : b, c, d ,f , g , h, j , k, kh, l, m, n,
ng, ny, p, q, r, s, sy, t, v, w, x, y, z. Konsonan kh, ng,
ny dan sy adalah contoh fonem yang terdiri atas dua
huruf. Selain itu dikenal pula istilah diftong, yaitu
gabungan 2 vokal yang membentuk kesatuan bunyi,
yaitu : au, ai, oi. Pada beberapa buku referensi,
diftong digolongkan sebagai vokal pula.
Aturan pemenggalan kata pada kata dasar
dilakukan sebagai berikut. a).Jika di tengah kata ada
vokal yang berurutan, pemenggalan itu dilakukan di
antara kedua huruf vokal itu. Misalnya: ma-in, sa-at,
bu-ah. Huruf diftong ai, au, dan oi tidak pernah
diceraikan sehingga pemenggalan kata tidak
dilakukan di antara kedua huruf itu. Misalnya: au-la
bukan a-u-la. b). Jika di tengah kata ada huruf
konsonan, termasuk gabungan-huruf konsonan, di
antara dua buah huruf vokal, pemenggalan
dilakukan sebelum huruf konsonan. Misalnya: bapak, ba-rang, su-lit. c). Jika di tengah kata ada dua
huruf konsonan yang berurutan, pemenggalan
dilakukan di antara kedua huruf konsonan itu.
Gabungan huruf konsonan tidak pernah diceraikan.
Misalnya:
man-di, ap-ril, swas-ta, d). Jika di
tengah kata ada tiga buah huruf konsonan atau
lebih, pemenggalan dilakukan di antara huruf
konsonan yang pertama dan huruf konsonan yang
kedua. Misalnya: in-stru-men ul-tra
Menurut Tofani & Nugroho, (1995) Bahasa
Indonesia mengenal beberapa pola umum suku
kata, yaitu :
a) V1
a-nak, ba-u
b) VK
an-da, da-un
c) KV
se-bab, man-di
d) KVK
lan-tai, ma-kan
e) KKV
pra-ha-rai, sas-tra
f) KKVK
frik-si, kon-trak
g) VKK
eks, ons
h) KVKK
pers, kon-teks
i) KKVKK
kom-pleks, ke-nyang
j) KKKV
in-stru-men, stra-ta
k) KKKVK
struk-tur, stres
Keterangan:
V berarti vokal dan K berarti konsonan
B1-141
3. Perancangan
3.1 Diagram Alur
Mulai
Deklarasi dan
inisialisasi
Input teks
Normalisasi teks
Kenali Suku kata BI
dengan Algoritma FSA,
Lockup pustaka
Diphone database
Suku
kata
Speech
Input teks
Lagi?
Ya
Tidak
Selesai
Gambar 3.1. Diagram alur TTS dalam Bahasa
Indonesia
3.2 Algoritma Finite State Automata (FSA)
Blank Spasi
Q1
Blank Spasi
Q2
Vokal
Vokal
Q3
‘G’,’Y’
N
Start
Q0
K
Q4
‘H’
Q8
S
‘Y’,’P’
G
Q5
Vokal
Vokal
Q10
‘R’
B
Vokal
Q6
Vokal
‘R’
Vokal
Q7
Konsonan selain
N,K,S,G,B
Q9
Gambar 3.2 FSA Tingkat 1.
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
Algoritma
FSA
yang
digunakan
untuk
pengenalan suku kata bahasa Indonesia dirancang
dalam dua tingkat. Perancangan ini merupakan
pengembangan dari algoritma FSA yang telah
dibuat sebelumnya oleh Anung dengan FSA tiga
tingkat. Dalam algoritma FSA Anung, tingkat
pertama mengenali pola suku kata V, K dan KV.
Pada tingkat 2 FSA mengenali suku kata dengan
pola V, VK, VKK, KV, KVK, KKV, KKVK, KKKV,
KKKVK. Sedangkan pada tingkat ketiga pola suku
kata yang dapat dikenali adalah VK, VKK, KVK,
KVKK, KKVK, KKVKK, V, KV, KVV, KKV, KKVV
spa
q
K
spas
i
K
q
K
q
q
V
K
K
q
KV
K
STAR
T
q
K
V
V
q
q
K
q
q
K
V
q
Gambar 3.3 FSA Tingkat 2
FSA tingkat 2 juga dapat mengenali diftong (au,
ai dan oi), namun kemunculan dua vokal tersebut
secara berurutan belum tentu berupa diftong.
Semua pasangan vokal ‘au’, ‘ai’ dan ‘oi’ akan
dikenali sebagai diftong.
3.3 Perekaman suara
Synthesizer yang menggunakan teknik diphone
concatenation bekerja dengan cara menggabunggabungkan segmen-segmen bunyi yang telah
direkam sebelumnya. Setiap segmen berupa
diphone (gabungan dua buah fonem). Sebelum
melakukan perekaman suara untuk menghasilkan
diphone database dilakukan persiapan:
1. Identifikasikan jumlah suku kata (diphone) dari
Bahasa Indonesia.
2. Membuat daftar kombinasi lengkap diphone.
jumlah
diphone
dikurangi
dengan
menghilangkan kombinasi diphone tertentu yang
anda anggap tidak pernah terjadi, misalnya
urutan dua fonem konsonan yang sama, seperti
b-b, c-c, dan sebagainya.
3. Membuat daftar contoh kata yang mengandung
setiap diphone
Pada saat perekaman diphone, terdapat
beberapa hal yang harus diperhatikan, yaitu :
Menyiapkan
ruangan,
yang
mempunyai
karakteristik : bebas noise(noise rendah), tidak ada
pantulan suara.
B1-142
1. Siapkan perangkat perekaman yang berkualitas
tinggi dan tempat nyaman.
2. Perekaman serangkaian diphone, lalu disimpan
pada file yang berbeda.
3. Memeriksa seluruh kualitas suara hasil
rekaman. Jika ada suara yang kurang
memuaskan, lakukan perekaman ulang.
Dalam satu kali perekaman akan merekam
beberapa suku kata sekaligus. Maka dari itu hasil
rekaman masih berupa serangkaian diphone.
Rangkaian tersebut akan dipotong-potong menjadi
per satu suku kata dengan menggunakan software
adhope audition 1.0. Hasil perekaman berupa file
suara berekstensi *.wav.
4. Hasil Dan Pembahasan
4.1 Pengenalan suku kata
Untuk mengenali suku kata Bahasa
Indonesia menggunakan pemodelan FSA bertingkat
yang berfungsi untuk mempermudah pemisahan
suku kata. Sebagai contoh pada saat kita membaca
dua huruf pertama pada kata anak (VKVK) dan kata
anda (VKKV) kita belum bisa memutuskan apakah
pemisahan suku kata akan dilakukan diantara kedua
huruf tersebut atau tidak. Setelah membaca huruf
ketiga, barulah bisa diputuskan di mana harus
dilakukan pemisahan suku kata. Jika huruf ketiga
berupa sebuah konsonan maka pemisahan
dilakukan setelah huruf kedua (kata anda akan
menjadi an-da). Sedangkan jika huruf ketiga adalah
sebuah vokal, maka harus ditelusuri mundur dan
memisahkan suku kata setelah huruf pertama (kata
anak akan menjadi a-nak). FSA tingkat pertama
yang mengenali pola V, K, . KV. Hasil eksekusi
algoritma FSA Tingkat 1 ditunjukkan dalam gambar
4.1. Hasil-hasil pengujian lain dari algoritma Tingkat
1 terangkum pada tabel 4.1
Gambar 4.1 Output Pengenalan suku kata
Tingkat 1
Pada tingkatan pertama kata anak akan dipisahkan
menjadi a-na-k (V-KV-K). Algoritma FSA Tingkat 1
(lihat gambar 3.2)
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
Tabel 4.1 Hasil pengujian pengenalan suku kata
tingkat 1
INPUT
OUTPUT
(teks)
Tingkat 1
Tingkat 2
Anak
a-na-k
Anda
A-n-da
Buah
Bu-a-h
Kenyang
Ke-nya-ng
Ultra
u-l-t-ra
Simpati
Si-m-pa-ti
Migrasi
mi-gra-si
Biografi
Bi-o-gra-fi
Struktur
s-t-ru-k-tu-r
Pantai
Pa-n-ta-i
Eks
e-k-s
Kemudian pada tingkat kedua FSA akan mengenali
suku kata dengan pola VK, VKK, KVK, KVKK,
KKVK, KKVKK, V, KV, KVV, KKV, KKVV (Gambar
3.3). Gambar 4.2 menunjukkan hasil eksekusi
algoritma Tingkat 2.
B1-143
Pantai
Pa-n-ta-i
pan-tai
Eks
e-k-s
Eks
Selain itu FSA pada Tingkat 2 juga dapat
mengenali diftong. Dalam penelitian ini semua vokal
‘au’, ‘ai’, ‘oi’ akan dianggap sebagai diftong.
Untuk input yang berupa angka akan
dinormalisasi terlebih dahulu dalam bentuk teks
yang lengkap. Misalnya input teks: 17 agustus 1945
akan dinormalisasi menjadi tujuh belas agustus
seribu sembilan ratus empat puluh lima. Selanjutnya
akan mengikuti proses yang sama dengan input teks
lainnya, berupa pengenalan suku katanya. Hasil
pengenalan suku kata akan menjadi: tu-juh be-las
a-gus-tus se-ri-bu sem-bi-lan ra-tus em-pat puluh li-ma.
4.2 Pengolahan Hasil Rekaman
Hasil perekaman suku kata masih berupa
serangkaian diphone (suku kata) dalam bentuk file
suara berekstensi *.wav. Misalnya suku kata yang
huruf depan a, ab, ad, direkam dalam satu kali
rekaman suara. Serangkaian suku kata tersebut
akan
dipotong-potong,
diolah
menggunakan
software menjadi per satu suku kata. Gambar 5.5
menunjukkan hasil rekaman suku kata a, ab, ad.
Hasil rekaman tersebut letakan pada
track1.
Selanjutnya masing-masing suku kata a di pindah ke
track2 dan ab ke track3, ad di track4 (gambar 4.6)
Gambar 4.2 Output Pengenalan suku kata
Tingkat 2
Kata anak pada Tingkat 1 menghasilkan output ana-k yang selanjutnya akan menjadi input pada
Tingkat 2. Output pada tingkat 2 akan menjadi a-nak
(V-KVK). Pemisahan sesudah huruf pertama ini
terjadi karena tidak dikenal suku kata berpola VKV.
Sedangkan kata anda pada tingkat pertama akan
dipisahkan menjadi a-n-da (V-K-KV), yang
selanjutnya masuk ke tingkat kedua akan dipisahkan
menjadi an-da. Hal ini sesuai dengan aturan
pemisahan suku kata Bahasa Indonesia. Contoh
hasil pengujian lain terangkum pada tabel 4.2
Tabel 4.2 Hasil pengujian pengenalan suku kata
tingkat 2
INPUT
OUTPUT
(teks)
Tingkat 1
Tingkat 2
Anak
a-na-k
a-nak
anda
A-n-da
an-da
Buah
Bu-a-h
Bu-ah
Kenyang Ke-nya-ng
Ke-nyang
Ultra
u-l-t-ra
Ul-tra
Simpati
Si-m-pa-ti
Sim-pa-ti
Migrasi
mi-gra-si
mi-gra-si
Biografi
Bi-o-gra-fi
Bi-o-gra-fi
struktur
s-t-ru-k-tu-r struk-tur
Gambar 5.5 Hasil rekaman suara suku kata a, ab,
ad
Gambar 5.8 Hasil pemisahan suku kata
Metode yang sama dilakukan untuk suku katasuku kata yang lain. Ribuan suku kata yang
SEMINAR NASIONAL ELECTRICAL, INFORMATICS, AND IT’S EDUCATIONS 2009
teridentifikasi di rekam dan di simpan sebagai
database diphone.
4.3 Konversi ke ucapan
Proses terakhir adalah dari hasil pemisahan
suku kata dicocokkan dengan database diphone
untuk menge-load
diphone tersebut sehingga
menjadi output pengucapan suatu kata/ kalimat.
Pada penelitian ini untuk pengkonversian dari
suku kata ke ucapan masih terbatas untuk 1 pilihan
diphone. Misalnya suku kata me mempunyai dua
macam pengucapan diphone seperti mê pada kata
merah dan më pada kata melati. Program ini belum
bisa memilih kapan menggunakan diphone mê dan
kapan më. Dengan sistem database suku kata
mempunyai kelebihan kapasitas database lebih
sedikit daripada database kata sehingga proses
lebih cepat, akan tetapi hasil suara yang diperoleh
masih patah-patah.
5. Kesimpulan Dan Saran
5.1 Kesimpulan
• metode FSA dua tingkat bisa mengenali suku
kata Bahasa Indonesia dengan tingkat
keberhasilan 96%, kesalahan 3,94% untuk kata
dasar, sedangkan untuk kata berimbuhan
dengan tingkat keberhasilan 69%, kesalahan
30,88%.
•
Metode FSA belum bisa membedakan
gabungan dua vokal au, ai, oi yang diftong dan
bukan diftong. Semua gabungan dua vokal au,
ai, oi dianggap diftong.
• Untuk pengkonversian dari suku kata ke ucapan
masih terbatas untuk 1 pilihan 1 diphone.
Misalnya untuk suku kata me pada kata merah
dan melati.
• Dengan sistem database suku kata mempunyai
kelebihan kapasitas database lebih sedikit
daripada database kata sehingga proses lebih
cepat, akan tetapi hasil suara yang diperoleh
masih patah-patah.
5.2 Saran
Dari kesimpulan hasil penelitian iharapkan pada
penelitian berikutnya :
Mengembangkan pada kata berimbuhan.
Membedakan gabungan dua vokal au, ai, oi
yang diftong dan bukan diftong
Bisa mempunyai lebih dari 2 diphone.
Untuk hasil suara yang lebih halus dan natural
diperlukan
suatu
algoritma
untuk
menggabungkan diphone dengan diphone
lainnya, serta algoritma untuk memanipulasi
diphone, khususnya untuk mengubah durasi
serta pitch diphone. Ada berbagai teknik yang
dapat digunakan untuk mendukung pensintesa
jenis ini diantaranya adalah autoregressive
(AR), Glottal AR, hybrid harmonic/stocastic, time
domain
PSOLA
(TD-PSOLA),
multiband
resynthesis-PSOLA (MBR-PSOLA), serta Linear
Prediction-PSOLA
(LP-PSOLA)
[Dut97].
Diharapkan dengan penambahan salah satu
metode di atas akan dihasilkan suara yang lebih
halus dan natural.
B1-144
DAFTAR PUSTAKA
Alam, 2001. Borland Delphi 6.0. PT. Elex Media
Komputindo kelompok Gramedia. Jakarta
Arman, 2002. Konversi dari Text ke Ucapan.
Departement Teknik Elektro, ITB, Bandung.
Arman, 2002. Perkembangan Teknologi TTS dari
Masa ke Masa. Departement Teknik Elektro,
ITB, Bandung.
Basuki, 2000. Pengenalan Suku Kata Bahasa
Indonesia
Menggunakan
Finite-State
Automata.
Jurusan
Ilmu
Komputer,
Universitas Katolik Parahyangan, Bandung.
Borkar, . Text to Speech System for Konkani
(GOAN) Language. Electronics Department
Rajarambapu Institute of Technology
Sakharale, Islampur, Maharashtra, India.
Dutoit, Thierry. 1997. An Introduction to Text-toSpeech Synthesis. Kluwer Academic,
Publisher Dordrecht (Text, Speech, and
Language Series, edited by Nancy Ide and
Jean Veronis, volume 3). State University.
USA.
G. L. Jayavardhana, A. G. Ramakrishnan, M vijay
Venkatesh, R. Murali Shankar. Thirukkural,
A Text to Speech Synthesis System.
Department of Electrical Engineering, Indian
Institute of Science, Bangalore, India.
Hariyanto Bambang. 2004. Teori Bahasa, Otomata,
dan
Komputasi
serta
terapannya.
Informatika Bandung, Bandung.
HOPCROFT, J.E. dan J.D. ULLMAN. 1979.
Introduction to Automata Theory, anguages
and Computation.Addison-Wesley
Publishing Company, Reading,
Massachusetts.
Kelley Dean.1999. Otomata dan Bahasa-bahasa
Formal : Suatu Pengantar. PT. Prehallindo,
Jakarta.
Nageshwara Rao, Thomas Samuel, Nagarajan T,
Murthy Hema A. Text to Speech Synthesis
Using Syllable-like Units. Department of
Computer Science and Engineering, Indian
Institute of Technology, Madras, India.
Parson, Thomas W. 1986. Voice and Speech
Processing. McGraw Hill, New York.
Romel, Edwin. 2005. Aplikasi SMS dengan Text to
Speech Bahasa Indonesia pada sistem
Operasi Symbian.
Departemen Teknik
Elektro, ITB, Bandung.
Sojka Petr, Kopecek Ivan, Pala Karel. 2004. Text,
Speech and Dialogue: 7th International
Conference. TSD 2004, Brno, Czech
Republic.
www.Wikipedia Indonesia, ensiklopedia bebas
berbahasa Indonesia.

30_Sistem TTS dalam Bahasa Indonesia2

Related documents

Products

Support

30_Sistem TTS dalam Bahasa Indonesia2

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib