MAKALAH “Text to Speech”

MAKALAH

Text to Speech

                                                                OLEH :

                                              NAMA            : ROSTY BOIMAU

                                              NIM                :  171100008

                                              PRODI            :  PENDIDIKAN  INFORMATIKA

 

 

Universitas Citra Bangsa

Program Studi Pendidikan Informatika

Kupang

2019/2020

 

 

 

 

                                                                           BAB I
                                                                 PENDAHULUAN

1.1 Latar Belakang
Text to speech didasari oleh sebuah konsep dasar yang dikenal dengan sebutan
lafal buatan (speech synthesis). Speech synthesis adalah penghasilan pertuturan manusia (secara rekayasa) tanpa mengggunakan suara manusia secara langsung, dan ujaran/ lafal buatan ini yang sering kita sebut dengan tulisan ke lafal (text to speech). Text to speech terdiri dari dua bagian, bagian depan dan bagian belakang, bagian depan mengambil input dalam bentuk teks dan output wakil simbolik linguistik (fonem) misal, /a/,/b/,/c/ dan seterusnya. Bagian belakang mengambil wakil simbol linguistik (fonem) sebagai input dan menghasilkan lafal buatan (waveform). Naturalness pensintesis pertuturan biasanya merujuk kepada berapa tepat bunyi output kedengaran seperti manusia sebenarnya.
Pada tugas akhir ini penulis mengkhususkan untuk mengembangkan bagian teks
ke fonem, sedangkan pada bagian phoneme to speech dilakukan oleh software engine MBROLA yang didalamnya terdapat diphone database bahasa Indonesia. Cara kerja teks ke fonem adalah melakukan konversi dari simbol tekstual menjadi simbol-simbol fonetik, yang mendefinisikan unit bunyi terkecil dari suatu kata yaitu fonem.simbol-simbol fonetik tersebut dikodekan berdasarkan durasi dan pitch yang kita sebut dengan kode fonem. Engine MBROLA dapat mengenal inputan teks yang diketikan karena kode fonem telah ditambahkan pada datebasenya yang selanjutnya akan diubahnya menjadi suara (waveform).

1.2 Tujuan dan Manfaat
Tugas akhir ini membahas tentang bagaimana dapat mengembangkan kualitas
pengucapan kata dengan pengembangan sistem prosodi, dan menggunakan salah satu metode pengembangan prosodi yang disebut metode dataset. Hasil dari tugas akhir ini bermanfaat untuk pengembangan kualitas pengucapan
suatu kata pada system text to speech dalam bahasa Indonesia.

1.3 Rumusan Masalah
Permasalahan dalam tugas akhir ini membahasa tentang bagaimana membuat
system yang memiliki output pengucapan kata dengan menggunakan metode dataset sebagai metode untuk meningkatkan kualitas pengucapan kata.

1.4 Batasan Masalah
Sistem yang digunakan dalam software engine MBROLA adalah text to speech
dengan Id1 sebagai diphone database bahasa Indonesia yang dibuat oleh Arry
Akhmad Arman. Sistem yang dikembangkan adalah sistem prosodi dengan metode dataset untuk meningkatkan kualitas dari pengucapan. Menggunakan Delphi 7.0 sebagai user interfacenya. Pengimplementasi sistem dibatasi dengan kalimat berupa teks saja (tidak termasuk angka dan simbol-simbol) Prosodi yang dihasilkan berdasarkan nilai pitch dan durasi yang ada pada kode
fonem, khususnya hanya fonem konsonan hambat (p//d//k//c//b//j//g//t//) kecuali ?.
Sistem hanya dikembangkan pada bagian text to phoneme dan hanya membahas sebagian kecil dari fonem to speech. Analisa system dibatasi dengan 2 suku kata sesuai dengan sampel yang diteliti. Analisis sistem sistem ini dilakukkan MOS.

1.5 Metodologi
Metode penelitian tugas akhir yang dilakukan meliputi :
=>  Studi literatur
Pencarian bahan-bahan referensi yang mendukung pembuatan tugas akhir, yang dapat diperoleh dari internet, buku perpustakaan, ataupun jurnal-jurnal yang dapat membantu pembuatan tugas akhir ini.
=> Eksperimen
Mencari rata-rata nilai frekuensi, nilai pitch dan durasi Text to phonem interface Delphi7.0 Synthesizer MBROLA Model prosodi dataset, Mencari data-data yang dibutuhkan untuk mendukung pembuatan sistem dengan cara melakukan eksperimen atau penelitian guna mendapatkan nilai pitch dan durasi.
=> Perancangan sistem
Pada tugas akhir ini dilakukan perancangan sistem text to speech dengan garis
besar alur.
=> Analisa sistem
Sistem yang telah dibuat akan dianalisa kehandalannya dan diperbandingkan
dengan kualitas output Indo TTS.

 

1.6 Sistematika Penulisan Laporan
Pada laporan penulisan ini, penulis membaginya ke dalam bab-bab yang masing-masing babnya menguraikan materi seperti yang dijelaskan di bawah ini :
BAB I
PENDAHULUAN
Bab ini berisi tentang latar belakang masalah, pembatasan masalah,
tujuan dan manfaat, metodologi penelitian dan sistematika
penulisan laporan.
BAB II
LANDASAN TEORI
Bab ini berisi tentang teori-teori pendukung dari aplikasi ini.
BAB III
ANALISIS
DAN PERANCANGAN APLIKASI
Bab ini berisi tentang bagaimana menganalisa dan merancang aplikasi ini.
BAB IV
IMPLEMENTASI DAN PENGUJIAN
Bab ini berisi tentang implementasi dan pengujian aplikasi yang telah dibuat.
BAB V
KESIMPULAN DAN SARAN
Bab ini berisi tentang kesimpulan dan saran untuk mendukung
perbaikan aplikasi ini.

DAFTAR PUSTAKA

        http://id.wikipedia.org/wiki/edmodoss

http://anangss.blogspot.com/2010/07/edmodo.html

 

Leave a Reply

Your email address will not be published. Required fields are marked *