Make own text to speech program




TTS (Text To Speech) merupakan sebuah teknologi yang dapat digunakan untuk mengconvert text menjadi suara, salah satu penggunaan dari TTS ini adalah untuk mengconvert ebook menjadi audio book. di internet terdapat beberapa situs yang menyediakan layanan TTS ini, salah satunya google cloud, AWS dan naturalreaders.com

Dalam artikel kali ini, saya akan membahas pembuatan TTS menggunakan python. Python menyediakan beberapa library untuk membuat text-to-speech. Dalam Python, ada beberapa library TTS yang tersedia untuk mengonversi teks menjadi suara, Salah satu library yang populer adalah pyttsx3, yang mendukung beberapa platform termasuk Windows, Linux, dan macOS.

sebagai pilihan untuk belajar, berikut adalah library-library yang dapat digunakan di python untuk mengkonversi text menjadi suara:

  • pyttsx3 Pyttsx3 adalah library TTS yang sangat mudah digunakan. Library ini menggunakan mesin TTS default dari sistem operasi yang digunakan dan mendukung banyak bahasa termasuk bahasa Indonesia. Berikut ini adalah contoh penggunaannya
import pyttsx3
engine = pyttsx3.init()
engine.say('Halo, apa kabar?')
engine.runAndWait()

  • gTTS  gTTS adalah library TTS Google yang memungkinkan pengguna untuk mengonversi teks menjadi suara menggunakan bahasa yang didukung oleh Google TTS. Library ini memerlukan koneksi internet untuk bekerja. Berikut ini adalah contoh penggunaannya

from gtts import gTTS

lang = 'en' # bahasa yang digunakan
tts = gTTS(text='Halo, apa kabar?', lang=lang)
tts.save("halo.mp3") # simpan data ke local

  • pyttsx pyttsx adalah library TTS open source yang memungkinkan pengguna untuk mengonversi teks menjadi suara. Library ini mendukung banyak bahasa termasuk bahasa Indonesia. Berikut ini adalah contoh penggunaannya:

import pyttsx
engine = pyttsx.init()
engine.say('Halo, apa kabar?')
engine.runAndWait()

  • eSpeak eSpeak adalah library TTS open source yang mendukung banyak bahasa termasuk bahasa Indonesia. Library ini memiliki suara yang cukup jelas dan mudah digunakan. Berikut ini adalah contoh penggunaannya:

from subprocess import call
call(["espeak", "Halo, apa kabar?"])

  • TextBlob TextBlob adalah library NLP (Natural Language Processing) yang mendukung banyak bahasa termasuk bahasa Indonesia. Selain dapat digunakan untuk melakukan sentiment analysis atau text classification, TextBlob juga dapat digunakan untuk mengonversi teks menjadi suara. Berikut ini adalah contoh penggunaannya:
from textblob import TextBlob
blob = TextBlob("Halo, apa kabar?")
blob.speak()



Dari beberapa library diatas, menurut saya gTTS merupakan library dengan suara yang cukup bagus, karena yang lainnya terdengar seperti robot. 

selain di python, kita juga bisa mencoba mengubah text menjadi suara di javascript, penggunaan di javascript dapat diaplikasikan ketika kita ingin menggunakan TTS langsung di web apps yang kita buat.

Untuk membuat text-to-speech dengan Javascript, kita dapat menggunakan Web Speech API yang sudah disediakan oleh browser. API ini dapat digunakan di beberapa browser modern seperti Google Chrome, Firefox, dan Safari.
Berikut adalah kode sederhana untuk menggunakan Web Speech API:
var synth = window.speechSynthesis;
// Text yang ingin diubah ke suara
var text = "Hello, how are you today?";
// Membuat objek pesan
var msg = new SpeechSynthesisUtterance(text);
// Mengubah teks ke suara
synth.speak(msg);

Kode di atas akan mengubah teks menjadi suara dan memainkan suara melalui speaker di komputer atau perangkat mobile.
Anda juga dapat menyesuaikan beberapa pengaturan, seperti kecepatan dan volume suara, menggunakan properti rate dan volume di objek SpeechSynthesisUtterance.
// Menambahkan kecepatan suara
msg.rate = 0.8;
// Menambahkan volume suara
msg.volume = 0.7;

Demikianlah cara menggunakan Python dan Javascript untuk membuat text-to-speech. Selamat mencoba!

Comments