İçindekiler:
Tanımı - Konuşma Sentezi ne demektir?
Konuşma sentezi, bir bilgisayar veya başka bir cihazla insan konuşmasının yapay simülasyonudur. Ses tanıma, konuşma sentezinin karşılığı çoğunlukla metin bilgilerinin ses bilgisine dönüştürülmesinde ve ses özellikli hizmetler ve mobil uygulamalar gibi uygulamalarda kullanılır. Bunun yanı sıra, görme engelli bireylerin metin içeriğini okumalarına yardımcı olmak için yardımcı teknolojide de kullanılır.
Techopedia Konuşma Sentezini Açıklıyor
Homer Dudley'nin Bell Laboratories'in vocoder'ına dayanan VODER'ı, ilk tamamen işlevsel ses sentezleyicisi olarak kabul edilir. Konuşma sentezinde kullanılan bilgisayar konuşma sentezleyici veya konuşma bilgisayarı olarak bilinir. Konuşma bilgisayarının kalitesi genellikle insan sesine benzerliği ile değerlendirilir. Çoğu bilgisayar işletim sistemi 1990'ların başından beri konuşma sentezleyicileri kullanmaktadır. Sentezlenen konuşma genellikle bir veritabanında bulunan kaydedilmiş konuşma parçalarının birleştirilmesi yardımıyla oluşturulur.
Konuşma sentezindeki ilk aşama, belirli kelimenin okunması gereken yolu çevreleyen belirsizliği ortadan kaldıran ve aynı zamanda homografları işlemeyi de içeren ön işlemedir. Konuşma sentezinin bir sonraki aşamasında, bilgisayar metni ses dizisine dönüştürmek için fonemlerin yardımını alır. Son aşama, insan ses mekanizmasını taklit etmek ve tüm metni okumak için insan kayıtlarının veya temel ses üretim tekniklerinin kullanılmasını içerir. Konuşma sentezinin popüler dallarından biri, sentezlenen konuşmayı tamamlamak için sıkıca senkronize edilmiş bir animasyonlu yüzden faydalanan görsel-işitsel konuşma sentezi veya multimodal konuşma sentezidir. Multimodal konuşma sentezi, kullanıcının sözlerini daha doğru bir şekilde iletmeye yardımcı olmak için konuşmaya sözel olmayan ipuçları gibi ek özellikler de içerir. Birçok konuşma sentez sistemi, kullanıcıların erkek veya kadın sesi gibi ses türünü seçmelerine olanak tanır.
Çoğu konuşma sentez sistemi metinleri okuyabilir ve bunları çok akıllı bir şekilde verebilir, ancak ses zaman zaman donuk olabilir. Bununla birlikte, konuşma sentezi, insan tonlama ve kadanslarının geniş spektrumunu tam olarak taklit etme yeteneğini geliştirmemiştir.