IMPLEMENTATION OF TURKISH TEXT TO SPEECH SYNTHESIS WITH RC8660 VOICE SYNTHESIZER

thumbnail.default.placeholder
Date
2015-10-25
Authors
KARAMEHMET, Timur
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
This thesis examines the text-to-speech (TTS) synthesis problem and the adaptation of the RC8660 Embedded System to Turkish. RC8660 is a system loaded with English phonemes and in the thesis the aim is to make this card synthesize Turkish. Firstly Turkish phonemes from their corresponding English phonemes are defined. For this purpose IPA: International Phonetic Alphabet was used. Because the syllabic structures of Turkish and English are different, there occurred a need for defining an Exception Dictionary using the text and phoneme modes of the system. The rules for correct syllabification were added to the dictionary one by one. Stress and intonation rules were also defined for making the synthesized Turkish speech as natural as a native speaker’s. Different phonemes were used for text and alphanumeric characters. The effects of the Speed, Expression, Pitch, Formant Frequency, Tone, Delay, and Articulation adjustments in the system’s software: RC Studio were also tested on the speech. The quality of the synthesis was evaluated by the Mean Opinion Score (MOS) test.
Description
RC8660 SES SENTEZLEYİCİ İLE TÜRKÇE METİNDEN KONUŞMA SENTEZLEME
ÖZ: Bu çalışma, metinden konuşma sentezleme problemini ve RC8660 gömülü sisteminin Türkçe’ye uyarlanması için yapılan çalışmaları incelemektedir. Tezde, İngilizce fonemlerle yüklü gelen RC8660 kartının Türkçe konuşma sentezlemesi hedeflenmiştir. Bu amaçla, öncelikle İngilizce’de bulunan fonemlere karşılık gelen Türkçe fonemler tanımlanmıştır. Bunun için IPA: International Phonetic Alphabet’den yararlanılmıştır. Türkçe ve İngilizce’nin hece yapıları farklı olduğu için, kartın sahip olduğu metin ve fonem modlarından yararlanılarak yeni bir harici sözlük tanımlamaya ihtiyaç duyulmuştur. Doğru heceleme için gerekli kurallar, oluşturulan bu sözlüğe tek tek eklenmiştir. RC8660’ın bir konuşmacı doğallığında Türkçe konuşması için vurgu ve tonlama kuralları da tanımlanmıştır. Üretilen konuşmanın düzgün ve anlaşılabilir olması amacıyla karakterler ve sayılar için farklı fonemler kullanılmıştır. Kartın yazılımı olan RC Studio’da yer alan hız, ifade, perde, formant frekansı, ton, gecikme ve telaffuz ayarlarının konuşma üzerindeki etkileri de test edilmiştir. Üretilen konuşmanın kalitesi ortalama görüş skoru (MOS) testi ile ölçülmüştür.
Keywords
electrical & electronics engineering
Citation