Ohjelmatestaukset ja ääninäytteet, osa 1

eSpeak, Festival ja Python3 ääninäytteet nauhoitettiin Audacity-ohjelmalla testauksen yhteydessä. Näytteitä verrattiin keskenään ja lopulta erittäin hyvänkuuloiseen TTS-sampleen, Tacotron 2. Python3 kuulosti hyvältä englanniksi, ei samaa luokkaa Tacotronin kanssa eikä myöskään toiminut suomeksi. eSpeak kuulosti erittäin robottimaiselta suomeksi. Festival kuulosti hieman paremmalta kuin eSpeak, mutta sekin oli kovin robottimainen. Alla ääninäytteitä.

eSpeak, Windows

Suomenkielisiä eSpeak ääninäytteitä.

Festival, Linux

Suomenkielisiä ääninäytteitä Festival Suopuhe TTS-projektista.

   

Python3, Windows

Python gTTs enlganninkielinen ääninäyte. Ei toimi suomenkielellä.

Tacotron 2

Tacotron 2 ääninäyte. Englanninkielinen TTS-projekti.

 

Monialaprojekti TTS Suomeksi

Tämä projekti on n. 6kk kestävä projekti, joka tehdään Haaga-Helian monialaprojekti-kurssilla. Projektin aikana etsitään tietoa olemassa olevista avoimenlähdekoodin tekstistä puheeksi -syntetisaattoreista, sekä verrataan niitä toisiinsa. Kartoittamisen jälkeen tavoitteena on luoda paranneltu versio suomenkielisestä tekstistä puheeksi -ohjelmasta.

Projektiryhmän jäsenet ova Tomi Irla ja Ina Andersin.

Vaihtoehtojen kartoitus

Suopuhe on LGPL lisenssillä julkaistu äänitietokanta, joka toimii Festival-
puhesyntetisaatorilla. Suopuheen projekti rahoitettiin TEKESIn rahoittaman
’Finnish Speech Technology: A Multidisciplinary Project’ -hankkeessa, joka
päättyi huhtikuussa 2003.  Suopuhe syntetisaattori julkaistiin 19.9.2004.

Suopuhe tulee toimiman projektin laadullisena tavoitekynnyksenä, mutta
äärimmäinen tavoitteellinen kiintopiste Tacotron 2:n suuntainen
puhesyntetisaattori.

Tutustumme projektin alussa avoimen lähdekoodin Festival-syntetisaattorin
toimintaan.

Vaihtoehtona on myös käyttää Pythonia ja eSpeakia.