Toon posts:

rsynth configureren voor human speach.

Pagina: 1
Acties:

Verwijderd

Topicstarter
Mogelijk hoort dit beter in NOS, maar in essentie is het toch een multi platform programma dus qua regels hoort het toch hier.

ik heb dus 2 programma's voor text-to-speach
festival en rsynth.

festival is een ware hell om uit te zoeken hoe je dingen moet doen, rsynth is daar in tegen zeer makkelijk.

maar nu heb ik bij synth dus het probleem, meer dan een ranzig mechanies stemmetje krijg ik er niet uit. je kunt vrij veel dingen instellen (onderin een kleine output van de instellings mogelijkheden)

wat mijn vraag nu is, zou iemand weten hoe je dit ding zo kan instellen dat er een normaal klinkende stem uit komt?
zelf ben ik niet zo'n geluids ingesteld persoon en heb er dus ook weinig kaas van gegeten.
Behalve wat termen zo'n beetje betekenen heb ik geen flauw idee hoe ik ze in werkelijkheid binnen normale limieten moet toe passen.

ook is er over rsynth vrij weinig te vinden. (meer dan een pagina met 2 download links is het niet)
en ook op got kon ik maar 1 link vinden die het programmatje noemt.

als het nou mogelijk is om met rsynth een normaale stem te krijgen dan kan ik festival (god zij dank) weer van mijn HD af gooien.
zo niet, naja dan zal ik zeker wat daagjes werk in festival moeten steken.

en waarom dit alles?
(meschien toch interesant om te weten enzo)
ben bezig aan een auto radio mp3 speler ding, en qua verkeers veiligheid leek voice output van selectie ons een goed idee. je oren zijn nou eenmaal van secundair belang tijdens het rijden.

code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
linux Audio:
 -r <d> [0]     Sample rate
 [+|-]a [yes]   Audio enable
 
Synth paramters:
 [+|-]q [yes]   Quiet - minimal messages
 [+|-]I [no]    Impulse glottal source
 -c <d> [0]     Number cascade formants
 -F <d> [0]     F0 flutter
 -f <lg> [10]   mSec per frame
 -t <d> [10]    Tilt dB
 -x <d> [1330]  Base F0 in 0.1Hz
 
Holmes:
 -p <string> [] Parameter file for plot
 -j <string> [] Data for alternate synth (JSRU)
 -S <d> [1]     Speed (1.0 is 'normal')
 -K <lg> [1]    Parameter filter 'fraction'
 
Dictionary:
 -d <string> [b]        Which dictionary [b|a]
 
File output:
 -l <string> [] Raw 16-bit linear pathname
 -o <string> [] Sun/Next audio file name