Talsyntes:____"För Folk I Tiden"

Varning! Det som diskuteras här är inte alltid enkelt och det kan hända att vissa installationer/modifieringar kan göra ditt system oanvändbart. Inget för nybörjare. Gör alltid backup av känslig data innan du experimenterar.
Kategoriregler
Varning! Det som diskuteras här är inte alltid enkelt och det kan hända att vissa installationer/modifieringar kan göra ditt system oanvändbart. Inget för nybörjare. Gör alltid backup av känslig data innan du experimenterar.
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Men det där ljudet som hörs i slutet "drives me nuts".
Jag har som sagt aldrig märkt av det där ljudet som du hör i slutet. Enda sättet att bli av med det är att försöka komma fram till vad det beror på. DVS göra små ändringar i taget tills problemet och på så sätt ringa in orsaken. Är det rösten? Är det mplayer-versionen? Är det något annat? Om jag förstår dig rätt så har du inte haft det här problemet hela tiden? Minns du isf ungfär när det dök upp?
Hans Linde skrev:Det måste också finnas någon anledning att "fast"F12 blir så mycket otydligare. Det mesta i texten
är tydligt, men så swischare/fläser en bit, så man tappar sammanhanget.
Du kan ju prova med varianten som gör en liten pause mellan varje mening och se om det blir bättre:

Kod: Markera allt

#!/bin/sh
exec 2>&-
(setsid festival --server >&- 2>&- &)
pkill -P `pgrep -d, 'festival_'`
find ~/.mplayer -name festival.\*.fifo -type p -exec rm -f {} \;
FIFO=~/.mplayer/festival.$$.fifo
trap 'rm -f "$FIFO"' EXIT
mkdir -p "${FIFO%/*}" &&
test -p "$FIFO" || mkfifo "$FIFO"
xclip -o | xargs -0 |
awk -F'[?.!][ \t\n]' '{for(i=1;i<=NF;i++)printf("%s\n", $i)}' |
while read sentence
do until echo "$sentence" | festival_client --ttw; do sleep 1; done | mplayer -input file="$FIFO" -really-quiet -speed 1.3 -af scaletempo -demuxer rawaudio -rawaudio channels=1:rate=16000 -
done
Se till att du får med alla rader den här gången. :)
Hans Linde skrev:3) Vi har ju 7st funktion-tangenter kvar :) . Resurcer ska användas. Tex skull vi kunna lägga "röstval" på dessa.
Röstval är ganska lätt ordnat, t.ex. ~/bin/festival_jmk.sh:

Kod: Markera allt

cat <<\EOF >~/.festivalrc
(set! voice_default 'voice_cmu_us_jmk_arctic_clunits)
EOF
pkill festival
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Ooj!
27 dagar kvar till Ubuntu 8.10!

Innebär det att det kvaddar det du nu gjort??
Förmodligen inte. Men om något "kvaddar" så lär det vara lätta att rätta till.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Jag kan inte komma på något bättreord. "Du är en KLIPPA!"

Dina förslag ska utvärderas,men jag är inte helt återställ efter "kraschen",
som jag får ta det lite i taget. Tangentbords hackande är mycket påfrästande
för oss med Wiplaschproblem. Å andra sidan behöver jag träna på det.

Åtekommer så fort jag har kommit fram med något resultat.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Då så får vi om sjukvården har fått gubbe styv igen.
Det får bli i en bit i taget.

Med avsikt att ringa in orsaken till "röst släpet".
- Du har rätt. Dett här finns inte på i386-versionen. (Men den förhållande vis otrolig seeeg i starten)
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

"Det måste också finnas någon anledning att "fast"F12 blir så mycket otydligare. Det mesta i texten
är tydligt, men så swischare/fläser en bit, så man tappar sammanhanget."

Min teori med att det skulle ha ett samband med "röstsläpet" är nog fel.
Det är samma problem med i386-versionen.

Mao jag ska utvärdera din nya (ja vad ska vi kalla den här instruktionen) "tangentfil".
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

" ......"fast"F12 blir så mycket otydligare. Det mesta i texten
är tydligt, men så swischare/fläser en bit, så man tappar sammanhanget...."

Den nya "tangentfilen" (om vi nu ska kalla den för det) är bättre.
Det är betydligt mera "hörbart".
Jag kan tom dra upp farten till "3", med samma eller bättre hörbarhet.

Vi har en "olinjäritet" i prestandan med av seende på hastighet.
Tex fart "2.3" låter otroligt "burkit". (ursäkta ordvalet) Men rösten blir dämpad och mycket distorderad.
Det får mig att tro att vi har ett problem som liknar analog-världen.
En liknelse: Om man dra en magnetband snabbare runt i bandspelaren, höjs också amplituden. Det i sin tur kan förorsaka överstyrning
i följand förstärkarsteg.
Eventuellt kan det vara något liknade som sker här . Även om jag inte känner till något sådan fall efter 25år i eletronikbranchen.
( Det får mig att tänka på det gamla uttrycket: "Varför göra det enkelt, när man kan göra det digital.")

Jag tycker alltså att det skull vara värdefullt om vi kunde titta mera på det här.
Det är framför allt "s-ljuden" som "skär sig", och blir tröttande i längden.
Men åter igen det här är betydlig bättre, när alla rader komma med ;D .
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

"Röstval är ganska lätt ordnat, t.ex. ~/bin/festival_jmk.sh:

Kod: Markera allt
cat <<\EOF >~/.festivalrc
(set! voice_default 'voice_cmu_us_jmk_arctic_clunits)
EOF
pkill festival

--------------

Grattis!
Din pedagogik funkar. Tre röstkataloger är kopplade. F2=bdl, F3=jmk, F4=rms.
Och det funkade på 2a försöket!!! (det var det där med "körbar")
Nu är det lätt att jämföra rösterna. Alla är okay på "1.3", men det är bara "rms" som klarar "3".
Alla rösterna har felet med "röstsläpet"och distortionen på de "bdl" o "jmk" är gräslig i högre hastigter.

Så vi kan fortsätta med "rms" tills något bättre hittas.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Om jag då ska summera vad som är av värde att förbättra: (ingen prio ordning)
1) röstsläpet.
2) swisch-ljudet (distortion?) i hög hatighet.
3)intro-tiden.....om nappade på micke_nordin`s inlägg om detta med Autostart, eller kanske där med servern igen. Jag måste erkännar att vi ibland bra bit över min "mjölsyretröskel". Så kanske den funkar om jag "får med alla raderna" eller vad nu kan ha varit.
Fast i om vi ska göra det behöver jag din lotsning. (Av leta tillbaka och läsa detta, kommer jag inte att mäkta med.)
4) En hel del till, men jag vill inte skrämma iväg dig? >:D
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Mja, den här metoden att klippa upp är något som påverkar uppläsningen.
Pausen som sker är lite för lång för att vara acceptabel. (även om det för min
del inte gör något.) Vid varje uppehåll hörs "röstsläpet".
"jmk" verkar vara en snabbtalande röst, så det är nog anledning till att den
inte är lika "stresstålig".
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Med avsikt att ringa in orsaken till "röst släpet".
- Du har rätt. Dett här finns inte på i386-versionen. (Men den förhållande vis otrolig seeeg i starten)
Så då är frågan varför den finns på amd64, men inte på i386?

Först bör du kolla om det är något problem med själva "tangetfilerna". Kopiera alla filerna från i386 till amd64 och se om "röstsläpet" försvinner. Alternativt kopierar du åt andra hållet och ser om röstsläpet dyker upp på i386 också. Men se i så fall till att ta backup på de tangetfiler som fungerade utan röstsläp.

För att kunna utesluta att problemet har något att göra med skillnaden compiz - metacity bör du testa att köra tangentfilerna direkt från terminalen.

Sen har vi det här med mplayer. Du har en egenkompilerad på amd64, men den på i386 är från en deb-fil. Antingen så försöker du använda standard-mplayer på amd64 /usr/bin/mplayer (den utan scaletempo) och ser om röstsläpningen försvinner. Eller så kompilerar du mplayer även på i386 på samma sätt som du gjorde på amd64. Dyker det upp röstsläpning även på i386 då så har vi hittat problemet.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Puuh.
Tror att jag känner rätt ok idag. Får hoppas att det håller i sig, för det här kommer att ta ett tag.
Det finns nog också risk att något fallerar på väg.

Jag har en fråga innan jag tar itu med det här.
Först bör du kolla om det är något problem med själva "tangetfilerna". Kopiera alla filerna från i386 till amd64 och se om "röstsläpet" försvinner. Alternativt kopierar du åt andra hållet och ser om röstsläpet dyker upp på i386 också. Men se i så fall till att ta backup på de tangetfiler som fungerade utan röstsläp.
Kanske jag inte var tillräckligt tydlig i morgonens redogörelse. -tangenfilerna i i386 har inte "röstsläpet", men det startar allt för sent.
Vill du att jag ska göra det iaf? Jag ska "gå över" till den PCn och lägga ut tangentfilen så du ser vilken det är. Återkommer.
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Kanske jag inte var tillräckligt tydlig i morgonens redogörelse. -tangenfilerna i i386 har inte "röstsläpet", men det startar allt för sent.
Vill du att jag ska göra det iaf? Jag ska "gå över" till den PCn och lägga ut tangentfilen så du ser vilken det är. Återkommer.
Om vi ska kunna utesluta att det är tangentfilerna som strular så måste vi försöka med samma tangentfiler på båda datorerna. Att i386 startar sent skulle ju kunna ha någonting att göra med att det inte blir något röstsläp på den datorn. Men du kan (som jag skrev i förra inlägget) kopiera åt andra hållet om du vill, så att även i386 får de snabbare filerna. Men gör i så fall en säkerhetskopia på de långsamma i386-filerna.
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Vi har en "olinjäritet" i prestandan med av seende på hastighet.
Tex fart "2.3" låter otroligt "burkit". (ursäkta ordvalet) Men rösten blir dämpad och mycket distorderad.
Det får mig att tro att vi har ett problem som liknar analog-världen.
En liknelse: Om man dra en magnetband snabbare runt i bandspelaren, höjs också amplituden. Det i sin tur kan förorsaka överstyrning
i följand förstärkarsteg.
Eventuellt kan det vara något liknade som sker här . Även om jag inte känner till något sådan fall efter 25år i eletronikbranchen.
( Det får mig att tänka på det gamla uttrycket: "Varför göra det enkelt, när man kan göra det digital.")

Jag tycker alltså att det skull vara värdefullt om vi kunde titta mera på det här.
Det är framför allt "s-ljuden" som "skär sig", och blir tröttande i längden.
Men åter igen det här är betydlig bättre, när alla rader komma med ;D .
Det här har med all säkerhet med scaletempo att göra.
Scaletempo works by playing <stride> ms of audio at normal speed then consuming <stride>*<scale> ms of input audio. It pieces the strides together by blending <overlap>% of stride with audio following the revious stride. It optionally performs a short statistical analysis on the next <search> ms of audio to determine the best overlap position.
Vi har hittills bara använt oss av standardinställningen för scaletemo. Det finns flera parametrar att leka med som kan förbättra det hela:
scale=<amount>
Nominal amount to scale tempo. Scales this amount in addition to speed. (default: 1.0)
stride=<amount>
Length in milliseconds to output each stride. Too high of value will cause noticable skips at high scale amounts and an echo at low scale amounts. Very low values will alter pitch. Increasing improves performance. (default: 60)
overlap=<percent>
Percentage of stride to overlap. Decreasing improves performance. (default: 0.20)
search=<amount>
Length in milliseconds to search for best overlap position. Decreasing improves performance greatly. On slow systems, you will probably want to set this very low. (default: 14)
speed=<tempo|pitch|both|none>
Set response to speed change.
tempo: Scale tempo in sync with speed (default)
pitch: Reverses effect of filter. Scales pitch without altering tempo.
both: Scale both tempo and pitch
none: Ignore speed changes
Exempel: -af scaletempo=stride=30:overlap=0.50:search=10
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:3)intro-tiden.....om nappade på micke_nordin`s inlägg om detta med Autostart, eller kanske där med servern igen. Jag måste erkännar att vi ibland bra bit över min "mjölsyretröskel". Så kanske den funkar om jag "får med alla raderna" eller vad nu kan ha varit.
Fast i om vi ska göra det behöver jag din lotsning. (Av leta tillbaka och läsa detta, kommer jag inte att mäkta med.)
Jag vet inte vad som kan göras åt intro-tiden annat än det här med att hugga upp i meningar. Server-Klient-grejen använder vi redan. Utan den skulle det antagligen bli ännu långsammare. Man skulle såklart kunna lägga in så att servern startas när datorn startas, men det hjälper bara för den allra första uppläsningen efter man startat om datorn.

Vid vid varje röstbyte stängs servern av, men startas inte förrän nästa gång något ska läsas upp. Man skulle kunna start servern direkt efter röstbytet istället, men det hjälper då bara vid den allra första uppläsningen efter ett röstbyte.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Det där får jag fundera på.
Nedan följer mitt inlägg till din tidigare "reply".

----

Okay, så får det bli. Jag har redan äldre tangetfiler i Katalogerna.
Dessa har jag kallat tex "festival_mid_rev2".
Jag antar att det är problemfritt förfarande?

Javisst, hustrun påminde mig just, att det är idag som hon tänkt ha med
mig på sin 50års släkt evenemang.
Mja jag får nog svårt att slingra mig ur det. Eventuellt kanske jag får
möjlighet att smyga mig undan för att egna mig åt väsentligheterna ;) .

Så här ser tangentfilerna ut i i386.

festival_stop.sh
#!/bin/sh
pkill -P `pgrep -d, 'festival_'` mplayer 2>&-

festival_pause.sh
#!/bin/sh
for FIFO in ~/.mplayer/festival*.fifo
do test -p "$FIFO" && echo pause >"$FIFO"
done

festival_fast.sh
#!/bin/sh
(setsid festival --server >&- 2>&- &)
FIFO=~/.mplayer/festival.$$.fifo
mkdir -p "${FIFO%/*}" &&
test -p "$FIFO" || mkfifo "$FIFO"
until xclip -o | festival_client --ttw 2>&-
do sleep 1
done | mplayer -input file="$FIFO" -really-quiet -speed 2.0 -af scaletempo -demuxer rawaudio -rawaudio channels=1:rate=16000 -
rm -f "$FIFO"

mid o slow är förståss versioner på det samma . mid=1.5, slow=1.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Åj, du har hunnit göra flera inlägg.
Va bra, min jag blir vungen att egna mig åt hon som ska försörja mig
det följande åren till pensionen. :-[
Troligen inte för än imorgon. :-\
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Okay, jag har fått despans. Tänk vad bra det är med en förståend hustru. Hon är en Pärla. ;D (och lite till som
inte ska skinera er med. >:D ) Jag tar med min Laptopen (dvs AMD64) så kan jag dra mig undan för livets
väsentligheter, när släktsnattret börjar. (Det är en form av genetisk verbalinkontinens, som jag tror
har att göra med en eventuellt kortslutning mellan tanken och talnerven. Jag får leta rätt på ett forum
för det temat.)
Det innebär att jag kommer ha AMD64 med mig till ca 1800 5e okt.

Jag trasslar över (visst de ligger ju reda på denna länk) tangentfilerna till AMD64.
Försöker prova de andra förslagen.

Är det något mer du kan tänka som jag ska flytta över från i386?
Användarvisningsbild
Konservburk
Inlägg: 5919
Blev medlem: 07 apr 2007, 22:28

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Konservburk »

Hans Linde skrev:Är det något mer du kan tänka som jag ska flytta över från i386?
Alla tangentfiler räcker bra. Tester åt andra håller (som att kompilera en egen mplayer på i386) kan vi vänta med.
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

Monica hälsar och tackar. :)
Hans Linde
Inlägg: 3375
Blev medlem: 06 sep 2008, 07:46
OS: Crunchbang
Utgåva: Vet inte/ingen utgåva passar

Re: Talsyntes/Festival/Scaletempo/Ubuntu-AMD64

Inlägg av Hans Linde »

God mat var det också...bla!

Då har jag gjort en dela av det du föreslog. Eftersom det var lite "pilligt", med flera terminaler
och copy/paste förfarande så kanske du ska titta på det här innan jag fortsättet.
Det här är kört i AMD64. Rapport följer.

Rapport 081005 13:20

2 första testerna av 3 från inlägg "igår 9:34.
Jag stannar här för din feedback. Det beter sig inte väl. Hoppas du minns och se sambanden.

Tangent:
Slow - ett knäpp, sedan tyst
mid, fast - tyst.

Terminal: ( om jag minns rätt så var det bara att klistra in det som skrevs i filen)
1)
hans@hl:~$ until xclip -o | festival_client --ttw 2>&-
> do sleep 1
> done | mplayer -input file="$FIFO" -really-quiet -speed 2.0 -af scaletempo -demuxer rawaudio -rawaudio channels=1:rate=16000 -
hans@hl:~$ rm -f "$FIFO"

Rösten är tyst, då sista raden visas.

2)
likadan i terminal.

tangent-paus funkar, ej stop.

3)
i terminal A--
hans@hl:~$ #!/bin/sh
hans@hl:~$ (setsid festival --server >&- 2>&- &)
hans@hl:~$ FIFO=~/.mplayer/festival.$$.fifo
hans@hl:~$ mkdir -p "${FIFO%/*}" &&
> test -p "$FIFO" || mkfifo "$FIFO"
hans@hl:~$ until xclip -o | festival_client --ttw 2>&-
> do sleep 1
> done | mplayer -input file="$FIFO" -really-quiet -speed 2.0 -af scaletempo -demuxer rawaudio -rawaudio channels=1:rate=16000 -
hans@hl:~$ rm -f "$FIFO"
hans@hl:~$

i terminal B-- (pause)
hans@hl:~$ #!/bin/sh
hans@hl:~$ for FIFO in ~/.mplayer/festival*.fifo
> do test -p "$FIFO" && echo pause >"$FIFO"
> done

Rösten stannar inte.
Jag förstår inte varför "hans@hl:~$" kommer på i stort sett alla rader nu.

4)
Som "3" men med stop.
Skriv svar

Återgå till "Experimentverkstad"