Serveur vosk de reconnaissance vocale

Vous envoyez votre enregistrement (jusqu'à 3Go). Le serveur va vérifier que le son est en mono, le normaliser, le passer à l'outil de reconnaissance vocale et vous renvoyer le texte sur cette page.

Le travail peut être long!
Pour un enregistrement de 15m, prévoir 3mn (en gros diviser par 5 le temps du son pour trouver le temps du traitement)
Les enregistrements sont aussitôt détruits, et les textes ne sont pas conservés.

Voici le fichier de substitutions qui est utilisé:

Ce fichier de substitution permet de dire la ponctuation à la voix
# Autant que possible le système mettra les majuscules au déut des phrases

# Remplace tous les sauts de lignes par des espaces
sed -i ':z;N;s/\n/ /;bz' $1

sed -i -z '{
    s/nouveau paragraphe/\n\t/g;
    s/point-virgule/;/g;
    s/ ;/;/g;
    s/deux points/:/g;
    s/ :/:/g;
    s/point d.interrogation/?/g;
    s/ ?/?/g;
    s/mettre un point/./g;
    s/ \././g;
    s/virgule/,/g;
    s/ ,/,/g;
    s/point d.exclamation/!/g;
    s/ \!/!/g;
    s/points de suspension/.../g
    s/ \.\.\./.../g;
    s/ouvre les guillemets/«/g;
    s/« /«/g;
    s/ferme les guillemets/»/g;
    s/ »/»/g;
    s/ouvre une parenth.se/(/g;
    s/( /(/g;
    s/ferme une parenthèse/)/g;
    s/ )/)/g;
    s/ouvre une accolade/{/g;
    s/{ /{/g;
    s/ferme une accolade/}/g;
    s/{ /{/g;
    s/ouvre les crochets/[/g;
    s/\[ /[/g;
    s/ferme les crochets/]/g;
    s/ \]/]/g;
    s/long tire./—/g;
    s/signe du paragraphe/§/g;
    s/signe du dollar/$/g;
    s/signe de la livre/£/g;
    s/signe de l.euro/€/g;
    s/signe de l.art aux bases/@/g;
    s/signe du di.se/#/g
    s/signe de l.ast.risque/*/g;
    s/signe du pourcentage/%/g;
    s/signe au carr./²/g;
    s/signe au cube/³/g}' $1

# Met une majuscule au premier mot de la ligne (même s'il y a des espaces ou des signes de tabulation avant)
sed -i 's/^\([\t ]*\)\(.\)/\1\u\2/g' $1

# Met une majuscule après le ., le ? et le ! (a fortiori après ...)
sed -i 's/\([\.\!\?] \)./\U&/g' $1