...
Info |
---|
À présent, vous pouvez choisir d’installer un des 2 modèles STT ou Vosk. Il est toutefois conseiller conseillé d'utiliser Vosk. |
STT (Coqui Ai)
Les fichiers peuvent être téléchargés sur le site du projet : https://coqui.ai/models
...
Pour ajouter un modèle d'un autre languagelangage, ajouter une entrée comme l'exemple ci-dessous, fait pour le language langage Anglais "en" :
Bloc de code | ||
---|---|---|
| ||
# Paramétrage des modèles # * Pour télécharger les Modèles STT : https://coqui.ai/models MODEL_PARAM = { # les modèles Stt 'STT': { 'fr': { 'model': "/usr/local/django_projects/transcription/model_fr/stt/model.pbmm", 'scorer': "/usr/local/django_projects/transcription/model_fr/stt/fr-cvfr-2-prune-kenlm.scorer", }, 'en': { 'model': "/usr/local/django_projects/transcription/model_en/stt/model.pbmm", 'scorer': "/usr/local/django_projects/transcription/model_en/stt/kenlm.scorer", } } } |
...
Bloc de code | ||
---|---|---|
| ||
(django_pod)$> python manage.py shell
Python 3.7.3
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
(InteractiveConsole)
>>> video_id = 1234
>>> from pod.video import transcript
>>> transcript.main_threaded_transcript(video_id) |
...
Les fichiers pour les modèles peuvent être téléchargés sur cette page : https://alphacephei.com/vosk/models.
...
Bloc de code | ||
---|---|---|
| ||
(django_pod) pod@:/path/to/project/django_projects/pod$/transcription/fr/vosk/$ sudo apt-get install unzip (django_pod) pod@:/path/to/project/django_projects/pod$transcription/fr/vosk/$ unzip vosk-model-fr-0.6-linto-2.2.0.zip |
...
Bloc de code | ||
---|---|---|
| ||
# Transcription
USE_TRANSCRIPTION = True
## Transcription use
# * STT
# * VOSK
TRANSCRIPTION_TYPE = "VOSK"
# Paramétrage des modèles
# * Pour télécharger les Modèles Vosk : https://alphacephei.com/vosk/models
MODEL_PARAM = {
# les modèles Vosk
'VOSK':{
'fr': {
'model': "/path/of/project/django_projects/transcription/model_fr/vosk/vosk-model-fr-0.6-linto-2.2.0",
}
}
} |
...
Pour ajouter un modèle d'un autre languagelangage, ajouter une entrée comme l’exemple ci-dessous, fait pour le language langage Anglais "en" :
Bloc de code | ||
---|---|---|
| ||
# Paramétrage des modèles # * Pour télécharger les Modèles Vosk : https://alphacephei.com/vosk/models MODEL_PARAM = { # le modèle vosk 'VOSK':{ 'fr': { 'model': "/path/of/project/django_projects/transcription/model_fr/vosk/vosk-model-fr-0.6-linto-2.2.0", }, 'en': { 'model': "/path/of/project/django_projects/transcription/model_en/vosk/vosk-model-en-us-0.22", } } } |
...
Il faut télécharger le modèle de compilation correspondant sur ce lien : https://alphacephei.com/vosk/lm#update-process.
...
Maintenant il faut installer docker sur votre machine. (voir https://docs.docker.com/engine/install/debian/ ci si besoin)
Après que docker soit installé, créer un fichier entrypoint.sh et DockerFile dans un même dossier.
...
Bloc de code | ||
---|---|---|
| ||
## Build the DockerFile # docker build --tag kaldi -f DockerFile . ## ## Example of manual execution of the Docker file # sudo docker run -v ${PWD}/compile-model:/kaldi/compile-model -it kaldi ## FROM debian:10 RUN apt-get update && apt-get install -y ca-certificates \ && apt-get install -y \ python3-pip \ git \ && apt-get install -y zlib1g-dev automake autoconf unzip wget sox gfortran libtool subversion python2.7 nano libfst-tools \ && apt-get clean RUN python3 --version ENV KALDI_ROOT="/kaldi" RUN git clone https://github.com/kaldi-asr/kaldi.git $KALDI_ROOT WORKDIR $KALDI_ROOT"/tools" RUN bash $KALDI_ROOT"/tools/extras/check_dependencies.sh" RUN touch $KALDI_ROOT"/tools/python/.use_default_python" RUN bash $KALDI_ROOT"/tools/extras/install_mkl.sh" RUN apt-get install gfortran sox RUN make -j $(nproc) RUN pip3 install phonetisaurus RUN bash $KALDI_ROOT"/tools/extras/install_opengrm.sh" RUN make RUN bash $KALDI_ROOT"/tools/extras/install_irstlm.sh" RUN apt-get install gawk RUN bash $KALDI_ROOT"/tools/extras/install_srilm.sh" "unkown" "unkown" "unkown" RUN cd $KALDI_ROOT"/src" && ./configure --shared RUN cd $KALDI_ROOT"/src" && make depend -j $(nproc) RUN cd $KALDI_ROOT"/src" && make -j $(nproc) RUN cd $KALDI_ROOT"/src/fstbin" && make RUN echo "export PATH="$KALDI_ROOT"/src/fstbin:\$PATH" >> $KALDI_ROOT"/tools/env.sh" RUN cd $KALDI_ROOT"/src/lmbin" && make RUN echo "export PATH="$KALDI_ROOT"/src/lmbin:\$PATH" >> $KALDI_ROOT"/tools/env.sh" RUN cd $KALDI_ROOT"/src/tree" && make RUN echo "export PATH="$KALDI_ROOT"/src/tree:\$PATH" >> $KALDI_ROOT"/tools/env.sh" RUN cd $KALDI_ROOT"/src/bin" && make RUN echo "export PATH="$KALDI_ROOT"/src/bin:\$PATH" >> $KALDI_ROOT"/tools/env.sh" COPY entrypoint.sh /entrypoint.sh WORKDIR $KALDI_ROOT ENTRYPOINT ["/entrypoint.sh"] |
Après avoir copié et créer créé les deux fichier fichiers Dockerfile
et entrypoint.sh
il suffit de lancer la commande ci-dessous en étant dans la même dossier que les fichiers précédemment mentionnés.
...