esup-pod

Arborescence des pages

Comparaison des versions

Légende

  • Ces lignes ont été ajoutées. Ce mot a été ajouté.
  • Ces lignes ont été supprimées. Ce mot a été supprimé.
  • La mise en forme a été modifiée.

...

Pour découper le fichier audio de pod et faire sa transcription, nous avons besoin de Sox, il faut donc installer les deux librairies suivantes :

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install sox

...


(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install libsox-fmt-mp3

Il faut également installer le module python ffmpeg-normalize

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/pod$ pip install ffmpeg-normalize

L'ensemble du modèle peuvent être stockés dans /path/to/project/django_projects/transcription. Il convient de faire un sous-dossier par langue (I.E: fr, en etc.), et un sous-dossier par type de modèle (I.E: stt, vosk, etc.)

...

/path/to/project/django_projects/transcription/fr/vosk/vosk-model-fr-0.6-linto-2.2.0/


Info

A présent, vous pouvez choisir d'installer un des 2 modèles STT ou Vosk. Il est toutefois conseiller d'utiliser Vosk

STT (Coqui Ai)

Bloc de code
pod@podv2:/usr/local/django_projects/transcription/model_fr/stt$ ll
-rw-r--r-- 1 pod pod        248 nov.  14 21:14 alphabet.txt
-rw-r--r-- 1 pod pod  189372825 nov.  15 09:12 model.pbmm
-rw-r--r-- 1 pod pod  1007576678 nov.  15 08:42 fr-cvfr-2-prune-kenlm.scorer
-rw-r--r-- 1 pod pod  47500492 nov.  15 08:54 model.tflite

...

Par exemple pour le modèle français:

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/transcription/fr/vosk/$ wget https://alphacephei.com/vosk/models/vosk-model-fr-0.6-linto-2.2.0.zip

Il faut après avoir téléchargé le modèle, il faut le décompresser. Pour cela vous pouvez utiliser la librairie unzip:

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install unzip

...


(django_pod) pod@:/path/to/project/django_projects/pod$ unzip vosk-model-fr-0.6-linto-2.2.0.zip



Dans le fichier custom/settings-local.py, il suffit d’ajouter les paramètres suivant:

...

Par exemple pour le modèle français:

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ wget https://alphacephei.com/vosk/models/vosk-model-fr-0.6-linto-2.2.0-compile.zip

Il faut après avoir téléchargé le modèle de compilation, le décompresser. Pour cela vous pouvez utiliser la librairie unzip:

Bloc de code
(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ sudo apt-get install unzip

...


(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ unzip vosk-model-fr-0.6-linto-2.2.0-compile.zip

Il faut seulement que la structure du dossier compile-model ressemble à cela:

...