...
Pour découper le fichier audio de pod et faire sa transcription, nous avons besoin de Sox, il faut donc installer les deux librairies suivantes :
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install sox |
...
(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install libsox-fmt-mp3 |
Il faut également installer le module python ffmpeg-normalize
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/pod$ pip install ffmpeg-normalize |
L'ensemble du modèle peuvent être stockés dans /path/to/project/django_projects/transcription. Il convient de faire un sous-dossier par langue (I.E: fr, en etc.), et un sous-dossier par type de modèle (I.E: stt, vosk, etc.)
...
/path/to/project/django_projects/transcription/fr/vosk/vosk-model-fr-0.6-linto-2.2.0/
| Info |
|---|
A présent, vous pouvez choisir d'installer un des 2 modèles STT ou Vosk. Il est toutefois conseiller d'utiliser Vosk |
STT (Coqui Ai)
| Bloc de code |
|---|
pod@podv2:/usr/local/django_projects/transcription/model_fr/stt$ ll -rw-r--r-- 1 pod pod 248 nov. 14 21:14 alphabet.txt -rw-r--r-- 1 pod pod 189372825 nov. 15 09:12 model.pbmm -rw-r--r-- 1 pod pod 1007576678 nov. 15 08:42 fr-cvfr-2-prune-kenlm.scorer -rw-r--r-- 1 pod pod 47500492 nov. 15 08:54 model.tflite |
...
Par exemple pour le modèle français:
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/transcription/fr/vosk/$ wget https://alphacephei.com/vosk/models/vosk-model-fr-0.6-linto-2.2.0.zip |
Il faut après avoir téléchargé le modèle, il faut le décompresser. Pour cela vous pouvez utiliser la librairie unzip:
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/pod$ sudo apt-get install unzip |
...
(django_pod) pod@:/path/to/project/django_projects/pod$ unzip vosk-model-fr-0.6-linto-2.2.0.zip |
Dans le fichier custom/settings-local.py, il suffit d’ajouter les paramètres suivant:
...
Par exemple pour le modèle français:
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ wget https://alphacephei.com/vosk/models/vosk-model-fr-0.6-linto-2.2.0-compile.zip |
Il faut après avoir téléchargé le modèle de compilation, le décompresser. Pour cela vous pouvez utiliser la librairie unzip:
| Bloc de code |
|---|
(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ sudo apt-get install unzip |
...
(django_pod) pod@:/path/to/project/django_projects/compile-model/fr$ unzip vosk-model-fr-0.6-linto-2.2.0-compile.zip |
Il faut seulement que la structure du dossier compile-model ressemble à cela:
...