esup-pod

Arborescence des pages

Comparaison des versions

Légende

  • Ces lignes ont été ajoutées. Ce mot a été ajouté.
  • Ces lignes ont été supprimées. Ce mot a été supprimé.
  • La mise en forme a été modifiée.

...

Les fichiers peuvent être téléchargés sur le site du projet : https://github.com/coqui.-ai/STT-models

Bloc de code
pod@podv3:/usr/local/django_projects/transcription/model_fr/stt$ ll
-rw-r--r-- 1 pod pod        248 nov.  14 21:14 alphabet.txt
-rw-r--r-- 1 pod pod  189372825 nov.  15 09:12 model.pbmm
-rw-r--r-- 1 pod pod  1007576678 nov.  15 08:42 fr-cvfr-2-prune-kenlm.scorer
-rw-r--r-- 1 pod pod  47500492 nov.  15 08:54 model.tflite

Dans le fichier custom/settings-local.py, il suffit d’ajouter les paramètres suivant:

 

Pour Pod à partir de la version 3 avec fr et en :

...

Bloc de code
languagebash
(django_pod3) pod@:/path/to/project/django_projects/transcription/fr/vosk/$ sudo apt-get install unzip
(django_pod3) pod@:/path/to/project/django_projects/transcription/fr/vosk/$ unzip vosk-model-fr-0.6-linto-2.2.0.zip

 

Dans le fichier custom/settings-local.py, il suffit d’ajouter les paramètres suivants (a préciser egalement sur les frontaux pour qu'il puisse lister les langue/model de dispo depuis la 3.3.1) :

Pour Pod avec Vosk en fr :

...

Les modèles utilisés pour l’enrichissement du modèle peuvent être stockés dans /path/to/project/django_projects/compile-model

 

Il faut télécharger le modèle de compilation correspondant sur ce lien : https://alphacephei.com/vosk/lm#update-process.

...

Bloc de code
languagepy
ACTIVE_ENRICH = True
MODEL_COMPILE_DIR = "/path/to/project/django_projects/compile-model"


Whisper (v3.5.0)

Sur les encodeurs :


Bloc de code
languagebash
pip install openai-whisper

ou si vous souhaitez bénéficier des derniers commits 

Bloc de code
languagebash
pip install git+https://github.com/openai/whisper.git

Exemple de configuration du custom/settings_local :

Bloc de code
languagepy
TRANSCRIPTION_TYPE = "WHISPER"

TRANSCRIPTION_MODEL_PARAM = {
	'WHISPER':{
		'fr': {
			'model': "small",
			'download_root': "/pod-transcription/transcription/whisper/",
		},
		'en': {
			'model': "small",
			'download_root': "/pod-transcription/transcription/whisper/",
		}
	}
}

Voir détails ici pour le choix du modèle
Le small n'est pas plus gourmand que vosk et est déjà performant