...
COMMON VOICE :
https://voice.mozilla.org/fr/datasets
Telecharger et extraire l’archive puis executer l’importer bin/import_cv2.py du depot deepspeech
VOXFORGE :
http://www.repository.voxforge1.org/downloads/fr/Trunk/Audio/Main/16kHz_16bit/
Dans bin/import_voxforge.py remplacer l’url ligne 123 par celle ci-dessus et executer le fichier
CAITO :
https://www.caito.de/2019/01/the-m-ailabs-speech-dataset/#more-242
Telecharger et extraire l’archive, puis executer le fichier aux_db_fr.py avec 2 paramètres, le chemin du dossier d’extraction et un nom de genre (female, male ou mix)
Attention, ce fichier est brut, à utiliser avec précaution.
NB : pour le dossier Mix il faut lui créer un dossier parent de manière a avoir l’arborescence ./mix/mix/… au lieu de ./mix/…
LINGUA LIBRE :
executer la commande en supposant être dans le dossier racine du projet deepspeech
$ ./bin/import_lingua_libre ’path_to_download’ --qId 21 —-iso639-3 fra -—english-name French —-normalize (optionnel)
...