Pour la création de voicebanks pour DiffSinger, un processus de configuration nommé “labeling” (anglais “label”: étiquette) est nécessaire. Grâce à LabelMakr, on peut facilement créer des auto-labels qui serviront de base à ce labeling.
C'est quoi DiffSinger?
Enregistrer pour DiffSinger
Logiciel
Ce tutoriel expliquera l’utilisation de LabelMakr, créé par tigermeat, dans le cadre de la création d’auto-labels Millefeuille. LabelMakr permet aussi de générer des labels automatiques pour d’autres langues comme le japonais ou l’anglais.
LabelMakr requiert d’être sur Windows (seulement pour les transcriptions japonaises) et d’avoir une carte graphique NVIDIA.
Télécharger LabelMakr
Installation
Rendez-vous sur la page de Releases afin de télécharger le .zip le plus récent de LabelMakr, que vous pourrez ensuite extraire là où vous le souhaitez (évitez cependant le Bureau, les Téléchargements ou les Program Files car cela peut provoquer des conflits de permission).
Toutes les étapes nécessaires à l’installation sont dans le readme.txt présent à la racine du dossier de LabelMakr. Vous devrez d’abord lancer “installer.bat” qui téléchargera et installera tous les éléments nécessaires à l’utilisation de LabelMakr.
Une fenêtre de commande Windows s’ouvrira et vous pourrez voir l’installation en temps réel ! Cela peut prendre un certain temps, quand l’installation sera terminée vous aurez un message “SETUP COMPLETE!!!” et vous pourrez fermer la fenêtre de commande.
Transcriptions
Une fois l’installation terminée, il faut lancer run.bat qui ouvrira une console de commande Windows (à ne pas fermer, c’est elle qui contrôle le programme) et une interface qui vous permettra d’interagir avec LabelMakr. Vous pouvez directement aller dans les Settings afin de changer la langue pour avoir le logiciel en français.
Revenez à l’onglet Transcriptions et cliquez sur Ouvrir. Le dossier “corpus” s’ouvrira et vous pourrez créer ici un dossier par chanteur ou color que vous souhaitez transcrire. Glissez vos fichiers wav correctement nettoyés et traités dans les dossiers correspondants. Vous pouvez ensuite choisir FR pour la langue transcrite puis Lancer la transcription.
Une fois que le message “Completed all transcriptions!” apparaît, vous pouvez ouvrir l’Editeur de transcriptions et vérifier que les paroles ont été correctement reconnues par le logiciel.
Astuce
Faites attention, dans les transcriptions il faut toujours un espace entre les articles/pronoms avec une apostrophe et le mot suivant! Sur l’exemple ci-dessus, on notera que “l’ herbe” a un espace entre les deux mots.
Alignements
Maintenant que vous avez vérifié vos transcriptions, vous pouvez aller sur l’onglet Alignements, changer le modèle SOFA sur millefeuille et Lancer SOFA. Cette étape va aligner les phonèmes à vos fichiers audios. Une fois que vous verrez le message “Saving htk labels…” vous pourrez retrouver un dossier labels avec vos auto-labs générés sous le dossier de votre chanteur !
Et voilà ! Vous pouvez maintenant passer au labeling de votre DiffSinger. Les auto-labs ne remplacent pas l’étape de labeling mais ils permettent de la rendre beaucoup plus rapide.