Cloner une voix en temps réel, en moins de 5 secondes
Un ingénieur en informatique réalise un outil capable de cloner une voix et de produire un discours arbitraire en temps réel… en 5 secondes !
Cloner une voix, une image, un son … rien de plus simple avec l’informatique. Cloner une image et un son pour leur faire dire n’importe quoi, cela devient « presque » facile : Les derniers exemples en date sont… parlant.
Souvenez-vous de ces personnes crées de toute pièce. Hommes, femmes et enfants qui n’existent pas mais dont les images sont ultra réalistes.
Côté vidéo truquée, Mark Zuckerberg, le 11 juin 2019 sur Instagram. Du Deep fake efficace qui fait dire au jeune milliardaire des énormités. Il contrôlerait des milliards de données personnelles volées. Un trucage vidéo réalisé par l’artiste britannique Bill Posters.
Voir cette publication sur Instagram
La société Deep Trace indiquait, il y a peu, la présence 12 000 fausses vidéos diffusées sur Internet.
Cloner et reproduction en temps réel
Il y a quelques jours, un ingénieur Belge du nom de Corentin Jemine diffusait sur Github un code en Python d’une efficacité redoutable. Un clonage vocal exploitant le SV2TTS . Une voix reproduite qui permet, en 5 secondes, de générer un discours arbitraire en temps réel.
N’hésitez pas à consulter la thèse de ce chercheur (Université de Liège – Faculté des Sciences appliquées) si vous êtes curieux, ou si vous recherchez des informations non encore documentées.
Comme l’indique sa thèse « Nous pensons que des formes de clonage vocal seront disponibles dans un proche avenir« .
SV2TTS est un framework d’apprentissage approfondi en trois étapes qui permet de créer une représentation numérique d’une voix à partir de quelques secondes d’audio, et de l’utiliser pour conditionner un modèle de synthèse vocale conçu pour être généralisé à de nouvelles voix. (merci tbz)
Pingback: ZATAZ Fraude au faux virement: les pirates imitent la voix du patron - ZATAZ