Transformation automatique de la parole

Lieferzeit: Lieferbar innerhalb 14 Tagen

95,90 

Etude des transformations acoustiques

ISBN: 3841626696
ISBN 13: 9783841626691
Autor: Mesbahi, Larbi
Verlag: Presses Académiques Francophones
Umfang: 180 S.
Erscheinungsdatum: 31.12.2013
Auflage: 1/2013
Format: 1.1 x 22 x 15
Gewicht: 286 g
Produktform: Kartoniert
Einband: KT
Artikelnummer: 6090263 Kategorie:

Beschreibung

Le travail effectué s'insère dans le cadre de la conversion automatique de la voix. La problématique est de modifier le signal d'un énoncé pour qu'il soit perçu comme prononcé par une autre personne. Parmi les applications, on peut noter: l'apprentissage des langues étrangères, le contrôle biométrique, la correction des voix pathologiques et le divertissement. Plusieurs techniques sont utilisées tels que les HMMs (Hidden Markov Model), les réseaux de neurones ou les GMMs (Gaussian Mixture Model). Un aspect de ce travail explore différentes stratégies d'apprentissage des fonctions de conversion. La première piste suivie est la réduction du nombre des paramètres libres de la fonction de conversion par GMM. La deuxième propose une alternative aux fonctions de conversion linéaires basées sur les GMMs en recourant aux modèles de transformation non-linéaire à base de réseaux de neurones (RBF, Radial Basis Functions). Une partie du travail est consacrée à l'alignement des données utilisées pour apprendre les modèles de voix et les transformations. En dernier, la prise en compte de l'aspect phonétique s'avère une solution efficace pour l'amélioration des systèmes de conversion de voix.

Autorenporträt

Larbi mesbahi a obtenu son doctorat en informatique à l'université de Rennes 1 et son diplôme de master 2 de recherche à l'université de Montpellier 2. Il a effectué ses recherches à l'INRIA et à l'IRISA, ses travaux sont reliés à la technologie de la parole et la robotique mobile. Actuellement, il continue ses recherches à l'IFSTTAR de Lille.

Das könnte Ihnen auch gefallen …