Beschreibung
Dans une première partie, partant dune discrimination parole/musique/bruit, la segmentation est abordée. Pour la parole, la segmentation en locuteurs permet dappréhender leur rôle au sein dun document et leurs interactions. Concernant la composante musique, elle seffectue à travers la discrimination monophonique/polyphonique, la détection du chant et du chur à lunisson. Afin daller au-delà de ces segmentations primaires, les zones de superpositions sont étudiées aussi bien en parole quen musique. Enfin létude de la composante bruit est initiée par lanalyse des applaudissements, des rires et des sons deau. Dans une seconde partie, le couplage avec la vidéo est abordé. Celui-ci permet deux types de segmentation: lun autour des intervenants, lautre autour de la similarité. Dans un premier temps, les intervenants sont ainsi détectés et caractérisés afin de structurer les documents audio-vidéo soit en programmes dans le cas denregistrements de télévision, soit en activités dans le cas denregistrements de la vie quotidienne. Dans un second temps, la similarité autour des documents est étudiée afin de ' chapitrer ' (structurer) tout type de document en zones homogènes.
Autorenporträt
Julien Pinquier a obtenu un doctorat, spécialité Informatique, en 2004. Depuis 2005, il est Maître de Conférences à l'Université Paul Sabatier (IRIT). Il a obtenu son HDR en 2014. Ses travaux actuels portent sur la segmentation sonore (parole, musique et sons environnementaux) et audiovisuelle.
Herstellerkennzeichnung:
BoD - Books on Demand
In de Tarpen 42
22848 Norderstedt
DE
E-Mail: info@bod.de




































































































