Centre de Recherche en Ethnomusicologie

ANR DIADEMS

Programmes en cours

ANR DIADEMS

Analyse d'un extrait de flûte Nar du Rajasthan
Analyse d'un extrait de flûte Nar du Rajasthan

Analyse d'un extrait de flûte Nar du Rajasthan
Partenaires : MNHN, LAM, IRIT, LABRI, LIMSI 

Responsable CREM : Joséphine Simonnot

Le projet ANR DIADEMS (2013-2015), pour Description, Indexation, et Accès aux Documents Ethnomusicologiques et Sonores, est un partenariat entre le LESC, le MNHN, le LAM et plusieurs laboratoires de traitement du signal et d'informatique (IRIT, LABRI, LIMSI) spécialisés dans l'analyse du son. Ce projet apportera des outils d'indexation des contenus audio (appliqués aux documents sonores et audiovisuels) qui pourront faciliter le traitement semi-automatique des archives, notamment la détection de zones de parole et de musique, la reconnaissance de locuteurs, l'identification de segments, l'identification de types musicaux (musique instrumentale, voix a cappella, voix et instruments, types d'instrument), la recherche de similarités (mélodique, rythmique, de timbre), la délimitation des zones intermédiaires (discours rituels, psalmodies, parlé-chanté).

Cette collaboration avec les équipes d'informaticiens et d'acousticiens s'accompagnera d'une part d'une réflexion sur les classifications et les terminologies de descriptions, notamment des types d'exécutions vocales, et d'autre part sur la visualisation des résultats d'analyses, les usages et l'ergonomie de la plateforme Telemeta du CREM, la modélisation et la représentation des formes musicales.

Detection of spoken voices in a song
Detection of spoken voices in a song

Detection of spoken voices in a song
Le Laboratoire d'Ethnologie et de Sociologie Comparative (LESC) comprenant le Centre de Recherche en Ethnomusicologie (CREM) et le centre d'Enseignement et de Recherche en Ethnologie Amérindienne (EREA) ainsi que le Laboratoire d'Eco-anthropologie du Muséum National d'Histoire Naturelle (MNHN) et l'équipe Lutherie, Acoustique et Musique (LAM) sont confrontés à la nécessité d'indexer les fonds sonores qu'ils gérent et de faire un repérage des contenus, travail long, fastidieux et coûteux.

Lors de l'Ecole d'Été interdisciplinaire (Sciences et Voix 2010) organisée par le CNRS, une convergence d'intérêts s'est dégagée entre les acousticiens, les ethnomusicologues et les informaticiens : il existe aujourd'hui des outils d'analyse avancés du son développés par les spécialistes en indexation qui permettent de faciliter le repérage, l'accès et l'indexation des contenus.

Le contexte du projet est l'indexation et l'amélioration de l'accès aux fonds d'archives sonores du LESC : le fonds du CREM et celui d'ethnolinguistique de l'EREA (« chanté-parlé » Maya, ainsi que celui du MNHN (musique traditionnelle africaine). Il s'inscrit dans la continuité d'une réflexion entreprise en 2007 pour l'accès aux données sonores de la Recherche : aucune application n'existant en « open source » sur le marché, le CREM-LESC, le LAM et la Phonothèque de la MMSH d'Aix-en Provence ont étudié la conception d'un outil innovant et collaboratif qui répond à des besoins « métier » liés à la temporalité du document, tout en étant adapté à des exigences du secteur de la recherche. Avec le soutien financier du Très Grand Equipement (TGE) ADONIS du CNRS et du Ministère de la Culture, la plateforme Telemeta développée par Guillaume Pellerin de la société PARISSON a été mise en ligne en mai 2011 : http://archives.crem-cnrs.fr.

Sur cette plateforme, des outils d'analyse élémentaires de traitement de signal sont d'ores et déjà disponibles. Cependant, il est nécessaire de disposer d'un ensemble d'outils avancés et innovants pour une aide à l'indexation automatique ou semi-automatique de ces données sonores, issues d'enregistrements parfois longs, au contenu très hétérogène et d'une qualité variée.

L'objectif du projet DIADEMS est de fournir certains des outils, de les intégrer dans Telemeta, en répondant aux besoins des usagers. Il s'en suit une complémentarité des objectifs scientifiques des différents partenaires :

  • Les fournisseurs de technologies, l'IRIT, le LIMSI, le LaBRI et le LAM auront à :
    • Fournir des technologies existantes telles que la détection de parole, de musique, la structuration en locuteurs. Ces outils visent à extraire des segments homogènes d'intérêt pour l'usager. Ces systèmes auront à faire face à la diversité des bases qu'il est proposé d'étudier dans ce projet ; leur hétérogénéité est liée aux conditions d'enregistrement, au genre et à la nature des documents, à leur origine géographique. Il faudra adapter ces systèmes dits « état de l'art » aux besoins des usagers
    • Proposer des outils innovants d'exploration du contenu de segments homogènes. Les travaux sur l'opposition voix parlée-déclamée-chantée, le chant, les tours de chant, la recherche de similarité musicale ne sont pas matures. Un véritable travail de recherche reste à faire et avoir à sa disposition des musicologues et des ethnomusicologues est un atout positif.
  • Les ethnomusicologues, ethnolinguistes, acousticiens spécialistes de la voix et les documentalistes spécialisés vont jouer un rôle important dans le projet en tant que futurs utilisateurs des outils d'indexation :
    • Les documentalistes doivent s'approprier les outils et apporter leur expérience afin d'adapter ces outils à leur besoin en indexation. Un échange important doit se réaliser entre celui qui fournit l'outil, celui qui l'intègre et celui qui l'utilise. L'effort doit être porté sur la visualisation des résultats avec pour fin une aide forte à l'indexation en la rendant de fait semi-automatique
    • Pour l'ethnomusicologue et l'anthropologue, l'objectif va au-delà de l'indexation. Il s'agit au travers d'aller et retour entre lui et les concepteurs de technologies de cibler les outils pertinents d'extraction d'information.
Logo CNRS

Agenda

Le 29/05/2017
l-histoire-culturelle-du-cri-le-langage-des-emotions-et-la-technologie-de-la-voix-haute-par-ana-lidia-dominguez-ruiz-seminaire-du-crem-du-lundi-29-mai-mae-14h-16hL'histoire culturelle du cri : le langage des émotions et la technologie de la voix haute Séminaire du CREM, lundi 29 mai de 14h à 16h, à la MAE (Université Paris Nanterre), salle 308 Ana Lidia Domínguez Ruiz   Le cri est la première émission vocale de l'être humain et l'unique expression... [Lire la suite]
Le 12/06/2017
Les puits chantants d'Arabie orientale: la pratique du Zamat au Sultanat d'Oman Séminaire du CREM avec Maho Sebiane Lundi 12 juin de 14h à 16h à la MAE (Université Paris Nanterre), salle 308   Dans la plaine côtière semi-désertique du nord du Sultanat d’Oman, l’apport en eau douce dépend... [Lire la suite]