La voix, un instrument de timbre
Comment joue-t-on du timbre vocal ?

par Nathalie Henrich Bernardoni & Michèle Castellengo


Dans l’univers de la musique, la voix humaine est une source sonore « à part ». Elle est l’expression d’un instrument vivant, d’un instrument incarné dont le son n’est jamais totalement stable et porte l’empreinte, immédiatement reconnaissable, de la trace spectrale des résonances vocaliques. 
Comme pour toute pratique instrumentale, le chanteur développe et travaille sa voix. Luthier de son propre instrument, il le façonne au sein d’une culture donnée, musicale, vocale, mais aussi linguistique, en quête d’une esthétique personnelle ou partagée collectivement.

Le timbre vocal est l’expression sonore de son jeu d’équilibriste habile, entre souffle, mouvements et résonances. Le chanteur peut sélectionner un mode d’émission par le choix du mécanisme laryngé dans lequel il s’exprime, jouer sur les contrastes – comme dans les techniques de yodel et de tahrir – ou au contraire les continuités mélodiques, en coordination et interactions avec les résonances vocaliques de sa langue. Il forge l’identité de son timbre harmonique, comme le montre le chant féminin bulgare. La musique naît des jeux vocaliques, des choix de tessitures et du nombre infini des ornementations : c’est une musique des variations de timbre, superbement illustrée par les nombreuses facettes du chant diphonique. Le chanteur tout entier est un instrument de timbre.

Les pratiques polyphoniques offrent encore d’autres possibilités de jeu sur le timbre vocal, par la combinaison de plusieurs timbres dont chacun conserve sa spécificité (polyphonie des pygmées Aka), ou qui s’unissent pour faire surgir une voix, comme celle de la quintina dans le chant polyphonique traditionnel de Sardaigne, ou encore qui élaborent une registration des tessitures et des timbres vocaliques selon un rituel immémorial comme celui de la polyphonie Bunun.

Ces pratiques vocales mises en lumière et disséquées sous le regard de l’analyse acoustique et physiologique sont tout à la fois uniques et plurielles. Toutes témoignent par leurs spécificités, de l’extraordinaire plasticité de l’instrument vocal humain, de la richesse des expressions et de la pluralité des timbres de la voix. 

Pour en savoir plus sur ce qui fait le timbre d’une voix, suivez le lien: 
La voix, un instrument de timbre 
Pour plonger dans le geste de l’instrumentiste-instrument:
Le geste vocal dans sa complexité

La voix est toujours modifiée en vue d’un effet perceptif. La plupart des études sur le timbre de la voix chantée traitent du chant savant occidental de l’adulte, pour lequel l’effet perceptif recherché est celui d’une qualité globale homogène développée sur l’ensemble de la tessiture du chanteur, tout en respectant au mieux la reconnaissance des voyelles. L’étude des qualités vocales développées au sein de diverses cultures musicales du monde nous offre l’occasion de découvrir une grande diversité de création de timbres : le souhait d’une qualité générale du son, comme la clarté, la brillance ; la maîtrise d’une rupture mélodique par changement de mécanisme laryngé et le choix de voyelles qui en facilitent la rupture et contribuent à la saillance perceptive; l’émergence d’une mélodie spectrale qui vient se superposer à la mélodie tonale, l’accompagnant ou l’éclipsant.  

Mise en ligne : décembre 2021

 
Découvrez la diversité des jeux du timbre vocal par quelques exemples :
(cliquez sur ce lien)

  • Ajustements pour une qualité de timbre : cas d’un chant féminin de Bulgarie
  • Ruptures mélodiques et ornementations : le yodel et le tahrir
  • Emergence d’une mélodie spectrale en monophonie : le chant diphonique
  • Emergence d’une mélodie spectrale en polyphonie :
    cas de la quintina d’un chant liturgique sarde, le «jesu»
  • Registration vocalique des chanteurs d'une polyphonie Aka
  • Un art du timbre vocalique : la polyphonie Bunun du pasi but but 


 La voix, un instrument de timbre     

La voix humaine est par essence un instrument de timbre, c’est-à-dire un instrument offrant des possibilités infinies de variations de son timbre. Mais qu’est-ce que le timbre ?
Du point de vue acoustique, le timbre n’est pas un paramètre que l’on peut mesurer objectivement – comme la fréquence ou l’amplitude – mais un ensemble de propriétés des sons discriminées par les auditeurs, lesquelles correspondent à deux attitudes d’écoute.
La première attitude d'écoute, quasi instinctive, nous permet de reconnaître en un temps très bref ce qui a produit le son : la frappe d’une cloche ou d’une corde de piano, le son d’une voix humaine ou animale. C’est le timbre identitaire lié essentiellement au mode de production du son.
La deuxième attitude d'écoute s’établit lorsque nous entendons différentes productions d’un même type de source : voix ou instrument. Nous portons alors attention aux différences de qualité entre les sons et aux effets ressentis à leur écoute : c’est le timbre qualitatif et c’est généralement dans ce sens que les musiciens parlent du timbre, l’art d’un instrumentiste étant justement d’apprendre à varier à l’infini les qualités des sons que permet de produire une source instrumentale ou vocale (Castellengo 2015 : 287-296).
Remarquons tout d’abord que les recherches acoustiques sur le timbre concernent soit les instruments de musique, soit la voix parlée ou chantée. Alors en quoi la voix humaine tient-elle une position exceptionnelle dans l’étude du timbre ? Parce qu’il s’agit d’un « instrument vivant », qui offre une plasticité exceptionnelle à tous les niveaux de la production du son : de la naissance du son (bruits de souffle ou sons harmoniques, entretenus ou percutés) jusqu’aux transformations spectrales extraordinaires que permettent les organes articulateurs de la langue, du voile du palais et de la bouche. Avec la voix humaine nous pouvons imiter une infinité de sons instrumentaux, animaux, des bruits de toutes sortes sans apport extérieur.
Face à une telle diversité, quels sont alors les indices identitaires d’une voix humaine ? Ce sont la reconnaissance dans le spectre de la trace sonore des résonances du conduit vocal par lesquelles nous percevons des voyelles et, lors d’une production chantée, la sensation instinctive d’un son harmonique vivant – un son qui bouge imperceptiblement sans être instable – qualités qu’il est bien difficile d’introduire dans une synthèse sonore. 

retour à l'article


 Le geste vocal dans sa complexité      

Pour produire un son vocal, l’« instrumentiste-instrument » ajuste et coordonne un ensemble de gestes. La maîtrise de ce contrôle gestuel peut constituer l’apprentissage de toute une vie, ou être induite tout naturellement par l’imprégnation dans une culture vocale environnante.
La complexité du geste vocal provient des différents niveaux de son contrôle et de leurs interactions. La voix humaine est tout d’abord un instrument à vent, que l’instrumentiste vocal contrôle par son souffle. Selon la pression d’air expirée au moment du jeu vocal, le son sera plus ou moins fort, plus ou moins timbré. Cette pression d’air est une énergie aérodynamique qui est transmise et se transforme en énergie mécanique pour mettre en mouvement des structures dans le conduit vocal, depuis le larynx jusqu’aux lèvres, puis en énergie acoustique pour produire des sources sonores (Henrich 2012). La phonation est ainsi le résultat d’une interaction forte entre de l’air expiré de façon contrôlée et les parois mobiles que sont les plis laryngés (plis vocaux1, plis vestibulaires, plis aryépiglottiques).
Si ces gestes sont invisibles pour nos yeux, leur signature acoustique est bien visible pour nos oreilles, qui les captent et les interprètent. Le mouvement régulier, très rapide et répété de mise en contact puis d’écartement des bords libres des plis vocaux se traduit acoustiquement par un signal périodique de fréquence fondamentale f0, ayant de l’énergie acoustique répartie dans un ensemble de fréquences dites harmoniques, en relation les unes avec les autres : le premier harmonique H1 (Titze et al., 2015) et tous ses multiples (Hn = n*f0). C’est la source glottique, en référence à cet espace entre les deux plis vocaux que constitue la glotte. A l’écoute d’un tel son, nous percevons une hauteur, dite hauteur tonale, qui est en lien avec la fréquence du premier harmonique2 (Castellengo 2015).
D’autres plis laryngés que les plis vocaux peuvent également participer du jeu vocal. Dans de nombreuses cultures vocales à travers le monde, nous trouvons le rapprochement, la mise en contact et la vibration des plis vestibulaires3. Bien qu’étant des oscillateurs moins performants que les plis vocaux, ces deux plis laryngés peuvent, lorsqu’ils sont suffisamment rapprochés l’un de l’autre, se mettre à auto-osciller en interaction avec le flux d’air. Leur rapprochement et leur éventuelle mise en contact interagissent avec l’auto-oscillation des plis vocaux. Ainsi, un contact vestibulaire tous les deux cycles glottiques entraîne un doublement de la période du cycle glottique, puisqu’un cycle glottique sur deux est altéré. Cela se traduit directement sur le spectre harmonique qui présente alors un premier harmonique à l’octave inférieure (f0/2) avec tous ses multiples.
La source glottique traverse différents espaces dans son parcours, ceux qui sont internes à notre instrument (le conduit vocal, composé de diverses cavités : supra-laryngée, pharyngée, buccale et éventuellement nasales) et l’espace extérieur jusqu’à nos oreilles. Tous vont laisser leur empreinte sur le son initial en modifiant la répartition d’énergie acoustique dans les harmoniques. Ces empreintes proviennent des propriétés de résonance des cavités. Le terme « formant » est parfois utilisé pour désigner ces zones spectrales renforcées. D’autres sources sonores vont éventuellement se rajouter à la source glottique, en particulier des bruits de friction lors de constrictions, de plosion lors du relâchement d’une occlusion, de turbulence lors de la rencontre d’un obstacle comme les dents, les lèvres. Nous pouvons ajouter ici que notre perception sera également très sensible à la façon douce ou rapide dont le son débute et prend fin.
Il existe ainsi différentes façons de faire varier l’énergie acoustique dans les harmoniques et donc de jouer sur leur saillance perceptive. Le premier ajustement possible est global, contrôlé par l’énergie mise dans le souffle expiré. Plus la pression ou le débit d’air en entrée de l’instrument est élevé, plus le niveau sonore est fort et, le plus souvent, le nombre des harmoniques augmente, de même que leur amplitude. Le contrôle global du gain peut être modulé par la résistance que le larynx oppose au souffle. Plus les plis vocaux sont contractés et fermement accolés, plus l’air doit « pousser fort » pour se frayer un passage. La phase de fermeture, selon qu’elle est douce ou abrupte, tend à modifier l’énergie des harmoniques de rang élevé : une remise en contact douce favorise l’énergie dans les premiers harmoniques de la voix, une remise en contact rapide favorisera l’énergie dans le second harmonique et, au-delà, au détriment du premier harmonique (Henrich 2001). La façon dont les plis vocaux s’accolent et auto-oscillent dépend des caractéristiques vibromécaniques des plis. Ainsi nous appelons mécanismes laryngés M1 et M2 des ajustements du vibrateur laryngé pour lesquels les plis vocaux sont épais (M1) ou minces (M2), reflétant par leur géométrie des couplages ou des dissociations au sein de la microstructure fibreuse et multicouche des plis (Roubeau et al. 2009). Une production vocale en mécanisme M2 se traduit systématiquement par une saillance du premier harmonique par rapport aux autres harmoniques, tandis qu’une production en M1 peut permettre de renforcer notablement le second harmonique.
Si les ajustements biomécaniques du vibrateur laryngé conditionnent le contenu harmonique de la source vocale, les gestes articulatoires comme le mouvement de la langue, l’ouverture de la bouche, l’élévation du velum ou l’abaissement laryngé vont également avoir une incidence majeure sur le spectre harmonique (Henrich Bernardoni 2014). Quand une cavité résonne, toute fréquence à proximité des fréquences de résonance est amplifiée, toute fréquence en dehors est atténuée. Dans le cas d’un signal vocal, les harmoniques dont les fréquences sont situées à proximité des fréquences de résonance (ou zone formantique) sont renforcés par rapport à ceux qui s’en trouvent éloignés. Prenons un cas concret, celui d’un son vocal ayant pour hauteur la3, ce qui revient à dire que la fréquence du premier harmonique vaut 440 Hz et celle du second 880 Hz. Si la fréquence d’une résonance R1 est à proximité de 440 Hz, par exemple fR1=400 Hz, elle contribue à amplifier le premier harmonique. Si elle se situe à distance, par exemple fR1=600 Hz, elle ne contribue pas grandement à l’amplification du premier harmonique, ni à celle du second. Néanmoins, si elle se situe à fR1=800 Hz, elle contribue à renforcer le second harmonique, au détriment du premier.
À ce stade, il est temps d’introduire la notion de voyelle : notion linguistique complexe s’inscrivant entre production et perception. Les voyelles sont des sons que l’être humain produit pour s’exprimer verbalement en utilisant des gestes articulatoires précis, semblables d’un individu à l’autre par leurs lieux et modes d’articulation. Ce sont des composants de la parole, qui vont être perçus et décodés pour comprendre ce qui est dit. La perception d’une voyelle dépend du système phonologique de l’auditeur, c’est-à-dire de la langue qu’il a apprise. Si une voyelle ne figure pas dans son système phonologique, l'auditeur aura du mal à la percevoir comme différente d’une autre voyelle acoustiquement proche et aura également du mal à la produire. C’est par exemple le cas des voyelles non natives /y/ et /ø/ pour des italophones apprenants du français (Cornaz 2014). Les voyelles de la parole se projettent sur un espace à deux ou trois dimensions dont les dimensions principales sont les fréquences des deux premières résonances ou celles des deux premiers formants F1 et F2 qui les constituent. Cet espace acoustique a son pendant articulatoire : le degré d’ouverture de la bouche4 et le point d’articulation, avant ou arrière5 (fig. 1). Les caractéristiques acoustiques des voyelles, en particulier les fréquences des deux premiers formants F1 et F2 qui permettent de les discriminer, dépendent des gestes articulatoires et également, dans une moindre mesure, de la morphologie de la personne (enfant, adulte), du genre (femme, homme) et de sa famille linguistique. 

  

 Fig. 1 : Les voyelles orales du français, représentées par leur projection dans l’espace acoustique (deux premiers formants F1-F2)
ou l’espace articulatoire (degré d’ouverture de la bouche – point d’articulation). D’après Castellengo 2015 : 452-457.

Le chant combine la contrainte d’une mélodie, dont découlent les fréquences des harmoniques, à celle de l’expression d’un texte, avec des voyelles qui imposent des plages de variations possibles mais restreintes pour les fréquences de résonance. 

retour à l'article

Notes 

  1. communément appelés "cordes vocales"
  2. Cette fréquence est dite « fondamentale ». Du point de vue temporel, elle correspond à la fréquence de répétition du mouvement vibratoire.
  3. Le terme « vestibulaire » provient de la nomenclature anatomique moderne. Ces plis peuvent également être désignés sous les termes de « bandes ventriculaires » ou « fausses cordes vocales ». Ce sont des plis situés au-dessus et à proximité des plis vocaux. Pour plus de détails sur leurs propriétés vibratoires et leurs usages dans la parole et le chant, voir la thèse de Lucie Bailly (2009) ou l’article de Bailly et al. (2014).
  4. Pendant articulatoire de l’axe acoustique selon F1.
  5. Pendant articulatoire de l’axe acoustique selon F2. 



Références
 

AROM Simha  •  « The use of play-Back Techniques in the Study of Oral Polyphonies », Ethnomusicology XX/3 : 483-519  [1976]. 
BAILLY Lucie  • Interaction entre cordes vocales et bandes ventriculaires en phonation: exploration in-vivo, modélisation physique, validation in-vitro. Thèse de Doctorat de l’Université du Maine  [2009]. URL : https://tel.archives-ouvertes.fr/tel-00416587
BAILLY Lucie, Nathalie HENRICH BERNARDONI et Xavier PELORSON  • « Vocal fold and ventricular fold vibration in period-doubling phonation: Physiological description and aerodynamic modeling », The Journal of the Acoustical Society of America 127(5) : 3212-3222  [2010].
BAILLY Lucie, Nathalie HENRICH BERNARDONI, Franck MÜLLER, Anna-Katharina ROHLFS et Markus HESS  •  « The ventricular-fold dynamics in human phonation », Journal of Speech, Language, and Hearing Research 57 : 1219-1242  [2014].
CASTELLENGO Michèle  • « Continuité, rupture, ornementation. Ou les bons usages de la transition entre deux modes d’émission vocale », Cahiers de musiques traditionnelles 4 http://journals.openedition.org/ethnomusicologie/1583, [1991].  •  « Perception(s) de la voix chantée : une introduction », in Henrich Bernardoni, dir. : La voix chantée, entre sciences et pratiques. Louvain-la-Neuve : Ed. De Boeck, Coll. Voix parole langage (Solal) : 35-64 [2014].  •  Ecoute musicale et acoustique : avec 420 sons et leurs sonagrammes décryptés. Paris: Eyrolles [2015]. 
CASTELLENGO Michèle, Jean DURING et Nathalie HENRICH BERNARDONI  •  « Electroglottographic assessment of Tahrir, a Persian vocal technique », International Conference on Voice Physiology and Biomechanics ICVPB2020 December Edition, Grenoble, France [2020].
CASTELLENGO Michèle et Nathalie HENRICH BERNARDONI  •  « Interplay between harmonics and formants in singing: when vowels become music », International Symposium on Musical Acoustics, Jul. 2014, Le Mans, France.
CASTELLENGO Michèle, Sylvain LAMESCH et Jean DURING  •  « Laryngeal mechanism change and frequency jump : the Persian tahrir », Poster presented at the 8th international conference PEVOC, Dresden, Germany [2009].
CURTET Johanni, Nathalie HENRICH BERNARDONI, Michèle CASTELLENGO, Christophe SAVARIAUX et Pascale CALABRESE  •  « L'art du Khöömii mongol ». Actes des Rencontres Nationales de Recherches en Musique. Paris : Ministère de la Culture (en cours d'édition) [2021].
CASTELLENGO Michèle, Bernard LORTAT-JACOB et Gilles LÉOTHAUD  •  « Pitch perception : five voices with four Sardinian singers », International Symposium on Musical Acoustics, Perugia, Italy [2001].
CURTET Johanni    La transmission du höömij, un art du timbre vocal : ethnomusicologie et histoire du chant diphonique mongol. Thèse de doctorat, Université Rennes 2 [2013].
DARGIE Dave  • « Thembu Xhosa umngqokolo overtone singing: the use of the humain voice as a type of "musical bow" ». Conférence présentée à l'International Concil or Traditionnal Music (ICTM), Berlin  [1993].
FÜRNISS Susanne  •  « La technique du jodel chez les Pymées Aka (Centrafrique). Étude phonétique et acoustique », Cahiers de musiques traditionnelles 4[1991].
HENRICH Nathalie  •  Etude de la source glottique en voix parlée et chantée : modélisation et estimation, mesures acoustiques et électroglottographiques, perception. PhD thesis, Université Paris 6  [2001]. •  « Physiologie de la voix chantée : vibrations laryngées et adaptations phono-résonantielles », in Renaud Garrel, Benoît Amy de la Bretèque & Vincent Brun, dir : La voix parlée et la voix chantée. Montpellier, Sauramps médical : 17-32 [2012].
HENRICH BERNARDONI Nathalie   « Vibrations et résonances en voix chantée », in Henrich Bernardoni, dir : La voix chantée, entre sciences et pratiques. Louvain-la-Neuve: De Boeck, Coll. Voix parole langage (Solal) : 3-20  [2014].
HENRICH Nathalie, Mara KIEK, John SMITH et Joe WOLFE  •  « Resonance strategies used in Bulgarian women's singing style : A pilot study », Logopedics Phoniatrics Vocology 32/4 : 171-177 [2006].
LAMESCH Sylvain  •  Mécanismes laryngés et voyelles en voix chantée : Dynamique vocale, phonétogrammes de paramègres glottiques et spectraux, transitions de mécanismes. Thèse, Université Paris 6  [2010].
LE GONIDEC Marie-Barbara  •  « Du patriarcat au communisme : les femmes et la musique en Bulgarie », Cahiers de musiques traditionnelles 18 : 173-182 [2005].
LORTAT-JACOB Bernard  •  Chants de Passion. Au cœur d'une Confrérie de Sardaigne. Paris : Éditions du Cerf  [1998].
ROUBEAU Bernard, Nathalie HENRICH et Michèle CASTELLENGO   « Laryngeal vibratory mechanisms : the notion of vocal register revisited » , Journal of Voice 23/4 : 425−438   [2009].
TERHARDT Ernst, Gerhard STOLL et Manfred SEEWANN  « Pitch of complex signals according to virtual-pitch theory: tests, examples and predictions », Journal of the Acoustical Society of America 71 : 671-678  [1982].
TITZE Ingo R., Ronald J. BAKEN, Kenneth W. BOZEMAN, Svante GRANQVIST, Nathalie HENRICH et al. •  « Toward a consensus on symbolic notation of harmonics, resonances, and formants in vocalization », Journal of the Acoustical Society of America 137/5 : 3005-3007  [2015].
WU Rung Shun   •  Tradition et transformation : le pasi but but, un chant polyphonique des Bunun de Taïwan. Thèse, Université Paris X, Nanterre   [1996].
ZEMP Hugo et Tràn Quang Hai « Recherches expérimentales sur le chant diphonique », Cahiers de musiques traditionnelles 4 : 27-68   [1991].

 

  Tous droits réservés ©  Michèle Castellengo et Nathalie Henrich Bernardoni / ADEM Genève / Colophon - 2021
  Remerciements à l'ADEM et Laurent Aubert.

Bannière utilisée pour cette page  (détail):
Le groupe A Filettaen répétition à Ajaccio au début des années 2000, a ressuscité les polyphonies corses grâce à sa rigueur technique et à sa capacité d'évolution.
(in
 "Un monde de musiques - Introduction aux musiques traditionnelles" - Colophon Records 2007 ©) Nicole Stolfi ) . 
(cliquez sur l'image pour l'agrandir)