0. Introduction
L'idée que les langues exploitent différemment les possibilités articulatoires à des fins perceptives distinctives est largement répandue. Une langue induit une "posture générale" articulatoire spécifique (positions et mouvements des articulateurs ; antériorisation/ centralisation / postériorisation, précision du mouvement : monophtongaison / diphtongaison). C'est cette gestuelle articulatoire spécifique à une langue donnée (décomposée en positions exactes des articulateurs et en gestes pour aller d'une cible à l'autre) qu'on appréhende par le biais des accents étrangers, des imitations ou caricatures, en logatomes, etc.; par exemple, le français se parle "en avant", l'anglais "en arrière" est une idée largement répandue et qui trouve une certaine justification phonétique dans les systèmes eux-mêmes.

L'idée d'une "posture" spécifique à une langue a été déclinée dans le domaine de la perception. On défend généralement que, à l'instar de l'appareil phonatoire qui acquiert une posture spécifique à la langue, l'appareil perceptuel acquiert un filtre (abstrait) spécifique à la langue, permettant d'intégrer dans une même catégorie perceptive (on pourrait dire aussi fonctionnelle ou phonologique) des réalisations physiques diverses de parole (phonétiques). POLIVANOV (1931), et surtout TROUBETZKOY (1939), sont à l'origine de cette idée.
C'est ce "crible" spécifique à une langue donnée qui rendrait l'auditeur "sourd" aux catégorisations opérées par d'autres langues. L'apprentissage de sa langue maternelle par l'enfant consiste à apprendre à ignorer les variations non-distinctives. L'auditeur chercherait à faire passer des réalisations de parole dans une langue qu'il ne connaît pas par le filtre fonctionnel de sa langue maternelle. On lit fréquemment que si un apprenant d'une langue étrangère répète mal ou incorrectement un mot ou un son d’un mot de LE, c’est qu’il l’a mal entendu. On dira plutôt que l'apprenant a fait un mauvais choix parmi ce grand nombre d’informations qu’on lui a proposées, influencé par les habitudes de sa langue maternelle.

En didactique de la phonétique, cette idée s'est vue naturellement appliquée par l'élaboration d'exercices de discrimination : il s'agit d'apprendre à catégoriser perceptivement les réalisations physiques d'une langue étrangère suivant le nouveau système.

1. Le système verbo-tonal

Nous évoquerons principalement les travaux de Petar GUBERINA qui a probablement le premier lié les observations faites à partir de l'utilisation de filtres électro-acoustiques et l'enseignement et la correction de la prononciation en classe de langue.
GUBERINA débute ses observations et ses recherches dès 1934 à l’Institut de Phonétique de Zagreb, pour établir en 1952 les principes de la théorie verbo-tonale (voir cours de méthodologie). Cette théorie fondée sur la correction auditive trouverait son application aussi bien dans les domaines de la correction des déficients auditifs qu'en correction phonétique de LE. En effet, l’une des idées fondamentales du système verbo-tonal est que l’oreille normale en contact avec des sons d’une langue étrangère se comporterait comme une oreille pathologique, ce qui explique que la rééducation de l’audition et la correction de la prononciation se font d’après les mêmes principes. Ces hypothèses sont infirmées.
Au cours de ses recherches, GUBERINA constate, par le biais de l'étude des déficients auditifs, les différences spectrales des voyelles et des consonnes. En distinguant les surdités de transmission (mauvaise audition des fréquences graves issue d'un mauvais fonctionnement de l'oreille moyenne) et les surdités de perception (mauvaise audition des fréquences aiguës issue d'un mauvais fonctionnement de l'oreille interne), les erreurs commises par des déficients perceptifs des deux types susmentionnés lui permettent d'ordonner voyelles et consonnes des plus graves au plus aiguës. Pour les voyelles, l'ordre est : [u, o, a, e, i], ce qui suit, au plan acoustique, les résultats de l'analyse spectrographique (deuxième formant), et pour la phonologie, l'ordre suit les traits de Jakobson à base acoustique (aigu/grave).
Pour les consonnes [p, b, m, v, l, k, t, S, s], suivant acoustiquement les zones de fréquences des consonnes.

2. Contextes facilitants
contexte = littéralement "le texte autour", il s'agit ici des sons contigus (juste avant et juste après).
facilitants = ces contextes favorisent la perception / production des traits caractéristiques d'un son.

On retrouve certains principes du système verbo-tonal dans les ouvrages de phonétique du français à l’usage des étudiants étrangers, sous la forme des “contextes facilitants” [CALLAMAND, 1981], [KANEMAN-POUGATCH, PEDOYA-GUIMBRETIÈRE, 1991], [PAGNIEZ-DELBART, 1991-1992], [ABRY, CHALARON, 1994], [TROUTOT, 1997] . Il s’agit de présenter le son à acquérir dans un contexte renforçant un ou plusieurs traits caractéristiques du son, et en particulier le ou les traits qui ne sont pas maîtrisés par l’élève. Les traits susceptibles d’être renforcés par le contexte sont l’acuité (aigu / grave), la labialité ( arrondi / écarté), la tension (tendu / relâché).

Or, l'utilisation des contextes facilitants se justifie avant tout du point de vue articulatoire, plus que du point de vue perceptif. Par exemple, si on présente un [y] en contexte postérieur, il sera moins bien entendu car [y] a alors "perdu" ses caractéristiques antérieures. Ceci n'est pas dû à la perception mais à la réalité de production. La production du trait antérieur de [y] est bien sûr favorisé par l'antériorité du contexte.