Esta página está en construcción: perdonen los errores y temas inacabados.

This page is being developed: I am sorry for errors and unfinished subjects.

PERCEPCIÓN TONAL CONSCIENTE E INCONSCIENTE EN EL HABLA

(escrito con Heliane Bergé y figurando ella como primer firmante)

La entonación constituye una herramienta de múltiples usos en el habla. Todos los niveles gramaticales y no gramaticales admitidos como dominios o aspectos lingüísticos aportan sus rasgos entonativos, componiendo al fin una melodía tonal de extraordinaria complejidad: así aparecen acentos, sintagmas, temas y remas, frases de diferente modalidad, entonaciones expresivas e impresivas, alusiones a hechos y dichos pasados, etc. Y, sin embargo, el oyente casual, el hombre de la calle, educado eso sí día tras día en su percepción hablando y oyendo, conversando, percibe esas sutilezas sin esfuerzo. Existe pues una percepción tonal inconsciente (PTI) de la melodía del habla. Ahora bien, asimismo el oyente puede dirigir su atención hacia ese hecho tonal; aquí, frente a la citada sutileza y competencia, nos encontramos con que, o no se sabe qué es el tono, o, si se sabe, no se sabe describir eso

que se ha entendido con tanta facilidad. Y esta dificultad se encuentra tanto en ese hombre de la calle como en el lingüista, salvo que se haya educado el oído para ello o para actividades similares, como la música.

La utilidad de esta otra percepción tonal, consciente, (PTC) es nula para el oyente normal, que adquirió la PTI a edad temprana, y que, por lo tanto, emplea competentemente esas entonaciones al hablar y escuchar. Pero es necesaria, creemos, para el que adquiere una segunda lengua, sobre todo a edad no temprana. Con frecuencia oímos hablantes de este tipo, los cuales, dominan prácticamente sintaxis y semántica de la segunda lengua; pero que, sin embargo, yerran en la entonación, lo cual les identifica enseguida como extranjeros. La razón nos parece clara: al aprender tipos de frase en la segunda lengua, este hablante les entona con los tipos tonales correspondientes a la primera. Este hablante aprende entonces vocabulario, construcción, pero no renueva su entonación, que ha quedado grabada en el inconsciente. La PTC ayudará a quienes aprenden segundas y terceras lenguas, a percibir estos matices tonales, cuya importancia no puede ser exagerada: la entonación hace la frase como se ha dicho.


Grafico 5. Frase 4. Exclamativa Natural.	Grafico 6. Frase 7. Exclamativa Sintética.

El propósito de este estudio es comparar esa percepción tonal consciente (PTC), en la que el oído tonal se convierte en aparato de medida o al menos de comparación, con las medidas de aparatos de gran precisión tonal. Para ello, se han presentado ejemplos de la percepción tonal de un grupo de oyentes de formación universitaria, mayoritariamente españoles, y con diferente competencia tonal, un corpus de frases cortas, aisladas, con diferentes modalidades y, en un caso, diferente estructura sintáctica. Las medidas de patrones reales se realizan mediante técnicas de tratamiento de señal elaboradas en nuestro laboratorio, integradas en SETS30, análisis prosódico con gran exactitud (Sánchez, 1995) con algoritmos de medida originales (Sánchez, 1977;1979).

Se ha pasado el test de percepción tonal a un grupo de oyentes de formación universitaria, mayoritariamente españoles, y con diferencia competencia tonal consciente, en el campo lingüístico, musical, o en ambos. La grabación consistió en: 1. Corta explicación del tono, oyendo agudos, graves, subidas y bajadas. 2. Secuencia de 8 frases, aisladas, separadas por 15 segundos aproximadamente. 3. Anuncio de Fin, y Despedida.

Se eligió una frase muy simple, cuya construcción permitiera las modalidades de Enunciado o Afirmación (A), de pregunta (P) y de exclamación (E). El texto es único: "Mi mamá viene" ( fonéticamente: [mimam'aßi'ene] ) , en las modalidades: A (afirma, enuncia), P (pregunta), E (exclama). Consta la frase de dos sintagmas, sin comas, excepto F2, con Coma Temática (Sánchez, 1996). Cuatro de las frases, las primeras, son naturales, emitidas por un locutor español consciente de su entonación ( el segundo de los firmantes ). Las cuatro últimas son artificiales, generadas mediante el programa SETS32 (Sánchez, 1995) del LTPM, con curvas entonativas simples y tipificadas. Se hace oír a los encuestados la grabación. Entre las pausas él o ella dibuja esquemáticamente los patrones oídos y atribuye una modalidad a la frase oída. Los patrones dibujados se comparan con la medida mediante el Melógrafo (SETS30). Se preparó una plantilla para ser rellenada por los oyentes encuestados a medida que oyen el corpus de frases.


Grafico 7. Frase 3. Interrogativa Natural.	Grafico 8. Frase 6. Interrogativa Sintética.

Resulta difícil evaluar la corrección de una curva de tono porque: 1. Una curva consta de infinitos puntos. 2. Hay que decidir sobre el peso o importancia de las divergencias, para medir el parecido. No hay una respuesta única para resolver la cuestión; pero, para abordarla, y obtener un primer resultado, proponemos el siguiente criterio de comparación:

1. Se reducen las curvas de entonación del estímulo a un corto número de tramos de subida y bajada, como se proponía en la plantilla, obteniéndose la ER ( frase estimulo reducida). Véase el resultado en los gráficos 1 a 8, correspondientes a las ocho frases.

3. Se comparan ambas curvas, la de estímulo reducida, ER y la repuesta, R con el siguiente criterio:

3a. Si no tienen igual número de tramos, se superponen del modo más favorable considerando erróneas las que faltan en R. Si R es más larga se desechan los tramos sobrantes.

3b. Cada trama se compara con su homóloga, asignando el valor d_i, igual a: 0, si coinciden (/ /, \ \), 1. si no (/ \).

3c. Se suman los valores d_i de diferencia de tramo, ponderándolos decrecientemente a partir del final con coeficientes w_i.

en la que n es el número de tramos de la reducida, w_i las ponderaciones según posición de tramo, y d_i las diferencias entre tramos. Esta medida de diferencia o distancia entre dos curvas de desigual longitud está relacionado con el usado al comparar parecidos fonéticos entre dos elocuciones, conocido como Alineación Temporal Dinámica (Dynamic Time Warping): véase p.e. (Sakoe, 1978). En nuestro caso, tras examinar los patrones reducidos ER y las R, hemos adoptado el valor n=3, con lo que sólo obtenemos dos tipos de curva, opuestos entre sí: / \ / para Afirmación, Exclamación.; y \ / \ , para Pregunta. Puede sorprender que a A y E les corresponda la misma curva, pero las simplificaciones efectuadas las igualan. Además, debido a la importancia que el último tramo tiene en la modalidad ( de hecho, en muchas descripciones, sólo se toma en cuenta ese tramo ) adoptamos ponderaciones que decrecen geométricamente a partir del final, de modo que: w₃ =4, w₂ =2, w₁ =1. Así, el denominador de nuestra ecuación vale siempre 1+2+4=7, y podemos evitar la normalización: las puntuaciones quedarán comprendidas entre: 7 para Respuesta Perfecta, y 0, Respuesta Pésima. Véanse en la Tabla 1 las respuestas correctas, que son, tomando como corrección lo explicado anteriormente, ( entre paréntesis, expresamos opciones, o matices):

El examen y conteo de las respuestas a la modalidad, (ocasionalmente ampliadas con los comentarios de los sujetos, que explicaban algunos matices en ocasiones), ha dado los resultados absolutos, para la PTI de modalidad de frase, que se exponen en la Tabla 2.

Nótese que se han juntado frases de modalidad similar, naturales y sintéticas, lo que permite comparar fácilmente la calidad entonativa (no se trata aquí de calidad fonética, no lo olvidemos) del habla sintetizada. Los resultados nos permiten ya algunos comentarios.

1. El reconocimiento de modalidad es abrumadoramente correcto. Se exceptúa la frase 2, natural, afirmativa con una coma temática quizá demasiado marcada con una ligera pausa, y que ha sido interpretada como exclamativa u ordenativa en 20+20 = 40% de los casos. Este aparente fracaso no lo es, en nuestra opinión, ya que el locutor introdujo un énfasís pretendidamente temático, pero que fue, a falta de contexto de la conversación, interpretado como exclamación y orden.

2. El habla natural y sintetizada se comportan similarmente en cuanto a la entonación de modalidad se refiere. Queremos decir que entonaciones de tipo expresivo se cuelan, por decirlo así, tanto en las locuciones naturales, emitidas conscientemente, y por tanto, no del todo naturales; y más aún, claro, en las sintéticas, donde el trazado manual de las curvas entonativas introduce expresividades a veces sorprendentes, existentes en el habla natural, o no, en cuyo caso el oyente percibe un algo que no puede definir.

3. La evaluación de la PTC mediante la comparación de patrones tonales de estímulo ET y respuesta R, presenta unos resultados que se exponen en la Tabla 3.

1. La PTC está lejos de presentar la corrección de la PTI, pese al simplificado criterio de evaluación.

2. El comportamiento para las frases sintéticas es peor que para las naturales, pese a su similar sencillez .

3. Las frases A arrojan mejor resultado que las P, y las P, mejor las E. Esto apuntaría a una mayor complicación tonal de estas últimas.

Tras evaluar y comparar la Percepción Tonal Inconsciente (PTI) producida en el habla corriente, y la Consciente (PTC), atendiendo a las oscilaciones de la curva entonativa escuchada, mediante un test pasado a un grupo de estudiantes de Lengua, se ha llegado a las siguientes conclusiones provisionales:

1. La PTC es bastante peor que la PTI, incluso en personas ligadas a los estudios del lenguaje, lo que corrobora nuestras ideas previas.

2. Nuestro sistema de síntesis y modelo de entonación es suficientemente bueno para expresar modalidad.

La aparición de estas divergencias entre estas dos estimaciones de tono ayudará, creemos, a encontrar esos rasgos tonales o tonemas, que el oyente abstrae de la melodía tonal, y que le sirven para organizar, sintáctica, léxica, semántica y pragmáticamente, lo oído. Y, paralelamente para el hablante, a introducir todas esos rasgos en su elocución para dar cuenta de esos niveles. Así nos acercaremos hacia esa fonología suprasegmental, mucho menos conocida que la segmental.

Junto con el interés evidente de avanzar en el conocimiento del habla en relación con su estructura subyacente, consideramos este estudio útil en el aprendizaje de las lenguas, la ayuda a hablantes discapacitados y en la síntesis automática del habla.

FLANAGAN, J.L. (1972): Speech Analysis Synthesis and Perception, Nueva York, Springer‑Verlag.

NAVARRO TOMÁS, M. (1974): Manual de entonación española, Madrid, Guadarrama.

SAKOE, H y CHIBA, S. (1978): "Dynamic Programming Algorithms Optimization for Spoken Word Recognition", IEEE Trans. on ASSP, vol. ASSP‑26, No. 1, Feb. pp. 43‑491.

SÁNCHEZ, F.J. (1977): "Application of Dissimilarity and Aperiodicity Functions to Pitch Extraction and Voiced‑Unvoiced Decision in Speech", Madrid, Proc.9th ICA Cong.

Sánchez, F.J. (1979): Tratamiento Señales Pseudoperiódicas. (Tesis Doct.), Madrid, U.P.M.

SÁNCHEZ, F.J. (1989): "Interválica musical subyacente en la prosodia", Symp. Ling. Log, y Artes del Lenguaje, Madrid, Resid. Estudiantes, C.S.I.C.

SÁNCHEZ, F.J. (1996): "Entaxis, a syntactical model of intonation". Proc. II Int. Conf. on Math. Ling., Tarragona, Univ. Rovira i Virgili.

Vuelta al Principio Última actualización: Thursday, 21 de February de 2013 Visitantes:

Dice o Afirma que.. xxx xxxx.	A	\ / \
2 Dice/Afirma que.. enfatizando "madre" ¡xxx!	A (T ) (E)	\ / \
3. Pregunta que si. ¿xxx xxxx?	P	/ \ /
4 Exclama que... ¡xxx xxxx!	E	\ / \
5 Afirma que.. .xxx.	A	\ / \
6 Pregunta que si.. ¿xxx xxxx?	P	/ \ /
7 Exclama que... ¡xxx xxxx!	E	\ / \
8 Afirma que.. .xxx.	A (C)	\ / \

Frase	Correcta	Afirma	Pregunta	Exclama	Ordena	No sabe
1	A, natural	38	0	2	0	2
5	A, sintética	24	0	4	10	4
2	AT, natural	25	0	8	8	1
8	AC, sintética	34	1	1	3	3
3	P, natural	0	42	0	0	0
6	P, sintética	0	42	0	0	0
4	E, natural	1	1	39	0	1
7	E, sintética	0	1	40	1	0

Frase	Correcta	0-1	2-3-4	6-7
1	A, natural	8	11	23
5	A,sinteti.	14	14	14
2	AT,natura	7	6	29
8	AC,sintét.	10	11	16
3	P, natural	6	23	13
6	P,sintetica	2	23	17
4	E, natural	7	25	10
7	E,sintetica	9	20	5


Grafico 1. Frase 1. Afirmativa Natural: "Mi mamá viene".	Grafico 2. Frase 5. Afirmativa Sintética.


Grafico 3. Frase 2. Afirmativa Temática, Natural	Grafico 4. Frase 8. Afirmativa (conclusiva). Sintética.