El modelo métrico y autosegmental José Ignacio Hualde University of Illinois 1. Introducción El modelo métrico-autosegmental de notación prosódica tiene su punto de partida en el análisis de la entonación del inglés propuesto en la tesis doctoral de Pierrehumbert (1980), revisado y aplicado también al japonés y a otras lenguas en obras posteriores como Beckman y Pierrehumbert (1986) y Pierrehumbert y Beckman (1988). Hoy en día es uno de los modelos de análisis de la entonación más empleados. La denominación de modelo métrico-autosegmental o modelo AM (las iniciales en inglés, que utilizaremos a partir de ahora) se debe a Ladd (1996). Como explicamos más adelante, el análisis AM es un análisis fonológico, más que fonético de la entonación. El objetivo del modelo es la identificación de los elementos contrastivos del sistema entonativo cuya combinación produce los contornos melódicos que encontramos en los enunciados posibles de la lengua. En muchos aspectos podemos encontrar antecedentes directos de este modelo en los principios para el análisis de lenguas tonales que se conocen como teoría fonológica autosegmental (Leben 1973, Goldsmith 1976) y otras ideas relacionadas propuestas durante los mismos años para el análisis de la entonación del inglés (Leben 1976, Liberman 1975) y del sueco (Bruce 1977). En la teoría fonológica autosegmental se asume que la melodía o modulación tonal de los enunciados constituye un nivel separado y en cierto modo independiente de los demás rasgos fonológicos. Los tonos que caracterizan un enunciado (melodía) son, pues, autosegmentos, asociados con el nivel segmental (texto) por medio de reglas en parte universales y en parte específicas para cada lengua. Consideremos un ejemplo. En una lengua tonal en que cada sílaba puede recibir un tono independiente del de las demás sílabas de la palabra (como muchas lenguas africanas), una palabra hipotética como [pátàká] (donde los acentos graves representan tono bajo y los acentos agudos tono alto) recibiría la siguiente representación autosegmental: (1) Nivel segmental: Nivel tonal: pataka | | | H L H Los elementos en el plano tonal son un número limitado de unidades paradigmáticamente constrastivas; en la mayoría de las lenguas tonales, sólo dos o tres. Representamos los tonos por sus iniciales en inglés: H = tono alto (high tone), L = tono bajo (low tone), M = tono medio (mid tone).1 Estos elementos tonales primarios pueden 1 Nos parece más apropiado emplear los símbolos ya establecidos en este campo, mayoritariamente en publicaciones en lengua inglesa, que reemplazarlos por sus traducciones en castellano. Los motivos son los mismos por los que en química es preferible utilizar símbolos universales como Ag aunque en escritos en español pronunciemos esta abreviatura como plata, en escritos en inglés como silver, etc. Nos guste o no, el inglés ha tomado el puesto que otrora tenía el latín en la comunidad científica internacional y es lógico que las abreviaturas y otros términos se tomen de esta lengua. 1 dar lugar a contornos complejos mediante su combinación. Siguiendo con nuestro ejemplo hipotético, supongamos que una secuencia en que la palabra /pátàká/ va seguida por /ìmó/ se pronuncia como [pátàkîmó], con elisión de la última vocal de la primera palabra y formación de un contorno tonal descendente. Aunque el ejemplo es inventado, no sería en absoluto difícil encontrar ejemplos reales de este tipo, sobre todo en lenguas africanas (véase, por ejemplo, Odden 1995). Estos hechos recibirían el siguiente análisis autosegmental: (2) p a t a k a i m o --> p a t a k i m o | | | | | | | /\ | H L H L H H L HL H Como vemos, un contorno tonal descendente sobre una sílaba es simplemente el resultado de la secuencia HL asociada con esa sílaba. En este caso, el contorno descendente resulta de la elisión de un segmento con preservación del tono al que estaba léxicamente asociado, que pasa a asociarse con la sílaba siguiente. De la misma manera, LH representa un contorno tonal ascendente. Todos estos aspectos de la teoría autosegmental, en particular, la independencia del nivel tonal con respecto al segmental y la concepción del aspecto melódico de los enunciados como el resultado de la combinación a nivel fonológico de una serie de especificaciones tonales contrastivas como H y L, se encuentran también en el modelo AM, por lo que la caracterización de este modelo como autosegmental es apropiada. Veamos ahora qué sentido tiene el término ‘métrico’. Hay lenguas en que toda sílaba tiene un tono léxicamente especificado. Claramente esto no es lo que encontramos en lenguas como el inglés o en español. En estas lenguas los tonos tienen función pragmática, constituyen la melodía de enunciados, no de palabras, y se asocian de manera distintiva sólo con ciertas sílabas. En su estudio sobre la entonación del inglés, Liberman (1975) propuso que en esta lengua la asociación de melodía con texto, esto es, el hecho de que ciertos tonos aparezcan asociados con ciertas sílabas en un enunciado concreto, depende de las relaciones de prominencia que se establecen de manera independiente tanto entre las sílabas de cada palabra como entre palabras en la oración. En la palabra elefante, la sílaba -fan- tiene más prominencia que las demás de la palabra (es la sílaba tónica) y en africano esta prominencia corresponde a la sílaba -ca-. En una frase como el elefante africano normalmente la sílaba tónica de la última palabra, africano, se percibe como más prominente que la de elefante. Decimos que porta el acento nuclear. En inglés blackboard ‘pizarra’ se diferencia de black board ‘tabla negra’ en la prominencia relativa de las dos sílabas. Estas relaciones de prominencia relativa constituyen el aspecto métrico de la teoría. La asociación de melodía con texto tiene en cuenta las relaciones métricas. En el modelo AM que constituye el tema de este capítulo, el aspecto métrico se encuentra considerablemente menos desarrollado que en la propuesta de Liberman (1975), por lo que no vamos a entrar en más detalles sobre fonología métrica aquí. Lo que importa resaltar es que en muchas lenguas los elementos con los que se asocian los tonos no son todas las sílabas, como en el ejemplo hipotético de lengua tonal que hemos dado más arriba en (1), sino sólo aquellas sílabas que tienen prominencia, venga ésta dada a nivel léxico o dentro del discurso. 2 2. Elementos primitivos: acentos tonales y tonos de frontera La teoría AM parte de la premisa de que el contorno entonativo de un enunciado es el resultado de la interpolación fonética entre eventos tonales fonológicamente especificados y asociados con determinadas sílabas. Básicamente, a nivel fonológico en lenguas como el inglés o el español los tonos pueden asociarse con sílabas con acento léxico (acentos tonales) o con el final de ciertas frases (tonos de juntura o de frontera). Un acento tonal es, pues, un tono o secuencia de tonos fonológicamente asociado con una sílaba acentuada, mientras que un tono de juntura o de frontera se asocia fonológicamente con el límite de una frase. Comenzando con los acentos tonales, en una lengua como el español casi todas las palabras tienen una sílaba que puede llevar prominencia tonal (dejando a un lado preposiciones, artículos determinados y otras palabras funcionales, que normalmente se pronuncian sin acento dentro de la frase). Decimos que ésta es la sílaba con acento léxico o, en terminología tradicional, la sílaba tónica de la palabra. Como es sabido, además de prominencia tonal, la sílaba tónica suele caracterizarse por una mayor duración e intensidad relativas que las sílabas átonas de la misma palabra. En el ejemplo en (3) (y figura 1) a mi manera, vemos que la sílaba con acento léxico -ne- lleva prominencia tonal asociada: un tono alto, que simbolizaremos de momento como H*. Con el asterisco indicamos que este tono se asocia con la sílaba acentuada:2 Fig. 1. a mi manera (3) a mi manera | 2 Salvo que se indique otra cosa, todos los ejemplos que se ofrecen en las figuras fueron pronunciados por el autor de estas líneas, cuya habla puede caracterizarse de manera general como perteneciente al dialecto castellano del centro-norte de la Península, sin rasgos que permitan una ubicación geográfica más concreta (o, por lo menos, eso es lo que pienso). Para obtener los trazados de frecuencia fundamental se utilizó el programa comercial Pitchworks, de Sciconrd. 3 H* El que en la palabra manera sea la sílaba -ne- y no ma- o -ra la que recibe prominencia tonal es una propiedad léxicamente contrastiva de esta palabra. La sílaba ne- tiene prominencia intrínseca o acento léxico y es con esta sílaba (que subrayamos) con la que se asocia o alinea el tono alto. Que la asociación de este tono (H*) es precisamente con la sílaba acentuada está claro en ejemplos como los que mostramos en la figura 2 (número, numero, numeró) . En estos ejemplos observamos que el pico tonal aparece en cada caso situado sobre la sílaba con acento léxico. Podemos añadir ahora que en estos ejemplos, además del pico acentual, hay también una bajada final que atribuimos a un tono bajo de frontera, L%. Un posible análisis fonológico de este contorno es, pues, el que damos en (4): (4) número] | | H* L% numero] | | H* L% numeró ] | | H* L% Pero la prominencia acentual no va necesariamenta asociada con un tono alto, un pico o cumbre tonal. En los ejemplos interrogativos de la figura 3 (¿digo número?¿digo numero? ¿digo numeró) vemos que el evento tonal que se asocia con la sílaba acentuada de la última palabra no es ya un tono alto, sino un tono bajo (L*) o valle. Estos ejemplos fueron pronunciados con un tono de frontera final alto, H%: 4 (5) digo número] | | L* H% La sílaba tónica sirve, pues, de punto de “anclaje” para ciertos eventos tonales que contribuyen a dar prominencia a esta sílaba sobre las otras de la palabra, pero el tipo de contorno tonal que se asocia con la sílaba acentuada depende del tipo de enunciado y de la posición y relevancia pragmática de la palabra dentro del mismo. La definición de puntos de anclaje para la melodía es un elemento esencial del modelo AM (con antecedentes en trabajos como Liberman 1975) y que lo distingue de otros modelos de la entonación. Las cosas pueden ser muy distintas en otras lenguas, donde los tonos están total o parcialmente especificados para cada palabra (lenguas con tono léxico). En español o en inglés el contorno entonativo de un enunciado se compone enteramente de elementos tonales con valor pragmático, que contribuyen al significado del enunciado dentro del discurso. Como hemos visto, algunos de estos elementos tonales se asocian con ciertas sílabas que llamamos sílabas tónicas o sílabas con acento léxico; otros se asocian con las fronteras de ciertas frases. Lo que es parte de la entrada léxica de cada palabra es la posición de la sílaba tónica, pero no la melodía con que es pronunciada. En las llamadas lenguas tonales, como el chino y muchas lenguas africanas, por el contrario, la melodía tonal tiene valor léxico, es parte integrante de cada palabra. Así, en chino mandarín, la sílaba /ma/ puede tener cuatro significados léxicos completamente diferentes según la melodía tonal que se le asigne. Pronunciada con tono alto es la palabra ‘madre’; con tono ascendente desde un punto medio es ‘cáñamo’, con tono bajo ascendente es ‘caballo’ y con tono descendente desde un punto alto es ‘reñir’. Para comparar, notemos que en español un texto monosilábico como /pan/ puede recibir también melodías muy variadas pero las diferencias de significado que obtenemos son de un tipo muy diferente. Pensemos en cómo lo diríamos en los contextos sugeridos por los signos de puntuación: pan. pan... ¿pan? ¡pan!. Al cambiar la melodía lo que alteramos es el valor pragmático de este enunciado monosilábico (declarativa completa, declarativa incompleta, interrogativa, exclamativa), pero no se altera su valor léxico: se trata siempre de la misma palabra /pan/. Del mismo modo, la entonación en español nos permite dar mayor enfásis a 5 unas palabras que a otras dentro del enunciado y expresar si algo constituye información que suponemos conocida a nuestro interlocutor o información nueva. Por ejemplo un texto como Mariano trajo el libro normalmente lo pronunciaríamos con contornos entonativos diferentes como respuesta a ¿quién trajo el libro? a ¿qué trajo Mariano? o a ¿qué hizo Mariano? Todos estos son significados pragmáticos, a nivel del discurso. Hay también lenguas donde algunos elementos tonales son léxicos y otros son pragmáticos. Este es el caso, por ejemplo, del sueco, al que volveremos a referirnos más abajo. Además de la diferencia en el contorno tonal asociado con la sílaba acentuada, los enunciados en (3-4) se diferencian del presentado en (5) en la terminación, como hemos visto ya también. Como acabamos de decir, los ejemplos declarativos en (3-4) terminan con un descenso tonal o cadencia, que podemos representar como el efecto de un tono de frontera bajo L%, mientras que el ejemplo interrogativo en (5) muestra una subida final, que podemos atribuir a la presencia de un tono de frontera alto H%. Así pues, esquemáticamente podemos analizar los dos tipos de contorno que hemos considerado hasta ahora de la siguiente manera: (6) a. [a mi manera] | | H* L% b. [a mi manera] | | L* H% El contorno tonal completo de los ejemplos en (6) se obtiene por interpolación entre los eventos especificados fonológicamente: en (a), un pico en la sílaba acentuada y una bajada final; en (b) un valle en la sílaba acentuada y una subida final. Los eventos tonales que pueden estar relacionados con las sílabas acentuadas (los acentos tonales) no se limitan a la presencia de un pico (H*) o un valle (L*). Consideremos el ejemplo en (7) ( = Figura 4, mi hermano viene de Alemania). Algo que vemos aquí es que en las palabras hermano y viene hay una subida del tono a través de la sílaba tónica. El tono sube a partir de un valle al principio de esta sílaba, alcanzándose la cumbre tonal en la postónica. Una manera de caracterizar este contorno es por medio de la secuencia bitonal LH. Como de los dos puntos extremos, el valle y el pico, el que se realiza dentro de los límites de la sílaba tónica es el valle, podemos especificar este hecho tonal más exactamente como: L*+H; es decir, un valle en la sílaba tónica (al comienzo) seguido por un pico que puede ocurrir fuera de los límites de la sílaba tónica. Este tipo de contorno tonal es muy frecuente en español en palabras no finales de frase (en posición prenuclear) en declarativas neutras sin énfasis especial sobre ninguna palabra:3 3 El frecuentísimo desplazamiento del pico tonal a la postónica en posición prenuclear fue notado ya por Navarro Tomás y confirmado por todas las descripciones más recientes (Fant 1984, Garrido et al. 1993, Mota 1995, Llisterri et al. 1995, Prieto et al. 1995, Sosa 1999, Face 2000, Willis 2002). 6 Fig. 4. mi hermano viene de Alemania En la última palabra, por el contrario, el pico acentual se sitúa dentro de los límites de la sílaba tónica. Éste es el mismo contorno que tenemos en la única sílaba tónica de las figuras 1 y 2 y que hasta ahora hemos indicado como H*. Algunos autores (Face 2001a, 2001b, 2002, Beckman et al. 2002) han propuesto representar este acento tonal como L+H* indicando así que, como L*+H, presenta una subida desde un valle, pero con la diferencia de que el pico acentual cae dentro de la sílaba tónica (con lo cual la notación H*, que hemos empleado hasta ahora quedaría reservada para un pico acentual que no presenta una subida desde un valle claramente marcado).4 Adoptando esta propuesta y añadiendo el tono de frontera final, tenemos pues el siguiente análisis:5 (7) mi hermano viene de Alemania | | | L*+H L*+H L+H* L% Otras veces el movimiento tonal que caracteriza y da prominencia a la sílaba tónica no es una subida sino una bajada desde un punto alto en la pretónica. Este contorno, que podemos observar en la figura 5, es frecuente en la última palabra acentuada de declarativas neutras (sin énfasis especial en ninguna palabra) en muchos dialectos del español, así como en otras lenguas románicas (véase Sosa 1999, Beckman et al. 2002). Podemos caracterizarlo como H+L* (como ha propuesto, por ejemplo, Frota 1998 para el portugués). En este acento bitonal, el tono que aparece más estrictamente asociado con la sílaba tónica es el segundo (L*), estando este tono precedido por un tono alto.6 4 La estabilidad de la posición del valle, al principio de la sílaba tónica, en comparación con la mayor movilidad del pico tonal ha sido puesta de manifiesto en estudios como el de Prieto et al. (1995). Por otra parte, sin embargo, Willis (en preparación) encuentra bastante variación también en la posición del valle, tanto en español mexicano como dominicano, incluyendo ejemplos en que la subida no empieza hasta el final de la sílaba tónica y Beckman et al. (2002) también señalan la presencia de este tipo de contorno en variedades caribeñas. 5 Como notamos más adelante, tanto la notación específica como el hecho de que tengamos dos acentos fonológicamente contrastivos según el pico se sitúe en la tónica o en la postónica son temas debatibles. 6 Este contorno con descenso en la tónica se ha descrito como propio del último acento de las declarativas neutras en portugués (Frota 1998), en italiano (Grice 1995, D’ Imperio 2002) y en catalán (Prieto 2002). Beckman et al. (2002) afirman haberlo encontrado en todos los dialectos del español que han examinado, aunque con diferencias en cuanto a su frecuencia. En el habla del autor del presente artículo este contorno no parece ocurrir, o por lo menos es muy infrecuente, por lo que el enunciado de la figura 5 fue producido por imitación y no refleja la pronunciación espontánea del autor. 7 Fig. 5. llegarán mañana (8) llegarán mañana | | L*+H H+L* L% Conviene también notar que todas las sílabas con acento léxico no siempre portan acento tonal. En la figura 6 (¡Anda que el vecinito que teníamos al lao!, ¿eh?), tomada de una conversación natural, por ejemplo, la sílaba con acento léxico de la palabra teníamos no tiene ningún tipo de prominencia tonal. Fig. 6. ¡Anda que el vecinito que teníamos a lao!, ¿eh? 8 En lenguas como el inglés y las lenguas románicas el que una palabra reciba o no prominencia por medio de un acento tonal es en cierta medida una opción pragmática del hablante que le permite resaltar más unas palabras que otras (Bolinger 1972), aunque entre estas lenguas encontramos diferencias importantes en la ‘densidad’ de acentos tonales que se considera normal. Así la desacentuación (el que una palabra aparezca sin relieve tonal) es muchísimo más frecuente en inglés que en español. El portugués europeo también parece diferenciarse de otras lenguas románicas como el español y el italiano en presentar una menor densidad de acentos tonales: en declarativas neutras sólo la primera palabra y la última suelen presentar acentos tonales (Frota 1998, 2002).7 El número y tipo de acentos tonales puede variar de lengua a lengua. Es de notar que para todas las lenguas que se han analizado hasta ahora empleando este modelo hay acuerdo unánime o casi unánime en que basta con especificar como mucho dos tonos como constituyentes del acento tonal. En principio, el sistema nos permite distinguir los siguientes acentos monotonales y bitonales: H* L* L+H* L*+H H+L* H*+L Pico en la tónica Valle en la tónica Pico en la tónica precedido por un valle (subida de la pretónica a la tónica) Valle en la tónica seguido por un pico (subida de la tónica a la postónica) Valle en la tónica precedido por un pico (bajada de la pretónica a la tónica) Pico en la tónica seguido por un valle (bajada desde la tónica) El análisis de los contornos entonativos de una lengua determinada es lo que nos llevará a postular la existencia de unos u otros acentos contrastivos en esa lengua. Además de las notaciones dadas existen otras posibilidades como H+H* (empleado en algunos análisis del inglés) y la existencia de acentos tritonales (como, por ejemplo, L+H*+L) no está tampoco necesariamente excluida, aunque no se haya utilizado en ninguna de las lenguas analizadas hasta ahora en este modelo. Hay lenguas como el japonés de Tokio que tienen un único acento tonal (H*+L: un pico en la tónica seguido por una bajada inmediata del tono). Para el inglés se ha propuesto un inventario con al menos 5 acentos tonales diferentes (Beckman y Hirschberg 1994, Beckman y Elam 1997, Syrdal et al. 2001; 7 en el análisis de Pierrehumbert 1980). El español parece representar una situación similar a la del inglés aunque quizá con un número más limitado de acentos tonales. En un análisis reciente (Beckman et al. 2002) se proponen 3 o 4 acentos tonales diferentes para el español, los 7 En otras lenguas como el japonés de Tokio y el vasco vizcaíno septentrional, por el contrario, no existe tal libertad en el uso de acentos tonales. Como explicamos después, en estas lenguas el que una palabra se pronuncie o no con acento es una propiedad léxica de cada palabra. Algunas palabras tienen acento léxico y necesariamente han de recibir un acento tonal y otras, por el contrario, no pueden recibir nunca un acento (en vasco a no ser que sean finales de frase). Así , en los dialectos vascos relevantes en un ejemplo como eskóla ederra ‘la hermosa escuela’ la palabra eskóla necesariamente ha de llevar un acento tonal (esta frase, pronunciada aislada, tiene siempre dos acentos, sobre -kó- y sobre la última sílaba -rra, que recibe acento de frase) , mientras que en alaba ederra ‘la hermosa hija’, la palabra alaba, que pertenece a la clase léxica de palabras inacentuadas, no puede llevar prominencia acentual de ningún tipo (esta frase se pronuncia obligatoriamente con un único acento, el acento de frase sobre la última sílaba). Beckman y Venditti (2000) afirman que en japonés se utiliza la mayor o menor amplitud del campo tonal para producir los efectos pragmáticos de otorgar mayor o menor énfasis que en inglés se consiguen mediante la localización de acentos tonales sobre ciertas palabras. 9 que ya hemos ilustrado: L*+H (subida con pico después de la tónica, como en los dos acentos prenucleares de la figura 4 y en las figuras 11 y 12); L+H* (subida con pico en la tónica, como en el acento nuclear de las mismas figuras); H+L* (descenso durante la tónica, como en el acento nuclear en la figura 5) y H* (pico pequeño sin valle precendente, propuesto provisionalmente para casos no identificables como ninguno de los otros tres acentos). Estos autores discuten también la posibilidad de añadir al inventario de acentos tonales un acento nuclear L* en oraciones interrogativas como las de la figura 3.8 Un tema relacionado con éste es si es suficiente con los dos elementos básicos L y H. Claramente en algunas lenguas con tono léxico (como el yoruba) podemos tener contrastes que requiren tres (L, M y H) o más niveles tonales fonológicamente contrastivos. Sin embargo, las lenguas en que los tonos tienen puramente valor pragmático y no léxico no parecen requerir más contrastes en sus acentos tonales de los que nos proporcionan los dos tonos fonológicos L y H. En cuanto a los tonos de frontera, en algunos análisis se ha empleado M% para indicar un tono medio final que contrasta tanto con una subida final como con una bajada (Beckman et al. 2002 lo proponen provisionalmente para el español).9 3. Escalonamiento tonal En un ejemplo como el dado en la figura 7 (viene de Alemania mañana) podemos notar que hay un escalonamiento descendente de los tres picos tonales: cada pico es más bajo que el anterior. 8 Notemos, de pasada, que la falta de una comprensión clara de la relación entre acento léxico y acento tonal ha llevado a algún autor a negar que en español la frecuencia fundamental sea un correlato importante del acento, basado en mediciones de altura tonal. Obviamente si la sílaba tónica está asociada con un acento tonal L*+H o H+L* vamos a encontrar que esta sílaba no es la que tiene mayor altura tonal en la palabra. La conclusión de que, por tanto, la frecuencia fundamental no es un correlato del acento es, sin embargo, completamente errónea. 9 En Gussenhoven et al. (1999) se propone un contraste ternario entre H%, L% y %, donde % se utiliza para descensos incompletos sin caída a un nivel bajo y es esencialmente equivalente a M%. 10 Fig. 7. Viene de Alemania mañana (9) Viene de Alemania mañana | | | L*+H L*+H L+H* L% En la medida en que este fenómeno --que se conoce como downstep y que podemos traducir como “escalonamiento descendente”-- es predecible y automático, no necesitamos marcarlo en nuestra transcripción tonal. Es posible, sin embargo, que la lengua tenga un contraste pragmático entre secuencias escalonadas y secuencias donde los picos acentuales sucesivos se mantienen más o menos al mismo nivel. Por ejemplo, la suspensión del escalonamiento descendente puede indicar énfasis o una distinción entre información conocida e información nueva. En ese caso se indica la presencia de escalonamiento, por medio del símbolo ! , tomado de la tradición africanista de transcripción tonal. Así, H* seguido de !H* sería una secuencia de dos picos acentuales donde el segundo es considerablemente más bajo que el primero, mientras que H* seguido de otro acento H* sin diacrítico de escalonamiento indicaría dos picos tonales a aproximadamente el mismo nivel. Por otra parte para el español se ha propuesto que algo que hay que indicar en la transcripción prosódica es el escalonamiento ascendente (upstep), por ejemplo en las preguntas con “entonación circunfleja” típicas del español caribeño. Beckman et alii (2002) proponen indicar este fenómeno mediante el diacrítico (¡). En el ejemplo de la figura 8, el tercer acento muestra upstep y el cuarto downstep: Figura 8. Mi hermano viene de Alemania mañana (10) Contexto: ¿Cuándo viene tu hermano de Alemania?) Mi hermano viene de Alemania mañana 11 | | L*+H L*+H | L*+¡H | L+!H* L% En español en oraciones declarativas con estructura información conocida/información nueva solemos encontrar una curva ascendente hasta el final de la parte del enunciado que representa información nueva. En Hualde (2002) se propone indicar este fenómeno por medio de un tono de frontera H- que causaría el escalonamiento ascendente (véase también Nibert 2000). Los mismos efectos los podemos indicar con los diacríticos empleados en (10). Notemos también que los niveles L y H se interpretan de forma relativa. Como podemos observar en los ejemplos anteriores, un tono H hacia el final del enunciado puede tener un valor absoluto incluso más bajo que un tono L en la parte inicial del mismo enunciado. Marcaremos un tono determinado como H si tenemos una subida con respecto a las sílabas inmediatamente precedentes. La interpretación relativa (o ‘local’) de los tonos H y L, junto con el empleo de diacríticos de escalonamiento es lo que nos permite analizar lenguas como el inglés y el español, así como el resto de las lenguas sin tono léxico estudiadas hasta ahora, con sólo dos tonos, H, L, en contraste con otras teorías anteriores, como la de Trager y Smith (1951) y Pike (1945) en que se reconoce un número mayor de niveles para el inglés sin que esto permita llegar a resultados satisfactorios (Pierrehumbert 2000). 4. Frases prosódicas y tonos de frontera En lo que podemos considerar el análisis estándar de la entonación inglesa dentro del modelo AM (el desarrollado por Pierrehumbert, Beckman y sus colaboradores) se distinguen dos tipos de frases prosódicas: la frase entonativa y otra unidad menor denominada frase intermedia. Una frase entonativa consiste en una o más frases intermedias. Una frontera de frase intermedia indica un grado de disjunción menor al que se encuentra al final de una frase entonativa. Al final de ambos tipos de frase podemos tener un tono de frontera. Como hemos indicado más arriba, los tonos de frontera de frase entonativa se indican como L%, H%. Los tonos que marcan el final de una frase intermedia se señalan como L-, H-. Tomemos un ejemplo como el siguiente: ¿quieres cerveza alemana, vino de Rioja, o agua con gas? Probablemente este enunciado lo pronunciaríamos con dos disjunturas menores, donde hemos colocado una coma, señaladas prosódicamente por un tono alto: (11) [[¿quieres cerveza alemana] [vino de Rioja] o agua con gas?]] | | HH- Esta frase entonativa contendría, pues, tres frases intermedias. Lógicamente, el final de la frase entonativa es también el final de una frase intermedia. Esto quiere decir que al final de una frase entonativa podemos tener una secuencia de dos tonos de frontera, T- T%, dando lugar a la posibilidad de tener contornos tonales más complejos al final de una frase entonativa que al final de una simple frase intermedia (Beckman y Pierrehumbert 1986). Todo esto lo ilustramos en (12) que muestra una frase entonativa 12 hipotética consistente en dos frases intermedias cada una de las cuales contiene a su vez dos palabras con acentos tonales: (12) [ [ooo ooo] [ooo ooo ] ] | | | | | | | T* T* T- T* T* T- T% La existencia de estos dos tipos o niveles de frases ha sido justficada para el inglés en el trabajo de Pierrehumbert y estudios posteriores. Esto no quiere decir, sin embargo, que todas las lenguas presenten la misma estructura con dos tipos de frases prosódicas. Según la lengua es posible que tengamos un número mayor o menor de niveles de frase. Para el español, no encontramos acuerdo entre los autores que se han ocupado del tema. Sosa (1999) propone que no necesitamos reconocer más de un nivel de frase prosódica. No necesitamos, pues, frases intermedias en el análisis. Nibert (2000) y Hualde (2002), por el contrario, abogan por el reconocimiento de la existencia de frases intermedias y sugieren que la posibilidad de alterar la posición de la frontera de estas frases es lo que nos permite dar diferentes interpretaciones a ciertos textos ambiguos (véase también Prieto 1997 para el catalán). Así la interpretación de un texto como vimos pueblos y campos abandonados (¿Estaban abandonados los pueblos y los campos, o sólo los campos?) puede depender de cómo dividamos el texto en frases intermedias. O tomemos el ejemplo la vieja lanza la amenaza (que adoptamos de Prieto 1997, traduciéndolo del catalán). Este texto es un ejemplo de homonimia léxica y tiene, pues, dos significados básicos diferentes según lanza se interprete como sustantivo o como verbo( y lo mismo para amenaza); es decir, la estructura sintáctica puede ser (13a) o (13b): (13) a. [la vieja]SN [lanza la amenaza]SV b. [la vieja lanza]SN [la amenaza]SV Como señalamos en Hualde (2002) este texto tiene una pronunciación que es ambigua y otra que no lo es. Pronunciado como en (14a) la palabra lanza es necesariamente un verbo; es decir la estructura sintáctica es (13a). Por el contrario, si la frontera de frase intermedia está después de lanza, ambas estructuras sintácticas en (13) son posibles:10 (14) a. la vieja H- lanza la amenaza No ambigua Posible contexto: ¿qué hace la vieja? b.la vieja lanza H- la amenaza Ambigua Posibles contextos: (a) ¿qué lanza la vieja? (b) ¿por qué teme María a la vieja lanza? 10 Los hechos son parecidos (pero hay diferencias entre lo que se interpretaría normalmente como información conocida o nueva) si en vez de H- utilizamos un tono bajo L- señalando el límite de la frase intermedia. 13 Estas interpretaciones dependen de las relaciones posibles entre frases sintácticas y prosódicas en el idioma.11 Hay que decir algo más sobre la realización de secuencias finales T-T%. Obviamente, ambos tonos no pueden realizarse estrictamente al final de la frase. En inglés el primero de los dos tonos de la secuencia, el indicado como T-, parece tener una cierta flexibilidad de alineación entre el último acento tonal y el tono T%, que se alinea con el límite de la frase. Para el inglés las cuatro combinaciones posibles de tonos de frontera al final de una frase entonativa reciben las siguientes interpretaciones (nos basamos en las definiciones en Beckman y Hirschberg 1994): L- L% Descenso final (como al final de una oración declarativa) L- H% Descenso incompleto con subida de continuación al final H- L% Tonema de suspensión, terminación en tono medio plano H- H% Subida final (como encontramos normalmente al final de una interrogativa total) Hemos visto antes que en muchas lenguas, incluyendo el inglés y el español, es necesario postular acentos bitonales además de monotonales. En el caso de los tonos de frontera, por otra parte, no parece ser necesario incluir unidades bitonales. La combinación de dos unidades monotonales T- y T% al final de la frase entonativa, unida a las diversas especificaciones posibles del último acento tonal, ofrecen suficientes posibilidades para analizar todos los contornos finales que aparecen en estas lenguas sin necesidad de recurrir a tonos de frontera más complejos. Aún más, para el español se ha propuesto que no hay tonos correspondientes a límites de frase intermedia y que es suficiente con un tono H% o L% siguiendo al último acento tonal para dar cuenta de todos los contornos finales que encontramos (Sosa 1999). Los tonos de frontera que hemos considerado hasta ahora se asocian con el final de una frase prosódica. En algunos casos, sin embargo, es útil postular también la presencia de tonos iniciales de frase. Así, el hecho notado por Navarro Tomás de que las interrogativas en español pueden tener un comienzo (y nivel general) más alto que las declarativas es interpretado por Sosa (1999) mediante un tono alto inicial %H. De la misma manera, en japonés hay una subida entre la primera y segunda sílaba de ciertas frases, que Pierrehumbert y Beckman (1988) analizan como una secuencia inicial %L Hmarcando el comienzo de la frase. Es interesante notar que el mismo fenómeno se da en ciertos dialectos vascos hablados en la parte norte de Vizcaya, como vemos en el ejemplo en la figura 10 (que reproducimos de Hualde et al. 2002). En este ejemplo puede verse que hay una subida de la primera a la segunda sílaba de la frase, a partir de la cual el contorno se mantiene en tono alto relativamente plano hasta llegar a la sílaba acentuada. Siguiendo la propuesta de Pierrehumbert y Beckman (1988) para el japonés, esta subida inicial de frase ha sido analizada como %LH- (Jun y Elordieta 1997, Elordieta 1998, Hualde et al. 2002): 11 A pesar de estos hechos, Beckman et al. (2002) concluyen, con Sosa (1999), que en español no hay evidencia suficiente para postular más de un nivel de frase prosódica. En el análisis de estos autores, las fronteras de frase intermedia que hemos señalado podrían ser fronteras de frase entonativa. 14 Figura 10. lagunen alabiá etorri da ‘ha venido la hija del amigo’ (15) vascuence vizcaíno septentrional [lagunen alabiá] etorri da | | %L HH*+L En los dialectos vascos en cuestión, como en japonés, hay un contraste léxico entre palabras con acento y palabras sin acento, que no llevan prominencia sobre ninguna sílaba. Es decir, mientras que en una lengua como el español las únicas palabras que sistemáticamente carecen de acento son palabras funcionales como preposiciones y artículos definidos (y aun estás palabras pueden acentuarse en contextos contrastivos especiales), en vizcaino septentrional la mayoría de las palabras son léxicamente inacentuadas. Estas palabras sólo llevan acento, sobre su última sílaba, cuando aparecen al final de frases focalizadas. En otras posiciones nunca recibe un acento tonal. Esto es lo que observamos en la figura 10, arriba, donde las dos palabras de la frase lagunen alabiá ‘la hija del amigo’ son léxicamente inacentuadas y la última sílaba de la frase recibe un acento por encontrarse en posición preverbal, que es la posición de foco en esta lengua. En frases producidas aisladamente o en posición de foco en la oración que contienen sólo palabras sin acento léxico, hay un tono bajo en la primera sílaba seguido por un subida en la segunda y un tono alto desde esta sílaba hasta la última de la frase, donde el tono baja bruscamente, como vemos en la figura. Si la frase contiene alguna palabra con acento léxico, por otra parte, la bajada del tono se produce inmediatamente después de la sílaba con acento léxico. Eso es lo que tendríamos en, por ejemplo, lagúnen alabiá ‘la hija de los amigos’, donde la forma de genitivo plural lagúnen lleva acento léxico y que forma un par mínimo con el ejemplo anterior. En este caso, tendríamos una subida en la segunda sílaba seguida inmediatamente por una bajada, como resultado de la secuencia de especificaciones tonales %L (H-) H*+L realizada sobre las tres primeras sílabas: (16) [lagúnen alabiá] etorri da ‘ha venido la hija de los amigos’ 15 | | %L H*+L | H*+L Vemos, pues, que aunque lo más común es que el final de las unidades prosódicas se asocie con tonos de frontera, en ciertos casos y en ciertas lenguas encontramos tonos de frontera también al comienzo de la unidad. 5. Algo más sobre los tonos o ‘acentos’ de frase Los elementos tonales que representamos como T- (esto es, H- o L-) se asocian como hemos dicho con el final (o el principio) de una frase intermedia y en combinación con T% marcan el contorno final de una frase entonativa, siguiendo al último acento. Estos elementos T- suelen recibir el nombre de phrase accents o “acentos de frase”. Esta denominación un tanto sorprendente (¿por qué se llaman “acentos” si no se asocian con sílabas léxicamente prominentes?) tiene una explicación histórica: el concepto y su nombre fueron adoptados por Pierrehumbert (1980) del análisis del sueco propuesto por Bruce (1977). En sueco, contrariamente a lo que ocurre en la mayoría de las lenguas europeas, los contornos tonales tienen, en parte, función léxica. Según la clase léxica a la que pertenezca la palabra (acento I o acento II) ésta aparecerá con un tipo de contorno o con otro en un contexto determinado. Un conocido par mínimo es, por ejemplo, el que nos proporcionan las palabras ánden ‘el pato’y ànden ‘el espíritu’, ambas con acento léxico en la primera sílaba pero con melodías asociadas diferentes. Pronunciadas aisladamente, lo que caracteriza a las palabras con acento II es la presencia de dos picos tonales: (17) Sueco: acento I vs. acento II ánden ‘el pato’ ànden ‘el espíritu’ Bruce examinó la realización del contraste acentual en otros contextos, como el prenuclear y observó que, aunque la distinción se mantiene aquí también, ya no tenemos un contraste entre un pico tonal y dos, sino que lo que ocurre es que el único pico que encontramos para ambas clases de palabras se alinea antes con respecto a la sílaba acentuada en las palabras de la clase con acento I que en las palabras con acento II. Esta diferencia de alineación es el elemento constante que permite caracterizar los dos acentos a través de todos los contextos entonativos, nuclear, prenuclear y postnuclear. Bruce llega a la conclusión de que en sueco hay un contraste fonológico entre dos acentos tonales, diferenciados en su alineación con respecto a la sílaba acentuada y que podemos representar como H+L*, para palabras con acento I, y H*+L, para palabras con acento II. ¿Cómo explicamos, entonces, la descripción clásica que establece un contraste entre palabras con un pico acentual y palabras con dos picos? (como en (17)) Esto se debe, concluye Bruce, a que en palabras aisladas tenemos necesariamente focalización de la palabra y en sueco la focalización de una frase introduce un tono H antes del descenso final. Para referirse a este tono alto Bruce emplea el término “acento de frase”, pues sus características son similares a las del acento tonal asociado con la sílaba tónica, pero sirve 16 para otorgar prominencia a la frase focalizada. En palabras con acento II tendríamos pues una secuencia que, usando la notación AM, podríamos representar como H*+L H- L%, que produce los dos picos que observamos en este caso: uno en la tónica y otro en la postónica. Los dos picos corresponden a los dos “acentos”, el acento de palabra, H*+L, y el acento de frase, H-. Pierrehumbert (1980) observó que en inglés podemos tener varios contornos diferentes en la porción del enunciado entre el acento nuclear y la frontera final de la frase entonativa. Para marcar estos eventos tonales esta autora introdujo la notación T- y propuso utilizar el término “acento de frase” por analogía con el análisis de Bruce, aunque para el inglés parece mucho menos apropiado referirse a estos elementos, H- y Lcomo “acentos”. En posteriores trabajos de Pierrehumbert y sus colaboradores se establece una relación clara entre el “acento de frase” y el concepto de “frase intermedia” en el análisis del inglés. Grice et al. (2000) argumentan que en una serie de contornos de varias lenguas europeas el mejor análisis consiste en postular un tono T- que se asocia inmediatamente después de un acento tonal. Es decir, este tono busca también para su asociación una sílaba acentuada, aunque puede estar también simultáneamente asociado con la frontera final, o podemos tener una ‘copia’ del mismo tono con una frontera final, dando lugar a una serie de sílabas aproximadamente al mismo nivel. Para dar un ejemplo, en el dialecto húngaro de Transilvania hay un contorno interrogativo en que la palabra con acento focal lleva un tono bajo (L*) en su sílaba tónica (que en húngaro es siempre la primera de la palabra) y a partir de aquí tenemos un tono alto hasta la penúltima de la oración, donde se produce el descenso. Grice et al. (2000) proponen que en este caso un acento de frase Hse asocia inmediatamente después del acento tonal L* y otro con la penúltima sílaba de la oración (las mayúsculas indican focalización): (18) Húngaro de Transilvania (Grice et al. 2000) LATTAD Ildikot ] | \ | | L* HH- L% ‘¿Has VISTO a Ildiko?’ La noción de “acento de frase” puede, pues, resultar útil para analizar fenómenos tonales que ni sirven para otorgar prominencia a la sílaba con acento léxico ni están estrictamente localizados al final de una frase. Por lo que respecta al español, sin embargo, no está claro que sea necesario hacer uso de este concepto. Como ya hemos señalado, Sosa (1999) afirma que dado que en español normalmente hay como mucho sólo una o dos sílabas después del acento nuclear y antes del final de la frase, la combinación de acentos bitonales con tonos de frontera unitarios es suficiente para dar cuenta de todos los contornos finales. Como nota Prieto (2001) en su reseña de Sosa (1999), es muy posible, sin embargo, que el estudio de un número de contextos pragmáticos superior al analizado por Sosa (1999) revele la existencia de contornos más complejos que requieran la utilización de acentos de frase para su análisis. 17 6. Nivel de representación Una pregunta que debemos hacernos es el nivel de representación a que corresponde la notación AM. Claramente la transcripción de la entonación de un enunciado en el modelo AM no es el equivalente prosódico de la transcripción de sus segmentos por medio de un alfabeto fonético. Esto es bastante obvio. Por medio de un sistema de transcripción como el que nos ofrece el alfabeto fonético internacional podemos representar el aspecto segmental de enunciados de una lengua que no comprendemos y cuyo sistema de contrastes fonológicos aún no conocemos. Por el contrario la transcripción AM de la entonación de un enunciado requiere la previa identificación de las sílabas con acento léxico y que conozcamos el sistema de contrastes tonales posibles en la lengua. Para transcribir correctamente los elementos tonales que constituyen la entonación de un enunciado tenemos que localizar las sílabas acentuables; esto es, los posibles puntos de anclaje de los acentos tonales, lo cual, como sabemos, es una propiedad léxica de las palabras en una lengua como el español. Es decir, no utilizamos directamente la curva de F0 para determinar qué sílabas llevan prominencia acentual, sino que antes de empezar a interpretar la curva de F0 tenemos que notar cuáles son las sílabas con acento léxico. Sólo entonces podremos decidir si estas sílabas tienen o no prominencia tonal en el enunciado que estamos considerando. Como en otras lenguas románicas, en español podemos encontrar también a veces acentos tonales sobre sílabas que carecen de acento léxico, generalmente la sílaba inicial de la palabra, como en el siguiente ejemplo: el présidénte déclaró que lá investigación cóntinuará sin ínterrupción. Nuestro conocimiento de cuáles sílabas poseen acento léxico es lo que nos permite advertir que en un ejemplo como éste el hablante persigue conseguir un efecto especial mediante la colocación de acentos sobre sílabas a las que léxicamente no corresponde llevarlo. Este efecto es el de dar mayor énfasis a la palabra. En el caso del ejemplo que hemos dado, no tendríamos dificultad en indentificarlo como perteneciente al estilo de habla enfática que caracteriza la lectura de noticias en la televisión, dada la frecuencia de acentos sobre sílabas léxicamente átonas. Podemos encontrar, pues, desviaciones en ambas direcciones: ni todas las sílabas con acento léxico llevan acento tonal ni todos los acentos tonales recaen sobre sílabas con acento léxico. Pero la interpretación del efecto pragmatico producido sea por la desacentuación tonal sea por la acentuación de sílabas léxicamente sin acento requiere que conozcamos cuáles sílabas poseen acento léxico.12 Una vez que reconocemos que correspondiendo a cierta sílaba con acento léxico tenemos un movimiento tonal determinado, tenemos que decidir cómo transcribirlo. Esto va a depender de los tipos de contorno que hayamos determinado que son contrastivos en la lengua. Por ejemplo una subida de la pretónica a la tónica con bajada inmediata en la postónica puede transcribirse de maneras muy diversas según la lengua (o, incluso, en diferentes análisis de la misma lengua). El reconocer un cierto contorno como, digamos, L+H*, es, pues, algo muy diferente de transcribir una nasal bilabial como [m], para lo cual no necesitamos ningún conocimiento previo de la lengua. 12 Rialland y Robert (2001) describen el curioso caso del wolof, una lengua no tonal de África Occidental en que las sílabas léxicamente prominentes no se asocian con acentos tonales, sino que la melodía de los enunciados se compone únicamente de tonos de frontera que indican los límites iniciales y finales de varios tipos de frases. 18 Veamos un ejemplo. Consideremos el contorno en la figura 11: Fig. 11. Mariano miraba la moneda El primer paso en el análisis del contorno entonativo de este enunciado ha de ser la identificación de las sílabas con acento léxico, lo cual requiere conocer la lengua, y de las fronteras de frase: (19) Mariano miraba la moneda El segundo paso es la identificación de los tipos específicos de acento tonal y de los tonos de frontera que tenemos, lo cual requiere un análisis previo del sistema de contrastes entonativos utilizado en la lengua. Un análisis posible del contorno en la figura 11 es el siguiente: (20) Mariano miraba la moneda | | | L*+H L*+H L+H* L- L% En el hecho de que tengamos que determinar el inventario de elementos contrastivos (tipos de acento tonal y tipos de tono de frontera) antes de poder transcribir enunciados, el sistema AM se diferencia de otros sistemas de transcripción como INTSINT, como afirman Hirst, Di Cristo y Espesser (2000:70). Concluimos, pues, que el sistema AM, nos ofrece una transcripción fonológica de la entonación, basada en un análisis del sistema de elementos tonalmente contrastivos de la lengua que estamos transcribiendo (Pierrehumbert 2000:26). 19 6. Problemas de análisis Como acabamos de mencionar, el tipo de transcripción utilizado en el modelo AM se acerca más a una transcripción fonémica que a una transcripción fonética, pues requiere un análisis previo del sistema de contrastes empleado en la lengua. Esto trae consigo, en primer lugar, el mismo tipo de problemas para establecer el inventario de unidades contrastivas que frecuentemente encontramos a nivel segmental. Para dar un ejemplo en el plano de la fonología segmental que suponemos conocido para el lector, varios lingüistas que aceptan que la descripción fonética que ofrece Navarro Tomás para los sonidos subrayados en pino, peine, tiene, hielo, mayo y conyuge es fundamentalmente correcta han propuesto análisis fonólogicos radicalmente diferentes y no podrían ponerse de acuerdo en su transcripción fonémica, a pesar del acuerdo en cuanto a los hechos fonéticos. El establecer un inventario de elementos contrastivos en una lengua determinada no es, pues, algo que pueda hacerse de manera automática, sino que depende en parte de decisiones del analista. Pero la dificultad en establecer un inventario fonológico es mucho mayor en el plano de la entonación que en el plano segmental. Podemos decir que mientras que los desacuerdos en el inventario de fonemas segmentales de una lengua dada se reducen prácticamente siempre a casos muy específicos, en el campo del análisis AM la falta de acuerdo puede ser bastante mayor. El motivo por el cual esto ocurre es evidente. A nivel segmental, tenemos criterios claros para decidir cuando nos encontramos con fonemas diferentes y cuando, por el contrario, tenemos realizaciones alófonicas de un solo fonema: podemos acudir al significado para dirimir esta cuestión. Esto es lo que nos lleva a concluir que, a pesar de la distancia fonética, [h], [s] y [z] en posición preconsonántica pueden ser todas realizaciones de un único fonema /s/ en español, dado que, por ejemplo, [éhta] y [ésta] son la misma palabra y [mízmo] no es algo diferente que [mísmo] o [míhmo]. De la misma manera y por motivos análogos, no hay desacuerdo en considerar que los segmentos entre corchetes en el inglés americano a[]om y a[th]omic son dos realizaciones de un solo fonema /t/. El tipo de significados que expresamos por medio de la entonación en lenguas como el inglés y el español, por otra parte, no permite una verificación tan sencilla de qué contornos son contrastivos. Para establecer si dos contornos entonativos son fonológicamente contrastivos o, por el contrario, son variantes “alotónicas” del mismo contorno es preciso llevar a cabo experimentos complejos, cuyos resultados, por otra parte, no son siempre concluyentes o fáciles de interpretar. A este respecto podemos notar que uno de los principales antecedentes intelectuales que sirvieron de base al análisis de Pierrehumbert (1980) y, por tanto, del modelo AM, es el análisis del sueco de Bruce (1977). En sueco, como hemos visto ya, las diferencias entre contornos tonales tienen en parte función léxica, sirven para distinguir palabras. El que la diferencia de significado se mantenga en contextos entonativos diferentes permitió a Bruce determinar en qué consiste exactamente la diferencia léxica entre las dos clases de palabra, con acento I y con acento II. La conclusión de que estos dos acentos tonales son fonológicamente contrastivos se apoya crucialmente en el hecho de que si reemplazamos una melodía por otra podemos obtener una palabra diferente. Siempre podemos preguntarnos si se trata de la palabra ‘pato’ o de la palabra ‘espíritu’’, para usar el par mínimo que hemos visto más arriba. Claramente, los acentos contrastivos que se postulan para lenguas como el español o el inglés carecen de este apoyo, dado que en estas lenguas los diferentes contornos tonales tienen funciones puramente pragmáticas y no léxicas. Esto puede llevar a que diferentes 20 analistas trabajando dentro del modelo AM propongan inventarios de elementos contrastivos muy diferentes para la misma lengua. En la práctica, se utilizan dos métodos para establecer la validez de un análisis AM concreto. El primer método consiste en la demostración de que es posible entrenar a un grupo de expertos en la utilización de una transcripción dada y que estos transcriptores, trabajando independientemente unos de otros, coinciden en gran medida en su etiquetado de nuevos textos (véase Pitrelli et al. 1994, McGory et al. 1999, Syrdal et al. 2001). El segundo método consiste en demostrar que podemos sintetizar contornos de F0 que se asemejan mucho a los originales empleando el análisis propuesto. En la medida en que podamos utilizar el análisis propuesto de manera satisfactoria para la síntesis prosódica de cualquier tipo de texto en la lengua, habremos demostrado también que hemos encontrado los elementos que se combinan en la lengua para generar sus contornos melódicos (Gussenhoven y Kerkhoff 2001). Dadas las características fonológicas del modelo teórico, un objetivo prioritario entre los defensores del sistema AM ha sido el llegar a un consenso de transcripción para cada lengua que permita a todos sus usuarios interpretar los datos de una manera uniforme. Esto es algo semejante, a nivel prosódico, a las discusiones que suelen tener lugar cuando se trata de fijar la ortografía de una lengua. Como resultado del acuerdo entre un grupo de expertos interesados en la transcripción del inglés surgió la transcripción ToBI para esta lengua (Silverman et al. 1992, Beckman y Ayers 1994, Beckman y Hirschberg 1997), que desarrolla y modifica en parte las propuestas de Pierrehumbert (1980) y Beckman y Pierrehumbert (1986). El nombre ToBI corresponde a las iniciales de Tone and Break Indices y hace referencia al hecho de que un aspecto importante del modelo es que, además de la transcripción de los tonos, incluye índices de separación prosódica entre palabras (que se emplean para detectar la presencia de posibles tonos de frontera entre frases). Después ha habido propuestas semejantes para muchas lenguas como el serbo-croata (Sc-ToBI, Godjevac 2000), el coreano (K-ToBI, Jun 2000), el griego (Gk-ToBI, Arvaniti y Baltazani 2000), el italiano (ToBIt, Avesani 1995), el alemán (Grice et al. 1996), el japonés (Venditti 1995), el español (Sp-ToBI, Beckman et al. 2002) y bastantes otras (véase Jun, en prensa). La medida en que hay acuerdo entre los expertos en la adopción de la propuesta ToBI pertinente varía mucho de lengua a lengua. Así la existencia de Sp-ToBI no implica ni mucho menos que todos los estudiosos de la entonación en español que utilizan el sistema AM acepten todos los detalles de la propuesta de Beckman et al. (2002). En algunos casos han surgido importantes contrapropuestas. Así, una “herejía” importante es la representada por el sistema TODI (Gussenhoven, Rietveld y Terken 1999) ideado en un principio para la transcripción del holandés pero que aspira a convertirse también en la base de la transcripción estándar del inglés. Para el francés también existen dos propuestas de análisis AM radicalmente diferentes, la de Post (2000), por una parte, y la de Jun y Fougeron (1995, 2000, 2002), por la otra. Por lo que respecta al español, aunque hay acuerdo bastante general en ciertos puntos del análisis, hoy en día tanto el número de acentos tonales diferentes que tenemos como su definición o etiquetado son temas controvertidos. Los problemas surgen de nuevo del carácter fonológico más que fonético de la transcripción. 21 Para hacernos una idea de las dificultades que pueden surgir para llegar a un acuerdo en el análisis de hechos de entonación dentro del modelo AM, consideremos un ejemplo sencillo: Una misma serie de picos acentuales puede interpretarse bien como una secuencia de movimentos ascendences (LH) o bien como una secuencia de movimentos descendentes (HL). Supongamos, en efecto, que encontramos un contorno como el que tenemos en la figura 12 (adoraban a mi hermana) y que, después de observar un número suficientes de ejemplos, llegamos a la conclusión de que podemos caracterizarlo de la siguiente manera: “El tono se mantiene bajo hasta el comienzo de la primera sílaba con acento léxico. A partir de este punto tenemos una subida que culmina en la postónica. Después tenemos una bajada hasta la siguiente sílaba acentuada, donde empieza otra subida. En el último acento de la frase la cumbre se alcanza en la tónica, habiendo una bajada final a partir de aquí”. Este contorno (que es el que muestran también varios de los ejemplos vistos más arriba) podemos esquematizarlo como hacemos en (21). Asumamos que no hay ninguna controversia en cuanto a la descripción de los hechos. Entre otras posibilidades y dejando a un lado la posibilidad de tener tonos de frontera de frase intermedia (en concreto, L- L% en vez de simplemente L% al final del enunciado), tenemos los tres análisis AM que indicamos debajo del ejemplo: Fig. 12. Adoraban a mi hermana (21) a do ra ban a mi her ma na a. a’. b. %L L*+H L*+H H*+L L*+H L% L+H* L% H*+L L% 22 En el análisis en (a) postulamos dos acentos ascendentes (L*+H) con descenso final provocado por el tono de frontera L% (una versión de este análisis la encontramos, por ejemplo, en Hualde 2002). El tono se mantiene bajo hasta el comienzo de la sílaba acentuada porque tenemos un acento que especifica la presencia de un valle seguido por una subida. La distinta posición del pico tonal en los dos acentos puede ser atribuida a que el tono de frontera L% requiere la retracción del pico en el acento nuclear. El análisis en (a’) es una variante de (a) donde los dos acentos ascendentes se analizan como categorías fonológicas diferentes debido a la distinta posición del pico, tardía o temprana, con respecto a la sílaba tónica. Este análisis con dos acentos contrastivos, L*+H y L+H* es el adoptado en Face (2001b) y Beckman et al (2002) y que empleamos también arriba en (5) y (7). La decisión entre los análisis (a) y (a’) depende de que encontremos motivos independientes para postular que estos dos contornos acentuales son realmente contrastivos y no alofónicos en la lengua. En el análisis en (b), que se basa (con alguna modificación de menor importancia) en el propuesto por Gussenhoven para hechos comparables en holandés, los mismos contornos se interpretan no como acentos ascendentes sino como acentos descendentes, H*+L. El nivel tonal bajo hasta la sílaba acentuada se atribuye a la presencia de un tono de frontera inicial %L, mientras que la bajada después del primer pico es parte de la especificación del acento descendente H*+L. Por supuesto, podríamos tener también un análisis (b’) con dos tipos de acento descendente con distinta especificación fonológica, H*+L, H+L* si encontramos que la posición del pico es fonológicamente contrastiva. ¿Cómo podemos decidir cuál de los análisis es el correcto? El carácter fonológicamente contrastivo de la posición del pico tonal con respecto a la sílaba tónica podría en principio decidirse experimentalmente. Así se ha propuesto que la presencia de un pico temprano (en la tónica) en una palabra no final en la oración, como en (22), se interpreta como foco estrecho sobre esa palabra y que, por tanto, tenemos un contraste en la posición del pico acentual que debe ser atribuida la la presencia de un contraste entre dos acentos fonológicamente distintos. (22) a do ra ban a mi her ma na Igualmente, en principio podríamos idear experimentos que nos permitieran decidir si en el movimiento acentual los dos tonos que van juntos y de alguna manera se asocian con la sílaba tónica son los correspondientes a la subida (LH) o los correspondientes a la bajada (HL). El hecho es, sin embargo, que incluso en el caso de las lenguas mejor estudiadas dentro de este modelo encontramos diferencias considerables entre las diferentes propuestas de análisis. Así basta comparar el sistema ToBI de trascripción del inglés propuesto por M. Beckman, J. Pierrehumbert y sus colaboradores con la propuesta de C. Gussenhoven plasmada en el sistema TODI para el holandés para darse cuenta hasta qué punto es posible tener análisis diferentes para los mismos contornos. Según Gussenhoven (Gussenhoven y Kerhoff 2001) las variedades estándar del inglés y del holandés coinciden casi totalmente en su sistema entonativo. Así, pues, las divergencias en el 23 análisis pueden atribuirse a diferencias reales entre las dos lenguas, el inglés y el holandés, sólo en muy pequeña medida. De hecho Gussenhoven y Kerhoff (2001) presentan una comparación detallada entre las dos transcripciones de un gran número de contornos entonativos que se encuentran tanto en una lengua como en la otra. Como botón de muestra puede bastar este ejemplo que es similar en su contorno al que acabamos de dar para el español:13 (23) Het hoeft niet altijd op een mislukking uit te lopen ToDI %L H*L H*L L% ToBI H* L+H* L-L% ‘No tiene que resultar siempre en un fracaso’ Aunque el propósito de Gussenhoven y Kerhoff (2001) es mostrar la superioridad del análisis ToDI sobre ToBI, es poco probable que los argumentos resulten convincentes a los partidarios del otro análisis. En mi opinión, el permitir esta multiplicidad de análisis posibles es el punto más débil del sistema métrico autosegmental en la actualidad. Como nota Ladd (1996) en las últimas páginas de su libro, otro problema que queda sin resolver completamente en el modelo AM tiene que ver con el tratamiento fonológico de las diferencias de campo tonal. Hay aspectos del campo tonal que parecen ser claramente paralingüísticos y que podemos por tanto excluir de nuestro análisis fonológico. Según el locutor o el interés con que hable la amplitud del campo tonal, es decir, la distancia en Hz entre valles y picos, puede ser mayor o menor. También es un hecho común que la amplitud del campo tonal se vaya reduciendo del principio al final del enunciado, sin que esto tenga relevancia lingüística ni sea percibido por el oyente. Lo que está menos claro es cuál es el tratamiento adecuado de las diferencias relativas entre acentos tonales que pueden ser manipuladas por el hablante para lograr efectos pragmáticos específicos. Sobre este tema hay varias propuestas. Siguiendo la propuesta de Beckman et al. (2002) para el español, en este capítulo hemos considerado un análisis en que estos hechos de prominencia relativa aparecen directamente incorporados a la especificación tonal fonológica, por medio de diacríticos de upstep o downstep añadidos al tono H de acentos bitonales. Ladd (1996), por el contrario, propone que el que un acento tonal se realice con mayor o menor amplitud tonal relativa no debe indicarse directamente en el plano tonal, sino que es preferible derivar estos hechos de la estructura métrica del enunciado, que constituye una representación fonológica independiente de relaciones de prominencia entre constituyentes prosódicos. Por otra parte, entre las ventajas del sistema métrico autosegmental destaca el permitir una comparación detallada de los contornos lingüísticamente contrastivos de una 13 En el sistema ToDI se hace una distinción entre acentos bitonales con el símbolo +, como H*+L donde la segunda especificación se realiza inmediatamente después de la primera (una bajada brusca en este caso) y acentos sin este símbolo, como H*L donde el segundo tono tiene una realización más prolongada en el tiempo (una bajada lenta hasta la próxima especificación tonal, en este caso). Este contraste de notación no se hace en ToBI. 24 lengua determinada, haciendo abstracción de aspectos irrelevantes tales como el número de sílabas o de palabras de cada enunciado. Por dar un ejemplo, el énfasis que el formalismo impone en la alineación exacta entre sílabas específicas y eventos tonales ha llevado al descubrimiento de muchos hechos que, operando dentro de otro sistema de análisis, pudieran muy bien pasar desapercibidos. Otra ventaja importante es que se ha demostrado su aplicabilidad a sistemas prosódicos muy diferentes entre sí, desde sistemas como el del inglés al de lenguas tonales como el chino, pasando por las llamadas lenguas de acento tonal tanto del tipo del japonés como del representado por lenguas europeas como el sueco, el serbo-croata y ciertos dialectos holandeses y bajo alemanes. Referencias bibliográficas Arvaniti, Amalia y Mary Baltazani. 2000. “Greek ToBI: a system for the annotation of Greek speech corpora”. Proceedings of the 2nd International Conference on Language Resources and Evaluation (LREC 2000), Atenas, 555-562. Arvaniti, Amalia y Mary Baltazani. en prensa. “Intonational analysis and prosodic annotation of Greek spoken corpora”. En: Sun-Ah Jun, ed., Prosodic typology and transcription: a unified approach. Arvaniti, Amalia, D. Robert Ladd y Ineke Mennen. 1998. “Stability of tonal alignment: the case of Greek prenuclear accents”. Journal of Phonetics 26: 3-25. Avesani, Cinzia. 1995. “ToBIt: un sistema di transcrizione per l’intonazione italiana”. Atti delle 5e Giornate di Studio del Gruppo di Fonetica Sperimentale (A.I.A), Povo, TN, 85-98. Beckman, Mary, Manuel Díaz-Campos, Julia Tevis McGory y Terrell A. Morgan. 2002. “Intonation across Spanish, in the Tones and Break Indices framework”. Probus 14: 9-36. Beckman, Mary y Gayle Ayers Elam. 1993, 1997. “Guidelines for ToBI Labelling”. The Ohio State University Research Foundation [http://www.ling.ohiostate.edu/phonetics/E_ToBI] Beckman, Mary y Julia Hirschberg. 1994. “ToBI annotation conventions”. The Ohio State University Research Foundation [http://www.ling.ohiostate.edu/~tobi/ame_tobi/annotation_conventions.html] Beckman, Mary y Janet Pierrehumbert. 1986. Intonational structure in Japanese and English. Phonology Yearbook 3: 15-70. Beckman, Mary y Jennifer Venditti. 2000. “Tagging prosody and discourse structure in elicited spontaneous speech”. Ohio State University Working Papers in Linguistics, 54:1-24. Bolinger, Dwight. 1972. “Accent is predictable (if you are a mind-reader)”. Language 48: 633-644. Bruce, Gösta. 1977. Swedish word accents in sentence perspective. Lund: CWK Gleerup. D’Imperio, Mariapaola. 2002. “Italian intonation: an overview and some questions”. Probus 14: 37-69. Elordieta, Gorka. 1998. “Intonation in a pitch-accent variety of Basque”. Anuario del Seminario de Filología Vasca ‘Julio de Urquijo’ 32: 511-569. Face, Timothy. 2001a. Intonational marking of contrastive focus in Madrid Spanish. Tesis doctoral, The Ohio State University. 25 Face, Timothy. 2001b. “Focus and early peak alignment in Spanish intonation”. Probus 13: 223-246. Face, Timothy. 2002. “Local intonational marking of Spanish contrastive focus”. Probus 14: 71-92. Fant, Lars. 1984. Estructura informativa en español: estudio sintáctico y entonativo (Acta Universitatis Upsaliensis, Studia Romanica Upsaliensia 34). Estocolmo: Almqvist y Wiksell. Frota, Sónia. 1998. Prosody and focus in European Portuguese. Tesis doctoral, Universidade de Lisboa. Frota, Sónia. 2002. “Nuclear falls and rises in European Portuguese: a phonological analysis of declarative and question intonation”. Probus 14: 113-146. Garrido, Juan M., Joaquim Llisterri, Carme de la Mota y Antonio Ríos. 1993. “Prosodic differences in reading style: isolated vs. contextualized sentences”. Eurospeech93, 573576. Godjevac, Svetlana. 2000. “An autosegmental/metrical analysis of Serbo-Croatian intonation”. Ohio State Working Papers in Linguistics 54: 79-142. Goldsmith, John. 1976. Autosegmental phonology. Tesis doctoral, MIT. Publ., 1979, Nueva York: Garland. Grabe, Esther. 1998. Comparative intonational phonology: English and German. Tesis doctoral, MPI Series in Psycholinguistics, 7, Nijmegen: Max Planck Institute for Psycholinguistics. Grice, Martine. 1995. The intonation of interrogation in Palermo Italian: implications for intonation theory. Tübingen: Niemeyer. Grice, Martine, D. Robert Ladd y Amalia Arvaniti. 2000. “On the place of phrase accents in intonational phonology”. Phonology 17: 143-185. Grice, Martine, Stefan Baumann y Ralf Benzmüller. en prensa. “German intonation within the framework of autosegmental-metrical phonology”. En: Sun-Ah Jun, ed., Prosodic typology and transcription: a unified approach. Oxford: Oxford University Press. Grice, Martine, Matthias Reyelt, Ralf Benzmüller, Jörg Mayer y Anton Batliner. 1996. “Consistency in transcription and labelling of German intonation with GToBI”. En H. Timothy Bunnell y William Idsardi, eds., Proceedings of the 4th International Conference on Spoken Language Processing, 1716-1719. Nueva York: Institute of Electrical and Electronic Engineers. Gussenhoven, Carlos y Joop Kerkhoff. 2001. “The synthesis of Dutch intonation on the basis of ToDI labels”. Presentado en Workshop on Tone and Intonation in Europe, Vitoria-Gasteiz, 28-30 de junio de 2001. Gussenhoven, Carlos, Toni Rietveld y Jacques Terken. 1999. ToDI: Transcription of Dutch Intonation. http://lands.let.kun.nl/todi. Hirst, Daniel, Albert Di Cristo y Robet Espesser. 2000. “Levels of representation and levels of analyis for the description of intonation systems”. En: Merle Horne, ed., Prosody: Theory and experiment, 51-88. Dordrecht: Kluwer. Hualde, José Ignacio. 2002. “ Intonation in Spanish and the other Ibero-Romance languages: overview and status quaestionis”. En: Caroline Wiltshire y Joaquim Camps, ed., Romance phonology and variation: Selected papers from the 30th 26 Linguistic Symposium on Romance Languages, Gainsville, Florida, February 2002, 101-116. Amsterdam: John Benjamins. Hualde, José Ignacio, Gorka Elordieta, Iñaki Gaminde y Rajka Smiljanic. 2002. “From pitch-accent to stress-accent in Basque”. En: Carlos Gussenhoven y Natasha Warner, eds., Laboratory Phonology 7. Berlin: Mouton de Gruyter. Jun, Sun-Ah. 2000. K-ToBI (Korean ToBI) labelling conventions. http://www.linguistics.ucla.edu/people/jun/ktobi/K-tobi.html Jun, Sun-Ah. (ed.) en prensa. Prosodic typology and transcription: A unified approach. Oxford: Oxford University Press. Jun, Sun-Ah y Gorka Elordieta. 1997. “Intonational structure of Lekeitio Basque”. En: Antonis Botinis, Georgios Kouroupetroglou y George Carayiannis (eds.): Intonation: Theory, models and applications. Proceedings of an ESCA Workshop, 193-196. Atenas: European Speech Communication Association. Jun, Sun-Ah y Cecile Fougeron. 1995. “The accentual phrase and the prosodic structure of French”. Proceedings of the International Congress of the Phonetic Sciences 13.2: 722-725. Jun, Sun-Ah y Cecile Fougeron. 2000. “A phonological model of French intonation”. En: Antonis Botinis, ed., Intonation: Analysis, modelling and technology, 209-242. Dordrecht: Kluwer. Jun, Sun-Ah y Cecile Fougeron. 2002. “Realizations of accentual phrase in French intonation”. Probus 14: 147-172. Ladd, D. Robert. 1997. Intonational phonology. Cambridge: Cambridge Univ. Press. Leben, William. 1973. Suprasegmental phonology. Tesis doctoral, MIT. Publ., 1978, Nueva York: Garland. Leben, William. 1976. “The tones of English intonation”. Linguistic Analysis 2: 69-107. Liberman, Mark. 1975. The intonational system of English. Tesis doctoral, MIT. Publ., 1978, Nueva York: Garland. Llisterri Joaquim, Rafael Marín, Carme de la Mota & Antonio Ríos. 1995. “Factors affecting F0 peak displacement in Spanish”. ESCA, Eurospeech’95. 4th Conference on Speech Communication and Technology, 2061-2064. McGory, Julie, Rebecca Herman y Ann Syrdal. 1999. “Using tone similarity judgements in tests of intertranscriber reliability”. Journal of the Acoustic Society of America 106: 2242 (Abstract). Mota, Carme de la. 1995. La representación gramatical de la información nueva en el discurso. Tesis doctoral, Univ. Autònoma de Barcelona. Mota, Carme de la. 1997. “Prosody of sentences with contrastive new information in Spanish”. ESCA Worskshop on intonation: Theory, models and applications, 75-78. Navarro Tomás, Tomás. 1945. Manual de entonación española. Nueva York: Hispanic Institute of the United States. Nibert, Holly. 2000. Phonetic and phonological evidence for intermediate phrasing in Spanish intonation. Tesis doctoral, University of Illinois at Urbana-Champaign. Odden, David. 1995. “Tone: African languages”. En: John Goldsmith, ed., The handbook of phonological theory, 444-475. Oxford y Cambridge, Mass.: Blackwell. Pierrehumbert, Janet. 1980. The phonology and phonetics of English intonation. Tesis doctoral, MIT. 27 Pierrehumbert, Janet. 2000. “Tonal elements and their alignment”. En: Merle Horne (ed.), Prosody: Theory and experiment, 11-36. Dordrecht: Kluwer. Pierrehumbert, Janet y Mary Beckman. 1998. Japanese tone structure. Cambridge, Mass.: MIT Press. Pike, Kenneth. 1945. The intonation of American English. Ann Arbor: Univ. of Michigan Press. Pitrelli, John, Mary Beckman y Julia Hirschberg. 1994. “Evaluation of prosodic transcription labeling reliability in the ToBI framework”. En Proceedings of the Third International Conference on Spoken Language Processing, Yokohama, 1994, ICSLP, vol 2, 123-126. Post, Brechtje. 2000. Tonal and phrasal structures in French intonation. Tesis doctoral, Katholieke Universiteit Nijmegen. LOT series (Netherlands Graduate School of Linguistics), 34. Thesus: La Haya. Prieto, Pilar. 1997. “Prosodic manifestation of syntactic structure in Catalan”. En: Fernando Martínez-Gil y Alfonso Morales-Front, eds., Issues in the phonology and morphology of the major Iberian languages, 173-194. Washington, DC: Georgetown Univ. Press. Prieto, Pilar. 2001. Reseña de Sosa (1999). Linguistics 39: 1192-1199. Prieto, Pilar. 2002. “Entonació”. En: Joan Solà, ed., Gramàtica del català contemporani vol. 1, 395-462. Barcelona: Edicions 62. Prieto, Pilar, Jan van Santen y Julia Hirschberg. 1995. “Tonal alignment patterns in Spanish”. Journal of Phonetics 23: 429-451. Rialland, Annie y Stéphanie Robert. 2001. “The intonational system of Wolof”. Linguistics 39: 893-939. Silverman, Kim, Mary Beckman, John Pitrelli, Mark Ostendorf, Colin Wighman, Patti Price, Janet Pierrehumbert y Julia Hirschberg. 1992. “ToBI: A standard for labelling English prosody”. En John Ohala, Terrance Neary, Bruce Derwin, Megan Hodge y Grace Wiebe, eds., Proceedings of the 1992 International Conference on Spoken Language Processing (Banff), vol. 2, 867-870. Edmonton: University of Alberta. Sosa, Juan Manuel. 1999. La entonación del español. Madrid: Cátedra. Syrdal, Ann K., Julia Hirschberg, Julie McGory y Mary Beckman. 2001. “Automatic ToBI prediction and alignment to speed manual labeling of prosody”. Speech Communication 33: 135-151. Trager, G. L. y H. L. Smith. 1951. An outline of English structure 41. Norman, Oklahoma: Battenburg Press. Venditti, Jennifer. 1995. Japanese ToBI labelling guidelines. http://www.ling.ohiostate.edu/phonetics/J_ToBI. Willis, Erik. 2002. “Is there a Spanish imperative intonation revisited: local considerations”. Linguistics 40.2. Willis, Erik. en preparación. The intonational system of Cibaeño Dominican Spanish . Tesis doctoral, Univ. of Illinois. 28