Rasgos acústicos de la prosodia acentual del español

Anuncio
Boletiii de Filología, Tomo XLI
(2006): 11 - 44
Rasgos acústicos de la prosodia acentual
del español
A Antonio Quilis, in inemoriarn
Luis Candiu Goniález*
Universiiy of Southern Calfornia, Estados Unidos
Hernán Urrutia Cúrdenas
Universidad del País Vasco, España
Teresa Fernández Ullou
California Siate University-Bakersfield,Estados Unidos
Resumen
En la mayoría de los estudios empíricos sobre acústica del acento
léxico en distintas lenguas se concluyó que este rasgo fonológico se
manifiesta fundamentalmente por medio de variaciones de intensidad, tono y duración de las vocales, además de algunos correlatos
* Para correspondencia dirigirse a: Luis Candia González (candia@uscspain.com),Madrid
Center University of Sothern Califonia. Velásquez 140, 28006, Madrid, España.
12
BOLETIN DE FILOLOGIA TOMO XLI, 2006
secundarios (Leah 1977, Al-Ani 1992, De Jong y Zawaydeh 1999:
5). Sin embargo, en el ámbito del español tradicionalmente ha existido diversidad de opiniones, donde la mayoría propone la existencia de un solo marcador: el tono, para algunos; la intensidad, para
otros, o la duración (Quilis 1993, Bolinger y Hodapp 196 1, Contreras
1963, Garrido et ál. 1995). En este artículo se presentan los materiales, métodos y resultados de un trabajo basado en instrumentos únicamente "digitales" (Multispeech 3.1, entre otros), que esencialmente
muestran que la prosodia acentual del español puede describirse sobre la base de tres parámetros acústicos: intensidad, tono y duración
-al parecer, un número reducido de parámetros, bastante universales.
Palabras clave: acento, prosodia, lengua española.
Abstract
Most of the empirical research about the word stress acoustic
parameters in different languages concluded that this phonological
feature is basically expressed by means of variations on the intensity,
pitch and duration of vocalic segments -besides of other secondary
correlates (Leah 1977, Al-Ani 1992, De Jong y Zawaydeh 1999: 5).
However, in the Hispanic Linguistics field, most of the studies
traditionally used diverse methodologies to their results, mostly
claiming there isjust one acoustic marker for lexical stress, depending
on the author: pitch, intensity or duration (Quilis 1993, Bolinger y
Hodapp 1961, Contreras 1963, Garrido el al. 1995)-. This paper
presents the materials, methods and conclusions of a laboratory
research work, based only on digital equipment (such as Multispeech
3.1), to essentially conclude that the word stress in Spanish is better
described on the jointly basis of those three parameters: intensity,
pitch and duration -seemingly, a reduced set of quite universal
parameters-.
Key words: accent, prosody, Spanish Language.
Recibido 2011 1/06. Aceptado 13112/06.
Mientras que la mayoría de los estudios sobre la estructura prosódica
del inglés y otras lenguas coincide en concluir que el acei~toléxico se manifiesta por medio de variaciones significativas en la intensidad, tono y
duración de las vocales, además de algunos correlatos secundarios (Leah
1977, Al-Ani 1992, De Jong y Zawaydeh 1999, Ladefoged 2003), en la
investigación de laboratorio sobre la prosodia acentual del español destaca
la diversidad de sus métodos y resultados. Considerando solo sus resultados, podemos encontrar: (1) estudios que concluyen que el tono es el único
correlato acústico del acento (Bolinger y Hodapp 1961, Contreras 1963,
Enríquez et á1. 1989, Quilis 1982); (2) otros que destacan el rol fundamental de la intensidad (Cuervo 1954, Navarro 1950); (3) aquellos que proponen la incidencia de la duración como único factor (Garrido et á1. 1995);y,
(4) los que plantean la influencia en interacción de al menos dos o tres
variables acústicas principales (Candia y Urrutia 1999).
A partir de la última década del siglo XX, la aparición de instrumentos
de laboratorio de base digital ha impulsado el desarrollo de nuevos estudios empíricos sobre la fonología prosódica. Apoyándonos en estos nuevos medios tecnológicos y en los avances últimos en el marco teórico de la
fonología prosódica, hemos llevado a cabo un estudio extenso y comprehensivo de los aspectos acústicos involucrados en la prosodia acentual del
español, cuyos materiales, métodos y resultados presentamos en este
artículo'.
La clave metodológica del estudio consistió en determinar si los niveles
acústicos absolutos observados en la intensidad, tono y duración de las
vocales acentuadas e inacentuadas de una muestra de varios miles de sílabas presentan o no diferencias estadísticamente significativas -además de
establecerse si la influencia de cada variable acústica ocurre de manera
aislada o en interacción. En el trabajo de laboratorio inicial se aplicó un
procedimiento de medición manual de las variables acústicas críticas a
'
Las actividades de la primera etapa, a partir de 1991, tiieron apoyadas por una beca de la
Fundación Del Amo y contaron con el apoyo del Laboratorio de Fonética de la Universidad
de Deusto y del Laboratorio de Fonética de la Universidad del País Vasco-Lejona. En la
segunda etapa, a partir del año 2000, se contó con la ayuda de una beca del Conse.jo de
Investigación de la Universidad de Missouri. Por su valioso aporte al trabajo de laboratorio
queremos dar las gracias a Alexander lribar (U. de Deusto) y a Begoña Arbulu (U. del País
Vasco).
14
BOLET~NDE FILOLOGIA TOMO XLI, 2006
partir del análisis espectrográfico digital de una muestra de 4.146 sílabas,
provenientes del Corpus grabado de 72 oraciones leídas por 4 hablantes
nativos de español, 2 de cada sexo. Para comprobar la fiabilidad de esos
datos, se aplicó luego una medición automatizada de las mismas sílabas,
recurriéndose al procedimiento Voicing Analysis, un componente del software MultiSpeech 3.1, de KAY Eleinetrics <on lo que se completó un
total de 8.292 espectrogramas básicos.
Los resultados del análisis estadístico de los datos provenientes de ambas mediciones, realizados por medio del paquete estadístico SPSS, coinciden en mostrar que hay tres variables acústicas: amplitud, duración y
tono, que en interdependencia presentan un efecto significativo sobre los
valores polarizados del criterio acentual. Realizado un análisis preliminar
y todavía no concluyente de la interacción de factores relevantes, surge con
bastante claridad un cuadro de asociación asimétrica, en el que destaca la
influencia fundamental de la intensidad, a la que acoinpafian de manera
compleja aunque consistente la duración, y de manera casual y no consistente, el tono.
El contenido siguiente se organiza sobre los siguientes apartados: (2)
Antecedentes de la investigación; (3) Metodología empleada; (4) Resultados; (5) Discusión de los resultados; (6) Referencias; (7) Tablas y, finalmente, (8) Materiales.
2. ANTECEDENTES DE LA INVESTIGACIÓN
2. l . ELOBJETO DE ESTUDIO:
LA IMAGEN ACUSTICA DEL ACENTO PROSODICO
En los manuales de fonética acústica se describe el acento fonético
como un correlato acústico del rasgo fonológico abstracto [+/- Acentuado], cuyas propiedades físicas observables se generan a partir de cambios
en la presión subglotal en la emisión del aire. Dichos cambios generalmente producen variaciones en la intensidad (o amplitud), acuidad (tono)
y duración (tiempo) de la señal acústica emitida, particularmente evidentes en los segmentos vocálicos (Johnson 1997, Stevens 1998, Ladefoged
2003). Los valores de intensidad se expresan e11 decibelios, los de acuidad
en hertzios y los de duración en segundos o milisegundos. De estas tres
escalas, la de intensidad es logarítmica, donde una variación de +/- 1 decibelio
corresponde a una oscilación de un 20% del valor anterior, lo que explica
entonces que por cada 5 decibelios se duplique la intensidad (Ladefoged
2003: 90). A modo de referencia, se sabe que la amplitud típica de la voz
humana en discurso conversacional normal suele situarse entre los 60 y los
75 db, en una escala donde O db es el mínimo (lo inaudible) y 120 db el
nivel máximo tolerable para el oido humano.
En los manuales de la especialidad suele destacarse la existencia de
algunos correlatos acústicos "primarios" del acento (tono, intensidad y duración), frente a otros marcadores "secundarios", que igualmente pudieran
concurrir en el fenómeno acentual: variaciones de timbre, reducción o elisión de las vocales inacentuadas, por ejemplo. Otra noción fundamental de
la fonología prosódica establece que los rasgos acústicos de las llamadas
"prosodias" -la acentual o la entonacional, por ejemple no son propiedades de un segmento aislado, sino correspondientes a conjuntos articulatorios
mayores, llámese sílaba, palabra, frase o enunciado, lo que ha dado origen
al término de rasgos suprasegmentales(Johnson 1997, Stevens 1998, Collins
y Mees 2003).
Un factor nuevo e importante ha surgido en las últimas décadas, cuando
aparecen sofisticados instruinentos de laboratorio, actualmente de base
digital (o computarizada), que posibilitan una indagación científica más
completa y exacta (la moderna "fonología dé laboratorio"). Pese a ello, los
investigadores siguen encontrándose con grandes dificultades en la captación y rnedición de los rasgos acústicos del acento léxico a partir de la
señal del habla. En Morton 1984 se comenta la perplejidad que se produce
al medir la amplitud de vocales acentuadas e inacentuadas en el análisis
espectrográfico de grabaciones sucesivas de una misma palabra, para encontrar que en muchas de las mediciones efectuadas, ni la amplitud, ni el
tono, ni la duración, se correlacionan bien con el acento fonológico. Eso
ocurre incluso considerándose el acento tanto en ténninos absolutos (esto
es, la media de los valores acústicos registrados para una misma vocal o
sílaba en grabaciones sucesivas de una palabra) como relativos (o sea, los
valores observados en el contexto de una palabra y10 enunciado). Eso lleva
a Morton a preguntar: ¿cómo puede el hablante nativo de una lengua ser
capaz de seRalar siempre tan certeramente cuál es la vocal y10 sílaba acentuada, si los instrumentos no siempre detectan indicios fonéticos claros de
tal fenómeno?
IJna línea de investigación ha llegado a plantear que los rasgos prosódicos
podrían ser elementos de naturaleza más bien cognitiva, que no necesitan
expresarse a través de indicadores acústicos perceptibles (De Jong y
Zawaydeh 1999: 5). Un planteamiento alternativo, de aceptación más general, sostiene que los fenómenos prosódicos existen tanto en la señal acústica como en la estructura mental. Silverman 1990, por ejemplo, manifiesta que los constituyentes prosódicos ocurren en la cadena del habla en
16
BOI.ETIN DE ~ 1 1 . 0 ~ 0'TOMO
~ 1 ~XLI, 2006
relación con la estructura abstracta de las unidades lingüísticas -que existen en la representación mental del hablante. Para Silverman, el perfil
acentual abstracto de una palabra siempre existe en cuanto imagen, modelo
o expectativa inental; aunque a veces, por causas diversas, pudiera no reflejarse en un contorno acústico concreto, o realizarse de maneras diversas.
No es necesario ser fonetista para darse cuenta de que el habla cotidiana,
por estar sujeta también al principio del mínimo esfuerzo, no suele reflejar
fielmente la calidad del conocimiento lingüístico del hablante nativo sobre
su lengua materna.
Se han identificado al 'menos dos tipos de factores involucrados en el
desfase entre "unidad idealmente acentuada" y "unidad acústicamente acentuada", descrito por Morton 1984. Por un lado está la adecuación de los
medios técnicos (equipos, métodos, conceptos científicos), y por el otro,
las complejas características de la serial acústica observable. Aunque pudiera haber sido lograda bajo condiciones óptimas de laboratorio, una muestra grabada puede estar afectada por la "atenuación" -reducción de los niveles acústicos de las prosodias (Collins y Mees 2003). Otro problema frecuentemente mencionado es el lapsus, o error lingüístico casual, que suele
aparecer tanto en muestras basadas en lectura como en las de discurso espontáneo aunque este factor resulta inás fácil de coiitrolar en el análisis.
Además de las dificultades antes mencionadas, el investigador se encuentra con que algunas propiedades fonéticas de los segmentos vocálicos o
consonánticos dificultan la identificación correcta del perfil prosódico
acentual: la intensidad intrínseca de cada segrneiito vocalico y consonántico
de la secuencia, el contexto fonético previo y posterior a cada núcleo silábico,
o la posición relativa dentro de la palabra fonológica y dentro del enunciado (Leah 1977). La influencia aislada o conjunta de algunos de esos factores puede conducir a que los decibeliosobservados en una vocal inacentuada
sean superiores a los de la vocal acentuada dentro de la misma palabra
prosódica. Sobre ese problema, Ladefoged, uno de los fonetistas más conocidos internacionalmente, señala: "Medir el acento a partir de una grabación acústica es difícil porque los correlatos acústicos del acento interactúan.
La señal acústica indica que una sílaba es acentuada por una combinación
de frecuencia, duración e intensidad (y otros rasgos del espectro de sonido). Pero no se conoce ningún algoritmo que haga posible a un observador
medir esas tres magnitudes y usarlas como una medida del acento
(Ladefoged 2003:94)".
Por otra parte, en los manuales de fonética de las últimas décadas se
encuentran explicaciones y soluciones del problema planteado por Morton
1984. De partida, se plantea que el acento se manifiesta dentro de un contexto lingüístico específico, donde son relevantes ciertos rasgos estructurales
RASGOS ACÚSTICOS DE LA PROSODIA ACENTUAL ... i LUIS CANDIA ET AL
17
de'cada ítein léxico, de la frase y del enunciado (este último entendido
como la secuencia lingüística con autonomía lingüística y prosódica). Por
ejemplo, es importante entender que aunque una vocal como la [o] de las
palabras [paso] y [pasá] del español pudiera no ser la aciisticamente prominente en términos absolutos de amplitud, tono o duración en esas palabras, sus propiedades aciisticas son significativamente diferentes dentro de
los contextos lingüisticos en que pueden ocurrir. De hecho, y puesto que
los perfiles acentuales se derivan de todos los componentes fonológicos de
un ítem léxico, las dos vocales de cada palabra deberían presentar cualidades acústicas diferentes. Algunas de esas cualidades puede que no las podarnos captar mediante instruinentos de laboratorio, que ya presentan limitaciones a la hora de capturar y medir exactamente la intensidad, el tono o
la duración, pero el hablante nativo sí es capaz de percibirlas.
Ahora bien, podemos agregar que las propiedades lingüísticas y aciisticas de la vocales implicadas en las palabraspaso ypasó naturalmente ocurren dentro un enunciado, como, por ejemplo, en alguno de los dos siguientes:
Ej. 1 a.
1 .b
[El paso por. la carre/er.a de San Jlran ... ]
[ É l pasb por. la carretera de San Juan...]
Uno de esos enunciados podría haber sido pronunciado en voz muy
f~iertey el otro de forma atenuada, por lo que los valores acústicos absolutos podrían parecer, a primera vista, no comparables. Sin embargo, dado
que las diferencias en el perfil acentual de las palabras [paso] y [pasó] son
consistentemente pautadas dentro de cada enunciado, la distancia relativa
entre vocales acentuadas y no acentuadas puede seguir dándose, posiblemente dentro del rango de uno a tres decibelios de intensidad. La diferencia
de un decibelio, o de menos de un decibelio, entre los valores de las vocales acentuadas e inacentuadas puede parecer pequeña, pero si la muestra es
suficientemente grande y bien disefiada, y tal diferencia se mantiene consistente a lo largo de cientos de casos, el análisis estadístico podría encontrar que es significativa.
A la hora de unificar criterios metodológicos para la investigación de
fonología de laboratorio, interesa sopesar adecuadamente que es dentro
del contexto lingüístico del enunciado donde se generan cabal y genuinamente los constituyentes prosódicos que interactúaii de manera comple.ja:
el acento léxico, el acento de frase, el énfasis contrastivo o no contrastivo,
la frase entonacional, la duración relativa de los distintos tipos de unidades allí implicados. Todos estos antecedentes sirven para mostrar la importancia de la muestra y del foco específico de la observación en el trabajo de
laboratorio. No parece casual que la discrepancia en los resultados de los
18
BOLETIN DE FILOLOGIA TOMO XLI, 2006
estudios sobre la prosodia acentual del español ocurra en paralelo a la diversidad que se observa en sus muestras, métodos, instrumentos de laboratorio y marco teórico.
En síntesis, estamos en presencia de un objeto de investigación, la prosodia acentual, cuya existencia es evidente al menos en dos órdenes naturales: (1) coino un conocimiento intuitivo del hablante que le permite controlar la producción y10 reconocimiento del perfil acentual de las palabras de
su lengua materna; y (2) bajo la forma de variaciones pautadas, esto es, ni
arbitrarias ni casuales, en los parámetros acústicos perceptibles en el habla.
La descripción científica de estos hechos ha encontrado hasta esta primera
década del siglo XXI serias dificultades, derivadas tanto de la insuficiencia
del conocimiento científico sobre un fenómeno de gran complejidad, coino
de la limitación de los instrumentos y métodos de laboratorio utilizables
para su estudio (Zue y Cole 1997). Los antecedentes presentados en este
apartado sirven para entender la vigencia del problema y el interés de los
investigadores por esclarecerlo.
2.2. ~NVESTIGACIONES
SOBRE LA ACÚSTICA
ACENTUAL EN DIVERSAS LENGUAS
En Leah 1977 se presentan los resultados del estudio acústico quizá
más exhaustivo de la prosodia acentual del inglés, donde se concluye que,
al margen de algunos correlatos de orden secundario, hay tres indicadores
acústicos principales del acento léxico: (1) una mayor intensidad en la vocal acentuada, (2) una mayor duración de las vocales, núcleos silábicos,
acentuados, y (3) un tono más agudo, reflejado por valores más altos de
frecuencia del fundamental en las vocales acentuadas. Leah identifica algunos factores que interfieren con la ubicación correcta del acento a partir
de correlatos acústicos: (1) el timbre intrínseco de cada vocal (en las vocales mhs agudas la frecuencia aumenta, mientras su intensidad y duración
disminuye, sucedierido lo contrario con las vocales más graves); (2) el contexto consonántico: por ejemplo, las consonantes áfonas reducen la intensidad de la vocal siguiente, a la vez que suben su frecuencia; (3) la posición
en el enunciado: las vocales y núcleos silábicos son de mayor duración y
con menor intensidad al final de las frases y oraciones. En sus conclusiones, Leah 1977 afirma haber diseñado un algoritmo, basado en su estudio
empírico, capaz de detectar una sílaba acentuada del inglés con un nivel de
acierto superior al 90% de los casos.
Por otra parte, en los trabajos de Al-Ani 1992 y De Jong y Zawaydeh
1999 se encontraron valores significativainentemayores de intensidad, frecuencia y duración en las vocales acentuadas del árabe. Esos resultados, a
RASGOS ACUSTICOS DE LA PROSOD~AACENTUAL.. I L U ~ SC A N D ~ AET ÁL.
19
partir de datos de una lengua cuya fonología es tipológicamente bastante
diferente del inglés, corroboran fuertemente los hallazgos de Leah 1977.
En Ladefoged 2003 se expresa que "las consecuencias acústicas/auditivas
de que una sílaba en inglés (y otras lenguas) haya sido acentuada probablemente será alguna combinación de incrementos en el tono, duración e intensidad, donde los dos primeros desempeñen un papel principal"
(Ladefoged 2003: 90). Su planteamiento luego se matiza: "Sin embargo,
no deberíamos suponer que un aumento en el tono es siempre el correlato
acentual más importante. Es posible enfatizar palabras sin usar un aumento
en el tono". "En esos casos el incremento en las variables de intensidad y
duración, junto a un cambio en el contorno tonal, portan la información de
que ésa es la sílaba acentuada (Ladefoged 2003: 93-94)".
SOBRE LA ACÚSTICA
2.3. ANTECEDENTES
DENTRO DE LA LINGUISTICA
ACENTUAL
HISPANICA
En los estudios publicados sobre la producción o percepción del acento
léxico en español no existe consenso sobre cuáles son sus correlatos acústicos, ni sobre cuáles son "determinantes". En Quilis 1993 se revisa la literatura y se clasifican los trabajos existentes, tanto de base experimental
como no experimental, dentro de dos planteamientos divergentes. En una
primera posición, según Quilis, estarían quienes opinan que el acento tiene
un solo correlato acústico, el tono. Entre éstos se encontrarían la RAE, que
define el acento como un fenómeno entonacional, o Bello 1847, que lo
relacionaba con cambios leves en la duración y tono. En la segunda, estarían Cuervo 1954 y Navarro 1950, quienes consideraban que en la producción acentual se realza la intensidad. Este último investigador estimaba que
si la percepción pareciera privilegiar la intensidad como variable acústica
acentual clave, "en la pronunciación de las palabras aisladamente consideradas, coinciden en líneas generales el tono y el acento de intensidad" (Navarro 1950: 181).
Antonio Quilis desarrolló una serie de estudios sobre las características
acústicas de las sílabas acentuadas e inacentuadas. En Quilis 1993, se expresa: '"en interior de grupo fónico, tienen mayor intensidad las vocales
tónicas (25,05 db) que las átonas (21,38 db), diferencia que casi desaparece
en las vocales situadas en posición inicial y final de grupo fónico, con una
intensidad media de 23,3 y 23,2 db, respectivamente" (Quilis 1993:408).
En la década de los 90, aparecen algunos trabajos que continúan presentando el tono (frecuencia del fundamental) como única clave acústica
del acento léxico en español. Por ejemplo, en el monográfico de Alcoba y
20
BOLETIN DE FILOLOGIA TOMO XLI, 2006
Murillo 1998, centrado en la entonación del español, sus autores se apoyan
en el contenido del estudio de Boliriger y Hodapp 1961 para afirmar que
"los valores relacionados con la intensidad constituyen un factor de muy
escasa importancia en la definición acústica del acento".
Una tercera posición que enfatiza el rol de la duración como correlato
acentual surge también en los años 90 del siglo pasado, cuando ya se empieza a contar con instrumentos técnicos de tipo digital en los laboratorios
de fonética. El estudio de Garrido et á1. 1995 es, probablemente, el trabajo
divulgado más recientemente que desarrollara una investigación empírica
sobre datos de producción acentual. Según sus autores, los resultados del
análisis espectrográfico de las muestras de lectura en voz alta, tanto de
oraciones no conectadas coino generadas en el contexto de párrafo, llevan
a plantear que:
"los valores máximos de Fo no parecen ser un correlato importante a la hora de
marcar las sílabas tónicas en la lectura, puesto que un 80% de las sílabas tónicas
no se corresponde con un valor máximo de Fo (el formante acústico fundamental). Cabe indicar también que los valores máximos de Fo aparecen principalmente en la sílaba posterior a la tónica" (Garrido et á1. 1995:189).
Se concluye en ese estudio que, tanto en lectura oral como en el Iiabla
espontánea, la duración es el único correlato seguro del acento, descartándose así la participación del tono y la intensidad.
Una cuarta posición frente al problema se vislumbra en algunas observaciones planteadas por Navarro 1950 y en Quilis 1993, que sugieren la
posible influencia de al menos dos variables acústicas en el fenómeno en
cuestión: tono e intensidad. En esa dirección se orientan los resultados del
informe presentado por Candia y Urrutia en el Simposio S.E.L. 1999, basado en el análisis espectrográfico digital de una submuestra aleatoria de 1.500
sílabas. En esos resultados parciales se corrobora ya la tendencia de los
estudios publicados sobre fonología prosódica del inglés y el árabe, al verificarse que las variables intensidad y duración (de la vocal y de la sílaba)
aparecen asociadas, en interdependencia, de manera consistente y significativa con el rasgo acentual. La variable tono, eri cambio, aparecía sin asociación consistente con el acento léxico y sin correlación con los otros dos
indicadores acústicos.
Un estudio experimental realizado por Enríquez et á1. 1989 investigó la
influencia del tono, intensidad y duración en la percepción del acento de
palabra en español. Se concluye que, de esas tres variables acústicas, el
tono (frecuencia fundamental) es "la única que actúa del mismo modo sobre la percepción del acento", excepto cuando la frecuencia es menor a 108
Hz. Aunque no trabajaron con datos de producción, dichos investigadores
concluyen que "la influencia de la intensidad en el acento español parece,
hoy por hoy, poder desecharse" (Enríquez et ál. 1989: 268).
El trabajo de Enriquez et ál. contrasta con los estudios publicados por
autores como Kohler 1994 o Silverman en 1990,sobre percepción del acento,
quienes concluyen que los contornos acústicos del formante fundamental
no son particularmente significativos cuando se los maneja y considera
aisladamente. En el trabajo experimental de Kohler 1994 se demuestra que
una sílaba acentuada cuya cima tonal se sitúa al comienzo del constituyente no será reconocida como acentuada, a menos que su duración, amplitud,
sonoridad y otras propiedades fonéticas sean consistentes con el rasgo apuntado. Tanto en Silverman 1990 como Kohler 1994 se presenta evidencia
empírica sustantiva como para concluir que es solamente por la combinación de características tanto acústicas como provenientes de la estructura
lingüística que la estructura fonológica completa de un constituyente puede ser inequívocamente identificada (Silverman 1990: 140).
En Líebennan y Blumstein (1 988: 154) se expresa que las conclusiones
de los estudios empíricos divulgados sobre percepción del acento
(Lieberman 1960 y 1967, Morton y Jassem 1965, Atkinson 1973) se orientan en una misma dirección, y "muestran que los oyentes humanos hacen
distinciones acentuales aparentemente"simples9'tomando en cuenta el contorno total de frecuencia fundamental del enunciado, la amplitud de los
"picos" silábicos, la duración relativa de los segmentos del enunciado, y el
rango de variaciones en la frecuencia de los formantes".
En resumen, si se dejan de lado algunos estudios publicados sobre percepción o producción del acento en español, no se encuentra ningún antecedente que plantee la existencia de un solo marcador acústico del acento.
Al contrario, en la totalidad de los trabajos de base empírica a los que hemos podido acceder se describe el fenómeno acentual como el resultado de
una compleja interacción de diversos correlatos acústicos, tanto primarios
como secundarios.
La relevancia del problema en cuestión puede establecerse en relación
con dos grandes vacíos de conocimiento: uno dentro del área de investigación científica básica, y otro, en el campo de la ciencia aplicada (la llamada
22
BOLET~NDE FILOLOGIA TOMO XLI, 2006
tecilología lingüística). Para apoyar con fundamentos sólidos el progreso
de las tecnologías de producción ("sintetización") y reconocimiento automatizadas del habla, cuyas repercusiones en el campo de la cibernktica y
las coinunicaciones resultan evidentes en la actualidad, es urgente lograr
un esclarecimiento cabal de la estructura lingüística y acústica de los rasgos prosódicos de las lenguas naturales. En su revisión del estado actual de
la tecnología lingüística, Zue y Cole 1997 coine~itan:"la caracterización
lingüística y acústica de los rasgos prosódicos presenta todavía importantes limitaciones que afectan seriamente a la tecnología lingüística relacionada con el reconocimiento y síntesis del habla". Los misinos autores seííalan que los especialistas han identificado 10 tireas clave de investigación
en el campo de la tecilología del lenguaje humano, una de las cuales es la
estructura prosódica.
En Zue y Cole 1997 se define prosodia como "la estructura acústica que
se extiende sobre varios segmentos o palabras". Con respecto a las tareas
científicas pendientes en este campo, seiialan: "los sistemas actuales no
captan la estructura prosódica"; y agregan: "cómo integrar la información
prosódica en la arquitectura del reconocimiento es una cuestión crítica que
está todavía por resolverse". En otra sección del mismo articulo se expresa:
"El reconocimiento es generalmente más difícil cuando el vocabulario es
de gran tamaño o tiene muchas palabras cuya imagen de sonido es parecida" (Zue y Cole 1997: 5). Además, Zue y Cole 1997 hacen notar que,
aunque ha habido un progreso rápido y significativo en la captación de
rasgos segmentales a partir de palabras aisladas, "las máquinas están muy
lejos de reconocer el lenguaje conversacional [discurso continuo]" (Zue y
Cole 1997:s).
Dentro de tecnología lingüistica se describe el reconocimiento de voz
como un proceso de convertir una seííal acústica en palabras mediante instrumentos de laboratorio (Zue y Cole 1997). En ese proceso se emplean un
micrófono y un equipo analizador que construye una representación
espectrográfica de una parte de la imagen acústica: la que sirve para identificar las unidades segmentales, y se deja de lado la frecuencia fundamental,
qiie permitiría configurar los rasgos prosódicos. Al respecto se comenta en
Hunt (1997: 15) que "en el discurso continuo el reconocimiento de los
contornos de frecuencia del fundamental puede aportar valiosa información sobre la estructura sintáctica y sobre las intenciones del hablante".
También este autor advierte que, en el reconocimiento de unidades Iéxicas
aisladas de ciertas lenguas (inglés, chino), el tono puede aparecer asociado
al acento léxico. Eso implica, según Hunt, que los fallos en el reconocimiento del tono o del acento, a causa del procesamiento incompleto de la
señal acústica, obstaculizan seriamente el reconocimiento de palabras tanto aisladas como conectadas.
Desde el punto de vista de la llamada tecnología lingüística puede concluirse que, en lenguas como el espaflol, en la que los vocablos con autonomía semántica y prosódica deben marcarse con el rasgo [+/- Acentuado]),
por ser este un rasgo distintivo, cualquier aporte a un progreso efectivo en
la correcta captación y producción automatizada de los correlatos acústicos acentuales será de gran importancia. Tampoco puede minusvalorarse
la necesidad de que el conocimiento científico básico de la estructura
prosódica del español y de otras lenguas progresen hacia una descripción
comprehensiva y bien sustentada en los aspectos teóricos y empíricos.
Los datos que presentaremos aquí provienen de un corpus lingüístico
obtenido en los laboratorios de fonética de la Universidad del País Vasco y
de la Universidad de Deusto en 1991, sobre la base de grabaciones de lectura en voz alta de 72 enunciados no conectadas entre sí (que pueden verse
en el Apéndice, al final de este artículo). Los 8 hablantes eran estudiantes
universitarios, hablantes iiativos monolingües de español del norte de Espafia, 4 hombres y 4 mujeres. De ese corpus se ha analizado hasta el momento una muestra de 4 sujetos, dos de cada sexo (lrune, Isabel, Alberto y
Fernando).
En el diseño de la muestra se optó por un corpus de gran tamaño, basado en la lectura oral que realiza un hablante de los enunciados, algunos de
los cuales se diferencian por la presencia de un par mínimo. Este tipo de
muestra permite tanto aplicar un análisis estadístico general de los datos
acústicos, como una observación minuciosa del perfil acentual de los pares
mínimos, o de ciertos ítemes léxicos morfológicamente interesantes (monosílabos acentuados e inacentuados, o los vocablos compuestos, por ejemplo), todos ellos situados en contexto de enunciado.
El trabajo de laboratorio se centró en las tareas de grabación, transferencia y procesamiento espectrográfico del sonido. Su objetivo principal
fue medir y registrar los valores de cuatro variables acústicas: (1) tono, (2)
amplitud, (3) duración de la vocal, (4) duración de la sílaba. Hasta el informe de avance de 1999, el análisis espectrográfico se realizó mediante el
equipo C.S.L. de Kay Elemettics, que presenta la limitación de no entregar
valores reales directos de la amplitud registrada en cada espectrograma,
sino unas cifras de escala negativa inversa con valores de - 1 a -48db (recordemos que en el habla normal la media de amplitud suele situarse en torno
24
BOLETIN DE FILOLOGIA TOMO XLI, 2006
a los 70db). A partir de entonces, empezamos a usar el software Multispeech
3.1 de Kay Elemetrics, que hace posible una medición directa de los herzios
del tono, de los milisegundos de la duracibn y también de los decibelios de
intensidad. El software Multispeech 3.1 permite además que se puedan
determinar las cualidades acústicas de una sílaba por medio de una medicibn manual o automatizada (esta última, mediante el procedimiento Voicing
Analysis, parte del mismo programa informático). Se procedió, entonces, a
realizar primero una medición manual y luego una medición automática de
las mismas sílabas.
En la primera medición con Multispeech 3.1 se buscaron de fonna manual los valores de amplitud y tono observables en el punto medio de cada
sílaba, así como la duración de las vocales y sílabas. Luego, con el procedimiento automatizado de Voicing Analysis, se analizó la señal acústica de
cada sílaba bajo un muestre0 de intervalos de I O milisegundos, obteniéndose
una estadística directa de los valores de tono, amplitud y duración. En definitiva, la data que se va a analizar en este estudio se basa en dos espectrogramas por cada una de las 1 .O24 sílabas grabadas de cada sujeto; vale
decir, 2.048 espectrograinas por cada hablante, y 8.292 en total.
Los valores acústicos observados en cada sílaba se archivaron y procesaron por medio del programa informatizado de estadística SPSS. Las entradas básicas del archivo en la base de datos es la sílaba (1 .O24 en total),
enumeradas y ordenadas en secuencia según ítem léxico, enunciado y sujeto. Los seis factores considerados como de mayor interés fueron: amplitud
medición manual, amplitud medición automatizada, tono medición manual,
tono medición automatizada, duración de la vocal y duración de la sílaba.
Con el fin de investigar los perfiles acústicos en el contexto del item léxico,
se incluyó una variable que marca la condición acentual abstracta de las
sílabas: (a) lexicalmente acentuada, (b) pre-acentuada o (c) post-acentuada. En los vocablos simples polisilábicos, esa variable permitió lograr datos para responder a la cuestibn: ¿es la sílaba acentuada la de mayor intensidad, tono o duración dentro de la secuencia Iéxica en que aparece? Con
respecto a factores no lingüísticos posiblemente intervinientes, se iizcluyeron las variables sujeto y sexo, dado que éstas suelen incidir en los valores
acústicos (la media toiial de las vocales en hablantes mujeres suele ser 100
herzios más aguda que la de los hombres).
Otras variables importantes en la codificacibn de los datos fueron: (1)
tipo de vocablo (monosilábicos, simples polisilábicos -subclasificados en
agudos, graves y esdrújulos-, y vocablos compuestos polisilábicos); (2)
posición de la sílaba en el enunciado; (3) vocal; (4) escala de intensidad
intrínseca de la vocal; (5) escala de acuidad intrínseca de la vocal; (6) tipo
de ataque silábico; (7) tipo de implosión silábica; (8) posición de la palabra
en la frase fonológica, y (9) índole interrogativa-no interrogativa de la itnidad, entre otras.
Los procedimientos estadísticos del programa SPSS que más nos facilitaron la tarea de clasificar la ii~forinaciónrelevante fueron el subprograma
de tabulación cruzada y, para la fase de contrastación de hipótesis, los de
correlación parcial y de regresión múltiple. Como investigadores, debemos
reconocer que la aparición de programas estadísticos informatizados capaces en la actualidad de mariejar una cantidad de miles de datos básicos, de
codificarlos en relación con cientos de variables y de probar las hipótesis
fundamentales mediante distintos procedimientos de análisis inultivariable
(la regresión múltiple o el análisis de varianza inultifactorial, por ejemplo),
probablemente constituye un hito decisivo para el progreso efectivo en el
desarrollo de la investigación en fonética acústica.
4. RESULTADOS
El análisis estadístico de los datos obtenidos en las dos mediciones apoya la extracción de las siguientes conclusiones:
Primero, que las medias de los valores de las variables acústicas:
tono 2 (automático), amplitud 1 (manual), amplitud 2 (automática), duración de la vocal y duración de la sílaba diferencian clara y significativamente las unidades acentuadas de las inacentuadas. Los datos de las tablas
1 y 2 señalan sucesivamente que, en mujeres y hombres, las unidades
fonológicamenteacentuadas presentaron valores acústicos consistentemente
mayores, tanto en las posiciones inicial, interna y final de enunciado. Igualmente, en las tablas 3 y 4 se puede observar que en posición interna de
enunciado y en todo tipo de vocablo (simples polisilábicos, compuestos
polisilábicos y monosilábicos) las vocales acentuadas fonológicamente, en
general, presentan valores acústicos mayores que los de las vocales
inacentuadas. Este alineamiento entre los valores acústicos superiores y las
unidades fonológicamente acentuadas prueba que existe una imagen acústica acent~ialpolarizada que se corresponde con cierta imagen mental que
tiene el hablante nativo sobre un ítem léxico particular de su lengua materna. Con respecto al tono, cabe hacer notar que solo en la medición automática (tono 2), y no en la manual, se observó una correlación fuerte entre esa
variable y el acento léxico. Eso podría deberse a que en el procedimiento
automatizado de Voicing Analysis se recurrió a una sincronización entre
las magnitudes de amplitud y tono -que si se desligaran podrían entregar el
inisrno resultado de la medición manual.
Segundo, coino se puede observar en la 'Tabla 5, encontramos una correlación altamente significativa entre la polarización del criterio acentual
y las variables, de mayor a menor: duración de la sílaba (. 1637), lugar en el
enunciado (. 1555) amplitud manual (.1480) duración de la vocal (. 1292),
amplitud autoinática (.0928) y tono (inedición automática) (.O8 L6). Los
datos de la inedición manual del tono no presentaron correlación significativa, ni siquiera al nivel tendencial, con el acento léxico.
Tercero, de la tabla 5 debe destacarse el nivel de correlacióii, altamente
significativa, entre las dos variables de ainplitud y las dos de tono, lo que
las define como fenómenos interdependientes en relación con el acento.
Por otra parte, también son significativas las correlaciones observadas entre: (1) las dos variables de amplitud y las dos de duración, y (2) entre tono
automático y duración (también significativa, aunque con un índice menor). Estos datos estadísticos expresan que hay un alto nivel de interdependencia entre los marcadores acústicos del acento prosódico.
Cuarto, al enfocarse el perfil acentual dentro del contexto de cada ítein
léxico (vocablos simples polisilábicos), se comprueba que con mayor frecuencia los valores acústicos máximos de la secuencia corresponden a la
sílaba acentuada. Por ejemplo, en las tablas 6 a la 10 se observa que, en la
mayor parte de los casos, es la sílaba acentuada la que presenta valores
significativamente superiores en los niveles de tono, intensidad, duración
de la vocal y duración de la sílaba. En contraste con los resultados de Garrido et al. 1995, los valores acústicos máximos no los heinos encontrado más
frecuentemente ni en la sílaba pre-acentuada ni en la post-acentuada. También hemos observado que los valores acústicos de tono y amplitud tienden
a alinearse en una curva creciente que, a partir de la sílaba pre-acentuada,
aumenta al coincidir con la sílaba acentuada, y generalmente disminuye o
se mantiene en la sílaba post-acentuada. En cambio, la duración de la sílaba post-acentuada tiende a ser tan larga o inás larga que la acentuada, hecho probablemente relacionado con la tendencia al alargamiento de las sílabas finales de palabra y de eniinciado, fenómeno descrito en Leah 1977.
Quinto, que la duración de las vocales y sílabas está también fiiertemente correlacionada con la posición en el enunciado. Podeinos ver en la
Tabla 5 que el índice de correlación entre duración (de la vocal y sílaba) y
acento léxico (con valores de .1292 y .1637, respectivamente) es considerablemente inenor al nivel de correlación entre duración y posición en el
enunciado (2428 y .3 13 1). En las tablas 1 y 2 puede verse cómo la inedia
de duración de las vocales en posición final de enunciado (incluyendo
acentuadas e inacentuadas) casi duplica la inedia de duración de las
sílabas situadas en posición inicial e interna de enunciado. Esto parece
sugerir que, en lo que respecta a las fi~ncioiieslingüísticas de la duracióri,
RASGOS ACUSTICOSDE
1A
. PROSODIA ACENTUAL ... ! LUIS CANDIA ET ÁL.
27
la función de marcar los límites de constituyente sobrepasa a una posible
Filnción culininativa-distintiva acentual -propuesta por Quilis 1993.
En lo fundamental, este trabajo ha mostrado la existencia de una correlación clara, aunque compleja, entre el rasgo acentual abstracto y las variaciones de intensidad, duración y tono en las palabras de la muestra grabada
en el norte de Espaíía. Los resultados de las dos mediciones sucesivas de la
inisma muestra, efectuadas primero mediante CSL de KAY Eleinetrics y
posteriormente con Multispeech 3.1 de la inisma marca, so11coincidentes
+xcepto en lo referente a la variable tono. La correlación entre ese factor y
el rasgo acentual se manifestó bastante más débil e inconsistente en la medición manual que en la medición automatizada-situación que debería aclararse en la investigación futura. Probablemente haya influido el uso del
mecanisino de Voicing Analysis, cuyo procedimiento incluye por defecto
una medición de la amplitud sincronizada con el tono. Cabe conjeturar que
a1 aplicarse en el futuro dicho subprograma sin la sincronización entre tono
y amplitud, o si se vuelve a medir coi1 otros métodos adecuados los niveles
tonales, la correlación entre acento y tono se muestre definitivamente no
sibqificativa.
Un aspecto de interés en estos resultados es la fuerte interacción observada entre las tres variables acústicas en cuestión, lo que pone nuestros
resuliados en la dirección de los trabajos que han investigado el fenómeno
acentual dentro del inglés y otras lenguas (L,eah 1997, Al-Ani 1992, De
Jong y Zawaydeh 1999). La interacción entre intensidad, tono y duración
parece originarse en las condiciones físicas y articulatorias involucradas en
el fenóineno acentual, tal como se señala en los manuales de Johnson 1997,
Stevens 1998, y Collins y Mees 2003. Se corroboran así también las observaciones de Silverman 1990 y Kohler 1994, quienes plantean que, no iinportando si se trata de su producción o percepción, el fenómeno prosódico
acentual está marcado siinulianeamente por diversas variables, interdependientes entre sí. En cambio, nuestros resultados no apoyan las conclusiones
de trabajos anteriores que plantearan la existencia de un solo marcador
acústico del acento (Bolinger y Hodapp 196 1, Contreras 1963, Garrido et
ál. 1995, entre otros), aunque sí corrobora11parcialmente algunas de las
propuestas y10 intuiciones de Navarro 1950 y Quilis 1993 -que sugieren
una posible interacción del tono e intensidad en el fenóineno acentual.
28
BOLETIN DE FILOLOGIA TOMO XLI, 2006
En vista de los resultados básicamente coincidentes entre los resultados
de estudios divulgados sobre correlatos acústicos del acento en lenguas
diversas (inglés, árabe y español), estimamos que la naturaleza acústica del
rasgo acentual es más universal que lo sugerido por estudios anteriores en
el ámbito de la lingüística hispánica. Destacados foiietistas del últirno siglo
han llamado la atención sobre la notable similitud que se observa en la
estructura prosódica de las diversas lenguas investigadas mediante métodos empíricos. Considerando la excepcionalidad de los trabajos que insisten en la participación exclusiva de una sola variable acústica en la prosodia acent~ial,estimamas que esos resultados deberían ser revisados con
métodos e instrumentos adecuados.
Con respecto a la implicación de nuestros resultados en la tecnología
lingüística, podemos decir que las conclusiones logradas guardan relación
con el desarrollo de los sistemas de producción (sintetización) y reconocimiento de voz (captación), específicamente con las bases lingüísticas de
los mecanismos de captación y producción automatizada de la prosodia
acentual (descritos en Hunt 1997; Zue y Cole 1997). De la evidencia empírica lograda en este trabajo y otros varios estudios antes mencionados, se
infiere que dicho mecanismo debería contener un algoritmo de procesamiento de la señal acústica acentual sobre la base de tres parámetros acústicos: intensidad, tono y duración. La ingeniería correspondiente no puede
desconocer la evidencia científica sustantiva, reunida sobre lenguas diversas, que ha mostrado que una elevación notoria y conjunta de intensidad,
tono y duración dentro de una palabra prosódica es la marca acústica de la
sílaba acentuada del ítern léxico correspondiente. En nuestra intuición, el
hablante nativo sabe que puede usar esos tres resortes acústicos, sea en
combinación, sea realzando alguno de ellos, para que se logre el perfil
acentual correcto. Y también todo hablante nativo parece saber que al aumentar la intensidad de la vocal acentuada, se elevarán automáticamente su
tono -por el refuerzo de los armónicos más agudos del formante fundamental- y su duración, por la lógica natural del proceso dinámico de la
articulación. Corresponde a los ingenieros y otros científicos programar
los mecanismos automatizados del habla para adquirir ese conociiniento
del hablante nativo sobre la prosodia acent~ialdel español. Como foiietistas,
hemos tratado de describir lo más claramente posible cuáles son los
parámetros lingüísticos y acústicos que deberían estar presentes en su construcción.
Por otro lado, no vemos necesario que el inecai~ismode ingeniería necesite afinarse hasta el grado de captar la incidencia de correlatos secundarios que se han encontrado en otras lenguas (Leah 1977), ni que necesite
captar otros aspectos de la imagen acústica global compleja que se perfila
en las palabras prosódicas. En un futuro probablemente cercano se podrá
saber si los algoritmos de captación y producción artificial del acento (Iéxico, de frase y oracional) necesitan más de estas tres variables acústicas
fundamentales: nuestrapredicción es que esas tres son suficientes.
Pasando a otro tipo de iinplicaciones de nuestros resultados, queremos
comentar brevemente SLIposible influencia en la elaboración de un modelo
teórico adecuado de la estructura prosódica del español. En dicho campo
de investigación siempre ha estado presente la controversia sobre el posible estatus priinario o secundario de los marcadores acústicos del acento en
español. Al respecto, teneinos la impresión de que en los resultados obtenidos en nuestro estudio destaca la participación de la variable intensidad,
altamente correlacionada con la estructura lingüística y prosódica de un
constituyente (palabra o frase). No hay base para afirmar que las oscilacianes de intensidad pudieran ser un efecto colateral de fluctuaciones en el
tono o duración, y dudamos que se pueda afirmar lo mismo sobre esas dos
últimas variables cuando covarían junto a la intensidad en función del criterio acentual. Aunque todavía está pendiente el desarrollo de un análisis
estadístico inultivariable que nos permita analizar con exactitud la forma
de la interdependencia o b s e ~ a d aentre las variables acústicas intensidad,
tono y duración, nos parece que la covariación observada no es simétrica.
Es necesario distinguir entre los conceptos y modelos que son relevantes
en el campo de la fonética acústica y la ingeniería lingüística fonética, por
Lin lado: y la elegancia, siinplicidad y naturalidad que se necesitan en un
modelo teórico adecuado de la fonología acentual del español, por el otro.
Es en este último terreno donde puede tener interés la cuestión del estatus
priinario o secundario de los indicadores del acento léxico.
En el marco teórico de la fonología prosódica del español, la entonación ha sido descrita como fuertemente asociada con elementos (semánticopragmáticos) de la estructura lingüística, tales como la interrogación o la
estructura de frase y de enunciado. En nuestro estudio, la participación del
tono corno marcador acentual se ha mostrado débil e inconsistente, siendo
al parecer un efecto contingente, no indispensable, de las variaciones de
intensidad motivadas por el rasgo acentual. La inconsistencia de su asociación con el rasgo acentual probablemente obedece al frecuente desdoblamiento funcional del tono, cuando es requerido por la estructura de la frase
entonacional. Así como la duración debe reaccionar en función del límite
final de enunciado, el tono debe responder a los perfiles de entonación, que
se superponen, causando que SLI nivel de covariación con la amplitud y
duración en función del acento se vea alterado (disminuido o anulado).
En lo que respecta a la variable duración, es necesario considerar su
doble faceta funcional, similar a la recién descrita sobre el tono. No
30
BOLETINDE FILOLOGIA
TOMO XLI. 2006
olvidamos que en nuestros datos se prueba que está consistentemente asociado con el acento léxico. Pero también Iieinos comprobado que el nivel
de correlación entre duración y límite de enunciado es bastante superior al
observado entre duración y acento. No sabemos de ninguna causa natural
por la cual la duración deba aumentar en la sílaba o parte final del enuiiciado: más intuitivo parece esperar allí su disininución. Si se alarga la duración al término del enunciado es para delimitar claramente ese constituyente, junto a una cadencia o declinación de los niveles de intensidad y
tonales, hasta llegar a la pausa o silencio. Es cierto que, por otra parte, las
fluctuaciones de la variable duración ocurren simultáneamente y alineadas
con las oscilaciones de tono e intensidad características de las vocales acentuadas e inacentuadas: ¿de esa evidencia debería inferirse que el estatus
teórico de la duración es la de marcador primario o fundamental del acento? En este momento estiinamos que hay mejores argumentos y datos einpíricos para considerar que no es así.
Nuevos estudios hacen pensar que la duración de las vocales acentuadas e inacentuadas está condicionada por pautas de naturaleza bioarticulatoria relacionadas con la estructura de un constituyente duracional
básico, diferente a la sílaba (cuyo estatus teórico y empírico pasa a
cuestionarse) y de manifestación ~iniversaly constante (v. Saltarelli 2003).
En estos momentos estamos comenzando un estudio piloto sobre las posibles bases empíricas de esa hipótesis dentro de la estructura fonológica del
español. Si los resultados finales siguen la tendencia ya observada en nuestros datos preliminares, la cornprensióii actual del compoi-tamiento de la
variable prosódica duración se verá notablemente modificada. Para cerrar
el tema duración, pensamos que esta variable parece ser: (i) en primer lugar, un marcador primario o indispensable del límite de enunciado (unidad
mínima con autonomía prosódica); y (ii), secundariamente, un correlato
acústico contingente a las variaciones de intensidad pautadas por el acento
Iéxico.
Otro antecedente importante de considerar en la discusión sobre los
marcadores fundamentales de ia prosodia acentual es la similitud observable en la conducta del acento en los niveles Iéxico, de frase y enunciado.
Tal como se señala en Ladefoged 2003, el acento enfático contrastivo y no
contrastivo se logra principalmente por medio de variaciones de intensidad. En particular, destaca la integración (progresión o acumulación ordenada de niveles) que se observa en la intensidad de las unidades prosódicas
palabra. frase y enunciado -que se suman de manera escalonada. Es fácil
captar que la sílaba acentuada situada en la última palabra de la frase
prosódica del español es la de mayor intensidad dentro de ese contexto. No
ocurre en cambio que, solamente por su posición, la última palabra de una
frase prosódica del español deba ser la de tono más agudo o la de mayor
duración. Eso significa que en la marcación fonética de la prominencia
acentual dentro de la fiase prosódica (lo que incluye a los vocablos compuestos) las variables duración y tono son irrelevantes. La intensidad inarca la prominencia acentual dentro de la frase y también marca la proininencia dentro del enunciado cuando se trata del Ilainado acento oracional del
español (acento enfático constrastivo y no constrastivo, realce del comentario frente al tópico oracional). De todo esto podernos concluir que por
razones de fundamento empírico, claridad y simplicidad, la intensidad debe
describirse como la variable fuiidamental en la marcacióii de la promiiiencia acentual, en cualquier constituyente prosódico (palabra, frase, enunciado).
En el Cuadro 1 , a continuación, presentamos la visión que tenemos en
la actualidad sobre las variables acústicas y lingüísticas implicadas en la
estructura prosódica de la lengua española, tema al cual queremos seguir
dedicando parte de nuestra investigacióri en el futuro, con miras a lograr el
mayor esclarecimiento posible de los interesantes fenómenos que envuelve.
Cuadro 1 :Nociones básicas para el estudio de los fenóineiios prosódicos
del español
t--
1
/
ESTRUCTURA
PROSODICA FONOLOGIAFONETICA
CONSTITUYENTES / MARCADOR
1 MAGNI~UDES
A C ~ S T I C A SIMPLICADAS
( 1 ) Acento (léxico, de
lntensidad
/
frase y oracional)
I
(2) Interrogación
- Frase entonacional
-
l.a lntensidad (necesario)
1 .b Duración (contingente)
1 .c Tono (contingente)
l1
2.a Tono (necesario)
2.b. lntensidad (eventual /contingente)
2.c Duración (eventual / contingente)
1
3.a Elongación final (necesario)
3.b Declinación final (necesario)
3.c Pausa anterior y pwterior (necesario)
32
BOLETlN DE FILOLOGIA TOMO XLI, 2006
AL-ANI.SALMAN.
1992. Lexical Stress Variation in Arabic: An Acoustic Spectrographic
Analysis. Eii Proceeding.~oJll?e C'olloqtriari~ion Al-abic Crai~imor.Budapest, Hungar).:
l'he Arabist.
ALCOBA,
SANTIAGO
Y JULIO
MURILLO.
1998. lntonation in Spanish. En Hirst, D. y A. Di Cristo
(eds.) In~ona~ion
3-vstei?ls.Cambridge: Cambridge University Press.
ATKINSON,
JAMES.1973. ..lspecfs oj'intonu~ionin speecli; Inipliccrrionsj b n nn e.~periiitentnl
studv oj'jiilndorrieii~alfieqtre~icy.
Tesis doctoral. Uriiversity of Connecticut. Storrs.
BELLO.ANDRES.
1847. Graii~óticade lo lengua costellontr desriiicida o1 uso de los a~nerictrnos.
Santiago de Chile: Imprenta El Progreso.
BOLINGER,
DWIC~HT
Y MARION
HODAPP.
196 1. Acento melódico. Acenio de iniensidad. Boletin
de Filologia de la Universidad [fe Chile XII 1: 33-48.
CANDIA,
LUISY HEKNAN
URRUTIA.
1999. C~ircrcteri~ocioii
aclislico del acento de polobro en
español: litievos dalos .v sus ittiplicaciones. XXlX Simposio S.E.L. - Universidad de
Cáceres.
COLE,RONALD
(ed). 1997. Survev oj' the stote of the nrt in htrnloii langzrcige lechnologv.
Cambridge: Cambridge University Press.
COLLINS,
BEVERLEY.
E INGER MEES.2003. Prtrclicul plionerics trnd pl~ot~ologi~.
New York:
Routledge.
CONTRERAS.
HELES.1963. Sobre el acento en español. Boletin cle Filologia de lo U~iiversidnd
de Chile XV.
CIJERVO,
RUFINO
JOSE.1954. Notas a la Gramática de Bello. En Obras 1, Bogolá.
DE JONC~,
K E N N ~ TYHBUSHRA
.
ADRIAN
ZAWAYDEH.
1999. Stress. duration. and intonation in
Arabic word-level prosody. Jnurnnl oj'Phoi?etics27: 3-22.
ENRIQUEL.
EMILIO:
CELIA
CASADO
Y ANDRE
SANIOS.
~
1989. La jxwepción del acento el1 esp¿Iiiol.
L~nguisacaEspcrñolrr Acluol XI (LEA): 24 1-270.
FRY,DENNIS
BUTLER.
1976. Acous~icPlionetics. Cambridge: Cambridge Universiiy Press.
GARRIDO,
JUANMARIA;
JOAQUIN
LLISTERRI;
C O S MDE~ L A MOTAY ANTONIO
&OS. 1995. Estudio
comparado de las características prosódicas de la oración simple en espahol en dos
modalidades de lectura. En Ana Elejabeitia y Alexander lribar (eds.) Phonericn. Bilbao:
Universidad de Deristo.
RASGOS ACÚSTICOS DE 1.A PROSODIA ACENTUAL ... í LUIS CANDIA ET AL.
33
t IUNT? MELVYN.
1997. Signal Kepreseiitaiion. En Cole, R. (ed.) S~rrvqiofthe stote ofthe rirt
in hrir~iunl~rnguogetecliiiologv. Cainbridge: Canibridge Ilniversity Press.
HYMAN.
LARRY.
(ed.). 1977. Studies i l i Stress and Accent. Southerii Callfornio Occrrsionul
Pnpers in Linguistics 4. Los Angeles: Univeisity of Southeni Califomia.
JOHNSON,
KEITII.1997. Acoustic un(/ Auditor- Plioiietics. Oxford: Blackwell.
KOHLER,
KLAUS.
1994. Macro and niicro FO in tlie synthesis of intonation. En John Kigston y
Maiy Beckniaii (eds.) Pupers 117 Loboiuloy Phodologv IV. Carnbridge: Carnbridge
University Press. .
LADEFOGED,
PETEK.
2003. Plioiielics dotu onu!vsis. Oxford: Blackwell.
LEAH.W. 1977. Acoustic Correlates oiStress and Juncture. En Lany Hyman (ed.) Studies in
Stress aiid Accent. So~outliernCrrijfornio Occosionr11.Pcrpersin Lingtiistics 4. University
o f Southetn California.
LIEBERMAN.
PHILIP.
1960. Some acoustic correlates ofword stress in American Lnglisli.Jotrinol
of [he AcoirsticuI SocieLv ofArizerico 33.
1967. Intonation. peireprion ond longlroge. Carnbridge, MA: The MIT Press.
LIEBERMAN.
PHILIP
Y SHCILA
BLUMSTEIN.
1988. Speech physiolog?: speech perceprion, und
trcoustic phonetics. Canibridge University Press.
MORTON.
KATE.1984. Expeririientol Plionologv o n ~ Phoiletics.
i
Cambridge: Carnbridge
University Press.
MORTON
JOHN Y WIKTOR
JASSEM.
1965. Acoustic correlales of stress. L L I I ~ ~ondSpeecli
IILI~~
8.
N AVAKRO,
TOMAS.1950. Alrrnrr~rlde pronlrnciación espoiiol~r. Madrid: CSIC.
Qurris, ANTONIO.
198 I . Fonética octístico de ILI le17gzrae.spuñola. Madrid: Gredos.
1982. El acento esprrñol. México: Universidad Autónonia de México.
1 993. Trcrt~rdo~irjot~ologío
.v.finético espuñolos. Madrid: Credos.
SALTARELLI.
MARIO.
2003. Durational asymnietries and the theory of quantity. En Going
Rorrrance 2003. Seventeentli Svnlpositrin on Roi~~~ince
Lingtrisfics.University of Nijrnegen.
SILVERMAN.
KIM.1990. The separation ofprosodies. En John Kigston y Mary Bechian (eds.),
Popers in Laborotory Plionology l . Cambridge: Cainbridge University Press.
KENNETM
N. 1998. Acolrstic Plionetics. Canibridge, MA: The MIT Press.
STEVENS,
ZUE.VCTORY RONALD
COLE.1997. Spoken laiiguage input. Speecli recognition. En Cole.
Ronald (ed.), Strrvw of tlie strrte oftlie art in hliiiion luiiguage ~eclinologv.Carnbridge:
Cambridge Uiiiversity Press.
.
7. TABLAS
Tabla 1. Medias acústicas segun vocal, acentuación y lugar en enunciado (sexo femenino)
* Nota:
Tono 1 1 Amplitud I= primera medición (manual)
Tono 2 1 Amplitud 2= segunda medición (autoinatica)
RASGOS ACUSTICOS DE LA I'ROSODIA ACENTUAL
' LUIS CANDIA ET AL.
35
Tabla 2. Medias acústicas según vocal, acentuación y lugar en enunciado
(sexo i n a s c u l i n o )
* Nota:
Tono 1 1 Amplitud 1= primera medición (manual)
.1.oiio 2 1 Amplitud 2= segunda medición (automática)
36
BOLET~NDE F~LOLOG~A
TOMO XLI: 2006
-
Tabla 3. Medias de valores acústicos-porvocal y vocablo en posicióii interna
(sexo femenino)
-iSexo
Vocablo
Tipo
Vocal
[ i l - Aceiiiol
Toiio I
iiia~itial
193
192
197
192
188
191
204
192
184
185
compuesto
189
184
184
193
193
184
203
195
iid
18 1
Toiio 2 Aiiiplitiid Aiiiplitiid Diiracioii
2
vocal
aiiloiiiatic
1
iila~i~rdlaiitonlaticí
1115
I1z
db
db
69
7 1,62
223
73.00
76
217
70,14
72.78
64
72,07
69.82
216
75
72,61
69,68
21 1
195
70.69
67.55
50
70,3 1
67
207
72,72
70,44
62
72,63
219
71,28
71.93
69
220
69,55
7 1.90
58
190
67
64,93
71.57
199
moiiosilabo
191
186
191
196
162
197
185
185
194
194
239
228
20 1
224
208
198
225
223
nd
174
73,33
73,46
72,16
72,32
72,94
72,49
72.96
73,93
nd
68,01
74,74
72.21
66,29
73.45
7 1,99
72,88
70.94
74,08
nd
56,17
73,17
74.19
72,27
73,28
70,64
72,64
70,76
7 1,86
69,74
70,61
72,12
74,52
69.32
74.16
58,34
56,19
71,82
73.81
69.85
75.34
68
68
65
64
56
63
67
70
nd
66
Tabla 4. Medias de valores acústicos por vocal y vocablo, en posición
interna (sexo masculino)
Vocablo
Tipo
Vocal
[ H - Aceiito]
7
simplc polisilabo
Ainplitu
I
111a11ua1
2
66.15
67,54
65,85
66.5 1
65,28
66,36
67,25
66.84
63,48
65,45
-compuesto
65.67
65,70
65,13
h6,40
64,02
64.84
64.50
67,60
nd
66,01
monosílabo
65:69
67,17
64.86
68.17
63.58
66,34
64.82
66,46
64,4 1
67,02
38
BOLETIN DE FILOLOGIA TOMO XLI, 2006
Tabla 5. Correlación parcial entre variables acústicas y factores
Yariiahli%mchdü~: 'T'oiio autoiiiático (TONOAIJTO),
Aiiiplitud Auloiiiática (AMPAUTO),
Duracióii de la vocal (DURVOCAL),
Acento I.ksico (ACENTO).
Tono manual (TONOMAN),
Anipli tud Maii~ial(AMPMAN),
Duracióii de la sílaba (DURSILA),
Lugar en la frase (L.OCUSFRA).
l
a de cantwi. (1) Iiiterrogación,
(2) Sexo,
(3)Vocal,
(4) Contesto previo al núcleo silabico (5) Suleto.
N Data:
Muestra::
3.991 Casos
.
4 Sujetos (2 FEM 1 2 MASC)
Controlalido:
INTEKROGATIVO SEXO
TONOMAN
TONOAUT(
-TONOMAN
-AMPAUTO
AMPMAN
DURSILA
LOCUSFRA
ACENTO
1 I'ONODIK
AMPAUTO
o 77
-3,991
P= O00
VOCAL
ONSET' SlLABlCO
SUJETO
Tabla 6. Jerarquía tonal y estatus acentual de la sílaba (medición manual)
,
N
Acentuada
% eii estatus
L' -4
aceiitual
% en escala toiial
% Total
1
Tabla 7. Jerarquía tonal y estatus acentual de la sílaba (inedición automática)
Estat.
Iéxicoacentual
.
Sílaba
Aceiituada
.lerarqi!ia ioi
N
% eii estatus
acentual
YOen escala to11a12
O/a Total
PostAcentuada
N
te1 cero
1o
33.7
1
5.0%
52
37.2
1
1
1 1
12.4
5.5%
48
48.3
44.7
50.1
46.9
1 22.5% 1 20.8%
1
40
1
42
% en estatus
% en estatus
acentual
% en escala toiial
% Total
11 (1
149
IOO.0
44.9%
44.5
lO0.0
44.5%
Total
40
BOLETIN DE FILOLOGIA TOMO XLI, 2006
Tabla 8. Estatus acentual y jerarquía de ainplitud (medición manual)
--Ea
priiiiero
PreN
Acent~iada % en estatus
l~xico-aceniual
% eii escala amplitud
% del 'Total
Acentuada N
% en estalus
.
Ikxico-acentual
% eii escala ainplitud
% del 'Total
PostN
Acentuada O/o cn estatu:
Iéxico-acentual
% en escala aniplitud
% del Total
Estatus
Iésicoaceiitual
168
N
Total
% en eslatus
Iéxico-aceiitiial
% eii escala amplitud
% del Total
Tabla 9. Estatus acentual y jerarquía de amplitud (medición automática)
--
Escala de aiiiplitcid 2
,
PreN
Aceiit~iada O/O eii eslalus
27~5
~éx;co-aceiitua~
% en escala ariiplitud 2
% del Total
3.9%
Sílaba
N
Aceiituada % en estatus
55.5
Iéxico-acenlual
1 I:
1
% eii escala amplitud 21 58.7
% del Total
26.2%
PostAcentuada
N
1
336
1
40.9
18.3%
475
% en eslatus
Iéxicw~cent~ial
% en escala aniplitud 2
% del Total
14.60/;i
1
Total
1
1
1029
Coiiiit
% en estsiiis
Iéxico-acentoal
44.7
% eii escala aniplitud 2 100.0
% del Total
44.7%
1
1
20.6%
1032
Tabla 10. Estatus acerit~taly jerarquía de duracióri de la vocal (núcleo silábico)
Total
Estatus
Iixicoacentual
PreAcentuada
N
% en estai~is
léxico-acentual
% en escala duracioii
vocal
% del Total
Sílaba
Acentuada
N
% en estatus
lixico-acentiial
% en escala duración
vocal en secuencia
% del l'otal
I'ostAcentuada
N
% en estatus
lixico-acentual
% en escala duración
vocal en secuencia
% del Total
N
% en esiatus
léxico-acentual
% en escala duración
vocal en secuencia
% del Total
4 82
100.0
16.3
16.3%
42
BOLETIN DE FILOLOGIA TOMO XLI, 2006
Tabla 1 l . Estatus aceritual y jerarquía de duración de la silaba
--
Jerai-qiiia diiracioii de la silaba
Estatus
léxicoaceiitual
PreAcentuada
N
% en sstatus
léxico-aceiitual
% eii escala duracioii silaba
% del Total
Silaba
Acentuada
N
% eii estatus
léxico-aceiitual
% eii duración silaba
% del Total
PostAcentuada
N
% en estaitis
léxico-aceiittial
% en diiración silaba
-
% del Total
Total
N
-
% en estatus
léxico-aceiitual
% en dui-acióii silaba
% del Total
8. MATERIALES
Corpus de grabación sobre lectura en voz alta
1. IDENTIF'ICACION DEL, HABLANTE:
Responda por favor, coinpletando las siguientes preguntas:
A. 1
son
A.2
A.3
Mi primer nombre es
Tengo
años de edad.
Nací en la ciudad de
y dos iniciales de mi apellido
y ini primera lengua es el
RASGOS ACIJSTICOS D t LA PROSODIA ACENTUAL
LIJIS CANDlA ET AL
43
11. INSTRUCCIONES PARA LA LECTURA EN VOZ ALTA
Necesilainos quc usted lea las siguientes oraciones dc acuerdo con el scntido de lo
queexpresan. Las frases son del tipo que puede ocurrir en la conversación diaria o
escucharse en los inedios de coinunicacióii. aunque también se ha necesitado incluir
pülabrris compuestas, inodisinos y palabras exóticas de interés para esta investigación.
Lea también el numero de referencia. De antemano. gracia por su cooperación.
111. ENUNCIADOS
César tiie un hombre célebre para los romanos.
Quieren que Pedro celebre pronto sii cuinpleanos.
Ayer celebré toda la noche.
Traigan la cántara de barro.
Si Oscar cantara tangos en ini fiesta.
Brigida cantará cuatro tangos en tu tiesta.
Todo limite tiene señalización.
Quiero que Pablo limite tanto gasto innecesario.
Es cierto que limitk muchos gastos innecesarios.
Al final ando doce kilómetros en bicicleta.
Si Miguel anduviera doce millas. seria fantástico.
Mañana andaré doce kilóinetros en bicicleta.
Tal vez anduve doce inillas.
Si Daniel andaría cuatro millas. sería fantástico.
Al final voy a salir rápidamente del lugar.
Al final he salido velozmente del lugar.
Al línal estoy saliendo calinadainente del lugar.
Al final habré salido tardíaiiiente de ese lugar. ,
'
Al línal hubiera salido pronto para Washington.
Todas las grandes naves pasan por una buena inspección.
Ese monte queda cerca de Reinington.
Ese terminal puede ser un éxito grande.
Coinpraii carey otra vez en el Caribe.
Una sábana bucna siempre se verá bien.
l,a buena música para ini vale mucho.
Hagan tei'iniriales grandes, coino se deben hacer.
Tú vendes gatos como mascotas.
lin caso fácil para mi doctora.
Tu tiibrica vende paraguas todo el año.
Muchos ganapanes curran iiiuy poco.
Siempre canto para las tiestas.
Es inevitable: tengo que cantar quiera o no quiera.
Cuando cantamos mucho, desafinainos.
BOLET~NDE FILOLOGIA TOMO XLI, 2006
Siempre canté para la Pascua.
Pronto cantaré para todo el piieblo.
Cuando cantábamos fuerte. desatinibainos.
Puede que antes cantara para tu cumpleaños.
Di.10 que pronto cantaría para mi familia.
Es inevitable: he de cantar quiera o no quiera.
Estaba mirándolos periódicamente.
Es para entregárselos vacío.
Vámonos a un lugar paradisíaco.
Nunca dije -'castígueseinelo" como trabalenguas.
Vainos a Mallorca este verano.
Se venden coches buenísimos para todo terreno.
Compórtense coino niños buenitos aunque estEn de pie.
Son músicos inaluchos como iniichos dc a!lí.
Quiero que ine des un teletbnazo cuando llegues.
Era una película "súper". según .luan¡ pero re-mala para mi
¿QUEcosas están "in" para los españoles?
¿,Cómo conversaron con la "contra" cuando ya era tarde?
Yo como una comida superbuena. según Carlos.
Es una razón archiconocida para todos.
Tiene una mente racional para ser antiprogresista.
¿Quién va a racionalizar la industria ?
El ministro es quien pide la tacionalización del sector.
Van a re-pro~amarla preselección de la muestra.
No se contradice con una subclasiticacibn de la muestra.
Él fue prosecretario cuando Pérez era vicerrector.
Dame ese cortaplumas amarillo.
Hay un semicírculo verde.
Alcánzaine ese sacapuntas rojo y blanco.
No quiero ese abrecartas para decoración.
Vieron a ese patapalo fuera del periódico.
¿Cuándo viste a ese carapalo fuera del bar?
Con ese metomentodo nunca converséis.
Este pegalotodo parece vacío.
Cada día Isabel abre cartas por cientos.
Él es el tercer mejor alumno: no inventariainos este asunto.
LI siempre saca puntas con su navaja.
El aviso es de una tienda inmensa cerca de aquí.
El avisó a .luan¡ que ayer inventariainos este lugar.
Descargar