Tema 1: La producción de la voz - Escuela Superior de Informática

Anuncio
TECNOLOGÍA DEL HABLA. CURSO 2009/10
TEMA 1: LA PRODUCCIÓN DE LA VOZ.
1.1. LA COMUNICACIÓN ORAL
El habla es la forma más natural de comunicación del ser humano.
La comunicación hablada tiene los siguientes niveles de información, es decir, lo que se puede
deducir por un ser humano escuchando hablar a alguien.





Mensaje propiamente dicho.
Identidad del hablante o locutor.
Idioma del hablante.
Estado de ánimo.
Etc...
Los elementos esenciales que intervienen en el proceso de comunicación hablada son:
Elementos esenciales del proceso de comunicación hablada



Locutor o hablante. Tiene una idea en el cerebro (etapa lingüística), articula los
órganos fonadores necesarios (etapa fisiológica) y emite sonidos (etapa físicoacústica). Se produce una cierta realimentación acústica entre los sonidos emitidos por
el hablante y su propio oído.
Canal. El medio por el que se propaga: en el caso de la voz es el aire, necesario para
la propagación de ondas sonoras. Puede verse reforzado por una amplificación si fuera
necesario (megafonía). Puede haber otros medios de telecomunicación: cables u
ondas. No es el caso de la comunicación oral o hablada.
Oyente. Es el destinatario del mensaje. Recibe las ondas sonoras por el oído (etapa
físico-acústica), se generan órdenes nerviosas (etapa fisiológica) y el cerebro
interpreta el mensaje (etapa lingüística) si conoce el idioma del hablante.
Tema 1: La producción de la voz
1
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.2. CARACTERIZACIÓN TEMPORAL DE LA SEÑAL DE VOZ
Supongamos un transductor, llamado micrófono, que convierte las ondas sonoras en señal de
tensión eléctrica. En función del tiempo de observación se pueden establecer los siguientes plazos:



Largo plazo (por ejemplo, 5 sg). La señal no es estacionaria.
Medio plazo (por ejemplo, 0,5 sg). La señal tampoco es estacionaria.
Corto plazo (por ejemplo 80 msg). La señal es cuasi-estacionaria. Es prácticamente periódica,
aunque puede haber segmentos en este margen de tiempo que no lo sean (sonidos sordos), en
contraposición a los que sí lo son (sonidos sonoros).
Largo plazo: 5 sg
Medio plazo: 0,5 sg
Corto plazo: 80 msg
Tema 1: La producción de la voz
2
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.3. GENERACIÓN DE LA VOZ
Se produce expulsando aire desde los pulmones a través de la tráquea.
Las cuerdas vocales, que están en la laringe, pueden estar:


En tensión y vibrando, en sonidos sonoros.
Relajadas y pasando el aire libremente por ellas, en sonidos sordos.
Entre el órgano de excitación (laringe) y los lugares de radiación (boca y orificios nasales) hay
tres cavidades bien diferenciadas que integran el TRACTO VOCAL, que son:



Cavidad faríngea, después de la laringe.
Cavidad oral: paladar, lengua, dientes y labios.
Cavidad nasal: entre velo del paladar y orificios nasales.
La laringe excita estas cavidades y se producen unas determinadas frecuencias de resonancia
llamadas frecuencias FORMANTES o simplemente FORMANTES. Equivalen a los máximos relativos
de la envolvente del espectro de la señal. Cada sonido tiene varios máximos relativos (4 a 5). Se llama
alófono a cada sonido que se diferencia de otros por el número de formantes, posición de los mismos,
anchos de banda, nivel espectral, etc...
Tema 1: La producción de la voz
3
TECNOLOGÍA DEL HABLA. CURSO 2009/10
Definiciones:







Lenguaje: Es la capacidad humana de comunicarse a través de un sistema de signos.
Lengua: Es el sistema de signos que emplea una comunidad lingüística como instrumento de
comunicación.
Habla: Es el uso individual que cada persona realiza del modelo general de la lengua.
Fonética: Es la disciplina que estudia los sonidos desde el punto de vista de su producción,
transmisión y recepción, sin preocuparse del significado de los mismos.
Fonema: Es la unidad fonológica más pequeña.
Alófono: Son las diferentes realizaciones de un mismo fonema según el entorno en que esté
situado.
Grafía: es la representación gráfica de un fonema.
Formantes del alófono de la vocal /a/. Valores aproximados:
F1 = 700 Hz
F2 = 1200 Hz
F3 = 2800 Hz
F4 = 3300 Hz
F5 = 6000 Hz
Tema 1: La producción de la voz
4
TECNOLOGÍA DEL HABLA. CURSO 2009/10
Otras figuras:
Tema 1: La producción de la voz
5
TECNOLOGÍA DEL HABLA. CURSO 2009/10
COMPARACIÓN HOMBRE – MUJER
Tema 1: La producción de la voz
6
TECNOLOGÍA DEL HABLA. CURSO 2009/10
Tema 1: La producción de la voz
7
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.4. CLASIFICACIÓN DE LOS FONEMAS VOCÁLICOS
Se producen con el tracto vocal abierto saliendo el aire libremente a través de la boca.
Según el GRADO DE ABERTURA:



Abierta: lengua totalmente separada del paladar /a/
Media: lengua a una distancia intermedia del paladar /e/o/
Cerrada: lengua muy cerca del paladar:/ /i/u/
Según la POSICIÓN:



Anterior: la lengua se aproxima a la región delantera del paladar: /e/i/
Central: la lengua se encuentra en la parte central del paladar /a/
Posterior: la lengua de aproxima a la zona velar: /o/u/
Relaciones articulatorias orales de los sonidos vocálicos
Espectrogramas de las cinco vocales castellanas: desde /a/ hasta /u/
Tema 1: La producción de la voz
8
TECNOLOGÍA DEL HABLA. CURSO 2009/10
Se da la circunstancia de que hay una relación directa entre el grado de abertura y la frecuencia
del primer formante F1 y entre la posición y la frecuencia del segundo formante F2.
Posición anterior
Posición posterior
Menor
Abertura
Mayor
Abertura
Triángulo vocálico
Triángulo vocálico castellano:
a: F1=660, F2=1130
e: F1=480, F2=2120
u: F1=270, F2= 650
i: F1=250, F2=2600
o: F1=500, F2= 930
Otras formas de triángulos vocálicos
Tema 1: La producción de la voz
9
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.5. CLASIFICACIÓN DE LOS FONEMAS CONSONÁNTICOS
Según el LUGAR DE ARTICULACIÓN:







Bilabial: labios superior e inferior en contacto durante la producción: /p/b/m/
Labiodental: incisivos superiores con labio inferior: /f/
Linguodental: ápice de la lengua con incisivos superiores: /t/d/
Linguointerdental: ápice de la lengua se sitúa en posición interdental: /z/
Linguoalveolar: ápice de la lengua contacta con los alveolos: /s/n/l/r/rr/
Linguopalatal: ápice de la lengua contacta con el paladar: /ch/ll/y/ñ/
Linguovelar: el postdorso de la lengua contacta con el velo del paladar: /j/ga/k/
Según la FORMA DE ARTICULACIÓN:





Oclusiva: el sonido se produce en dos fases, cierre del tracto seguido de apertura súbita
(explosión): /p/b/t/d/k/g//m/n/ñ/
Fricativa: el aire encuentra un cierre parcial o total en algún punto del tracto, provocando una
turbulencia: /f/s/z/j/
Africada: composición de oclusiva seguida de fricativa: /ch/
Vibrante: el ápice de la lengua se pone en vibración simple o múltiple: /r/rr/
Lateral: el aire sale por uno o ambos lados de la lengua: /l/ll/
Tema 1: La producción de la voz
10
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.6. OTROS CRITERIOS DE CLASIFICACIÓN (FONEMAS EN GENERAL, TANTO
VOCÁLICOS COMO CONSONÁNTICOS)
Por la VIBRACIÓN DE LAS CUERDAS VOCALES:


Sordas: no vibra la cuerda vocal. Turbulencias. Baja energía, alta frecuencia y poca estabilidad a
corto plazo: /p/t/k/f/z/s/j/ch/
Sonoras: vibra la cuerda vocal. Periódico. La frecuencia fundamental es el llamado tono. Alta
energía y estabilidad a corto plazo: /b/d/g/y/m/n/ñ/l/ll/r/a/e/i/o/u/
Por la ACCIÓN DEL VELO DEL PALADAR:


Nasales: el velo del paladar está separado de la pared faríngea: /m/n/ñ/
Orales: el velo del paladar está unido a la pared faríngea y no permite el paso de aire hacia la
cavidad nasal: /p/t/k/f/z/s/ch/j/b/d/g/y/ll/r/rr/a/e/i/o/u/
1.7. PERCEPCIÓN DE LA VOZ HUMANA
Las ondas sonoras producen impulsos nerviosos que son interpretados por el cerebro.

Oído externo. Oreja, recoge y amplifica. Acaba en el tímpano.

Oído medio. Comienza en el tímpano y se compone además por la ventana oval y la ventana
redonda. Hay tres huesos llamados martillo, yunque y estribo y la trompa de Eustaquio, que se
comunica con la faringe. La principal función del oído medio es la adaptación de impedancias
acústica, amplifica la señal débil y atenúa la señal fuerte.

Oído interno. Está compuesto por el caracol y el órgano vestibular, responsable del equilibrio.
El caracol recibe frecuencias de vibraciones y las convierte en impulsos nerviosos.
Distribución de frecuencias en el caracol
Tema 1: La producción de la voz
11
TECNOLOGÍA DEL HABLA. CURSO 2009/10
1.8. EJEMPLOS DE FORMAS DE ONDA EN EL DOMINIO DEL TIEMPO
Visualización de fonemas vocálicos en el dominio del tiempo para las cinco vocales castellanas
con voz de hombre y mujer.
“a” con voz de hombre de 409 msg
“a” con voz de hombre de 20 msg
“a” con voz de mujer de 409 msg
“a” con voz de mujer de 20 msg
“e” con voz de hombre de 409 msg
“e” con voz de hombre de 20 msg
Tema 1: La producción de la voz
12
TECNOLOGÍA DEL HABLA. CURSO 2009/10
“e” con voz de mujer de 409 msg
“e” con voz de mujer de 20 msg
“i” con voz de hombre de 409 msg
“i” con voz de hombre de 20 msg
“i” con voz de mujer de 409 msg
“i” con voz de mujer de 20 msg
Tema 1: La producción de la voz
13
TECNOLOGÍA DEL HABLA. CURSO 2009/10
“o” con voz de hombre de 409 msg
“o” con voz de hombre de 20 msg
“o” con voz de mujer de 409 msg
“o” con voz de mujer de 20 msg
“u” con voz de hombre de 409 msg
“u” con voz de hombre de 20 msg
Tema 1: La producción de la voz
14
TECNOLOGÍA DEL HABLA. CURSO 2009/10
“u” con voz de mujer de 409 msg
“u” con voz de mujer de 20 msg
FUENTE DE DATOS: ficheros reales de voz de alumnos de la Escuela Universitaria de Informática de Ciudad
Real 1994 (hoy llamada Escuela Superior de Informática), UCLM.
1.9. FONÉTICA INGLESA.
En inglés, existe una mayor variedad de fonemas vocálicos y consonánticos. Algunos de ellos
se parecen a los castellanos y otros son distintos. Para mayor detalle, consultar el documento
siguiente:
Tema 1: La producción de la voz
15
Descargar