TECNOLOGÍA DEL HABLA. CURSO 2009/10 TEMA 1: LA PRODUCCIÓN DE LA VOZ. 1.1. LA COMUNICACIÓN ORAL El habla es la forma más natural de comunicación del ser humano. La comunicación hablada tiene los siguientes niveles de información, es decir, lo que se puede deducir por un ser humano escuchando hablar a alguien. Mensaje propiamente dicho. Identidad del hablante o locutor. Idioma del hablante. Estado de ánimo. Etc... Los elementos esenciales que intervienen en el proceso de comunicación hablada son: Elementos esenciales del proceso de comunicación hablada Locutor o hablante. Tiene una idea en el cerebro (etapa lingüística), articula los órganos fonadores necesarios (etapa fisiológica) y emite sonidos (etapa físicoacústica). Se produce una cierta realimentación acústica entre los sonidos emitidos por el hablante y su propio oído. Canal. El medio por el que se propaga: en el caso de la voz es el aire, necesario para la propagación de ondas sonoras. Puede verse reforzado por una amplificación si fuera necesario (megafonía). Puede haber otros medios de telecomunicación: cables u ondas. No es el caso de la comunicación oral o hablada. Oyente. Es el destinatario del mensaje. Recibe las ondas sonoras por el oído (etapa físico-acústica), se generan órdenes nerviosas (etapa fisiológica) y el cerebro interpreta el mensaje (etapa lingüística) si conoce el idioma del hablante. Tema 1: La producción de la voz 1 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.2. CARACTERIZACIÓN TEMPORAL DE LA SEÑAL DE VOZ Supongamos un transductor, llamado micrófono, que convierte las ondas sonoras en señal de tensión eléctrica. En función del tiempo de observación se pueden establecer los siguientes plazos: Largo plazo (por ejemplo, 5 sg). La señal no es estacionaria. Medio plazo (por ejemplo, 0,5 sg). La señal tampoco es estacionaria. Corto plazo (por ejemplo 80 msg). La señal es cuasi-estacionaria. Es prácticamente periódica, aunque puede haber segmentos en este margen de tiempo que no lo sean (sonidos sordos), en contraposición a los que sí lo son (sonidos sonoros). Largo plazo: 5 sg Medio plazo: 0,5 sg Corto plazo: 80 msg Tema 1: La producción de la voz 2 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.3. GENERACIÓN DE LA VOZ Se produce expulsando aire desde los pulmones a través de la tráquea. Las cuerdas vocales, que están en la laringe, pueden estar: En tensión y vibrando, en sonidos sonoros. Relajadas y pasando el aire libremente por ellas, en sonidos sordos. Entre el órgano de excitación (laringe) y los lugares de radiación (boca y orificios nasales) hay tres cavidades bien diferenciadas que integran el TRACTO VOCAL, que son: Cavidad faríngea, después de la laringe. Cavidad oral: paladar, lengua, dientes y labios. Cavidad nasal: entre velo del paladar y orificios nasales. La laringe excita estas cavidades y se producen unas determinadas frecuencias de resonancia llamadas frecuencias FORMANTES o simplemente FORMANTES. Equivalen a los máximos relativos de la envolvente del espectro de la señal. Cada sonido tiene varios máximos relativos (4 a 5). Se llama alófono a cada sonido que se diferencia de otros por el número de formantes, posición de los mismos, anchos de banda, nivel espectral, etc... Tema 1: La producción de la voz 3 TECNOLOGÍA DEL HABLA. CURSO 2009/10 Definiciones: Lenguaje: Es la capacidad humana de comunicarse a través de un sistema de signos. Lengua: Es el sistema de signos que emplea una comunidad lingüística como instrumento de comunicación. Habla: Es el uso individual que cada persona realiza del modelo general de la lengua. Fonética: Es la disciplina que estudia los sonidos desde el punto de vista de su producción, transmisión y recepción, sin preocuparse del significado de los mismos. Fonema: Es la unidad fonológica más pequeña. Alófono: Son las diferentes realizaciones de un mismo fonema según el entorno en que esté situado. Grafía: es la representación gráfica de un fonema. Formantes del alófono de la vocal /a/. Valores aproximados: F1 = 700 Hz F2 = 1200 Hz F3 = 2800 Hz F4 = 3300 Hz F5 = 6000 Hz Tema 1: La producción de la voz 4 TECNOLOGÍA DEL HABLA. CURSO 2009/10 Otras figuras: Tema 1: La producción de la voz 5 TECNOLOGÍA DEL HABLA. CURSO 2009/10 COMPARACIÓN HOMBRE – MUJER Tema 1: La producción de la voz 6 TECNOLOGÍA DEL HABLA. CURSO 2009/10 Tema 1: La producción de la voz 7 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.4. CLASIFICACIÓN DE LOS FONEMAS VOCÁLICOS Se producen con el tracto vocal abierto saliendo el aire libremente a través de la boca. Según el GRADO DE ABERTURA: Abierta: lengua totalmente separada del paladar /a/ Media: lengua a una distancia intermedia del paladar /e/o/ Cerrada: lengua muy cerca del paladar:/ /i/u/ Según la POSICIÓN: Anterior: la lengua se aproxima a la región delantera del paladar: /e/i/ Central: la lengua se encuentra en la parte central del paladar /a/ Posterior: la lengua de aproxima a la zona velar: /o/u/ Relaciones articulatorias orales de los sonidos vocálicos Espectrogramas de las cinco vocales castellanas: desde /a/ hasta /u/ Tema 1: La producción de la voz 8 TECNOLOGÍA DEL HABLA. CURSO 2009/10 Se da la circunstancia de que hay una relación directa entre el grado de abertura y la frecuencia del primer formante F1 y entre la posición y la frecuencia del segundo formante F2. Posición anterior Posición posterior Menor Abertura Mayor Abertura Triángulo vocálico Triángulo vocálico castellano: a: F1=660, F2=1130 e: F1=480, F2=2120 u: F1=270, F2= 650 i: F1=250, F2=2600 o: F1=500, F2= 930 Otras formas de triángulos vocálicos Tema 1: La producción de la voz 9 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.5. CLASIFICACIÓN DE LOS FONEMAS CONSONÁNTICOS Según el LUGAR DE ARTICULACIÓN: Bilabial: labios superior e inferior en contacto durante la producción: /p/b/m/ Labiodental: incisivos superiores con labio inferior: /f/ Linguodental: ápice de la lengua con incisivos superiores: /t/d/ Linguointerdental: ápice de la lengua se sitúa en posición interdental: /z/ Linguoalveolar: ápice de la lengua contacta con los alveolos: /s/n/l/r/rr/ Linguopalatal: ápice de la lengua contacta con el paladar: /ch/ll/y/ñ/ Linguovelar: el postdorso de la lengua contacta con el velo del paladar: /j/ga/k/ Según la FORMA DE ARTICULACIÓN: Oclusiva: el sonido se produce en dos fases, cierre del tracto seguido de apertura súbita (explosión): /p/b/t/d/k/g//m/n/ñ/ Fricativa: el aire encuentra un cierre parcial o total en algún punto del tracto, provocando una turbulencia: /f/s/z/j/ Africada: composición de oclusiva seguida de fricativa: /ch/ Vibrante: el ápice de la lengua se pone en vibración simple o múltiple: /r/rr/ Lateral: el aire sale por uno o ambos lados de la lengua: /l/ll/ Tema 1: La producción de la voz 10 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.6. OTROS CRITERIOS DE CLASIFICACIÓN (FONEMAS EN GENERAL, TANTO VOCÁLICOS COMO CONSONÁNTICOS) Por la VIBRACIÓN DE LAS CUERDAS VOCALES: Sordas: no vibra la cuerda vocal. Turbulencias. Baja energía, alta frecuencia y poca estabilidad a corto plazo: /p/t/k/f/z/s/j/ch/ Sonoras: vibra la cuerda vocal. Periódico. La frecuencia fundamental es el llamado tono. Alta energía y estabilidad a corto plazo: /b/d/g/y/m/n/ñ/l/ll/r/a/e/i/o/u/ Por la ACCIÓN DEL VELO DEL PALADAR: Nasales: el velo del paladar está separado de la pared faríngea: /m/n/ñ/ Orales: el velo del paladar está unido a la pared faríngea y no permite el paso de aire hacia la cavidad nasal: /p/t/k/f/z/s/ch/j/b/d/g/y/ll/r/rr/a/e/i/o/u/ 1.7. PERCEPCIÓN DE LA VOZ HUMANA Las ondas sonoras producen impulsos nerviosos que son interpretados por el cerebro. Oído externo. Oreja, recoge y amplifica. Acaba en el tímpano. Oído medio. Comienza en el tímpano y se compone además por la ventana oval y la ventana redonda. Hay tres huesos llamados martillo, yunque y estribo y la trompa de Eustaquio, que se comunica con la faringe. La principal función del oído medio es la adaptación de impedancias acústica, amplifica la señal débil y atenúa la señal fuerte. Oído interno. Está compuesto por el caracol y el órgano vestibular, responsable del equilibrio. El caracol recibe frecuencias de vibraciones y las convierte en impulsos nerviosos. Distribución de frecuencias en el caracol Tema 1: La producción de la voz 11 TECNOLOGÍA DEL HABLA. CURSO 2009/10 1.8. EJEMPLOS DE FORMAS DE ONDA EN EL DOMINIO DEL TIEMPO Visualización de fonemas vocálicos en el dominio del tiempo para las cinco vocales castellanas con voz de hombre y mujer. “a” con voz de hombre de 409 msg “a” con voz de hombre de 20 msg “a” con voz de mujer de 409 msg “a” con voz de mujer de 20 msg “e” con voz de hombre de 409 msg “e” con voz de hombre de 20 msg Tema 1: La producción de la voz 12 TECNOLOGÍA DEL HABLA. CURSO 2009/10 “e” con voz de mujer de 409 msg “e” con voz de mujer de 20 msg “i” con voz de hombre de 409 msg “i” con voz de hombre de 20 msg “i” con voz de mujer de 409 msg “i” con voz de mujer de 20 msg Tema 1: La producción de la voz 13 TECNOLOGÍA DEL HABLA. CURSO 2009/10 “o” con voz de hombre de 409 msg “o” con voz de hombre de 20 msg “o” con voz de mujer de 409 msg “o” con voz de mujer de 20 msg “u” con voz de hombre de 409 msg “u” con voz de hombre de 20 msg Tema 1: La producción de la voz 14 TECNOLOGÍA DEL HABLA. CURSO 2009/10 “u” con voz de mujer de 409 msg “u” con voz de mujer de 20 msg FUENTE DE DATOS: ficheros reales de voz de alumnos de la Escuela Universitaria de Informática de Ciudad Real 1994 (hoy llamada Escuela Superior de Informática), UCLM. 1.9. FONÉTICA INGLESA. En inglés, existe una mayor variedad de fonemas vocálicos y consonánticos. Algunos de ellos se parecen a los castellanos y otros son distintos. Para mayor detalle, consultar el documento siguiente: Tema 1: La producción de la voz 15