Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Compresión multimedia: Bibliografía [SAL10] “Handbook of Data Compression” Imagen Vídeo Audio Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Introducción Enciclopedia Almacenamiento 500.000 páginas de texto (2 Kb/pág.) 3.000 imágenes (640x480x24 bits) 500 mapas (640x480x16 bits) 60 minutos de audio (176 Kb/s) 30 animaciones de 2 minutos (640x320x16 bitsx16 frames/s) 50 vídeos de 1 minuto de media (640x480x24 bitsx30 frames/s) ~ ~ ~ ~ 1 Gb (2:1 compres.) 2,77 Gb (15:1) 0,31 Gb (10:1) 0,63 Gb (6:1) ~ 23,59 (50:1) ~ 82,94 (50:1) Se necesitan 111,24 Gb // Con compresión 2,95 Gb 2 Arquitectura de Redes y Servicios de Telecomunicación Introducción Cámara de fotos (7 megapíxeles) Resolución: 3072x2304 pix. = 7.077.888 píxeles Color: 24 bits / píxel = 169.869.312 bits 169.869.312 bits = 21.233.664 bytes = 21,2 MB / foto 100 fotos = 2,12 GB En realidad cada foto suele ocupar ~ 1,4 MB Tasa de compresión ~ 15:1 2,12 GB ~ 1.500 fotos 3 Arquitectura de Redes y Servicios de Telecomunicación Introducción Vídeo Full-HD (1080p) Resolución: 1920x1080 pix. = 2.073.600 pix. / frame Color: 12 bits / píxel = 24.883.200 bits / frame Tasa: 50 frames / segundo = 1.244.160.000 bits / seg ¿ Cuántos GigaBytes ocuparía una película de 90 minutos? ¡¡¡840 GigaBytes!!! 4 Arquitectura de Redes y Servicios de Telecomunicación Introducción Ventajas de la compresión Se necesita menos espacio para almacenar los datos Se necesita menos ancho de banda para transmitirlos (el ancho de banda de las redes no crece tan rápidamente como el tamaño de los discos duros, tarjetas de memoria, . . .) El almacenamiento “en la nube” se beneficia de ambas ventajas Desventajas de la compresión Necesitan tiempo de procesamiento para comprimir y para descomprimir Tiempo real vs. “off-line” 5 Arquitectura de Redes y Servicios de Telecomunicación Introducción Clasificación de los métodos de compresión Lossless (sin pérdidas) Permiten recuperar exactamente la información original a partir de los datos comprimidos Eliminan la redundancia (no es información necesaria) p.ej. WinRAR, WinZIP Lossy (con pérdidas) No recuperan exactamente la información original Dependiendo de la tasa de compresión, la pérdida puede ser inapreciable por los sentidos p.ej. MP3, JPEG 6 Arquitectura de Redes y Servicios de Telecomunicación Introducción Clasificación de los métodos de compresión Basados en la entropía (Entropy Coding) Entropía es la cantidad de información contenida en un mensaje (marca el límite de la compresión) Son de propósito general Son codificadores sin pérdidas (p.ej. Huffman) Basados en la fuente (Source Coding) Se tienen en cuenta qué tipo de datos se están codificando y se comprimen basándose en sus características Son de propósito específico (p.ej. codecs de vídeo) Suelen ser con pérdidas y consiguen altas tasas de compresión 7 Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Compresión multimedia: Bibliografía [SAL10] “Handbook of Data Compression” Imagen Vídeo Audio Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Métodos de compresión estadísticos Utilizan VLC (Variable-Length Codes) – Códigos de Longitud Variable Asignan los códigos más cortos a los símbolos o grupos de símbolos que aparecen con mayor frecuencia en los datos originales La probabilidad de un símbolo viene dada por el número de ocurrencias del símbolo dividido entre el número total de símbolos de los datos originales 9 Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Codificación Huffman Representa los símbolos con un número de bits inversamente proporcional a su frecuencia Se construye un árbol binario {0,1} de abajo hacia arriba agrupando los símbolos de menor frecuencia y asignando la suma de probabilidades de ambos al nodo padre del árbol Cada símbolo original corresponde a una hoja del árbol y su código son los bits recorridos desde la raíz 10 Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Codificación Huffman Ejemplo Codificar “TRES TRISTES TIGRES” Solución… 19 T R E S = = = = = I = G = 4 3 3 4 2 2 1 0 00 100 101 01 110 1110 1111 1 11 0 1 5 0 8 0 1 6 1 0 3 1 T(4) S(4) R(3) E(3) 0 (2) I(2) 1 G(1) 11 Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Codificación Aritmética Identifica una secuencia de símbolos asignándole una representación binaria de un intervalo de longitud inferior a la unidad [0, 1) Es más eficiente (en tasa de compresión) que la codificación Huffman Se acerca mucho (incluso puede llegar a coincidir) con la entropía Es computacionalmente eficiente (aunque menos que Huffman) Está sujeto a patentes (una gran parte son de IBM) 12 Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Codificación Aritmética Ejemplo Símbolos A B C D Probabilidad 0,2 0,5 0,2 0,1 Codificar la secuencia: CBAD 0 0.2 0.7 A B 0.7 C 0.74 0.74 A 0.76 0.88 0.9 C 0.81 B 0.754 B D B A 0.744 1 0.84 A 0.74 0.9 D 0.83 0.84 C D 0.758 0.76 C D Cualquier valor de dicho intervalo [0.758, 0.76] representa a CBAD Elegimos 0,759765625 (en binario 0,110000101) 13 Arquitectura de Redes y Servicios de Telecomunicación Métodos Estadísticos Codificación Aritmética Ejemplo A B C D 0,2 0,5 0,2 0,1 Símbolos Probabilidad Decodificación de 0,759765625 (sabiendo que longitud=4) 0 0.2 A 0.7 B 0.9 C 1 D 0,7 < 0,759765625 < 0,9 letra C (0,759765625 – 0,7) / 0,2 = 0,298828125 letra B (0,298828125 – 0,2) / 0,5 = 0,19765625 letra A (0,19765625 – 0) / 0,2 = 0,98828125 letra D Resultado de la decodificación: CBAD 14 Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Compresión multimedia: Bibliografía [SAL10] “Handbook of Data Compression” Imagen Vídeo Audio Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario Métodos de compresión basados en diccionario Estos métodos no usan un modelo estadístico ni generan códigos de longitud variable Seleccionan cadenas de símbolos y codifican cada cadena con un elemento de un diccionario El diccionario puede ser estático (se mantiene la correspondencia entre elementos y cadenas) o dinámico (adaptativo) Lo más habitual es ir creando el diccionario con los patrones que se van encontrando en los datos 16 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW LZW 1984 Terry Welch Es una versión mejorada del LZ78 (Lempel-Ziv) No utiliza la ventana de desplazamiento como diccionario En su lugar se va creando el diccionario con los símbolos/cadenas que se van encontrado en el texto 17 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW LZW Compresión El diccionario se inicializa con los valores de todos los símbolos del alfabeto de entrada (p.e. texto) Se crea una cadena C con la primera letra del texto a codificar Como dicha cadena C sí se encuentra en el diccionario entonces le concatenamos a C la siguiente letra del texto Se busca C en el diccionario y como no se encuentra (ya que C tiene ahora 2 letras) entonces se almacena C en el diccionario como una nueva entrada. La cadena C menos la última letra añadida sí estaba en el diccionario por lo que la salida del codificador será el índice (posición) donde se encontró C sin la última letra añadida Ahora se guarda en C únicamente la última letra añadida Si C está en el diccionario se le añade la siguiente letra del texto y se vuelve a hacer la búsqueda 18 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW LZW Compresión Mientras se vaya encontrando C en el diccionario se le concatenará una letra más En el momento que al añadir una letra a C, ésta no se encuentre, entonces se añadirá una entrada al diccionario y se enviará la posición (índice) de la cadena que hasta el momento sí se había encontrado Descompresión Se parte del mismo diccionario inicial y se van leyendo los símbolos del texto codificado Cuando al concatenar varios símbolos la cadena resultante no exista en el diccionario entonces se añade una nueva entrada El diccionario se va llenando idénticamente a como se hace en el proceso de compresión por lo que tendremos disponibles las entradas nuevas del diccionario cuando sean necesarias. 19 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW Texto: “TO BE OR NOT TO BE OR TO BE OR NOT” LZW: Ejemplo compresión 20 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW LZW: Ejemplo descompresión 21 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW LZW Limitaciones Tenemos un número limitado de entradas en el diccionario (según el número de bits usados para el índice) por lo que el diccionario se puede “llenar” Las cadenas del diccionario se incrementan en un solo símbolo cada vez (el “llenado” es lento) La búsqueda en el diccionario puede ralentizar el tiempo de compresión Existen variaciones e implementaciones del LZW que solucionan estos aspectos y que crean diccionarios donde las búsquedas e inserciones sean eficientes 22 Arquitectura de Redes y Servicios de Telecomunicación Métodos de Diccionario: LZW Más métodos de compresión basados en diccionario LZ78, LZSS, LZPP, LZX, LZFG, LZRW1, LZRW4, LZC, LZMW, LZAP, LZJ, LZY, LZP, LZMA, ... RAR (WinRAR), GIF, XMill, QIC-122, Gzip, 7-zip, PNG, ... 23 Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Bibliografía [SAL10] “Handbook of Data Compression” Compresión multimedia: Audio Imagen Vídeo Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Audio digital Señal de audio = onda acústica = variaciones de presión del aire Un micrófono transforma las variaciones de presión del aire en señales eléctricas (señal unidimensional) PCM (Pulse Code Modulation) – dicha señal (analógica) se muestrea con una frecuencia y con un número de bits/muestra (error implícito) Teorema de Nyquist: para señales cuya frecuencia máxima sea f, la frecuencia de muestreo debe ser 2f Rango de frecuencias audibles: 20Hz – 20KHz 25 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Codificación diferencial DPCM (Differential Pulse Code Modulation) Explota la redundancia temporal de la señal de audio Se envía la diferencia entre muestras (bastante menor) Problema con las frecuencias altas: necesitan más bits de lo normal ya que la diferencia puede ser mayor que la muestra ADPCM (Adaptive Differential Pulse Code Modulation) Codifica la diferencia entre la muestra actual y una estimación basada en las últimas n muestras Para altas frecuencias aumenta n y para bajas frecuencias disminuye n (adaptativo) 64 Kbps 32 Kbps 26 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Codificadores con pérdidas Características Utilizan la psico-acústica para eliminar o reducir aquella información que nuestro sistema auditivo no puede percibir. – Frequency masking (o auditory masking): un sonido fuerte en una determinada frecuencia sube el umbral mínimo de intensidad para las frecuencias adyacentes por lo que podría enmascarar a otros sonidos (y podríamos eliminarlos) – Temporal masking: un sonido fuerte puede enmascarar a otros sonidos temporalmente cercanos (y podríamos eliminarlos) El umbral de intensidad mínimo que podemos percibir depende de la frecuencia del mismo. Si un sonido (con una determinada frecuencia) no alcanza el umbral mínimo, se puede eliminar sin que el audio pierda calidad. 27 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Codificadores MPEG MPEG-1 (1993) Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s Consta de 5 partes Parte 2: Vídeo Parte 3: Audio (2 canales de audio) – Layer I .mp1 / .m1a – Layer II .mp2 / .m2a – Layer III .mp3 – Frecuencias de muestreo soportadas: 32, 44.1, 48 KHz – Tasas de bits: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, 384 Kbps 28 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Codificadores MPEG MPEG-2 (1995) Generic coding of moving pictures and associated audio Consta de 11 partes Parte 2: Vídeo DVD, DVB- (-C/cable, -S/satélite, -T/TDT) Parte 3: Audio (5.1 canales de audio: 5+1 de efectos) – Layer I / Layer II / Layer III (extensiones de MPEG-1) – Frecuencias de muestreo: MPEG-1 + 16, 22.05, 24 KHz – Tasas de bits: MPEG-1 + 8, 16, 24, 40, 48, 144 Kbps Parte 7: AAC – Advanced Audio Coding – Mejor calidad que MP3 a las mismas tasas de compresión – Soporta hasta 48 canales de audio – iPhone, iPod, iPad, Nintendo DSi, iTunes, PlayStation 3, Wii, Sony Ericsson, Nokia, Android, BlackBerry, Flash Player, ... 29 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Codificadores MPEG MPEG-4 (1998) Coding of audio-visual objects Consta de 29 partes Parte 2: Vídeo (MPEG-4 Part 2 = MPEG-4 Visual) DivX Parte 3: Audio AAC – Advanced Audio Coding (extensión de MPEG-2 Parte 7) (.mp4/.m4a/.m4p) – Frecuencias de muestreo: de 8 a 96 KHz – Tasas de bits: de 24 a 256 Kbps (96 Kbps) Parte 10: AVC – Advanced Video Coding (H.264 / AVC) Parte 14: MP4 File Format (formato contenedor) 30 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Audio Otros codificadores Lossless (sin pérdidas) FLAC, ALAC, DST, MPEG-4 SLS, ATRAC Advanced Lossless, WMA Lossless, OSQ, Dolby TrueHD, Monkey’s Audio, ... Lossy (con pérdidas) OGG Vorbis, Microsoft WMA, Dolby AC-3, Musepack, ATRAC, ... 31 Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Bibliografía [SAL10] “Handbook of Data Compression” Compresión multimedia: Audio Imagen Vídeo Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Imagen digital Características de la imagen Las imágenes que percibimos están compuestas de ondas electromagnéticas (: 250nm - 780nm) A diferentes longitudes de onda, diferentes sensaciones de color Mezclando tres colores (R, G, B) podemos obtenerlos todos Una cámara fotográfica digital utiliza un CCD (ChargeCoupled Device) para la captura analógica de la imagen – El CCD tiene pequeños diodos sensibles a la luz que la convierten en impulsos eléctricos – A cada diodo se le añade un filtro (R ó G ó B) para obtener la intensidad de color por componentes 33 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Imagen digital: Espacio de color RGB 34 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Imagen digital: Espacio de color YCbCr 35 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Compresión de imagen Proceso de compresión Eliminar (reducir) la redundancia espacial (p.ej. fondos uniformes) basándose en source coding (mediante una transformada) Codificar los datos obtenidos en el paso anterior mediante entropy coding Para conseguir altas tasas de compresión el proceso se realiza con pérdidas (lossy) 36 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Codificación JPEG Estándar JPEG (1992) Método desarrollado para comprimir imágenes del mundo real (fotografía digital) Compresión con pérdidas (tiene también un modo lossless) Sistema de codificación simétrico .jpg, .jpeg, .jpe, .jfif, .jif Ampliamente usado en cámaras digitales, en la web, ... Un fichero .mp3 puede llevar incrustado una imagen JPEG como carátula Su sucesor: JPEG2000 37 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Codificación JPEG Esquema estándar JPEG Codificación fuente Imagen original (RGB) Prep. de bloques DCT Cuantiz. Codificación entrópica Run Length Tabla Huffman Imagen codificada Tabla Paso 1: Preparación de bloques Se convierte la imagen a YCbCr con subsampling 4:1:1 – p.ej. RGB 640x480 (VGA) Y (640x480) Cb y Cr (320x240) Se divide la imagen en bloques de 8x8 píxeles – p.ej. 4800 bloques Y, 1200 bloques Cb, 1200 bloques Cr 38 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Paso 2: Transformada Discreta del Coseno (DCT) Transforma los datos (amplitudes) del dominio espacial al dominio de la frecuencia Se aplica la transformada a cada bloque de 8x8 El componente (0,0) DC es el valor de la media del bloque El resto indican el valor de las frecuencias encontradas Coeficiente DCT Amplitud x y Transformada DCT Fx Fy 39 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Paso 3 Cuantización (quantization) mediante la división por una tabla (luminancia y crominancia usan tablas distintas) Se eliminan los coeficientes menos significativos Se pueden escalar las tablas con el parámetro Q (que permite así ajustar la tasa de compresión) 150 88 21 4 1 0 0 0 70 56 34 6 0 1 0 0 38 22 12 3 5 0 0 0 16 32 4 7 0 0 0 0 4 2 0 0 2 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 Coeficientes DCT 0 0 0 0 0 0 0 0 / 1 1 2 4 8 16 32 64 1 1 2 4 8 16 32 64 2 2 2 4 8 16 32 64 4 4 4 4 8 16 32 64 8 8 8 8 8 16 32 64 16 16 16 16 16 16 32 64 32 32 32 32 32 32 32 64 64 64 64 64 64 64 64 64 Tabla de cuantización = 150 88 10 1 0 0 0 0 70 56 17 1 0 0 0 0 19 11 6 1 0 0 0 0 4 8 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Coeficientes cuantizados 40 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Paso 4: Codificación componente DC Codificación DPCM de los componentes DC (0,0) de cada bloque Los bloques sucesivos tienen un valor medio muy similar Paso 5: Codificación RLE coeficientes DCT 150 88 10 1 0 0 0 0 Se recorre el bloque en zig-zag para agrupar los valores nulos 70 56 17 1 0 0 0 0 19 11 6 1 0 0 0 0 4 8 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 150-70-88-10-56-19-4-11-17-1-0-1-6-8-0-0-0-1-1-0-0-0-0-0-2-..(39 0’s) 150-70-88-10-56-19-4-11-17-1-0-1-6-8-A0/3-A1/2-A0/5-2-A0/39 41 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Paso 6: Codificación Huffman (VLC) El resultado del paso anterior se codifica mediante Huffman Los datos obtenidos son la imagen codificada Decodificación JPEG Se decodifica aplicando los pasos inversos Inverse Quantization Zig-zag ordering Run-length decoder Inverse DCT Huffman decoder 110001110011100010….. 42 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Imagen Codificación JPEG Comparación tasas de compresión 2,6:1 46:1 15:1 23:1 144:1 43 Tema 7: Compresión de datos Introducción. Métodos estadísticos. Métodos de diccionario. Bibliografía [SAL10] “Handbook of Data Compression” Compresión multimedia: Audio Imagen Vídeo Arquitectura de Redes y Servicios de Telecomunicación (ARST) Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Video digital Vídeo = secuencias de imágenes Vídeo entrelazado (líneas impares / líneas pares) Vídeo progresivo (imágenes completas) Características del vídeo Redundancia espacial (en cada cuadro) – Técnicas de compresión de imágenes aisladas Redundancia temporal (cuadro a cuadro) – Motion estimation / Motion compensation 45 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Compresión de vídeo (MPEG) Cuadro auto-contenido (intracoded frame) No se construye a partir de ningún otro Cuadro de referencia (reference frame) Se utilizan para construir otros frames (intercoded frame) Macrobloque (macroblock) 16x16 píxeles (6 bloques de 8x8 4 Y, 1 Cb, 1 Cr) F1 F2 F3 46 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Compresión de vídeo (MPEG) Vectores de movimiento (motion vectors) Identifican el desplazamiento de un macrobloque en el cuadro actual respecto a la posición que tenía en el cuadro de referencia Vector de movimiento Δx = -20, Δy = 0 Cuadro de referencia Macrobloques idénticos F1 F2 47 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Compresión de vídeo (MPEG) Búsqueda de macrobloques Se buscan los macrobloques del cuadro actual en el cuadro de referencia Si se encuentra exactamente, sólo se codifica el vector de movimiento Si no, se elige el más parecido y se codifica el vector de movimiento y la “diferencia” de macrobloques igual que JPEG (DCT, cuantización, RLE+VLC en zigzag) (macrobloque INTER) Si no se encuentra ninguno parecido entonces se codifica como JPEG (macrobloque INTRA) 48 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Compresión de vídeo (MPEG) Tipos de cuadros Tipo I (intracoded frames) (poca compresión) – Cuadro autocontenido usando JPEG Tipo P (predictive frames) (más compresión) – Cuadro basado en las diferencias con un cuadro anterior Tipo B (bidirectional frames) (mayor compresión) – Interpolación con un cuadro anterior y otro posterior Cuadro de tipo I autocontenido F1 Macrobloque encontrado!! Cuadro de tipo B basado en F1 y F3 F2 Cuadro de tipo P basado en F1 Macrobloque encontrado!! F3 49 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video Secuencias de cuadros (Group Of Pictures) Los cuadros de tipo I son los menos comprimidos, a continuación los de tipo P y por último los que más compresión obtiene son los de tipo B. Secuencias típicas: IBBBPBBBI IBBPBBPBBI (PAL) IBBPBBPBBPBBI (NTSC) I B B P B B P B B I 50 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: Video La importancia de los cuadros de tipo I. En un sistema de vídeo es habitual el usar los controles de avance, retroceso, pausa, etc. Si queremos detener la secuencia de vídeo, necesitamos encontrar el último cuadro I para reconstruir el cuadro donde se ha detenido la imagen. Sirven como puntos de sincronización. Se estima que deben aparecer al menos un cuadro I cada 300-400 ms. Si se está difundiendo una secuencia de vídeo comprimida (TV broadcast, videoconferencia, etc) Permite “engancharse” rápidamente y recuperarse ante la recepción de algún cuadro dañado. 51 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: MPEG Video MPEG: Conjunto de estándares ISO para la grabación y transmisión digital de audio y vídeo. Varias versiones MPEG: MPEG-1 (ISO 11172) (‘91): CD-ROM vídeo (1,5 Mbps). MPEG-2 (ISO 13818) (‘93): TV Broadcast (4-6 Mbps). HDTV (25-34 Mbps). MPEG-4 (ISO 14496) (‘99): Originalmente: Videoconferencia (4,8 a 64 Kbps). Enfoque universal de tratamiento de elementos multimedia. MPEG-7 (‘04): Descripción de contenido multimedia (videodb) MPEG-21 (01-?): Uso transparente de contenido multimedia entre redes y usuarios heterogéneos. 52 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: MPEG Video MPEG-1 (ISO 11172) (‘91) MPEG-Vídeo (IS 11172-2) MPEG-Audio (IS 11172-3) (Tema siguiente) MPEG-System (IS 11172-1): Multiplexado y sincronización. MPEG-Conformance Testing (IS 11172-4) Patrones de prueba, medida de calidad, etc MPEG-Software Coding (IS 11172-5) Directrices para la codificación de los algoritmos. Propósito de MPEG-1 Almacenamiento en CD-ROM de audio (calidad CD) y vídeo (calidad VCR) sincronizado (1,5 Mbps). 53 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: MPEG Video MPEG-2 (ISO 13818) (‘93) Propósito: Aplicación: Mejorar la calidad de imagen respecto al anterior sin incrementar excesivamente la tasa de bits requerida Calidad de vídeo profesional (studio-quality) y HDTV Difusión de señales de TV, HDTV, VOD, DVD La codificación/decodificación es muy similar a la de MPEG-1 salvo algunas diferencias: No se incluyen cuadros de tipo D. Permite bloques de 16x8 para vídeo entrelazado. Otras mejoras (permite DC de hasta 10 bits, cuantización no lineal, nuevas tablas VLC, escalabilidad SNR y multiresolución) 54 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: MPEG Video MPEG-4 (ISO 14496) (‘99) Propósito: Diseño de aplicaciones multimedia interactivas distribuidas. Aplicación: Televisión digital, DVD, HDTV. Compatibilidad con MPEG-2 (backware compatibility) Aplicaciones multimedia interactivas El usuario puede interaccionar con los objetos multimedia de la sesión. Distribución de información multimedia (i.e. WWW) A través de una red, se permitirá el acceso y distribución a información multimedia, facilitando su diseño y presentación. 55 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: ITU Video H.261 pertenece al conjunto de estándares H.320 de ITU dedicados a videoconferencia sobre RDSI (‘98) H.320: Definición de la familia de estándares H.221: Multiplexado, sincronización sobre uno o varios canales RDSI y empaquetamiento (framming). H.242/H.230: Establecimiento y control de sesión. H.224/H.281: Control remoto de cámaras. H.233 y H.234: Cifrado y autenticación de los datos. T.120: Soporte para aplicaciones (transferencia de imágenes, anotaciones compartidas, etc.) G.711, G.72x ...: Algoritmos de compresión de audio H.261: Compresión de vídeo (conocido como px64). 56 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: ITU Video H.263 (‘96): Mejora, amplía y sustituye al H.261 H.264 (´98): Mejora la eficiencia en codificación De propósito general (no sólo para videoconferencia) Incluye compensación de movimiento de “medio-píxel” Soporta cinco resoluciones (SQCIF, QCIF, CIF, 4CIF y 16CIF) Permite estimación de movimiento bidireccional y sin restricción en el tamaño de la ventana de búsqueda Escalabilidad SNR, espacial y temporal Predicción de los valores de los coeficientes de la DCT DCT con enteros (bloque 4x4), compensación de movimiento con bloques de tamaño variable, etc. H.265/HEVC (‘12): Evolución natural del H.264 Mayor número de modos de predicción tanto INTRA como INTER, bloques de tamaño variable hasta 64x64, mejoras generales en las etapas del codificador. 57 Arquitectura de Redes y Servicios de Telecomunicación Compresión multimedia: ITU Video Comparación subjetiva H.264 vs HEVC 58