1 1 1 1 1 Constantino Pérez Vega
2011
Dpto. de Ingeniería de Comunicaciones
LA IMAGEN DIGITAL
3 3 Orthicón de Imagen
(1940 a c.1980)
Disector de imagen (c. 1940-50) (se usó muy poco)
5 5 Vidicón (c. 1948-70)
7 7
9 9
11 11 Diversos tipos de CCD
13 13
1 píxel
1 píxel
Sensor de una línea
Sensor de tres líneas
15 15
Escáner CIS (Contact Image Sensor)
LUZ INCIDENTE
MICROLENTE
FILTRO DE COLOR
FOTODIODO Microlente y filtro de color
17 17 Patillas de conexión
Conexiones con hilo de oro
Almohadillas de conexión
Substrato de silicio Paquete de cerámica o plástico
Area de imagen
Registro en serie
Amplificador en chip Estructura de un CCD
Optica Interna
Separa la luz incidente de la escena en tres colores primarios, generalmente rojo, verde y azul, mediante el empleo de espejos, filtros o prismas dicroicos
19 19 19 Luz reflejada por la escena Rojo azul + verde azul verde espejo neutro dicroico rojo dicroico azul espejo neutro sensor rojo sensor verde sensor azul E E E R G B SISTEMA OPTICO EXTERNO SISTEMA OPTICO INTERNO CONVERSION OPTO-ELECTRICA
Generación de la señal de vídeo cromático
OPTICA EXTERNA OPTICA INTERNA
SISTEMA DE PRISMAS PARA SEPARACION DE COLORES CCD VERDE CCD ROJO CCD AZUL LUZ INCIDENTE LENTE
21 21 CCD de transferencia de cuadro
23 23
25 25
27 27 Imagen digital RGB – 4:4:4 Formato 4:4:4 720 480 Luminancia y crominancia a plena resolución. Píxels/cuadro: 3x720x480 = 1'036,800 Flujo de datos: 8 x 30 x 1'036,800 = = 248.832 Mbit/seg.
29 29 29 720 480 Y NTSC
480 líneas activas por cuadro 720 muestras/línea
31 31 31 Muestreo 4:2:2 720 480 240 240 Formato 4:2:0
Luminancia: 480 líneas activas Crominancia: 240 líneas activas Píxels por cuadro:
720 x 480 + 2 x 240 x 360 = 518,400 píxels
Flujo de datos:
33 33 33 Muestreo 4:2:0
Ancho de Banda requerido por la señal digital:
Radiodifusión Terrestre de TV y Cable: 6 MHz (NTSC) y 7 u 8 MHz (PAL)
35 35 Jerarquía de codificación
4:4:4
4:2:2
4:2:0
Tipos de imagen posibles HDTV
Relación de aspecto 16:9. Aprox. 1200 líneas/cuadro. Barrido entrelazado o progresivo
EDTV
Relación de aspecto 4:3. 750 líneas. Barrido progresivo
SDTV
Relación de aspecto 4:3. 525/625 líneas. Barrido entrelazado.
Generación y CAD Producción/Postproducción
4:4:4 4:2:2 4:2:0 Compresión Flujo de transporte Audio digital
MUX
Flujo MPEG-237 37 37 Recomendación UIT BT.601-5 4:4:4 324 Mbit/s RGB 4:2:2 216 Mbit/s YCrCb 4:2:0 162 Mbit/s YCrCb Señal analógica Vídeo digital COMPRESION COMPRESION H.261 MPEG1, MPEG2, H.263 MPEG4 Visual, H.264/MPEG4 AVC
39 39
39 Compresión de vídeo:
Se basa en aprovechar las propiedades de las imágenes y las características perceptuales del sistema visual humano:
• Redundancia espacial • Redundancia temporal • Compactación de energía
• Eliminación de información irrelevante • Respuesta visual humana
Compresión de audio
Se basa principalmente en la explotación de las características psicofisiológicas del sistema auditivo humano:
• Enmascaramiento
• Respuesta en frecuencia del oído interno (cóclea) • Compactación de energía
Compresión:
Es la reducción del flujo o tasa binaria: • Reduciendo la información redundante • Eliminando la información irrelevante
Información redundante:
Información superflua, presente varias veces en el flujo binario, o que no contiene información, o que puede recuperarse fácilmente sin pérdidas, mediante un proceso matemático simple en el receptor.
Información irrelevante:
Es la que no puede ser percibida por el sistema visual humano, de modo que puede ser eliminada sin pérdida de la calidad subjetiva.
41 41
41 Redundancia Espacial
Zonas en que los elementos de imagen son prácticamente iguales con muy pocas variaciones entre uno y otro Zonas con elementos de imagen similares, aunque con algunas variaciones más notorias perceptualmente
Cuadros sucesivos Redundancia temporal
43 43 43 Imagen Original Dominio espacial 8x8 pixels
DCT
Dominio de la transformada 8x8 coeficientes Procesado en el Estudio Calidad de contribución Cuantificación perceptual Algoritmos de compresión Señal comprimida 1 pixel = 1 muestra Y+ Cr + Cb Imagen original DCT Hadamard Fourier Seno discreto Karhunen-Loeve Propiedades de compactación de coeficientes de diversas transformadas45 la DCT parte el área de la imagen en frecuencias
discretas en dos dimensiones Bajas frecuencias espaciales Altas frecuencias espaciales 81.47 95.75 42.17 67.87 27.69 43.87 7 90.93 95.97 Bloque original de 8 x 8 valores de intensidad de la imagen
47 47 152.59 192.16 196.70 146.24 114.56 146.70 136.28 152.75 42.77 37.86 1.62 47.19 -30.54 0.75 40.16 9.92 9.85 -16.79 5.94 -5.06 -44.61 -3.43 2.45 31.69 -4.23 48.00 -67.48 5.65 26.11 -38.42 -3.67 10.91 52.98 21.88 13.37 -21.91 14.81 -0.54 43.49 33.48 -11.35 11.94 2.51 10.06 54.27 25.35 -23.18 -3.34 -47.85 -67.68 -48.24 -31.83 -49.98 21.74 -22.52 12.80 -27.36 -10.90 9.70 41.56 12.02 -18.61 -12.09 46.73 Bloque original de 8 x 8 transformado mediante la DCT
El bloque transformado se divide luego elemento a elemento por
los elementos de una matriz de
cuantificación perceptual
.
Como el ojo percibe peor las altas frecuencias espaciales, los
coeficientes correspondientes a estas frecuencias se reducen en
mayor medida que los coeficientes correspondientes a las bajas
frecuencias
49 49
49
Coeficientes de cuantificación perceptual
19.07 12.01 10.35 6.64 4.40 5.43 4.69 4.49 2.67 2.36 0.07 1.96 -1.13 0.02 1.18 0.26
51 51 19 12 10 6 4 5 4 4 2 2 0 1 1 0 1 0 0 0 0 0 1 0 0 0 0 2 2 0 0 1 0 0 2 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 2 1 0 1 0 0 0 1 0 0 1 0 0 0 0 19 12 10 6 4 5 4 4 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 2 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0
53
Compensación de movimiento
Imagen de referencia Predicción hacia adelante Imagen de referencia Predicción hacia atrás Imagen actual tiempo55 Modelo temporal Modelo espacial Codificador de entropia Salida codificada Vídeo digital no
comprimido Residuo Coeficientes
Vectores de movimiento
(códigos binarios cortos)
Imágenes previas y futuras
Codificación híbrida
57
Cuadro n Cuadro n ± k
Diferencia
59 59 59
Codificación de recorrido
frecuencia horizontal frecuencia vertical61 61
¿Y todo esto para qué?
Ch 7 Ch 8 Ch 9
Ch 6 Ch 10
63 63
Ch 7 Ch 8 Ch 9
Ch 6
8-VSB COFDM COFDM 8-VSB
Grado de utilización del espectro en TV digital
•
De 4 a 6 programas por canal
•
Pueden utilizarse los canales adyacentes
•
Aprovechamiento espectral prácticamente de 100%
Ch 7 Ch 8 Ch 9
Ch 6 Ch 10
8-VSB COFDM
Los canales analógicos pueden coexistir con canales digitales
adyacentes sin interferencia
65 65
65
Formatos de codificación (no deben confundirse con formatos de compresión) CIF (Common Intermediate Format) Usado para estandarizar las resoluciones horizontal y vertical en píxels de secuencias de vídeo en componentes YCbCr. Se diseñó para convertir fácilmente PAL NTSC y se propuso inicialmente en el estándard H.261.
Define una secuencia de vídeo con resolución de 352(H)x288(V) y una frecuencia de cuadro de 30000/1100 (aprox. 29.97 cuadros/seg) con codificación de color YCbCr 4:2:0.
QCIF (Quarter CIF). Significa "un cuarto de CIF" y ocupa la cuarta parte del área en CIF. La altura y el ancho se reducen a la mitad.
También se utilizan SQCIF (Sub Quarter CIF), 4CIF (4× CIF) y 16CIF (16× CIF).
67 67 67
Todos los formatos XCIF resultan en imágenes con relación de
aspecto 4:3
Los tamaños de imágen XCIF son múltiplos de
macrobloques
(16x16 píxels)
Por ejemplo, una imagen CIF (352x288) corresponde a 22x18
macrobloques.
4CIF
es adecuado para SDTV (TV estándard) y DVD
CIF
y
QCIF
se usan generalmente para videoconferencia
QCIF
o
SQCIF
son adecuados para aplicaciones multimedia
móviles
Original 5.03 x 3 MB 2592 x 1944 pixels
69 69 640 x 480 píxels 307 x 3 KB 320 x 240 píxels 76.8 x 3 KB
71 71 160 x 120 píxels
20.4 x 3 kB
73