PARTE I: FUNDAMENTOS TEÓRICOS DE LA IMAGEN DIGITAL
5. El muestreo
hemos dicho, consta de sendos canales para los tres colores primarios. ¿Como reproducir entonces la sensación de “blanco y negro”?
Esta necesidad era una condición sine cua non para el mundo de la televisión. Al contrario que en el cine, donde un proyector sirve tanto para copias en blanco y negro como en color, los televisores en blanco y negro no podrían reproducir las señales de televisión en color. Era necesario adquirir un nuevo aparato para poder verlas.
Este dilema (de alguna manera semejante a la actual transición entre SD y HD) planteaba tres problemas comerciales. El primero, que no se podía obligar a los espectadores a adquirir nuevos equipamientos. Los organismos reguladores exigían que las nuevas emisiones en color fueran compatibles con los televisores monocromos ya instalados en los hogares. El segundo problema es que a las pro pias cadenas de televisión no les interesaba perder audiencia. Querían empezar a emitir en color, pues suponía una gran mejora técnica, pero estas emisiones deberían ser captadas también por todos los espectadores, no sólo por aquellos con capacidad económica suficiente para adquirir un nuevo televisor en color.
Y el tercer problema, no menos importante, en aprovechar adecuadamente el espacio radioeléctrico, sin eliminar operadores.
» Luminancia y crominancia
La solución aparentemente más sencilla (una mezcla ponderada al 33 % de las tres señales) no era visualmente correcta. La razón es que el ojo humano es más sensible al color verde que a los otros dos primarios, quizá debido a nuestros orígenes selváticos como primates. Una ponderación por igual de los tres colores primarios no equivaldría a la sensación de contraste entre blancos y negros tal como la percibe nuestro cerebro.
Por esa razón, y tras diversas pruebas técnicas, se convino en la señal en blanco y negro más apropiada, a la que a partir de ahora llamaremos luminancia
(luminance, cuyo símbolo es la letra y griega mayúscula, Y), y era un balance de
los tres canales en la siguiente proporción:
Y = 0.299R + 0,587G +0.114B
que se suele redondear para decir que la luminancia es la suma del 30 % de la señal del canal rojo, más el 60 % del verde, más el 11 % del azul.
Es importante no confundir luminancia con intensidad lumínica o luminosidad (ligth- ness). Luminancia es equivalente a la escala de grises o señal en blanco y negro.
El resto de la información tricolor se denomina crominancia (notada con la letra ce mayúscula, C) y está formada a su vez por dos señales denominadas arbitrariamente U y V. La fórmula, igualmente sencilla, es:
U = Y-R V = Y-B C = U + V
Asimismo, no hay que confundir crominancia con información de color.
Como se observa, la conversión de RGB a YUV es una sencilla operación aritméti ca que no requiere ni tecnología avanzada ni grandes complicaciones. Bajo esta norma, si se quisiera volver a obtener el canal rojo, bastaría con hacer una resta:
Y-U = Y-(Y-R) = R
Un monitor en blanco y negro funciona tomando la señal Y y mostrándola en la pantalla, desechando la señal de crominancia.
En el caso de un monitor en color, toma la señal YUV y la vuelve a convertir en RGB, aplicando la fórmula inversa. Una vez convertida en RGB la muestra en la pantalla con sus colores originales.
Se conseguía así salvar el principal escollo de aquella etapa de transición al color en televisión, que era la compatibilidad con los equipamientos y televisores ya establecidos en blanco y negro.
5. EL MUESTREO
>> Las limitaciones del espacio radioeléctrico
El otro gran reto de esa etapa fue también de índole comercial. Como podemos deducir, una señal de color triplica la cantidad de información (ancho de banda en analógico o bitrate en digital) de una señal en blanco y negro de iguales características.
Aquí nos enfrentábamos a las limitaciones del espectro radioeléctrico de emisión. Las emisiones de televisión vía antena tradicional (conocidas como emisiones terrestres -Aerial o Terrestrian-, para distinguirlas de las realizadas vía satélite o por cable) ocupan una parte del espacio radioeléctrico público, accesible a todos los operadores. Este espacio ha de tener cabida también para otro tipo de emisiones, como las señales de radio, las comunicaciones de radiofrecuencias públicas y privadas, señales de satélite, de radar, aplicaciones científicas y militares y, últimamente, las frecuencias para la telefonía móvil y las soluciones wifi y Bluetooth.
Esto significaba que, si en la banda del espacio radioeléctrico destinada a televisión (tradicionalmente conocida como de muy alta frecuencia -Very High Frecuency- o VHF) podían "caber” 12 canales en blanco y negro, sólo podría
haber espacio para 4 en color.
Triplicar el ancho de banda de la señal implicaba, además, graves problemas tecnológicos por lo que se refiere al cableado, equipamiento, mezcla y almacena miento de la información. Todos los costes se multiplicarían asimismo por tres.
» El submuestro o muestreo parcial
Por esa razón, los ingenieros buscaron una solución que permitiría reducir el ancho de banda de la señal a algo más razonable. En aquel tiempo, el concepto de compresión digital no se manejaba, así que hicieron sus pruebas en función del espectador medio (el naked eye u ojo desnudo, no el ojo experto del profe sional). Se buscaba una reducción de la información objetiva pero sin “pérdida aparente” o subjetiva. En estas pruebas advirtieron que el ojo humano es muy sensible a los cambios de contraste lumínicos, pero no tanto a los cambios de tono o color.
Dicho con un ejemplo quiere decir que si caminamos por un denso bosque, con profusión de colores verdes y pardos y muchas sombras, enseguida dis tinguiremos un conejo blanco: sabremos casi inmediatamente que es blanco y también que es un conejo. Por el contrario, si el conejo es gris o pardo, proba blemente lo confundamos con un tronco o una piedra o, aunque se mueva, no distinguiríamos su forma de la de cualquier otro animal (y por esa misma razón de supervivencia, los conejos árticos son blancos, y no pardos).
Bajo este razonamiento se decidió que una vez obtenida la señal YUV, la luminancia era intocable pero que las otras dos señales, que juntas formaban la crominancia, se podían reducir a la mitad sin que el "ojo desnudo” apreciara una pérdida significativa de la calidad.
Es lo que la técnica llama submuestreo (subsampling) o muestreo parcial, y entra dentro de las recomendaciones ITU 609 (para SD) y 701 (para HD), siendo el estándar internacional de la televisión. Por esta razón se entiende que toda señal YUV de televisión está submuestreada.
» Submuestreo analógico
En términos numéricos, la señal SD analógica tiene un canal Y con una cantidad de muestras de 13,5 MHz, mientras la señal U tiene sólo la mitad, 6,75 MHz y V otros 6,75 MHz.
En HDTV la señal Y tiene 75 MHz, U = 37,5 MHz y V = 37,5 MHz.
Como U + V = C, se dice entonces que el muestreo de luminancia Y es igual al de crominancia C, en ocasiones referida en una señal multiplexada como la subportadora de color (insistiendo una vez más en que crominancia no es la se ñal de color, sólo una parte de ella).
» TV 4:2:2
En digital se utiliza una convención numérica conocida como 4:2:2. Lo único que quiere decir de manera muy arbitraria (se podían haber elegido otros números, como 10:5:5) es que de cada 4 muestras de Y, sólo obtendremos 2 de U y otras 2 de V.
4:2:2 es el equivalente digital al espacio de color analógico YUV (si bien se usan indistintamente). En ocasiones también encontramos las siglas Y Pb Pe, que se refieren al muestreo parcial para señales de alta definición.
5. EL MUESTREO
Incluso en la actualidad muchas cámaras de gama alta HDTV pueden trabajar completamente con muestreos RGB, sin pérdida de información, por lo que pueden considerarse ya cámaras del segmento HR.
Por definición, también los ficheros y formatos de gráficos (dpx, tiff, bmp, png, etc.), así como todo lo relacionado con la informática, son siempre RGB, sin submuestreo.
» Reducción de flujo de datos
Es fácil calcular que si una señal con muestreo completo RGB ocupa el 100 % de un determinado ancho de banda, la misma imagen submuestreada en YUV ocupa sólo el 66 %.
Esto quiere decir, ni más ni menos, que donde antes emitían 12 canales en blanco y negro, pueden emitir hasta 6 canales en color YUV y no tan sólo 4 en RGB.
La misma reducción de ancho de banda o bitrate del 33 % es igualmente provechosa para el diseño y funcionamiento del equipamiento televisivo, redu ciendo costes. De ahí que el espacio YUV que no presenta pérdidas aparentes de calidad, tenga grandes ventajas de orden económico.
» Pérdida de calidad efectiva
Por pura lógica, no obstante, también debemos comprender que una señal 4:2:2 YUV siempre tendrá menos calidad que una señal con muestreo completo RGB 4:4:4. Las pérdidas en la parte de crominancia quizá no sean apreciables por el espectador medio, pero sí lo son en el entorno profesional.
Por esa razón, 4:2:2 siempre será un estándar admitido en el mundo de la televisión, pero un exigente trabajo de cinematografía digital optará por trabajar con imágenes 4:4:4.
Esta tendencia se observa también en el mercado. Casi todas las cámaras que hemos calificado como de Higher Resolution (HR) ofrecen una captación 4:4:4.
» Cine 4:4:4
Como ya hemos dicho, el cine digital es siempre un formato 4:4:4, y como tal siempre se transfiere así a los archivos que maneja. 4:4:4 es sinónimo de RGB.
ligeramente diferente, pero también con muestreo total 4:4:4. Se profundizará en estos aspectos en la parte dedicada a la postproducción.
EL espacio de color RGB es propiamente televisivo e informático. En ocasiones, las soluciones de cine digital usan un espacio de color específico, conocido como XYZ,
E incluso empiezan a aparecer equipamientos de HDTV que pueden ofrecer esta opción. Después de todo, la conversión RGB/YUV es un proceso añadido al flujo de información propio de la cámara, que encarece el equipamiento: todas las cámaras captan la señal en RGB, y es una etapa interna la que convierte esta señal original en YUV
En cuestión de monitorización, los televisores tradicionales de tubo de ra yos catódicos (CRT, analógicos) trabajan en YUV Pero esta tecnología está en
desuso. Sus sustitutos, los monitores planos tipo LCD, TFT, plasma y similares, trabajan siempre en RGB al igual que cualquier otro equipamiento informáti co (si muestran señales YUV es porque internamente constan de un conversor RGB/YUV en la entrada correspondiente).
Tecnológicamente, hoy no supondría ningún problema que toda la industria televisiva trabajara en RGB. Excepto en el caso de las emisiones, por el tema ya comentado de la limitación del espacio radioeléctrico. También hace tiempo que se dejaron de vender televisores en blanco y negro. Sin embargo, la nece saria compatibilidad con los equipamientos previos, permiten que el 4:2:2 siga siendo el estándar televisivo profesional, como recogen todas las normativas y recomendaciones internacionales (véase página 394).
No es impensable suponer que a medio plazo las opciones de grabación y postproducción de todas las cámaras sean 4:4:4. El 4:2:2 se mantendrá como una conversión final para
su posible emisión por las televisiones y canales tradicionales.
» Número de muestras
Si pensamos en digital, la reducción de muestras se realiza en el número de muestras horizontales. Siempre mantendremos la resolución vertical.
En una señal HD 1.080, sabemos que cada canal RGB necesitará 1.920 x 1.080 píxeles o muestras para un “sampleo" (del inglés sampling) completo. Habrá pues
1.920 x 1.080 = 2.073.600 muestras del canal rojo, otras tantas del canal verde y otras tantas del canal azul.
Sin embargo, en 4:2:2 tendremos 1.920 x 1.080 muestras de luminancia, y sólo 960 x 1.080 de la señal U y otras 960 x 1.080 muestras o píxeles activos del canal V
Evidentemente, esto no quiere decir que haya “huecos" entre píxeles, sino que una muestra U ocupa el espacio de dos. Como veremos, a pesar de que visualmente es apenas apreciable, este hecho puede producir distorsiones y falta de precisión en procesos de postproducción. Un caso típico es el uso de un
chroma key o incrustación por llave de color, que siempre será más preciso, con
5. EL MUESTREO
» 4:2:0 y 4:1:1
Además del estándar 4:2:2, la industria ha desarrollado equipamientos pensados para el consumidor final o incluso prosumer que eliminan aún más la informa ción de crominancia. Y también en formatos de distribución como el DVD o los vídeos a los que accedemos a través de internet. La idea es reducir aún más el flujo de datos para tener una señal más manejable, que pueda caber en cintas o soportes más pequeños y que necesiten menos potencia en ordenadores caseros en el momento de la edición.
Son señales a las que también podemos calificar de “espacio color YUV”, con submuestreo, pero no son brodcast o profesionales. Son soluciones comerciales ofrecidas por la industria, pero no admitidas (si bien toleradas) por las normativas internacionales y las cadenas comerciales. La calidad, una vez más, se resiente, pero a favor de un flujo de datos más reducido (un 33 % de ahorro sobre 4:2:2 y un 50 % sobre el RGB).
Es por ejemplo el muestreo parcial 4:1:1. En este caso, por cada 4 muestras de luminancia, sólo obtendremos 1 de la señal U y 1 de la señal V
Una imagen de HD 1.080 con muestreo 4:1:1 nos daría entonces Y = 1.920 x 1.080 muestras
U = 480 x 1.080 muestras V = 480 x 1.080 muestras
Hay otra cifra más común: 4:2:0. En este caso es preciso recordar que la intuición numérica debe obviarse y, asimismo, que el uso de esta numeración en base 4 es puramente arbitraria. 0 no quiere decir que carezca de información de la señal V sino que su lectura es distinta. Una señal 4:1:1 aplica el mismo submuestreo en todas las líneas de resolución, mientras que 4:2:0 lo hace alternando las líneas: en una, obtendrá 480 muestras de U y 0 muestras de V y en la siguiente lo alter nará: 0 muestras de U y 480 de V En sistemas interlazados, 4:1:1 submuestrea cuadro a cuadro, mientras 4:2:0 lo hace campo a campo.
Esto es útil para los sistemas interlazados, pero también para los progresivos, por lo que la tendencia es abandonar el submuestreo 4:1:1. En cualquier caso, 4:1:1 y 4:2:0 tienen la misma cantidad de información.
Para entender estos conceptos, interlazado y progresivo, cuadro y campo,
tenemos que seguir avanzando y pasar a definir el último de nuestros cuatro términos básicos: la cadencia y su barrido.
Para profundizar aún más sobre otras cifras, como 3:1:1 o 4:4:4:4, véase el anexo corres pondiente.
R e c a p i t u l a c i ó n
• Una señal digital en color contará siempre con tres canales. Cada uno de ellos tendrá un número de muestras igual al de los demás para poder representar fielmente la realidad. Es el sistema conocido como muestreo total, RGB o 4:4:4.
• Sin embargo, en el mundo de la televisión (y exclusivamente en él) se permite reducir una parte de la información con objeto de asegurar la compatibilidad con equipos antiguos, ahorrar costes y aprovechar mejor el espacio radioeléctrico. Es lo que se conoce como muestreo parcial de la señal, YUV o 4:2:2.
• En formatos de gama baja o de distribución se puede reducir aún más la información (4:2:0, 4:1:1) para una mejor relación calidad/coste.
La cadencia
» Cadencia ideal
El número de imágenes por segundo (images per second, ips o fotogramas/frames
por segundo, fps) es lo que conocemos por cadencia o framerate.
Este número también nos habla de calidad, pues es evidente que cuantas más imágenes por segundo mostremos, mayor será la fidelidad de la representación real. Si tenemos un número escaso de imágenes, se producirá el efecto conocido como "parpadeo" o fliqueo (del inglés flicker) de la imagen, con la sensación de que se desvanece entre dos fotogramas.
Lo primero es señalar que la cadencia siempre ha sido un compromiso entre calidad y economía. Análisis técnicos indican que la cadencia ideal para una representación “real", sin sensación de parpadeo, estaría en torno a los 72 ips. Pero por razones económicas nunca se ha ofrecido esta cantidad de fotograma Actualmente, tampoco ningún estándar de cine o televisión alcanza este núme ro, pero no es descartable que lo pudiera hacer en el futuro. La tecnología actual digital lo permite y en digital el capítulo de costes no se encarece tanto como en fotoquímico.
» Cadencia en el cine
En cine el compromiso viene dado, una vez más, por el coste del material Rodar con cadencias muy altas significa aumentar proporcionalmente el gasto en negativo. De la misma manera, las ya de por sí voluminosas copias positivadas (cuatro o cinco rollos de gran tamaño) también aumentarían, complicando su distribución en las salas.
Durante los primeros años se probaron diferentes cadencias, siendo la más popular la de 16 fps de la mayoría de las películas del cine mudo. Para evitar el parpadeo, se proyectaba hasta tres veces cada fotograma. Sin embargo, aun así era más que evidente. Posteriormente, se optó por el compromiso de rodal
6. CADENCIA Y BARRIDO
24 fotogramas (un gasto superior en negativo) proyectando en sala dos veces el mismo fotograma, por lo que la cadencia que realmente ve el espectador es de 48 ips.
La recomendación actual para el cine digital de la DCI mantiene la cadencia tradicional de 24 ips, pero con la posibilidad de aumentarla a 48 en los formatos 2K. La cadencia de 48 ips en formatos 4K puede resultar un poco excesiva por el gran tamaño de los ficheros, pero una vez más no es descartable en un futuro a medio o largo plazo.
>> Televisión: diferentes cadencias
El compromiso en el caso de la televisión no es tanto de calidad/coste como de calidad/flujo de datos. Dado que el "material virgen" televisivo (cinta o disco duro) no es excesivamente caro en comparación con el del cine, no supondría mucho problema de coste aumentar la cadencia. Pero sí de ancho de banda o flujo de datos: si doblamos la cadencia, también doblamos la cantidad de información.
Por razones tecnológicas, que no comerciales, los sistemas de televisión optaron por cadencias similares pero un poco diferentes a las del cine.
En concreto, en los sistemas PAL y SECAM se optó por los 25 ips, y en los sistemas NTSC por una cadencia un poco extraña, 29,97 ips.
La razón de esta divergencia tiene que ver con la frecuencia de la red eléctrica en los distintos continentes. En Europa, la red de corriente alterna circula a
50 Hz, mientras que en Estados Unidos de América circulaba a 60 Hz. En los primitivos sistemas de televisión, esta frecuencia se usaba para sincronizar la señal, de ahí su utilidad.
La cadencia tradicional del NTSC es siempre 29,97 ips. Sucede sin embargo que por comodidad se redondea esta cifra a 30 ips. Para profundizar sobre este tema, véase el anexo Non Drop Frame
» Cadencia HD
Con la tecnología digital actual, la frecuencia de la corriente alterna es indife rente, pues ya no se precisa para una sincronización de la señal. Por esa razón, dado que los sistemas HD vienen a superar las viejas diferencias entre NTSC y PAL, sería conveniente que se estableciese una única cadencia para todas las producciones, bien sea 24, 25 o 30/29,97. No obstante, hay implicaciones comerciales y de compatibilidad con los sistemas antiguos que hacen que, a día de hoy, esta cadencia universal no esté definida.
Por ello, la inmensa mayoría de los equipos actuales permiten, además del trabajo multiformato en SD y HD, escoger entre todas las diferentes cadencias admitidas.
» 23,976
Las pequeñas diferencias entre las cadencias en cine y en televisión generan, no obstante, grandes problemas. Por ejemplo, cuando queremos adaptar para televisión una película rodada en cine 24 ips.
La transferencia entre los 25 ips del PAL y los 24 ips no es muy problemática (un 4% de diferencia temporal). Suele hacerse respetando todos los fotogramas
6. CADENCIA Y BARRIDO
de la imagen, sin eliminar ninguno, y alterando un poco la banda de sonido. Lo mismo sucede si rodamos digitalmente a 25 ips y luego lo distribuimos en salas a 24 ips.
En el caso del NTSC, los 24 ips se pasan a 30 (29,97 ips) mediante un sistema algo más complicado conocido como pull down (véase el anexo), aprovechando