• No se han encontrado resultados

Evaluación de la calidad de video en el entorno de la televisión digital terrestre cubano

N/A
N/A
Protected

Academic year: 2020

Share "Evaluación de la calidad de video en el entorno de la televisión digital terrestre cubano"

Copied!
75
0
0

Texto completo

(1)Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica Departamento de Electrónica y Telecomunicaciones. TRABAJO DE DIPLOMA Evaluación de la calidad de video en el entorno de la Televisión Digital Terrestre cubano.. Autor: Maidelis Marín Placeres Tutor(a): MSc. Irina Siles Siles. Santa Clara 2016 "Año 58 de la Revolución".

(2) Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica Departamento de Electrónica y Telecomunicaciones. TRABAJO DE DIPLOMA Evaluación de la calidad de video en el entorno de la Televisión Digital Terrestre cubano.. Autor: Maidelis Marín Placeres e-mail: mmarin@uclv.cu Tutor(a): MSc. Irina Siles Siles e-mail: irinass@uclv.edu.cu Santa Clara 2016 "Año 58 de la Revolución".

(3) i. Hago constar que el presente trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería en Telecomunicaciones y Electrónica, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Tutor. Firma del Jefe de Departamento donde se defiende el trabajo. Firma del Responsable de Información Científico-Técnica.

(4) ii. PENSAMIENTO. “¡Ama! Ama por encima de todo, Ama a todo y a todos. No cierres los ojos a la suciedad del Mundo, No ignores el hambre. Olvida la bomba, Pero antes haz algo para combatirla, Aunque no te sientas capaz”. ¡Sueña! Pero no perjudiques a nadie y No transformes tu sueño en fuga. Sube Haz de los obstáculos escalones Para aquello que quieras alcanzar. Mas no te olvides de aquellos Que no consiguieron subir En la escalera de la vida. Charles Chaplin.

(5) iii. DEDICATORIA. A mis padres, por su apoyo incondicional, sus enseñanzas, por darme confianza para poder tomar mis propias decisiones y por creer siempre en mí, los amo mucho..

(6) iv. AGRADECIMIENTOS. Agradezco a mi tutora por su paciencia, dedicación y por ser un ejemplo de profesional abnegada y mujer excepcional. A mi familia por su apoyo en estos tiempos difíciles que nos ha tocado vivir. A mis amigos sin los cuales hubiese sido muy difícil graduarme de ingeniera. A todas aquellas personas que de una forma u otra me han apoyado y se han preocupado por mí..

(7) v. RESUMEN. La DTT es una tecnología con abundantes prestaciones que la convierte en un sistema atractivo para proveedores y televidentes. En Cuba se está realizando actualmente un proceso de despliegue de la DTT aunque aún existen deficiencias económicas y tecnológicas que no permiten una total migración a dicha tecnología. Para la difusión de la DTT se ha seleccionado un modo de trabajo que proporciona una razón de datos TS de 18.274Mbps. De esta razón, se le proporciona a la mayoría de los canales digitales un VBR que le permita a cada uno oscilar dentro del ancho de banda asignado de acuerdo a sus requerimientos. A pesar de esta asignación los programas no siempre cuentan con la calidad esperada. Para conocer como se está comportando la señal percibida en los diferentes canales se evaluó la calidad de video digital irradiado en el entorno de la DTT en Cuba mediante el uso de métricas subjetivas y objetivas. Del mismo modo se estudiaron y ejemplificaron diversas degradaciones que fueron observadas durante las evaluaciones realizadas. Se constató que el canal virtual Cubavisión posee una calidad superior a los demás canales, mientras que el Canal Infantil/Canal Habana no posee toda la calidad deseada.. Palabras Claves: DTT, TS, VBR, calidad de video y métricas subjetivas y objetivas.

(8) vi TABLA DE CONTENIDOS. PENSAMIENTO ................................................................................................................... ii AGRADECIMIENTOS .........................................................................................................iv RESUMEN ............................................................................................................................. v INTRODUCCIÓN .................................................................................................................. 1 CAPÍTULO 1. 1.1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN . 6. Conceptos generales de Calidad............................................................................... 6. 1.1.1. Calidad de Servicio (QoS). ............................................................................... 7. 1.1.2. Calidad de Experiencia o Calidad Percibida (QoE).......................................... 8. 1.2. Clasificación de los modelos según la disponibilidad de la señal de referencia.. Métricas asociadas al modelo de Referencia Completa.................................................... 10 1.2.1. Métricas usadas en el método Full Reference (FR). ....................................... 12. 1.2.1.1 Parámetros Básicos utilizados por los algoritmos FR. .......................... 13 1.2.1.2 Parámetros Perceptuales utilizados en el algoritmo FR. ....................... 15 1.3. Degradaciones que ocurren en el proceso de codificación, multiplexación y. trasmisión de vídeo. .......................................................................................................... 19 1.4. Conclusiones del capítulo. ..................................................................................... 25. CAPÍTULO 2.. MÉTODO FR PARA LA EVALUACIÓN DE LA CALIDAD DE VIDEO 26. 2.1. Análisis del flujo de transporte irradiado por la señal DTT en Cuba..................... 26. 2.2. Implementación del método de Referencia Completa. .......................................... 27. 2.3. Características de software Elecard Video Quality Estimator 6.0. ........................ 31. 2.4. Evaluación Subjetiva .............................................................................................. 34. 2.5 Conclusiones del capítulo ........................................................................................... 37.

(9) vii CAPÍTULO 3.. OBTENCIÓN Y ANÁLISIS DE LOS RESULTADOS ......................... 38. 3.1. Realización de Evaluaciones Subjetivas a la señal DTT irradia. ........................... 38. 3.2. Obtención y análisis de Métricas Objetivas. .......................................................... 42. 3.2.1. Análisis de las métricas objetivas básicas....................................................... 42. 3.2.2. Análisis de las métricas objetivas perceptuales. ............................................. 45. 3.3. Obtención e interpretación de las degradaciones percibidas. ................................. 47. 3.4. Conclusiones del capítulo ...................................................................................... 49. CONCLUSIONES ................................................................................................................ 50 Recomendaciones ................................................................................................................. 52 REFERENCIAS BIBLIOGRÁFICAS ................................................................................. 53 GLOSARIO .......................................................................................................................... 57 Anexo I Anexo II. Resultados de la Comparación entre Cubavisión y Canal Educativo 2. ......... 60 Resultados de la Comparación entre Canal Infantil y Canal Educativo 2 .. 61. Anexo III Resultados de la Comparación entre Cubavisión y Canal Infantil/Canal Habana. ............................................................................................................................. 63.

(10) INTRODUCCIÓN. En el mundo actual la televisión digital o TVD está siendo muy difundida de acuerdo con autores tales como (Joskowicz and Sotelo, 2014), (Osmany Yaunner Núñez, 2015) y (Durán et al., 2014). La posibilidad de enviar mayor información por un canal que contenga menor ancho de banda y la reducción de la potencia de transmisión para lograr una mejora en la calidad de la señal, hace más atractiva la instalación de esta tecnología en la mayoría de los países. Además, la compresión de las señales que se emiten ha hecho posible la difusión de la televisión en alta definición (HD, high definition), que requiere un ancho de banda mayor que la de definición estándar. Cuba se encuentra en estos momentos en el proceso de despliegue de la Televisión Digital Terrestre (DTT, Digital Terrestrial Television). La mayoría del territorio nacional ya tiene cobertura de la señal digital, por lo que el establecimiento masivo de los receptores digitales constituye el paso clave para realizar el llamado apagón analógico. Consecuentemente, la penetración de dichos receptores continúa en aumento y en el año 2015 fue estimado que más de 500 000 usuarios ya disfrutaban de las ventajas de este servicio (Osmany Yaunner Núñez, 2015). Entre otras bondades, esta tecnología ofrece a los usuarios el acceso a nuevos servicios. Entre ellos se encuentra el servicio de Guía Electrónica de Programa (EPG, Electronic Program Guide), de Radiodifusión de Datos, además de otras facilidades tales como la de pausar y luego continuar la recepción de un programa, la posibilidad de grabación de un programa mientras se visualiza otro y la presentación de la información como un proceso independiente, todo en tiempo real. También es posible en las transmisiones de TVD insertar programas de radio multiplexados con los programas de televisión. Es notorio además que la.

(11) INTRODUCCIÓN. 2. calidad de audio y video digital usualmente debe ser superior en comparación con el servicio tradicional de Televisión Analógica. A pesar de todos los beneficios proporcionados por esta tecnología y los logros alcanzados hasta el momento en Cuba, la realidad es que todavía existen algunas deficiencias tecnológicas, económicas y sociales para la migración completa a la DTT que no han permitido un salto total a esta. El video digital, distribuido a través de la red de telecomunicaciones, sufre de varios tipos de distorsiones durante el proceso de adquisición, compresión, procesamiento, transmisión y reproducción. Por citar solo un ejemplo, las técnicas utilizadas en el proceso de codificación digital del video introducen pérdidas de la información con el propósito de reducir el ancho de banda necesario para ajustarse al canal de transmisión disponible (Herranz, 2014). Entre los aspectos a tener en cuenta acerca de la DTT resulta importante, principalmente para el proveedor de la misma, conocer la calidad de los servicios utilizados por sus usuarios. En Cuba esto se pone de manifiesto en la recepción de los programas de televisión, radio y servicio de datos. Específicamente para audio y video es deseable medir la calidad percibida del programa digital que llega a los receptores debido a que los operadores pueden utilizar esta información como una realimentación desde el receptor al emisor para lograr un mayor control de la calidad perceptual y tomar acciones determinadas para aumentar o disminuir ancho de banda de un flujo de video cuando las condiciones lo impongan. Para evaluar el comportamiento de la DTT se emplean diferentes métodos de medición de la calidad de video. Los mismos se dividen en dos tipos: los métodos subjetivos y los objetivos. Ambos métodos se encuentran avalados por diversos estudios, entre los que se hallan (Javier Silvestre-Blanes), (Valderrama et al.) y (Zoran and Pece, 2010). Los métodos subjetivos están basados en la percepción visual humana y son considerados como los sistemas de medidas más confiables, al ser los resultados de la opinión directa de los observadores. En ellos la opinión de los evaluadores es promediada, obteniéndose el parámetro de Puntuación de Opinión Media (MOS, Mean Opinion Score). Por otro lado, los métodos objetivos son sistemas de evaluación basados en procesos y algoritmos matemáticos que permiten estimar la calidad percibida por los usuarios. Un sistema ideal de estimación de calidad percibida debería dar como resultado una calificación casi idéntica a la que se obtendría en pruebas.

(12) INTRODUCCIÓN. 3. subjetivas promediando los resultados de un gran número de individuos. Dentro de esta categoría se encuentran los métodos de Referencia Completa (FR, Full Reference), Referencia Reducida (RR, Reduce Reference) y Sin Referencia (NR, No Reference) (Joskowicz and Sotelo, 2012). En la actualidad se están realizando múltiples estudios en el mundo para conocer directamente de los usuarios como se percibe la señal de TVD. Ejemplo de ello es el proyecto de Indicador de Calidad de Video (VQI, Video Quality Indicators) que de acuerdo con (Durán et al., 2014) posibilita a los operadores conocer mediante los usuarios como se está comportando la calidad de video en la televisión digital abierta ISDB-T. El mismo consiste en la generación de indicadores de calidad de video, además del desarrollo y puesta en marcha de un sistema automático de estimación de calidad percibida por los televidentes de TVD. También se destaca el trabajo del Grupo de Expertos de Calidad de Video (VQEG, Video Quality Experts Group), organismo que fue creado con el objetivo de avanzar en el campo de la evaluación de la calidad de video mediante la investigación de nuevas y modernas técnicas y métodos de evaluación subjetiva y objetiva (Joskowicz and Sotelo, 2012). Retomando el contexto de Cuba, actualmente se encuentra en marcha la transmisión de 8 programas digitales SD multiplexados con codificación H264, 8 programas de audio con codificación MPG1 y 9 programas de radio también con codificación MPG1. La multiplexación se realiza estadísticamente lo que hace que cada programa multiplexado se codifique con VBR (Variable Bit Rate). Todo esto se multiplexa en un canal con capacidad de 18.274 Mbps. Además se cuenta con una FEC (Forward Error Correction) de 0.6, Modulación 64-QAM, un total de 3780 portadoras, un entrelazado de 720 y una tasa de error de 10-5. De mediciones realizadas a la DTT en Cuba se constata en (Osmany Yaunner Núñez, 2015) una calidad de video que en ocasiones se degrada de modo perceptible y que incluso varía de servicio a servicio. Teniendo en cuenta la situación expuesta anteriormente del flujo TS (Transport Stream) de la DTT, surge la siguiente interrogante científica: ¿Se puede estimar cuantitativa y cualitativamente la calidad de la señal de video irradiada en los flujos TS para el esquema DTT nacional?.

(13) INTRODUCCIÓN. 4. Para dar respuesta a la pregunta científica planteada anteriormente, la presente tesis se propone como Objetivo General:  Evaluar la calidad de video en el entorno de la Televisión Digital Terrestre (DTT) en Cuba mediante el uso de métricas de calidad predefinidas. Como solución al Objetivo General planteado con anterioridad se enuncian los Objetivos Específicos siguientes: . Caracterizar diferentes métricas de calidad aplicables a entornos de video.. . Proponer un diagrama de flujo que permita evaluar la calidad del video transmitido en función de métricas de calidad objetivas y subjetivas.. . Analizar los resultados de las métricas de calidad obtenidas a partir de las normas establecidas.. Para un cumplimiento íntegro de los objetivos propuestos la presente tesis se organizó se la siguiente manera: En la Introducción se analiza la importancia, novedad científica e impacto de la investigación, partiendo del comportamiento de la TVD en Cuba actualmente. A continuación se exponen las métricas de calidad de video con las que se estará trabajando y se plantean los objetivos de la presente tesis. En el Capítulo 1 se aborda la Calidad de Experiencia (QoE) y la Calidad de Servicio (QoS), se explica en qué consisten las métricas objetivas utilizadas para las evaluaciones de la calidad de video digital radiado y se enuncian algunas degradaciones presentes en las señales digitales. En el Capítulo 2 se exponen los materiales y métodos utilizados en la tesis, se esboza un diagrama de flujo que parte de la elección del método para posibilitar la realización de evaluaciones de las señales transferidas y se concluye con la obtención de las métricas de calidad a analizar. Luego, en el Capítulo 3 se realizan las evaluaciones, interpretaciones y análisis de las métricas objetivas y subjetivas obtenidas del examen realizado a varios flujos de video seleccionados para los diferentes canales virtuales..

(14) INTRODUCCIÓN. 5. Por último, en las Conclusiones se ve cómo han sido cumplidos todos los objetivos presentados. Finalmente se dejan especificadas algunas Recomendaciones para futuros proyectos..

(15) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. En el presente Capítulo se realiza un esbozo sobre diversos conceptos de calidad hasta llegar a los de Calidad de Experiencia (QoE) y Calidad de Servicio (QoS). Luego se analizan las diferentes métricas de calidad utilizadas para medir la calidad de un video digital. Además, se indaga sobre las principales degradaciones que pueden ser observadas durante la trasmisión de un video digital. 1.1. Conceptos generales de Calidad.. En la literatura (ASQ, 2016), (Salmerón, 2015), (ISO, 2005), (Drucker, 2014), (ITU, 2008a), (ITU, 2007) y (Cranley et al., 2006) se pueden encontrar diversas definiciones de calidad sin ligar dicho estudio a ningún ámbito, tecnología o sistema concreto. Para la Sociedad Americana para la Calidad (ASQ, American Society for Quality) (ASQ, 2016) la calidad es una combinación de perspectivas cualitativas y cuantitativas para la que cada persona tiene su propia definición. En un contexto técnico, la calidad suele tener dos significados. El primero de ellos asociado a las características de un producto o servicio que le confieren su aptitud para satisfacer necesidades explícitas o implícitas y el segundo la define como un producto o servicio sin deficiencias. Otra definición interesante es la proporcionada por Peter Drucker quien asevera que la calidad de un producto o de un servicio no es lo que el proveedor pone en él sino lo que el cliente obtiene y por lo que está dispuesto a pagar (Drucker, 2014). Para Philip Crosby, calidad significa conformidad con los requisitos (Salmerón, 2015)..

(16) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 7. En el contexto de los servicios de telecomunicaciones, la Unión Internacional de Telecomunicaciones (ITU, International Telecommunications Union) también ofrece varias definiciones de calidad en algunas de sus recomendaciones: • ITU-T E.800 (ITU, 2008a): Conjunto de características de una entidad que le confieren su aptitud para satisfacer necesidades explícitas o implícitas. • ITU-T E.802 (ITU, 2007): Conjunto de características de una entidad que le confieren su capacidad para satisfacer necesidades explícitas e implícitas. Estas características deben ser observables o medibles. Cuando se definen dichas características, estas se convierten en parámetros y los parámetros se expresan mediante medidas. Aunque la variedad de definiciones de calidad es grande, hay ciertos aspectos que comparten la mayoría de ellas. En primer lugar, la calidad es un aspecto inherente al objeto en cuestión, no es un añadido ni algo que se pueda añadir una vez creado el objeto. Además, varias definiciones como (Salmerón, 2015), (ISO, 2005), (Drucker, 2014) y (Cranley et al., 2006) coinciden en que la calidad de un objeto depende de las propiedades o las características del mismo. Por otro lado (ASQ, 2016), (ITU, 2008a) y (ITU, 2007)coinciden en destacar la calidad como la capacidad de que el objeto en cuestión realice adecuadamente las funciones para las que está diseñado. Sin embargo, las métricas para evaluar el desempeño del objeto varían entre definiciones (requisitos, expectativas y porcentaje de defectos). Las definiciones presentadas ponen de manifiesto dos puntos de vista. Algunas referencias como (Drucker, 2014), (ITU, 2008a) y (ITU, 2007)asocian la calidad a una serie de parámetros observables y medibles, mientras que otras como (ASQ, 2016), (Salmerón, 2015), (Cranley et al., 2006) y (ISO, 2005) hablan de expectativas o de utilidad para el usuario, siendo ambas magnitudes complejas de observar y medir. Estos puntos de vista han dado lugar a dos conceptos muy extendidos en el ámbito de la gestión de la calidad, que son la Calidad de Servicio (QoS, Quality of Service) y Calidad de Experiencia de Usuario (QoE, Quality of Experience). 1.1.1 Calidad de Servicio (QoS). Algunas de las definiciones que proporciona la ITU sobre la calidad de servicio son:.

(17) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. . 8. ITU-T E.800 (ITU, 2008a): El conjunto de características de un servicio de telecomunicaciones que le confieren su aptitud para satisfacer las necesidades del usuario del servicio, ya sean explícitas o implícitas. Como se puede ver, la definición de calidad de servicio de ITU-T E.800 es simplemente la adaptación de su definición de calidad genérica a un servicio de telecomunicaciones.. . ITU-T E.802 (ITU, 2007): Esta recomendación ofrece dos definiciones complementarias. La primera de ellas es la misma definición que la ofrecida en la recomendación anterior. La segunda define la calidad de servicio como el efecto colectivo del rendimiento del servicio, que determina el grado de satisfacción de los usuarios del mismo.. . ITU-T X.902 (ITU, 2009): Un conjunto de cualidades relacionadas con el comportamiento colectivo de uno o más objetos. La QoS se puede especificar en un contrato y debe poder ser medida y reportada. La QoS está relacionada con características como la tasa de transferencia de información, latencia, probabilidad de que una comunicación se interrumpa, probabilidad de que el sistema falle, probabilidad de que el almacenamiento falle, entre otras.. En las recomendaciones ITU expuestas se definen varios puntos de vista de QoS: requisitos de QoS del usuario, QoS ofrecida por el proveedor del servicio, QoS conseguida/entregada por el proveedor del servicio y QoS percibida por el usuario. Este último punto de vista, está más próximo al concepto de QoE que de QoS. 1.1.2 Calidad de Experiencia o Calidad Percibida (QoE). En (Brunnström et al., 2013) se maneja el concepto de QoE como el grado de placer o disgusto del usuario de una aplicación o servicio. Es el resultado de la realización de sus expectativas con respecto a la utilidad y/o disfrute de la aplicación o servicio en función de la personalidad del usuario y de su estado actual. La aceptación de una nueva tecnología depende en gran medida de la QoE por parte del público. La misma puede ser definida como el desempeño general de un sistema visto desde la perspectiva del usuario. Diversos factores pueden afectar a la QoE, dependiendo de cuál sea la aplicación, el servicio y las expectativas que de ellos tengan los usuarios..

(18) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 9. En varias de las definiciones anteriores, tanto del concepto general de calidad, como del concepto de QoS, se deja entrever una perspectiva subjetiva, cercana al usuario final y relacionado con sus expectativas y el nivel de satisfacción que obtiene al consumir el servicio. Estas definiciones ponen de manifiesto dos planos de calidad íntimamente relacionados: el plano de la QoS que está vinculado con el rendimiento de la red y el plano de la calidad percibida o QoE, una dimensión del concepto de calidad más amplia que incluye aspectos subjetivos relacionados con la percepción de los usuarios finales. Los conceptos que brinda la ITU respecto a la QoE se relacionan a continuación: . TS 22.105 (3GPP, 2015) define la calidad de servicio en su especificación como el efecto colectivo de factores de rendimiento del servicio que determinan el nivel de satisfacción del usuario de un servicio.. . ITU-T P.10 (ITU, 2008b): aceptabilidad general de una aplicación o servicio, percibida subjetivamente por los usuarios finales. La QoE incluye los efectos del sistema extremo a extremo (cliente, terminal, red, infraestructura). La aceptabilidad general puede estar influenciada por las expectativas y el contexto del usuario.. . ITU-T E.800 (ITU, 2008a) e ITU-T G.1000 (ITU, 2001b): define un concepto de calidad de servicio percibida (QoSE, QoS experienced/perceived by customer/user) como el nivel de calidad que los clientes o usuarios creen que han experimentado. Además, introduce los siguientes conceptos: o El nivel de calidad de servicio percibida se puede expresar como una escala de opinión. o La QoSE tiene un componente cuantitativo y otro cualitativo. El componente cuantitativo puede estar influido por el efecto extremo a extremo del sistema. El factor cualitativo puede estar influenciado por las expectativas del usuario, condiciones ambientales, factores psicológicos, contexto de la aplicación, etc.. . ITU-T G.1010 (ITU, 2001a): aunque no introduce específicamente el término de QoE, hace referencia a la importancia de especificar los requisitos de los servicios y aplicaciones desde el punto de vista del usuario. En concreto, según esta recomendación el rendimiento debe ser expresado mediante parámetros que:.

(19) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 10. o Tengan en cuenta todos los aspectos del servicio desde el punto de vista del usuario. o Se centren en efectos perceptibles por el usuario y no tanto en las causas que los provocan. o Independientes de la tecnología y de la arquitectura de red. o Puedan ser objetiva o subjetivamente medidos. o Puedan ser fácilmente relacionados con parámetros de rendimiento de red. o Puedan ser asegurados al cliente por parte de los proveedores de servicio. Como un ejemplo de la relevancia del empleo del concepto de QoE en aplicaciones reales, en (Joskowicz and Sotelo, 2012) se expresa que la calidad que perciben los usuarios del audio y el video son de los aspectos más importantes a considerar en la calidad final de la experiencia de estos usuario. 1.2. Clasificación de los modelos según la disponibilidad de la señal de referencia. Métricas asociadas al modelo de Referencia Completa.. La posibilidad de poder contar con herramientas que permitan obtener información confiable y precisa que brinden la opción de velar por la calidad del servicio ofrecido a los usuarios llevó a la necesidad de generar indicadores para medir la calidad percibida por los usuarios. Para esta evaluación se crearon métodos objetivos y subjetivos. Según (Joskowicz and Sotelo, 2012) las evaluaciones subjetivas son siempre los sistemas de medida más confiables ya que en dichas evaluaciones se toman directamente la opinión de los usuarios y se promedia entre un número apropiado de observaciones, obteniendo típicamente una MOS. Existen estándares como ITU-R BT.500-11 y ITU-T P.910 que indican cómo realizar estas evaluaciones. Sin embargo, su realización es costosa y compleja debido a que es necesario implementarlas en ambientes controlados, así como disponer de un número importante de usuarios y de contenidos multimedia especialmente preparados. Adicionalmente, no soluciona la necesidad de evaluar en tiempo real los servicios tales como el de la TVD..

(20) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 11. Es por ello que en los últimos años se han comenzado a desarrollar sistemas, algoritmos y modelos matemáticos que permitan estimar la calidad percibida por los usuarios. Un sistema ideal de estimación de calidad percibida debería dar como resultado una calificación idéntica a la que se obtendría en pruebas subjetivas promediando los resultados de un gran número de individuos. Diversos modelos de este tipo han sido propuestos y algunos de ellos han sido estandarizados por organismos internacionales como la ITU después de obtener resultados satisfactorios de proyectos realizados por el VQEG, organización creada para contribuir a la rama de la evaluación de calidad de video mediante la validación de métricas objetivas y el desarrollo de nuevos métodos de evaluación subjetiva (Osmany Yaunner Núñez, 2015). Utilizar métodos automáticos y objetivos, es decir, en los que no se precisa la participación de sujetos, permite predecir con fiabilidad calidad de video digital percibida. De acuerdo con (Joskowicz and Sotelo, 2012) y (Salmerón, 2015) se pueden encontrar varias categorías como son: los métodos de FR, RR y NR. Los métodos FR se basan en la disponibilidad de la señal original, normalmente descomprimida, que puede ser contrastada con la señal degradada, cuadro a cuadro. Estos modelos son de fácil implementación, tienen métricas de evaluación de la calidad ampliamente difundidas y cuentan con diversos estándares dentro de la ITU como son los estandarizados en ITU-T J.144 (ITU, 2004c) y en ITU-R BT.1683 (ITU, 2004b). Los métodos RR poseen una disponibilidad parcial de la señal original. Se basan en el envío por un canal auxiliar junto con el video codificado, de algunos parámetros que caractericen la señal y que sirvan de referencia en el receptor para poder estimar la calidad percibida. Para ello puede pensarse en la reserva de un pequeño ancho de banda (en comparación con el del video) para el envío de este tipo de información adicional (Joskowicz and Sotelo, 2012). Estos modelos también han sido estandarizados en la recomendación ITU-T J.249 (ITU, 2010) en el 2010. Por otro lado, en los métodos NR sólo se utiliza la señal degradada, por lo que no se necesita referencia ni ningún tipo de calibrado. A pesar de ser los métodos más complejos según (Joskowicz and Sotelo, 2012) y (Salmerón, 2015), resultan también los más deseables de utilizar debido a que no requieren un canal adicional para hacer llegar la información complementaria y solamente se basan en la imagen desplegada para estimar la calidad, al.

(21) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 12. igual que lo hace un televidente, quien no necesita de información adicional para juzgar la calidad de la señal de video sino que se basan en sus experiencias previas y en las expectativas que tengan respecto al sistema. Lamentablemente aún no se han estandarizado modelos NR para TV por parte de la ITU. 1.2.1 Métricas usadas en el método Full Reference (FR). Los métodos que utilizan métricas del tipo FR pueden ser empleados para categorizar en forma objetiva un sistema de transmisión, un codificador-decodificador, el efecto de un reducido ancho de banda o de diversos factores que degradan una señal en ambientes controlados básicamente dedicados a pruebas. Para su funcionamiento requiere de una perfecta alineación temporal y espacial por lo que se consideran métodos complejos para una aplicación en tiempo real dado que difícilmente se cuente con la señal original (Joskowicz and Sotelo, 2012, Salmerón, 2015). No obstante, son las técnicas más empleadas en un gran rango de aplicaciones. Los algoritmos usados en las técnicas FR se pueden categorizar en parámetros básicos y parámetros perceptuales. Los primeros calculan la diferencia píxel a píxel entre las imágenes original y la degradada. Algunas de las medidas más simples y utilizadas son el Error Cuadrático Medio (MSE, Mean Square Error), la Relación Señal a Ruido Pico (PSNR, Peak Signal to Noise Ratio), el Promedio Escalado de la Desviación Absoluta (MSAD, Mean Scaled Absolute Deviation) y el DELTA. Cabe destacar que la fácil implementación de PSNR y MSAD se ve opacada por sus resultados, que están poco correlacionados con la percepción de calidad por parte del usuario. Los parámetros perceptuales son más sofisticados y tratan de buscar una apreciación más parecida al sistema humano visual (SHV). Algunas de ellas son la Similitud Estructural (SSIM, Structural Similarity), el Nuevo Índice de Calidad (NQI, New Quality Index) y la Métrica de Calidad de Video (VQM, Video Quality Metric) (KOTEVSKI and Pece). Según la recomendación de la ITU-T J.149 (ITU, 2004a) las métricas perceptuales de calidad de video mencionadas anteriormente deben encontrarse idealmente en un rango de [0, 1] donde el 0 indica que no hay distorsión y el 1 una distorsión máxima. A pesar de esto, este caso ideal no se cumple para ciertas métricas..

(22) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 1.2.1.1. 13. Parámetros Básicos utilizados por los algoritmos FR.. Los parámetros básicos han sido ampliamente difundidos por su simplicidad a la hora de la realización de pruebas y obtención de resultados. Las medidas objetivas más sencillas de estimación de la calidad del video están basadas en obtener las diferencias píxel a píxel entre las imágenes originales (previo a la compresión y transmisión) y las imágenes degradadas (luego de la recepción y reconstrucción). Las imágenes presentadas serán diferentes a las originales debido a que los sistemas de video utilizan técnicas de compresión con pérdida de información y a que los medios de transmisión pueden introducir factores distorsionantes (retardos, pérdida de paquetes) (Joskowicz and Sotelo, 2012). Como ya se mencionó anteriormente el MSE es una de las medidas más simples de las utilizadas. La misma proporciona la diferencia cuadrática media entre la imagen de prueba y de referencia. MSE es usado de forma regular para evaluar objetivamente la calidad de video. Su resultado, junto con el de otros métodos similares, da una idea más completa para comparar la correspondencia entre imágenes (Kotevski and Mitrevski, 2010). MSE sugiere mayor similitud cuando más pequeño sea su valor. En ocasiones esta medida no brinda total correspondencia con el SHV ya que este último reconoce mejoría en imágenes en que se añade cierto ruido. En ese caso la medición MSE arrojaría mayor valor, por tanto, sugeriría menor correspondencia entre las imágenes, cuando la práctica visual demuestra lo contrario. Siendo la señal degradada (g) y la señal original (f) y teniendo una imagen de ancho X y alto Y, la ecuación 1.1 nos permite calcular el valor de MSE según (Javier Silvestre-Blanes): 1. 𝑦. 𝑀𝑆𝐸 = 𝑥𝑦 ∑𝑥𝑖=1 ∑𝑗=1(𝑓(𝑖, 𝑗) − 𝑔(𝑖, 𝑗))2. ecuación 1.1. Otra de las métricas más utilizadas en la práctica para evaluar calidad de codificación y decodificación es la PSNR. Esta es una expresión de relación entre la máxima energía posible de una señal y el ruido que afecta la calidad de su representación. El PSNR generalmente está representado en términos de escala logarítmica en decibeles. Sin embargo, la propia naturaleza de este método hace que en ocasiones no se ajusten completamente al resultado arrojado a partir de una observación subjetiva (Kotevski and Mitrevski, 2010)..

(23) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 14. El PSNR se calcula con el valor del MSE y el máximo valor que puede tomar el píxel (MAX). Teniendo estos valores la ecuación que se emplea para su obtención según (Javier SilvestreBlanes) es: 𝑀𝐴𝑋 2. 𝑃𝑆𝑁𝑅 = 10 log10 ( 𝑀𝑆𝐸 ). ecuación 1.2. A pesar de su popularidad, según (Winkler and Mohandas, 2008) el PSNR solo brinda una relación aproximada de la calidad de video percibida por los observadores humanos, simplemente porque realiza una comparación de los datos sin considerar lo que ellos verdaderamente representan. De esta forma, el PSNR es completamente ignorante de la interpretación de imágenes que realiza el SHV. Debido a que esta métrica no toma en cuenta la manera en que el SHV procesa la información, puede darse el caso en que dos imágenes tengan el mismo valor de PSNR y sin embargo la calidad percibida en cada una de ellas sea muy diferente. Esto puede ocurrir, por ejemplo, debido a la distorsión ya que la misma puede ser más o menos visible para el espectador dependiendo de su tipo y propiedades (el SHV no es muy sensible al ruido de altas frecuencias pero sí al ruido de frecuencias bajas). Además, la percepción del espectador varía en base a la zona del video que es afectada por la distorsión (regiones con una alta actividad de imagen, tales como bordes o lugares de mucha textura, enmascaran mucho más la distorsión que otros tales como fondos claros con poca actividad de imagen). El MSAD se define según (Kotevski and Mitrevski, 2010) como la diferencia máxima absoluta entre los componentes de color. Para MSAD, el valor absoluto de cada desviación es dividida entre el error estándar para cada media de datos. Este tipo de escalamiento es similar al realizado con los residuos estandarizados en una regresión estadística y en el modelado estructural de ecuaciones. Así, las desviaciones entre lo modelado estadísticamente y los datos (por ejemplo, los residuos) son divididos entre el error estándar de los datos. MSAD es definido como sigue (Schunn and Wallach, 2005): 𝑀𝑆𝐴𝐷 = ∑𝑘𝑖=1. |𝑚𝑖 − 𝑑𝑖 | 𝑠 𝑘 𝑖 √𝑛𝑖. = ∑𝑘𝑖=1. |𝑚𝑖 − 𝑑𝑖 |√𝑛𝑖 𝑘𝑠𝑖. ecuación 1.3. Donde 𝑚𝑖 es la media modelada para cada punto i, 𝑑𝑖 es la media de los datos para cada punto i, 𝑠𝑖 es la desviación estándar para cada media de dato i, 𝑛𝑖 es el número de datos que.

(24) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 15. contribuyen a cada media de datos, mientras que k es el número de puntos i (Schunn and Wallach, 2005). MSAD es invariante ante escala; esto quiere decir que, sin importar si los datos son medidos en términos del error, del tiempo de reacción o del porcentaje de un parámetro determinado, un valor determinado MSAD tiene el mismo significado. Esta invariante a la escala hace que la evaluación general de la calidad de los datos escogidos resulte bastante fácil. Para poder obtener estos valores se necesita tener información de la varianza de los datos, la cual puede no estar disponible en algunos antiguos set de datos (Schunn and Wallach, 2005). Un problema potencial con MSAD es que un menor valor de n producirá un menor valor de MSAD, lo que aparentemente encaja con los estudios de bajos n. Sin embargo, al aumentar la precisión en las representaciones gráficas de los datos se hace evidente la baja fidelidad de los mismos, por lo que se reduce la exactitud del modelo. Aún más, cuando n es baja, los datos parecen como si hubieran sido sometidos a un alto nivel de ruido que luego resulta muy difícil de conciliar. De esta manera, el uso de MSAD para estudios con bajo n no brinda resultados tan exactos como los logrados con otras métricas (Schunn and Wallach, 2005). Por su parte la métrica DELTA define la diferencia máxima entre los componentes de color en los correspondientes puntos de la imagen. Esta métrica es usada en codificadoresdecodificadores y filtros de prueba. La ecuación 1.4 indica cómo se calcula de acuerdo con (Kotevski and Mitrevski, 2010): 𝑑(𝑥, 𝑦) = ∑𝑚,𝑛 𝑖=1,𝑗=1. (𝑋𝑖,𝑗 − 𝑌𝑖,𝑗 ) 𝑚𝑛. ecuación 1.4. En la ecuación anterior los valores Xij > Yij enuncian que el color rojo es predominante en el video a evaluar, mientras que para Xij < Yij el color predominante es el verde. 1.2.1.2. Parámetros Perceptuales utilizados en el algoritmo FR.. En los últimos tiempos se ha realizado un gran esfuerzo para desarrollar nuevos modelos que tengan en cuenta las características de percepción del SHV y que permitan calcular métricas objetivas que lo simulen, tratando de lograr mejores resultados que los obtenidos con los parámetros básicos. Existen varias propuestas de métricas con diversa complejidad y precisión de sus resultados..

(25) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 16. El SHV es extremadamente complejo. Puede detectar fácilmente ciertos tipos de distorsión, mientras pasa por alto otras, dependiendo de diversos factores. Estos factores pueden incluir el tipo de aplicación que esté siendo utilizada (TV, video conferencia, video telefonía), el lugar de la imagen en donde se produce la degradación (generalmente las degradaciones son menos visibles en regiones con muchos detalles o actividad espacial y con gran movimiento, mientras que son más visibles en imágenes estacionarias o en fondos poco texturados). Incluso la calidad percibida puede depender del tipo de dispositivo utilizado y del tamaño del monitor. En general, el SHV juega un rol fundamental y la ciencia no tiene aún una compresión total del mismo (Joskowicz and Sotelo, 2012). Entre las técnicas perceptuales se encuentra SSIM, basada en que las estructuras de los objetos de las escenas son independientes de la iluminación, de forma que la influencia de esta debe ser aislada en el cálculo de la calidad de la imagen (Javier Silvestre-Blanes). En este método se calculan tres componentes de forma independiente y por separado: luminancia (l), contraste (c) y similitudes estructurales (s). SSIM requiere que dos imágenes a comparar sean debidamente alineadas y escaladas para que puedan ser comprobadas punto a punto. Debe considerarse además que SSIM es altamente sensible a degradaciones en estructuras espaciales de luminancia. El cómputo se realiza a partir de una ventana gaussiana deslizante (Kotevski and Mitrevski, 2010). Según (Javier Silvestre-Blanes), para obtener SSIM teniéndose la señal degradada g y la señal original f, es necesario calcular para cada una de ellas sus medias (µ𝑓 y µ𝑔 ), sus desviaciones estándar (𝜎𝑓 y 𝜎𝑔 ), y la covarianza (𝜎𝑓𝑔 ) de forma que se puede calcular cada uno de estos compontes como: 𝑙(𝑓, 𝑔) = 𝑐(𝑓, 𝑔) =. 2𝜇𝑓 𝜇𝑔 + 𝐶1 2 +𝐶 𝜇𝑓2 +𝜇𝑔 1. 2𝜎𝑓 𝜎𝑔 + 𝐶2 𝜎𝑓2 +𝜎𝑔2 +𝐶2 2𝜎𝑓𝑔 + 𝐶3. 𝑠(𝑓, 𝑔) = 𝜎. 𝑓 𝜎𝑔 + 𝐶3. ecuación 1.5 ecuación 1.6 ecuación 1.7. Finalmente, a partir de estos valores se obtiene SSIM mediante: 𝑆𝑆𝐼𝑀(𝑓, 𝑔) = 𝑓 (𝑙(𝑓, 𝑔), 𝑐(𝑓, 𝑔), 𝑠(𝑓, 𝑔)). ecuación 1.8.

(26) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 17. Los valores obtenidos presentan un mejor comportamiento en su correlación con el SHV si son calculados localmente en lugar de ser calculados de forma global sobre toda la imagen. Los valores de las constantes 𝐶𝑖 utilizadas en el cálculo de l, c y s se introducen para evitar la inestabilidad de la medida cuando los denominadores son muy bajos. Por otra parte, NQI es una métrica perceptual que mide trama a trama la calidad de video. Esta métrica según (Wang and Bovik, 2002) es calculada como: 𝑁𝑄𝐼 =. ̅̅̅̅ 4𝜎𝑥𝑦 𝑥𝑦 (𝜎𝑥2 + 𝜎𝑦2 )[(𝑥̅ )2 + (𝑦̅)2 ]. ecuación 1.9. Donde x = [𝑥𝑖 |𝑖 = 1, 2, … , 𝑁] y y = [𝑦𝑖 |𝑖 = 1,2, … , 𝑁] son las señales de la señal original y de prueba respectivamente. Además: 1. 𝑥̅ = 𝑁 ∑𝑁 𝑖=1 𝑥𝑖. ecuación 1.10. 1. 𝑦̅ = 𝑁 ∑𝑁 𝑖=1 𝑦i. 𝜎𝑥2 = 𝜎𝑦2 = 𝜎𝑥𝑦 =. 1 𝑁−1 1 𝑁−1 1 𝑁−1. ecuación 1.11. 2 ∑𝑁 𝑖=1(𝑥𝑖 − 𝑥̅ ). ecuación 1.12. ∑𝑁 ̅)2 𝑖=1(𝑦𝑖 − 𝑦. ecuación 1.13. ∑𝑁 ̅) 𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦. ecuación 1.14. El rango dinámico de NQI es de [-1,1] de acuerdo con (Wang and Bovik, 2002). El mejor valor de 1 es alcanzado si y solo si 𝑦𝑖 = 𝑥𝑖 para todo i = 1,2,…, N. El menor valor de -1 ocurre cuando 𝑦𝑖 = 2𝑥̅ − 𝑥𝑖 para todo i = 1,2,…, N. Este índice de calidad modela la distorsión como una combinación de tres factores diferentes: la pérdida de correlación, la distorsión de la luminancia y la distorsión del contraste. Para comprender esto, se reescribe la definición de NQI como el producto de tres componentes: 𝑁𝑄𝐼 =. 𝜎𝑥𝑦 𝜎𝑥 𝜎𝑦. ∙. 2𝑥̅ 𝑦̅ (𝑥̅ )2 + (𝑦̅)2. ∙. 2𝜎𝑥 𝜎𝑦 𝜎𝑥2 + 𝜎𝑦2. ecuación 1.15. El primer componente es el coeficiente de correlación entre x y y, que mide el grado de correlación lineal entre x y y con un rango dinámico de [-1,1]. Incluso si x y y están relacionados linealmente, aún pueden ocurrir distorsiones relativas entre ellas, las cuales son evaluadas con el segundo y tercer componente. El segundo componente, con un rango de valores de [0,1], mide cuán cerca está la luminancia media entre x y y. Es igual a 1 si y solo.

(27) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 18. si x = y. Por último 𝜎𝑥 y 𝜎𝑦 pueden ser entendidos como estimadores del contraste de x y y, de manera que el tercer componente mide cuán similar es el contraste de las imágenes evaluadas. Posee un rango de [0,1], donde el mejor valor 1 es alcanzado si y solo si 𝜎𝑥 = 𝜎𝑦 .. De acuerdo con Wang (Wang, 2006) y Lu (Lu et al., 2009) VQM mide todos los fallos de la calidad de video tales como visión borrosa, movimientos espasmódicos/artificiales, ruido, distorsión de bloque o distorsión de color. Entre el 2003 y el 2004, la Administración Nacional de Telecomunicaciones e Información de EE.UU (NTIA, U.S. National Telecommunications and Information Administration) desarrolló dos modelos de calidad de video VQMs con RR: el primero llamado VQM de bajo ancho de banda (low bandwidth VQM) y el segundo conocido como VQM rápido de bajo ancho de banda (Fast low bandwidth VQM). El segundo de estos modelos, fue una versión computacionalmente eficiente del primer modelo y 4 veces más rápida que el mismo (ITU, 2010). Según (ITU, 2010) el método VQM comprende tres áreas primarias: 1) las características de bajo ancho de banda que son extraídas del flujo de video original y del procesado; 2) los parámetros que resultan de comparar las características del flujo original y del procesado; 3) el cálculo de VQM que combina varios parámetros, cada uno de los cuales mide un aspecto diferente de la calidad de video Tres tipos de características son utilizadas por el VQM rápido de bajo ancho de banda: de colores, espaciales y temporales. La característica fCOHER_COLOR expuesta en la recomendación (ITU, 2004c), brinda un vector bidimensional con las mediciones de la cantidad de información de crominancia azul y roja (Cb, Cr) en cada región espacio-temporal (S-T, spatial-temporal). Así, la característica fCOHER_COLOR es sensible a las distorsiones de color. Las características espaciales fSI13 y fHV13 miden la cantidad y la distribución angular de los gradientes espaciales en sub-regiones S-T de las imágenes de luminancia (Y). Así, las características fSI13 y fHV13 son sensibles a las distorsiones espaciales tales como borrosidad y efecto de bloque. Por último, las características temporales son usadas para cuantificar el efecto perceptual que provocan las distorsiones temporales. Esta característica mide la información temporal absoluta (ATI, absolute temporal information) o movimiento, en el plano de luminancia (Y) de la imagen. Para las características fSI13, fHV13 y fCOHER_COLOR el.

(28) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 19. empleo de una cuantización de 9 bits de exactitud es suficiente, mientras que la característica fATI debe ser cuantificada con 10 bits. Para el cálculo de VQM según la (ITU, 2004c) y (ITU, 2010), dos parámetros son extraídos de la característica fCOHER_COLOR. Uno de estos parámetros, llamado color_extreme, mide las distorsiones extremas de color que pueden ser causadas por bloques de crominancia debido a errores de transmisión. El otro parámetro, llamado color_spread, brinda una medida de la varianza o esparcimiento de los errores de color. Por otro lado, también son extraídos dos parámetros espaciales de la característica fSI13, uno que mide la pérdida de información espacial (si_loss) y otro que mide la ganancia de información espacial (si_gain). Además, dos parámetros espaciales tomados de la característica fHV13, uno que mide la pérdida de información espacial relativa horizontal y vertical (hv_loss) y otro que mide la ganancia (hv_gain). Por último, dos parámetros temporales son obtenidos de la característica fATI, uno que mide el ruido aleatorio adicionado (ati_noise) y otro que mide las perturbaciones en el movimiento causadas por errores en la transmisión (ati_error). Finalmente la VQM se calcula mediante la combinación lineal de los parámetros anteriormente presentados, con la excepción de que los dos parámetros de colores se combinan para formar un solo parámetro de distorsión de color llamado color_comb. Entonces, se puede calcular VQM como: VQM = [0.38317338378290 * hv_loss + 0.37313218013131 * hv_gain + 0.58033514546526 * si_loss + 0.95845512360511 * si_gain + 1.07581708014998 * color_comb +. ecuación 1.16. 0.17693274495002 * ati_noise + 0.02535903906351 * ati_error ] VQM puede ocasionalmente exceder el valor de 1 en escenas de video que estén extremadamente distorsionados (ITU, 2004c). 1.3. Degradaciones que ocurren en el proceso de codificación, multiplexación y trasmisión de vídeo.. El proceso de digitalización y codificación de los videos influyen en la calidad final de estos. La selección del códec también tiene una gran importancia porque este define la tasa de bits a la que se transmitirá, la robustez ante las pérdidas y el retardo en la transmisión (Herranz, 2014)..

(29) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 20. También el ruido de cuantificación puede degradar la imagen original a niveles perceptibles. Es este ruido de cuantificación, de acuerdo con (Robertson and Stevenson, 2005), el que genera las clásicas degradaciones que pueden verse en imágenes y videos con alta compresión tal como el conocido efecto de bloques, que hace ver a la imagen como un conjunto de bloques pequeños. Además, los algoritmos de compresión utilizados durante el proceso de codificación digital de video introducen varios tipos de degradaciones (Wu and Rao, 2005). El efecto de bloques (blocking) es según (Herranz, 2014) la más notoria de las degradaciones percibidas en video digital. Este efecto tiene su origen al dividir la imagen en bloques para realizar la Transformada Discreta del Coseno (DCT, Discrete Cosine Transform). El efecto de bloques se presenta como discontinuidades en los bordes de bloques adyacentes al reconstruir la imagen. Dentro de un mismo cuadro, cuanto más gruesa sea la cuantificación realizada, más visible es el efecto de bloques. El umbral de cuantificación a partir del cual es percibido el efecto de bloque depende del tipo de imagen y del movimiento, por lo que no es posible definir un valor estándar e independiente de otros factores. Generalmente el efecto es menos perceptible en imágenes con movimiento, o en lugares de mucho o muy poco brillo. Los coeficientes de bajas frecuencias espaciales, y particularmente el coeficiente de DC de la transformada DCT, son los que determinan en mayor grado la visualización del efecto de bloques. En cuadros predictivos, el efecto se puede dar entre macro-bloques, presentando discontinuidades entre sus bordes o dentro de un macro-bloque entre los cuatro bloques que lo componen. Como las compensaciones de movimiento generalmente proveen una buena predicción para los componentes de baja frecuencia, en este caso el error de predicción cuantificado se reduce a cero dentro de un macro-bloque. Si este tiene un contenido uniforme, no se produce el efecto de bloques entre los cuatro bloques internos. El desenfoque o falta de definición (blurring), de acuerdo con (Wang et al., 2004), es otra de las degradaciones que sufren las imágenes. Se manifiesta como una pérdida de los detalles en las mismas. Si bien esto puede deberse a imágenes tomadas fuera de foco, también puede ser un efecto introducido por el proceso de digitalización. Este caso se da cuando se suprimen los coeficientes DCT de mayor orden, que son los que aportan los detalles finos dentro de.

(30) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 21. sus bloques. Esta degradación también puede relacionarse con el efecto de bloques y de mosaico. El desplazamiento de color (color bleeding) según (Triantafyllidis et al., 2002) se debe a que la falta de definición de la información de luminancia reduce la difusión de los detalles en un área visible. El mismo concepto aplicado a la crominancia produce manchas de colores sobre áreas de colores contrastantes. Al igual que en el caso anterior, este efecto se debe a la supresión de los coeficientes de alta frecuencia de los componentes de crominancia. Dado que la crominancia es sub-muestreada, el efecto se propaga en todo el macro-bloque. Por otra lado, la consecuencia general del efecto de patrones de mosaico (mosaic patterns) es la aparente discordancia entre todos o entre una parte de los bloques adyacentes en una imagen. Tiene un efecto similar al producido al usar piezas cuadradas que no corresponden en un mosaico. El patrón de mosaico generalmente coincide con el efecto de bloques. Se produce a causa de un bloque con un cierto contorno o textura muy distinta a los bloques vecinos. El efecto mosaico se presenta cuando parecen no coincidir los bordes de todos o gran parte de los bloques de una imagen (Herranz, 2014). El efecto de cuantización de los valores de luminancia de los píxeles hace que en zonas de transiciones graduales se generen falsos contornos (false contouring), por ejemplo en los lugares de transición de un valor cuantizado a otro. Este efecto es apreciable si la cantidad de niveles de cuantización es insuficiente. Detectar y corregir los contornos falsos no es sencillo debido a que además de detectar los contornos, se debe decidir si corresponden a un borde real o a un efecto del proceso de digitalización. Adicionalmente, al intentar corregir los contornos falsos no se deben introducir otras degradaciones como borrosidad o disminución de la definición general de la imagen (Hai-Feng et al., 2006). Los bordes falsos ocurren como consecuencia de transportar el efecto de bloques hacia cuadros predictivos con compensación de movimiento. Si se produce el efecto de bloques en una imagen tomada como referencia para próximos cuadros, estas discontinuidades producidas entre los bloques se pueden convertir en bordes falsos dentro de bloques predictivos debido a la estimación de movimiento. Como se observa, la señal de DTV está sujeta a degradaciones en su camino desde el transmisor al espectador. Sin importar el medio de transmisión utilizado (terrestre, cable.

(31) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 22. coaxial, fibra o satélite), se añade ruido a la señal original que lleva a la pérdida potencial de paquetes (Joskowicz and Sotelo, 2014). Con el fin de controlar la calidad de servicio que el operador de DTV ofrece a su audiencia es necesario entender la forma en que estas pérdidas de paquetes afectan a la calidad percibida por el espectador de TV. En DTV se utiliza la Razón de Error de Bit (BER, Bit Error Rate) como un parámetro relacionado con la capacidad del receptor para reconstruir la señal transmitida. Por ejemplo, DVB-T (ETSI, 2009) define la recepción Casi Libre de Errores (QEF, Quasierror Free) como menos de un evento de error no corregido por hora, correspondiente a una BER = 10−11 a la entrada del demultiplexor MPEG-2 o una BER = 2 𝑥 10−4 después de Viterbi. El enfoque común es que si la relación C/N está por debajo de un cierto valor habrá un efecto de acantilado o precipicio (cliff effect) o también llamado efecto ladrillo o pared de ladrillo que va a causar la degradación inmediata de la señal. Aunque la calidad del enlace de transmisión de radio frecuencia se caracteriza generalmente por la BER, este enfoque no es suficiente para estudiar el problema de cómo el ruido en el enlace de transmisión afecta la QoE desde la perspectiva del usuario en DTV. Una disminución de la relación C/N hará que el receptor de DTV pase de un estado limpio y sin errores a una imagen congelada (el llamado efecto de acantilado). Sin embargo, esta transición no es muy abrupta. Como la relación C/N disminuye desde una recepción perfecta la imagen recibida experimenta diferentes tipos de degradaciones antes de llegar a una completa formación de bloques. De acuerdo con la literatura (Martin, 2010) esta transición de una degradación mínima a una máxima se lleva a cabo en una caída de C/N recibida de 1 a 3 dB. La relación C/N varía con las condiciones del entorno y con el tiempo. Esto aumenta el número de receptores que pueden estar en el borde del efecto acantilado en diferentes períodos de tiempo. Además, la intensidad del ruido puede tener estructuras diferentes en el tiempo, dependiendo de su origen (es decir, homogéneos o en ráfagas). Cuando la intensidad de la señal disminuye, algunos errores pueden estar presentes en los paquetes TS (Joskowicz and Sotelo, 2014). Cada paquete TS perdido puede transportar información de vídeo codificada relacionada con un tipo de fotograma o segmento específico, es decir, I, P o B. En (Greengrass et al., 2009) se muestra que no todos los paquetes son iguales. La pérdida o daños a tramas I afecta mucho.

(32) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 23. más que los cuadros P o B, ya que la información de tramas I se usa para decodificar los cuadros P y B de todo el Grupo de Cuadros (GoP, Groups of Pictures), por lo que el efecto se propaga a más tramas. La pérdida de tramas P afecta más que la de fotogramas B, debido a que su información se utiliza para decodificar otros fotogramas P y B, de la trama P perdida hasta la siguiente trama I. Por último, una trama B perdida o dañada no afecta a los otros fotogramas, sino solo a sí misma. Las técnicas de corrección de errores proporcionadas e implementadas por las diferentes normas eventualmente pueden corregir todos los errores, pero los algoritmos de decodificación pueden ser sobrecargados y ser incapaces de corregir el paquete integro. En este caso el bit indicador de los errores de transmisión en la cabecera será puesto en “1” (ETSI, 2001). El decodificador puede decidir qué hacer con la información que falta. El ruido del canal conduce a errores en los bits de entrada del receptor; pero puesto que el código Reed-Solomon puede corregir errores en paquetes, o bien los errores de bits se corrigen o hay errores en paquetes TS en la salida del decodificador Reed-Solomon, anteriores al decodificador de vídeo. Esto afectará a cada paquete TS de forma independiente, lo que lleva a un patrón de pérdida de paquetes TS individuales (Joskowicz and Sotelo, 2014). El control de la razón (RC, Rate Control) es un mecanismo que se encarga de ajustar el volumen de datos generado por el codificador de vídeo a una serie de requisitos impuestos por la aplicación. Entre estos requisitos están las imposiciones sobre el tipo de tráfico generado, dígase Razón de Bit Constante (CBR, Constant Bit Rate) o Razón de Bit Variable (VBR, Bit Rate Variable) (Pagan et al., 2011). En términos de asignación de servicios, CBR provee la ventaja de conocer a priori las necesidades de cada servicio, pero tiene la desventaja que para mantener contenidos de videos con tasa de bit constante afecta la calidad del programa transmitido ya que en la compresión de video el parámetro de cuantización (QP) determina el grado de fidelidad entre el contenido sin comprimir y el video final y este varía en el tiempo para mantener salidas constantes (Rezaei et al., 2007). Codificaciones CBR conllevan a variaciones de calidad en términos de mediciones tanto subjetivas como objetivas, si el contenido de video difiere en la cantidad de detalles de las escenas, los movimientos de los objetos en las escenas y los cambios de iluminación..

(33) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 24. Especialmente fuentes de materiales diferentes de video como películas, animados, o contenido generado computacionalmente puede influir directamente sobre las razones de bit obtenidas (Changuel et al., 2012). Si se quiere obtener una tasa constante se debe sacrificar la calidad, ya que ésta variará inversamente con la complejidad de la secuencia que se esté codificando. Para tratar de suavizar este problema se ha contemplado el uso de buffers en el codificador y decodificador, de manera que sean capaces de absorber pequeñas variaciones en el flujo de datos generado. Por otro lado, El RC de razón de bit variable (Pagan et al., 2011) surge principalmente de la necesidad de obtener secuencias de vídeo con una calidad más estable que la obtenida con CBR. Una codificación VBR requiere un proceso de asignación de bits variable, de manera que se asignen bits a cada cuadro en función de su complejidad. De este modo se ahorran bits en los cuadros menos complejos para posteriormente invertirlos en los cuadros más complejos, que requerirán una razón de bit mayor. El principal problema para conseguir este objetivo es el desconocimiento del contenido de los cuadros futuros, por lo que la estrategia de codificación VBR para calidad constante sólo será posible a efectos prácticos en aplicaciones que no requieran codificación en tiempo real. De lo contrario habría que introducir un retardo en la codificación inaceptable para la mayoría de aplicaciones para poder examinar el contenido de varios cuadros. Aun así, el objetivo de calidad constante no podría garantizarse a toda la secuencia, sino al conjunto de cuadros almacenados en el buffer para su análisis. Con el VBR la capacidad efectiva del canal se ve incrementada, ya que la unión de video VBR y la red VBR permite emplear la multiplexación estadística (statmux), quien se encarga de aumentar la capacidad del multiplex tomando ventaja de la razón de bit variable a través del tiempo que duren los diferentes servicios cuando un número suficiente de ellos se combinan en un TS. En un análisis realizado al implementar las simulaciones para comparar 9 secuencia de video de diferentes complejidades con técnicas CBR y VBR combinada con statmux, efectuando el estudio en relación a indicadores de métricas de calidad que representan la distorsión, los artefactos y su cercanía a la calidad subjetiva de la apreciación humana (SSIM) y el PSNR,.

(34) CAPÍTULO 1. CALIDAD DE VIDEO DIGITAL Y MÉTRICAS DE EVALUACIÓN. 25. se obtienen resultados que evidencian las buenas prestaciones de la statmux con altos por cientos de ganancia como se observa en la figura 1.1.. (a). (b). Figura 1.1. Ganancia de ancho de banda y su equivalencia en calidad (a) en términos de SSIM y (b) en términos de PSNR.. 1.4. Conclusiones del capítulo.. En este capítulo se indagó sobre dos de las definiciones más extendidas en el ámbito de la calidad, estas son la QoS y QoE. Se estudiaron las métricas de calidad de video irradiado que posteriormente serán usadas para evaluar la calidad de las señales. En el próximo capítulo se estudiaran las características del flujo de transporte irradiado por la señal DTT en Cuba, además se implementará un diagrama de flujo que nos permitirá realizar la evaluación objetiva y subjetiva de la calidad que se percibe del DTT, a partir de un método FR implementado..

(35) CAPÍTULO 2. MÉTODO FR PARA LA EVALUACIÓN DE LA CALIDAD DE VIDEO. En el presente Capítulo se conocerán los materiales y métodos usados en la presente tesis para la evaluación de la calidad de video. Para ello se realizará un análisis del flujo de transporte irradiado por la señal DTT en nuestro país, posteriormente se implementará un método de Referencia Completa que posibilite llevar a cabo una comparación completa de lo la señal digital recibida. 2.1. Análisis del flujo de transporte irradiado por la señal DTT en Cuba. Desde que comenzó a irradiarse la señal de TVD en Cuba en cada uno de los trasmisores BBEF de las diferentes cabeceras provinciales, el modo de trabajo escogido propiciaba una razón de datos de TS de 18.274Mbps (Montejo, 2015). En función, de dicha razón y teniendo en cuenta el flujo digital asociado a cada uno de los diferentes servicios (dígase video SD codificado con H264 y audio MPEG2 asociado a un determinado programa, el audio de las diferentes emisoras radiales y los datos) en cada canal digital de 6MHz se podían multiplexar un total de 8 servicios audiovisuales, 9 servicios de radio digital, los servicios interactivos, la EPG y las diferentes tablas de señalización (PSI/SI, Program System Information/ System Information ) que rigen el estándar. Se constata que los flujos analizados en dicha etapa la calidad de video variaban apreciablemente de un servicio a otro o dentro del mismo servicio. Bajo este escenario, 7 de los 8 servicios de video nacionales se codificaban con VBR en la Cabeza de Línea y se distribuían vía satelital y mediante el backbone de la fibra óptica nacional con flujo de 34 Mbps que transporta el canal digital desde La Habana hasta los Centro de Mantenimiento de la Transmisión Provinciales y los 22 saltos de radioenlaces de 34 Mbps de capacidad para llevar el canal digital desde los CMT provinciales hasta los 25.

(36) CAPÍTULO 2. MÉTODO FR PARA LA EVALUACIÓN DE LA CALIDAD DE VIDEO. 27. Centros de TV más importantes. Una vez que el flujo digital nacional se encontraba en cada cabecera provincial, al TS contenedor de los todos los servicios nacionales se le extraía un servicio (Canal Educativo 2) y se le insertaba el canal virtual local para cada territorio en determinados días y horarios pero siempre codificado en formato H264 y CBR, para luego ser modulado e irradiado mediante el estándar DTMB en cada una de las zonas. Este tipo de arquitectura es bien sencilla y poco costosa ya que adolece de equipamiento dedicado a la multiplexación estadística en todos los puntos. La principal desventaja es la asignación fija de ancho de banda para servicios que pudieran tener una demanda de la razón de datos superior a las previamente establecidas para cada servicio. 2.2. Implementación del método de Referencia Completa.. En la Televisión Digital Terrestre Cubana la calidad percibida en diferentes programas con el mismo contenido en el mismo momento varía notablemente. Para poder conocer en qué medida ocurre la degradación de la señal correspondiente a los videos transmitidos en diferentes programas de interés, se implementará un método FR que posibilite llevar a cabo la evaluación de las señales transferidas en la TVD. Dado que desde un inicio el programa Cubavisión mostró subjetivamente mayor calidad con respecto a los demás programas, se decidió seleccionarlo como video de referencia. Además se evaluaron varias secuencias de video con diferentes niveles de movimiento y 720x480 pixeles (definición estándar). Para realizar la comparación de los programas se realiza un diagrama de flujo donde se expuso los pasos seguidos en este proceso..

(37) CAPÍTULO 2. MÉTODO FR PARA LA EVALUACIÓN DE LA CALIDAD DE VIDEO. 28. Para cada canal virtual a Evaluar. Implementación del Método FR USB STB Obtención de Videos Deviser. .mts. TS Analizer. Implementar FR en software ¿Acepta el software los. NO. videos obtenidos?. SI Comparación entre el canal de Referencia y la imagen de prueba. Obtención de las Métricas. NO. ¿Están los valores de las métricas dentro de los rangos correspondientes?. Evaluación Objetiva de la calidad. SI Realización de tablas y gráficos. Evaluación Subjetiva de la Calidad. Evaluación General de la Calidad de las señales de TVD. Figura 2.1. Representación del método FR implementado ..

Referencias

Documento similar

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos