CAPÍTULO 3. DISEÑO DE LA ESTRATEGIA PARA LA
3.2 Empleo de la recomendación P.563 para realizar la evaluación de la
Como se hizo referencia anteriormente, el algoritmo P.563 es aplicable para la predicción de la calidad vocal sin una señal de referencia independiente, a diferencia del PESQ donde ambos ficheros con extensión WAV, el fichero original y el modificado o degradado, son analizados con el software PESQ para calcular la calidad de la voz.
Por ese motivo, este método relacionado con la recomendación P.563 se recomienda para la evaluación no intrusiva de la calidad vocal y para la supervisión y evaluación con la red en funcionamiento, empleando fuentes de señal vocal desconocidas en el extremo lejano de una conexión telefónica.
En comparación con la recomendación P.862 que compara una señal de referencia de elevada calidad con la señal degradada en base a un modelo perceptual, la
recomendación P.563 predice la calidad de la voz de una señal degradada sin una señal vocal de referencia dada. Esta puntuación de calidad que se predice está relacionada con la calidad percibida en el extremo receptor.
El software de esta recomendación se compone de los archivos con extensión h y con extensión c contenidos en los subdirectorios “include” y “source” respectivamente. El procedimiento empleado para realizar la demostración con esta recomendación es similar al anterior, es decir, aplicando el software Matlab. En la ventana de comandos se ejecutó el comando >> mbuild *.c para obtener el archivo ejecutable p563.exe.
La señal de voz digitalizada para realizar las pruebas con el archivo ejecutable p563.exe es tomada de los archivos con extensión WAV contenidos en la recomendación P.862, para lo cual se debe tener en cuenta las características que deben cumplir las señales, entre las que se destacan como más significativas las siguientes: señal vocal activa mínima del fichero (3 s) y duración máxima de la señal (20 s). Por esta razón la evaluación es realizada solo para las señales mostradas en la figura 18, donde los valores obtenidos se hacen correlacionar con el MOS (P.563-MOS). El resto de las señales no cumplen con estos requerimientos.
Figura 18. Puntaje de la recomendación P.563 para distintos valores de la señal degradada.
Como se puede apreciar en la figura anterior, el análisis P.563 con los archivos con extensión WAV procesado a través de Matlab, proporciona los valores para cada señal
degradada evaluada. El resultado varía en dependencia de la degradación introducida y está correlacionado con un valor de MOS (P.563-MOS).
3.2.1 Evaluación de P.563 para señales procesadas con distintos codec
Las evaluaciones realizadas anteriormente contemplan señales con retardos variables, lo cual constituye uno de los factores de degradación de la QoS desde el punto de vista de la red de transporte.
A continuación, en la figura 19 se muestra el resultado de la demostración realizada para distintos archivos, obtenidos a partir del uso de varios codec. Éstos constituyen uno de los factores de degradación de la QoS desde el punto de vista de los terminales o equipos de acceso. Se comprueba y es comparada la calidad obtenida para cada uno de ellos, observando cómo a medida que se va comprimiendo más la señal de audio, la calidad disminuye. Por otro lado la compresión hace que el ancho de banda necesario para enviar la información sea menor y los retrasos también serán menores. A medida que la voz se va comprimiendo suena más metálica y la calidad se deteriora.
Las muestras fueron tomadas principalmente del proyecto Hawk Software [41], cada una de ellas con 25 segundos de duración:
• Fichero .WAV para codec G.711 a 64 Kbps
• Fichero .WAV para codec ADPCM a 32 Kbps (similar a G.721)
• Fichero .WAV para codec G.729
• Fichero .WAV para codec LPC10 a 2.4 Kbps
El procesamiento de los archivos anteriores se realiza con el algoritmo de la recomendación P.563 mediante Matlab y los resultados son mostrados en la figura 19. En la figura 20, el resultado MOS-LQO de P.563 indica la calidad de la señal procesada por cada tipo de codec empleado (valor de 1 a 5) como lo indica la recomendación. Como se puede observar, el codec G.711 que emplea la técnica de codificación PCM es el que mayor valor proporciona, lo cual indica una mayor calidad de voz. Le sigue el G.721 que usa técnica ADPCM y luego el G.729 con algoritmo CS-ACELP. En la misma medida que los algoritmos de compresión son más sofisticados, como es el caso del codec LPC10, mayor es la demora de procesamiento y mayor es el grado de afectación de la señal procesada a la salida del codec.
Figura 19. Resultados de la evaluación realizada con distintos codec.
En la tabla 11 se muestra un resumen con los resultados obtenidos de la evaluación anterior, para cada señal procesada en dependencia del codec al aplicar P.563
Tabla 11. MOS resultante en dependencia del codec al aplicar P.563.
CODEC Tasa de datos MOS
G.711 64 Kbps 3.9
G.721 32 Kbps 3.6
G.729 8 Kbps 3.5
LPC10 2.4 Kbps 1
La compresión de la forma de onda representada permite el ahorro del ancho de banda
.
Esto es especialmente interesante en los enlaces de poca capacidad y posibilita tener un mayor número de conexiones de VoIP simultáneamente. Otra manera de ahorrar ancho de banda es el uso de la supresión del silencio o VAD, que es el proceso de no enviar los paquetes de la voz entre silencios durante las conversaciones. En dependencia de las condiciones de la red de transporte, es importante seleccionar el tipo de codec para garantizar la mejor QoS que necesita el usuario para su satisfacción. A continuación se comprueban estos aspectos mediante la simulación.