Digitalización de la voz

(1)

Digitalización de la voz

Digitalizacion es: Acción de convertir en digital información analógica. En otras palabras, es convertir cualquier señal de entrada continua (analógica) en una serie de valores numéricos.

La información digital es la única información que puede procesar una computadora, generalmente en el sistema binario, es decir unos (1) y ceros (0).

La señal digital, es la codificación de la señal sonora en términos discretos (por lo general en dos estados 1, y 0). El principal problema de la señal digital, es que nuestro oído es analógico con lo que por un lado necesitamos una conversión analógica digital y posteriormente una conversión digital analógica (para que nuestro oído sea capaz de percibirla). A este conjunto de procesos se le suele llamar DSP (Digital Signal Procesing).

En el paso del analógico al digital (ADC) existen dos procesos; el muestreo (número de muestras que cogemos de la señal analógica, a mas muestras, mejor representación de la señal) y la codificación (el valor que le vamos a dar a todas esas muestras, a mayor número de bits mayor parecido con la señal analógica. Posteriormente aparece el DAC (paso de la señal digital a la analógica), para que nuestro oído sea capaz de escucharlo.

La tasa o frecuencia de muestreo es el número de muestras por unidad de tiempo que se toman de una señal continua para producir una señal discreta, durante el proceso necesario para convertirla de analógica en digital. Como todas las frecuencias, generalmente se expresa en hercios (Hz, ciclos por segundo) o múltiplos suyos, como el kilohercio (kHz), aunque pueden utilizarse otras magnitudes.

En audio, la máxima audiofrecuencia perceptible para el oído humano está en torno a los 20 kHz, por lo que teóricamente una frecuencia de muestreo de 40 kHz sería adecuada para digitalizarla; no obstante, el estándar introducido por el CD-Audio (Disco Compacto), se estableció en 44,1 kHz. La frecuencia de muestreo ligeramente superior permite compensar los filtros utilizados durante la conversión analógica-digital.

Hay que tener en cuenta que no todas las fuentes sonoras se aproximan a los 20 kHz que corresponden a esta frecuencia máxima; la mayoría de los sonidos está muy por debajo de

(2)

En este caso, siguiendo el Teorema de Nyquist, sería adecuada una frecuencia de muestreo en torno a los 2100 Hz. En este sentido, la mayoría de software/hardware están preparados para que el usuario pueda seleccionar la frecuencia de muestreo a utilizar. El estándar del CD-Audio está fijado en 44,1 kHz, pero esto no significa que esa sea la frecuencia que utilizan todos los equipos. Los sistemas domésticos de baja calidad pueden utilizar frecuencias de 22,05 kHz o de 11,025 kHz (produciendo así una señal analógica de inferior calidad a la que podría generarse con la información contenida en el disco). Además, las tarjetas de sonido de los equipos informáticos utilizan frecuencias por encima o por debajo de este estándar, muchas veces seleccionándolas en función de las necesidades concretas (sobre todo, en aplicaciones de audio profesional).

En audio profesional, se utilizan frecuencias de muestreo de 48 kHz o superiores. La razón es que cuando se graban altas frecuencias, cercanas a los 20 kHz, usando los 44,1 kHz, sólo se recogen dos muestras por ciclo, con lo que la señal resultante queda muy limitada. Ante esto, es evidente que las altas frecuencias se muestrean peor que las bajas; una tasa de muestreo superior al estándar permite corregir esta disparidad.

Teorema de Nyquist

Según el teorema de muestreo de Nyquist-Shannon, para poder replicar con exactitud (es decir, siendo matemáticamente reversible en su totalidad) la forma de una onda es necesario que la frecuencia de muestreo sea superior al doble de la máxima frecuencia a muestrear.

Es un error frecuente y extendido creer que una misma señal muestreada con una tasa elevada se reconstruye mejor que una muestreada con una tasa inferior. Esto es falso (siempre que la tasas empleadas cumplan el criterio de Nyquist,

naturalmente). El proceso de muestreo (que no debe ser confundido con el de cuantificación) es, desde el punto de vista matemático perfectamente reversible, esto es, su reconstrucción es exacta, no aproximada. Dicho de otro modo, desde el punto de vista matemático al que se refiere el teorema de muestreo de Nyquist-Shannon, la reconstrucción de una señal de 10 kHz es idéntica tanto si se obtiene de una tasa de muestreo de 25000 muestras por segundo como de una de 50000 muestras por segundo. No aporta nada incrementar la tasa de muestreo una vez que ésta cumple el criterio de Nyquist. También son errores frecuentes y extendidos, relacionados con lo expuesto en este párrafo, creer que los puntos que resultan del proceso de muestreo se unen en la reconstrucción mediante rectas formando dientes de sierra o que existe un proceso de cálculo que realiza la interpolación de manera simulada. En resumen, el teorema de muestreo demuestra

que toda la información de una señal contenida en el intervalo temporal entre dos muestras cualesquiera está descrita por la serie total de muestras siempre que la señal registrada sea de naturaleza periódica (como lo es el sonido) y no tenga

componentes de frecuencia igual o superior a la mitad de la tasa de muestreo; no es necesario inventar la evolución de la señal entre muestras.

(3)

Conversión analógica-digital

La conversión analógica-digital (CAD) consiste en la transcripción de señales analógicas en señales digitales, con el propósito de facilitar su procesamiento (codificación, compresión, etc.) y hacer la señal resultante (la digital) más inmune al ruido y otras interferencias a las que son más sensibles las señales analógicas.

La digitalización o conversión analógica-digital (conversión A/D) consiste básicamente en realizar de forma periódica medidas de la amplitud (tensión) de una señal, redondear sus valores a un conjunto finito de niveles preestablecidos de tensión (conocidos como niveles de cuantificación) y registrarlos como números enteros en cualquier tipo de memoria o soporte. La conversión A/D también es conocida por el acrónimo inglés ADC (analogue to digital converter).

En esta definición están patentes los cuatro procesos que intervienen en la conversión analógica-digital:

1.

Muestreo: el muestreo (en inglés, sampling) consiste en tomar muestras periódicas de la amplitud de onda. La velocidad con que se toma esta muestra, es decir, el número de muestras por segundo, es lo que se conoce como frecuencia de muestreo.

2.

Retención (en inglés, hold): las muestras tomadas han de ser retenidas (retención) por un circuito de retención (hold), el tiempo suficiente para permitir evaluar su nivel (cuantificación). Desde el punto de vista matemático este proceso no se contempla, ya que se trata de un recurso técnico debido a limitaciones prácticas, y carece, por tanto, de modelo matemático.

3.

Cuantificación: en el proceso de cuantificación se mide el nivel de voltaje de cada una de las muestras. Consiste en asignar un margen de valor de una señal analizada a un único nivel de salida. Incluso en su versión ideal, añade, como resultado, una señal indeseada a la señal de entrada: el ruido de cuantificación.

4.

Codificación: la codificación consiste en traducir los valores obtenidos durante la cuantificación al código binario. Hay que tener presente que el código binario es el más utilizado, pero también existen otros tipos de códigos que también son utilizados.

Durante el muestreo y la retención, la señal aún es analógica, puesto que aún puede tomar cualquier valor. No obstante, a partir de la cuantificación, cuando la señal ya toma valores finitos, la señal ya es digital.

Los cuatro procesos tienen lugar en un conversor analógico-digital.

(4)

El proceso de digitalización utiliza el muestreado o sampleado, cada cierto tiempo se lee el valor de la señal analógica y toma una muestra:

1.

Si el valor de la señal en ese instante está por debajo de un determinado umbral, la señal digital toma un valor mínimo (0).

2.

Cuando la señal analógica se encuentra por encima del valor umbral, la señal digital toma un valor máximo (1).

(5)

Recuperación de la señal analógica

En la recuperación se realiza un proceso inverso, con lo que la señal que se recompone se parecerá mucho a las originales (a), (b) y (c), si bien durante el proceso de cuantificación, debido al redondeo de las muestras a los valores cuánticos, se produce una distorsión conocida como ruido de cuantificación. En los sistemas normalizados, los intervalos de cuantificación han sido elegidos de tal forma que se minimiza al máximo esta distorsión, con lo que las señales recuperadas son una imagen casi exacta de las originales. Dentro de la recuperación de la señal, ya no se asignan intervalos de cuantificación en lugar de ello son niveles, equivalentes al punto medio del intervalo IC en el que se encuentra la muestra normalizada.

Ventajas de la señal digital

1. Cuando una señal digital es atenuada o experimenta perturbaciones leves, puede ser reconstruida y amplificada mediante sistemas de regeneración de señales.

2. Cuenta con sistemas de detección y corrección de errores, que se utilizan cuando la señal llega al receptor; entonces comprueban (uso de redundancia) la señal, primero para detectar algún error, y, algunos sistemas, pueden luego corregir alguno o todos los errores detectados previamente.

3. Facilidad para el procesamiento de la señal. Cualquier operación es fácilmente realizable a través de cualquier software de edición o procesamiento de señal.

4. La señal digital permite la multigeneración infinita sin pérdidas de calidad.

5. Es posible aplicar técnicas de compresión de datos sin pérdidas o técnicas de compresión con pérdidas basados en la codificación perceptual mucho más eficientes que con señales analógicas.

Desventajas de la señal digital

1. Se necesita una conversión analógica-digital previa y una decodificación posterior, en el momento de la recepción.

2. Si no se emplean un número suficientes de niveles de cuantificación en el proceso de digitalización, la relación señal a ruido resultante se reducirá con relación a la de la señal analógica original que se cuantificó. Esto es una consecuencia de que la señal conocida como error de cuantificación que introduce siempre el proceso de cuantificación sea más potente que la del ruido de la señal analógica original. En los casos donde se emplean suficientes niveles de cuantificación, la relación señal a ruido de la señal original se conservará esencialmente porque el error de cuantificación quedará por debajo del nivel del ruido de la señal que se cuantificó. Esto, naturalmente, es lo normal.

3. Se hace necesario emplear siempre un filtro activo analógico pasa bajo sobre la señal a muestrear con objeto de evitar el fenómeno conocido como aliasing, que podría hacer que componentes de frecuencia fuera de la banda de interés quedaran registrados como componentes falsos de frecuencia dentro de la banda de interés. Asimismo, durante la reconstrucción de la señal en la posterior conversión D/A, se hace también necesario aplicar un filtro activo analógico del mismo tipo (pasa bajo) conocido como filtro de reconstrucción. Para que dicho filtro sea de fase lineal en la banda de interés, siempre se debe dejar un margen práctico desde la frecuencia de Nyquist (la mitad de la tasa de muestreo) y el límite de la banda de interés (por ejemplo, este margen en los CD es del 10%, ya que el límite de Nyquist es en este caso 44,1 kHz / 2 = 22,05 kHz y su banda de interés se limita a los 20 kHz).

Procesamiento digital de señales

(6)

Se ha dicho que puede trabajar con señales analógicas, pero es un sistema digital, por lo tanto necesitará un conversor analógico/digital a su entrada y digital/analógico en la salida. Como todo sistema basado en procesador programable necesita una memoria donde almacenar los datos con los que trabajará y el programa que ejecuta.

Se puede procesar una señal para obtener una disminución del nivel de ruido, para mejorar la presencia de determinados matices, como los graves o los agudos y se realiza combinando los valores de la señal para generar otros nuevos.

Eventualmente cuándo el DSP ha terminado su trabajo, los datos digitales pueden volverse atrás como señales analógicas, con calidad mejorada. Por ejemplo: un DSP puede filtrar ruido de una señal, remover interferencias, amplificar y/o suprimir frecuencias, encriptar información, ó analizar una corriente compleja en sus componentes esenciales.

Este proceso deberá ser realizado en TIEMPO REAL, lo cuál es muy rápido, necesitando así que el DSP realice miles de millones de operaciones por segundo.

En su núcleo, un DSP es altamente numérico y repetitivo. A la vez que cada dato llega, éste debe ser multiplicado, sumado y además de eso transformado de acuerdo a fórmulas complejas. Lo que permite realizar todo ello es la velocidad del

dispositivo. Los sistemas basados en DSP’s deben trabajar en tiempo real, capturando y procesando información a la vez que ocurre. Los conversores análogo – digital deben adquirir la información lo suficientemente seguido como para captar todas las fluctuaciones relevantes de las señales. Si el ADC es muy lento se perderá información. El DSP también debe trabajar rápido para no perder información que le llega desde el ADC y además cumplir con el adecuado procesamiento de las señales.

Conversores AD y DA

ADC tipo flash (en paralelo).

Consiste en una serie de comparadores arreglados en paralelo que comparan a la señal con una referencia para cada nivel. El resultado de las comparaciones ingresa a un circuito lógico que “cuenta” los comparadores activados.

ADC de simple rampa.

(7)

ADC de doble rampa.

Este esquema permite independizarse de la precisión de la frecuencia del reloj, la resistencia y el condensador. La conversión se hace en dos etapas, la primera se realiza la integración de la tensión de entrada durante un tiempo fijo, y en la segunda se produce la descarga con

pendiente fija, durante un tiempo que depende de la cantidad de carga acumulada.

DAC de escalera.

Esta configuración permite un rango amplio de valores

de las resistencias. En la actualidad, este tipo de circuito es superado por

las redes de escalera del tipo R-2R

Digitalización de la voz