• No se han encontrado resultados

Grabadora digital de voz para una PC

N/A
N/A
Protected

Academic year: 2017

Share "Grabadora digital de voz para una PC"

Copied!
154
0
0

Texto completo

(1)

INSTITUTO POLITÉCNICO NACIONAL

ESCUELA SUPERIOR DE INGENIERÍA MECÁNICA Y ELÉCTRICA

UNIDAD PROFESIONAL “ADOLFO LÓPEZ MATEOS”

“GRABADORA DIGITAL DE VOZ PARA UNA PC"

T E S I S

QUE PARA OBTENER EL TÍTULO DE:

INGENIERO EN COMUNICACIONES Y ELECTRÓNICA

P

R

E

S

E

N

T

A

N

ANTONIO BAUTISTA GUSTAVO

CUREÑO MARTÍNEZ HUMBERTO YAHVEH

ASESORES:

ING. ALEJANDRO VICENTE LUGO SILVA

M. EN C. GENARO ZAVALA MEJÍA

(2)

ESCUELA SUPERIOR DE INGENlERÍA MECÁNICA Y ELECTRICA

UNIDAD PROFESIONAL "ADOLFO LÓPEZ MATEOS"

TEMA DE TESIS

INGENIERlA EN COMUNICACIONES Y ELECTRÓNICA

QUE PARA OBTENER EL TITULO DE

TESIS COLECTIVA y EXAMEN ORAL INDIVIDUAL

POR LA OPCIÓN DE TITULACIÓN

ANTONIO BAUTISTA GUSTAVO

DEBERA(N) DESARROLLAR HUMBERTO YAHVEH CUREÑO MARTINEZ

TEMA: GRABADORA DIGITAL DE VOZ PARA UNA PC

OBJETIVO DEL TEMA: DISEÑAR UN PROTOTIPO DE UNA GRABADORA DIGITAL DE VOZ PARA UNA PC USANDO EL MICROCONTROLADOR PIC18F4550.

PUNTOS A DESARROLLAR:

セ@ INTRODUCCIÓN

セ@ CAPITULO 1: ANTECEDENTES Y ESTADO DEL ARTE

セ@ CAPITULO 2: MARCO TEORICO

セ@ CAPITULO 3: DISEÑO DE HARDWARE Y SOFTWARE

セ@ CAPITULO 4: RESULTADOS EXPERIMENTALES

(3)

ii

Agradecimientos

Desde el primer día de vida hasta el último de la ingeniería, cada paso, cada persona, cada recuerdo, me han hecho ser quien soy. He forjado mi propio camino y no pretendo corregirlo, pues nada cambiaría de él. Del mismo modo seguiré labrando mi camino para ser cada día mejor. Gracias a todos los que han estado conmigo y en especial quiero agradecer:

A mis padres: por ser pilares fundamentales en mi vida y educación; por todo su cariño, comprensión, confianza, enseñanzas y apoyo incondicional hacia mí, por demostrarme con su ejemplo que no hay imposibles cuando realmente quieres conseguir algo. Porque de ellos aprendí que no debes dejar que nada te desvié del camino que te has fijado y mantenlo hasta el final, serle fiel y ser todo lo que quieras ser.

A mis hermanos: porque sé que cuento con ellos en todo en todo momento y porque para mí siempre han sido un claro ejemplo del don de la perseverancia. Porque desde siempre me han enseñado que el esfuerzo, dedicación, constancia, disciplina, trabajo, sacrificio y confianza en uno mismo son indispensables para llegar al éxito.

A mis tutores: por guiarme y ayudarme en éste camino para lograr la culminación de ésta tesis con mucho éxito. Porque gracias a ellos aprendí que todo gran éxito es una acumulación de pequeños esfuerzo realizados diariamente.

Una meta de muchas más alcanzada. En el camino muchas veces he tropezado y gracias a ustedes aprendí a levantarme. Nunca se fracasa hasta que se deja de intentar.

(4)

iii

Agradecimientos

Quiero dedicar este trabajo de tesis, que es resultado de la formación que he recibido de muchas personas, de las cuales, las más importantes son mis padres y mi hermano a quienes dedico este trabajo. He tenido la fortuna de vivir 23 años gloriosos llenos de amor y calor de una familia, de un ejemplo y miles de enseñanzas que jamás podré pagarte a ti mamá y a ti papá. A ti hermano, mi mejor amigo, nunca dejarás de ser mi mejor ejemplo a seguir y mi mayor admiración. Por todas esas bendiciones de Dios, de la vida, solo puedo decir ¡gracias!

Quiero agradecer a Mario Cureño y Jaime Cureño por su apoyo incondicional a lo largo de mi formación académica. A mi familia, amigos y a quienes han sido participes en que haya podido lograr esta meta en mi vida. A mi sobrino Yahveh Cureño, por sus risas y alegría que me compartía en esos días de intenso trabajo, a quien mi mayor deseo es una vida llena de amor y éxito.

Quedo completamente agradecido al Instituto Politécnico Nacional, la casa de estudios que me brindó una educación superior y una forma de ver la vida diferente. A los profesores y personal que velan porque los estudiantes de esta institución sean profesionistas de calidad, brindando lo mejor de ellos, como lo fueron las enseñanzas y apoyo de nuestros asesores de tesis; quienes nos enseñaron el camino de la perseverancia y si se ha llegado a este objetivo es también gracias a ellos.

(5)

Índice general iv

GRABADORA DIGITAL DE VOZ PARA UNA PC

Índice general

Índice general ... iv

Índice de figuras ... vii

Índice de tablas ...x

Objetivo general ... xii

Objetivos particulares ... xii

Justificación ... xiii

Introducción ... 1

Capítulo 1: Antecedentes y estado del arte ... 3

1.1 Sonido, audio y voz... 4

1.2 Grabación del Sonido ... 5

1.2.1 Grabación analógica y digital ... 6

1.2.2 Almacenamiento digital del audio. ... 7

1.3 Evolución del hardware y software para grabación de audio ... 11

Capítulo 2: Marco teórico ... 17

2.1 Estructura de un sistema de grabación de audio digital ... 19

2.1.1 Micrófonos ... 21

2.2 Etapa de acondicionamiento analógico ... 26

2.2.1 Acoplamiento ... 26

2.2.2 Amplificación ... 27

2.2.3 Relación señal/ruido... 30

2.2.4 Distorsión ... 31

2.2.5 Respuesta en frecuencia ... 31

2.2.6 Filtrado ... 32

2.3 Conversión analógico-digital ... 41

2.3.1 Muestreo ... 43

(6)

Índice general v

2.4 Transmisión serie de datos ... 51

2.4.1 Comunicación RS-232 y sus características ... 51

2.4.2 UART ... 55

2.4.3 Construcción física DB-9 ... 56

2.5 Almacenamiento digital ... 60

2.5.1 RIFF ... 61

2.5.2 Estructura de un archivo WAV ... 62

2.5.3 MP3 ... 66

Capítulo 3: Diseño de hardware y software ... 68

3.1 Micrófono SHURE C606N ... 69

3.2 Etapa de acondicionamiento y acoplamiento ... 70

3.2.1 Amplificador de pequeña señal ... 70

3.2.2 Filtro pasa-bajas ... 72

3.2.3 Resultados ... 73

3.3 Codificación de la señal acondicionada... 76

3.3.1 Módulo convertidor analógico-digital ... 76

3.3.2 Software de adquisición de datos ... 77

3.4 Transmisión de datos (USART) ... 81

3.4.1 Software de transmisión de datos ... 82

3.4.2 Interfaz de Comunicación del Microcontrolador con la PC ... 89

3.5 Prototipo final del hardware ... 90

3.6 Software de la Interfaz Gráfica de Usuario ... 92

Capítulo 4: Resultados experimentales ... 100

4.1 Sistema de adquisición de datos ... 101

4.1.1 Respuesta del micrófono ... 101

4.1.2 Respuesta del filtro ... 102

4.2 Comunicación entre el microcontrolador y la Interfaz Gráfica de Usuario ... 104

4.3 Uso de la Interfaz Gráfica de Usuario ... 107

4.4 Archivo final de la Grabación ... 108

4.5 Pruebas de funcionamiento ... 110

4.5.1 Portabilidad del archivo ... 110

(7)

Índice de figuras vii

Índice de figuras

Capítulo 1. Antecedentes y estado del arte

Figura 1. 1 Fonógrafo ... 11

Figura 1. 2 Disco de Vinilo ... 11

Figura 1. 3 Cassette ... 11

Figura 1. 4 Compact Disc (CD) ... 11

Figura 1. 5 Grabadora Digital de voz ... 11

Figura 1. 6 Software Audacity ... 14

Figura 1. 7 Software Free Audio Editor ... 15

Figura 1. 8 Software Adobe Audition ... 15

Figura 1. 9 Software Pro Tools ... 16

Capítulo 2. Marco teórico Figura 2. 1 Diagrama a bloques de un sistema ... 18

Figura 2. 2 Diagrama de las etapas funcionales que conforman el sistema de la grabadora de voz 20 Figura 2. 3 Diagrama a bloques de un transductor electroacústico ... 21

Figura 2. 4 Micrófono es tanto mejor cuanto más rectilíneo sea su curva de respuesta de frecuencia. 1) Micrófono de calidad. 2) Micrófono con poca sensibilidad a tonos bajos. 3) Micrófonos con poca sensibilidad a los tonos altos. 4) Micrófono de baja calidad ... 22

Figura 2. 5 Diagramas polares de campos unidireccionales, micrófonos bidireccionales y omnidireccionales ... 22

Figura 2. 6 Curva de directividad: a) Omnidireccional, b) Semidireccional, c) Bidireccional, d) Unidireccional ... 25

Figura 2. 7 Terminales de un amplificador operacional de propósito general ... 27

Figura 2. 8 Polaridad de voltaje y dirección de corrientes para amplificadores no inversores ... 29

Figura 2. 9 Respuesta en frecuencia para cuatro categorías de filtros. ... 33

Figura 2. 10 Filtro pasa-bajas y gráfica de respuesta en frecuencia para un filtro con una pendiente de -20 dB/década ... 34

Figura 2. 11 Circuito y gráfica de respuesta en frecuencia para un filtro pasa-bajas de -40 dB/década ... 37

Figura 2. 12 Circuito y gráfica de respuesta en frecuencia para un filtro pasa-bajas de -60 dB/década ... 39

Figura 2. 13 Gráfica de respuesta en frecuencia para tres tipos de filtros pasa-bajas Butterworth 40 Figura 2. 14 (a) Representación de una señal analógica y (b) Representación de una señal digital 41 Figura 2. 15 Etapas de un convertidor analógico-digital ... 42

Figura 2. 16 Muestreo de una señal analógica... 43

(8)

Índice de figuras viii

Figura 2. 18 Codificación de una señal analógica ... 45

Figura 2. 19Función de transferencia de un ADC unipolar ... 47

Figura 2. 20 Función de transferencia de un ADC bipolar ... 47

Figura 2. 21 a) Periodo de muestreo y b) redondeo de las muestras a valores discretos durante el proceso de la cuantización y codificación. ... 49

Figura 2. 22 Cable Serial con adaptador USB ... 51

Figura 2. 23 Ejemplo de la transmisión de un carácter ... 52

Figura 2. 24 a) Conectores DB-25 macho/hembra respectivamente y conectores DB-9 macho/hembra respectivamente ... 53

Figura 2. 25 Diagrama de comunicación entre un DTE y un DCE a través de una interface serial ... 54

Figura 2. 26 Diagrama a bloques de la conexión entre el CPU y la USART ... 55

Figura 2. 27 Diagrama de pines del conector DB-9 ... 57

Figura 2. 28 Diagrama del conector DB-9 con adaptador USB ... 58

Capítulo 3. Diseño de hardware y software Figura 3. 1 Diagrama a bloques del sistema grabadora de voz ... 69

Figura 3. 2 Micrófono Shure C606N ... 69

Figura 3. 3 Función de transferencia del micrófono C606N dada por el fabricante ... 70

Figura 3. 4 Bloques de la etapa de acondicionamiento de la señal ... 70

Figura 3. 5 Circuito amplificador de pequeña señal ... 71

Figura 3. 6 Filtro activo pasa bajas de 4000 Hz ... 73

Figura 3. 7 Circuito de acondicionamiento de la señal ... 73

Figura 3. 8 Respuesta del filtro pasa bajas de 4000 Hz ... 74

Figura 3. 9 PCB de la etapa de acondicionamiento de la señal ... 75

Figura 3. 10 Diagrama del circuito impreso del filtro pasa bajas a 4 KHz ... 75

Figura 3. 11 Circuito de la etapa de acondicionamiento de la señal ... 75

Figura 3. 12 Diagrama de flujo del programa principal de la adquisición de datos en el microcontrolador ... 78

Figura 3. 13 Diagrama de flujo de la función config() para la configuración de puertos ... 79

Figura 3. 14 Diagrama de flujo de la función cfgADC() para la configuración del ADC ... 79

Figura 3. 15 Diagrama de flujo de la función getADC() para conseguir el resultado del muestreo .. 81

Figura 3. 16 Diagrama de flujo de la función configUSART() para la configuración del puerto serial ... 82

Figura 3. 17 Diagrama de flujo de la función TXbyte() para el envío de datos ... 83

Figura 3. 18 Tiempo de muestreo y de transmisión de datos sin retardo ... 85

Figura 3. 19 Diagrama de flujo de la función configTemp0() para el retardo ... 86

Figura 3. 20 Software PIC Timer Calculator para el cálculo de TMR0H y TMR0L ... 87

Figura 3. 21 Tiempo de muestreo y de transmisión de datos acondicionado a 1 ms ... 88

(9)

Índice de figuras ix

Figura 3. 23 PCB del circuito MAX 232 para la comunicación serial entre la PC y el microcontrolador

... 89

Figura 3. 24 Circuito PCB del circuito MAX232 para la comunicación serial entre la PC y el microcontrolador ... 90

Figura 3. 25 Hardware del sistema de adquisición de datos... 90

Figura 3. 26 Diagrama de flujo del programa principal de la Interfaz Gráfica de Usuario ... 92

Figura 3. 27 Diagrama de flujo del programa principal de la Interfaz Gráfica de Usuario ... 93

Figura 3. Asig a ió de o e COM al pue to se ial e el Ad i ist ado de dispositi os de Windows... 93

Figura 3. 29 Diagrama de flujo de la etapa de grabación en memoria temporal ... 94

Figura 3. 30 Diagrama de flujo de la etapa de graficación del espectro resultante. ... 95

Figura 3. 31 Diagrama de flujo para guardar un archivo WAV... 96

Figu a . Diag a a de flujo del otó Nue a g a a ió ... 97

Figura 3. 33 Diagrama de flujo para asignar dimensiones de la grabación a la cabecera correspondiente ... 97

Figura 3. 34 Diagrama de flujo para convertir archivo WAV en MP3 ... 98

Figura 3. 35 Vista general de la Interfaz Gráfica de Usuario en C# para iniciar una grabación ... 99

Capítulo 4. Resultados experimentales Figura 4. 1 Señal de voltaje de salida del micrófono ... 101

Figura 4. 2 Diagrama de un proceso... 102

Figura 4. 3 Señal de voltaje de salida del micrófono con la etapa de acondicionamiento ... 102

Figura 4. 4 Respuesta del filtro pasa bajas de 4000 Hz ... 104

Figura 4. 5 Comparación de la señal de entrada del generador contra la señal en la IGU ... 105

Figura 4. 6 Respuesta en frecuencia del sistema en la IGU ... 106

Figura 4. 7 Elementos de la Interfaz Gráfica de Usuario ... 107

Figura 4. 8 Archivos generados en carpeta destino ... 109

Figura 4. 9 a) Espacio de almacenamiento en disco del archivo WAV b) Duración y velocidad en bits del archivo WAV ... 109

Figura 4. 10 a) Duración y velocidad en bits del archivo MP3 b) Extensión MP3 y espacio en disco del archivo MP3 ... 110

Figura 4. 11 Archivos WAV y MP3 en el explorador de Windows... 111

Figura 4. 12 Reproductor de Windows Media Player ... 111

Figura 4. 13 Archivos WAV y MP3 en el explorador de archivos Finder de Mac OS ... 112

Figura 4. 14 Reproductor iTunes de Mac OS ... 112

Figura 4. 15 Archivos WAV y MP3 en el explorador de archivos de Linux Ubuntu ... 113

Figura 4. 16 Reproductor de música Totem 3.0.1 de Linux Ubuntu ... 113

Figura 4. 17 Resultado de la grabación de 1 hora continua ... 114

Figura 4. 18 Diferencia de tiempo de un cronometro contra la IGU en una hora. ... 115

Figura 4. 19 Diferencia de tiempo de un cronometro contra la IGU. ... 116

(10)

Índice de tablas x

Índice de tablas

Capítulo 1. Antecedentes y Estado del Arte

Tabla 1. 1 Formatos de archivos de audio libres ... 8

Tabla 1. 2 Formatos de archivos de audio abiertos ... 9

Tabla 1. 3 Formatos de archivos de audio propietarios ... 9

Tabla 1. 4 Evolución de artefactos y dispositivos grabadores y/o reproductores de audio digital . 12 Capítulo 2. Marco Teórico Tabla 2. 1 Señales de los pines del conector DB-9 para el RS-232 ... 57

Tabla 2. 2 Estructura de un formato WAV ... 62

Tabla 2. 3 Especificaciones de los bloques de un formato WAV ... 63

Tabla 2. 4 Ejemplo de la conformación de un archivo con formato WAV ... 64

Tabla 2. 5 Comparación de formatos de calidad de audio ... 67

Capítulo 3. Diseño de hardware y software Tabla 3. 1 Configuración del registro ADCON0 ... 80

Tabla 3. 2 Función de cada bit del registro ADCON0 ... 80

Tabla 3. 3 Configuración del registro ADCON1 ... 80

Tabla 3. 4 Función de cada bit del registro ADCON1 ... 80

Tabla 3. 5 Configuración del registro ADCON2 ... 80

Tabla 3. 6 Función de cada bit del registro ADCON2 ... 80

Tabla 3. 7 Configuración de los registros de control de la USART ... 83

Tabla 3. 8 Función de cada bit del registro TXSTA ... 83

Tabla 3. 9 Configuración del registro RCSTA ... 83

Tabla 3. 10 Función de cada bit del registro RCSTA ... 84

Tabla 3. 11 Configuración del registro BAUDCON ... 84

Tabla 3. 12 Función de cada bit del registro BAUDCON ... 84

Capítulo 4. Resultados experimentales Tabla 4. 1 Respuesta en frecuencia del filtro ... 103

Tabla 4. 2 Diferencia de tiempo de un cronometro contra la IGU. ... 116

(11)

Índice de tablas xi

Apéndice B

(12)

Objetivo general xii

Objetivo general

Diseñar un prototipo de una grabadora digital de voz para una PC usando el microcontrolador PIC18F4550.

Objetivos particulares

1. Elaborar un sistema de adquisición de datos para la entrada de la señal de voz al PIC 18F4550.

2. Diseñar y construir una interfaz de comunicación entre el microcontrolador y la PC aplicando el estándar RS-232.

3. Realizar la codificación de los datos obtenidos a un formato estándar de audio.

(13)

Justificación xiii

Justificación

o Ventajas de la grabación digital frente a la analógica

El procesamiento digital de voz es empleado en muchos sistemas de comunicación por las grandes ventajas que presenta ésta frente a la analógica, entre las cuales está la facilidad de almacenamiento, transmisión, calidad y una muy importante, un menor margen de ruido. Para el caso de este proyecto, la finalidad es obtener un mensaje de voz entendible con una calidad baja, por lo que reduciendo el ancho de banda a 4 KHz y un ancho de palabra de 8 bits, se obtiene una grabación con calidad telefónica que genera poco espacio de almacenamiento y no requiere un gran canal para su transmisión.

o Computadoras portátiles sin entrada de línea

En algunos foros de ayuda por internet, se ha planteado una problemática con ciertos modelos de computadoras portátiles que no cuentan con entrada de micrófono o línea de grabación, por lo que necesitan un hardware externo para poder realizar una grabación. Este proyecto resuelve esa problemática usando una interfaz serial o bien USB con el adaptador que es usado para este mismo.

o Impulso a la investigación y desarrollo nacional

(14)

Introducción 1

Introducción

Las grabaciones caseras han crecido con popularidad día a día, ya que cada vez más personas se involucran con éste tipo de proyectos de audio. El equipo que se utiliza en estas aplicaciones se ha vuelto más sofisticado, práctico y accesible. El dispositivo de grabación es el objetivo final en la trayectoria de la señal. En muchos estudios el dispositivo de grabación, es la computadora; sin embargo, algunos proyectos de audio requieren de un equipo más complejo.

Una grabadora de sonidos externa, es muy útil para el uso en computadoras portátiles donde no se cuenta con una entrada de grabación, como es el caso de algunos modelos de portátiles; sin embargo, usando un hardware externo puede realizarse una grabación. En este proyecto se desarrollará una grabadora digital de voz para una PC, la cual tendrá la ventaja antes mencionada de poder usarla en equipos que carecen de entrada de micrófono. Cabe enfatizar la aplicación para voz, debido a que se busca que el mensaje en la grabación sea entendible y audible únicamente, reduciendo la calidad de la grabación para tener beneficios de almacenamiento y transmisión.

Una buena grabación inicia con un principio básico, mientras mejor sea la captura desde la fuente original, mejor será la salida final de audio; por ello es bueno asegurar que la grabación inicial de voces sea fuerte, clara y precisa. Recordar la importancia que tiene el lugar donde se hace la grabación ya que la primera manera de eliminar el ruido ambiental no deseado es asegurarse de no capturarlo. La elección del tipo de micrófono, la determina el tipo de fuente de sonido; que para este caso es voz, así que la búsqueda será de un modelo apropiado o bien, alguno de propósito general que cumpla las expectativas. El micrófono debe colocarse exactamente en el lugar correcto y mantenerlo ahí, así como recordar buscar adaptadores de calidad en caso de requerirlos, para evitar falsos contactos, entre otras cosas importantes como el usar los cables adecuados para reducir ruidos y zumbidos.

(15)

Introducción 2

(16)

Capítulo 1: Antecedentes y estado del arte 3

Capítulo 1: Antecedentes y estado del arte

Capítulo 1

Antecedentes y

estado del arte

1.1 Sonido, audio y voz

1.2 Grabación del sonido

(17)

Capítulo 1: Antecedentes y estado del arte 4

Capítulo 1: Antecedentes y estado del arte

El presente capítulo resume los principales logros y limitaciones de la grabación, reproducción y almacenamiento de audio, que ha dado lugar a las diversas áreas de manufactura e ingeniería para el desarrollo y comercialización de tecnología de éste tipo. Así también se exponen los diferentes tipos formato de archivos de audio actual y los software comerciales más usados hoy en día para la grabación y edición de audio.

1.1 Sonido, audio y voz

El sonido audible es la sensación producida en el oído a partir las perturbaciones de un cuerpo vibrante que se propagan en un medio elástico (sólido, líquido o gaseoso) en forma de onda, las cuales posteriormente el cerebro percibirá y procesara.1

El espectro de frecuencia audible varía según cada persona, sexo, edad, etcétera. Sin embargo normalmente se acepta como el intervalo entre 20 Hz y 20 KHz. Por debajo de esta medida se encuentran los infrasonidos que son vibraciones de presión, cuya frecuencia es inferior a la que el oído humano puede percibir, es decir, de 0 a 20 Hz. Por encima están los ultrasonidos, que son aquellas ondas cuya frecuencia es superior al margen de audición humana, superior a los 20 KHz. Entre las características más importantes del sonido tenemos:

 El tono es la velocidad particular de vibración por el cual se caracteriza un sonido y que reconoce de manera peculiar el sentido auditivo; nos permite diferenciar un sonido de otros por su frecuencia (grave, agudo o medio). El tono queda determinado por el número de vibraciones por segundo (frecuencia), así a mayor frecuencia más agudo es el sonido, y a menor frecuencia más grave es el sonido.

 La intensidad es la cantidad de energía que tiene el sonido y nos permite distinguir entre sonidos fuertes o débiles. La podemos definir como la fuerza con la que se produce un sonido. Además de la amplitud en la percepción de la intensidad, influye la distancia a que se encuentra situado el oyente y su capacidad auditiva.

 La duración es la característica del sonido que nos permite diferenciar sonidos largos de sonidos cortos. La podemos definir como el tiempo de permanencia o duración de un sonido. La sucesión de sonidos de distinta duración nos da el ritmo.

 El timbre es la cualidad de permitir distinguir los sonidos producidos por diferentes fuentes (de un mismo tono), de acuerdo con las vibraciones que produce el timbre. A través del timbre somos capaces de diferenciar, dos sonidos de igual frecuencia. Esta cualidad físicamente se llama forma de onda.

(18)

Capítulo 1: Antecedentes y estado del arte 5

La voz es el sonido que se produce con la vibración de las cuerdas vocales mediante el aire que es expulsado por los pulmones y sale por la laringe, en forma de una onda sonora que es combinación de varias frecuencias y sus correspondientes armónicos. La voz masculina tiene un tono fundamental de entre 100 y 200 Hz, mientras que la voz femenina es más aguda, típicamente está entre 150 y 300 Hz. Las voces infantiles son aún más agudas.2

El audio digital es la codificación digital de una señal eléctrica análoga a una onda sonora. Consiste en una secuencia de valores enteros que son obtenidos a partir de los procesos de muestro y cuantificación digital de la señal eléctrica, dos procesos esenciales para la conversión de una señal analógica a una señal digital. 3

 El muestreo consiste en fijar la amplitud de la señal eléctrica a intervalos regulares de tiempo (tasa de muestreo). Para cubrir el espectro audible (20 a 20 KHz) suele bastar con tasas de muestreo de algo más de 40 KHz.

 La cuantificación consiste en convertir el nivel de las muestra fijadas en el proceso de muestreo, normalmente, un nivel de tensión, en un valor entero de rango finito y predeterminado. Por ejemplo, utilizando cuantificación lineal, una codificación lineal de 8 bits discriminará entre 256 niveles de señal equidistantes (28).

De acuerdo con el Teorema de muestreo de Nyquist, la tasa de muestreo, esto es, el número de muestras con las que se realiza el proceso de muestreo en una unidad de tiempo, determina exclusivamente la frecuencia máxima de los componentes armónicos que pueden formar parte del material a digitalizar.

El formato más usado de audio digital PCM (Pulse Code Modulation, Modulación por Pulsos Codificados) lineal es el del CD de audio: 44,1 kHz de tasa de muestreo y cuantificación lineal de 16 bits (que mide 65536 niveles de señal diferentes) y que, en la práctica, permite registrar señales analógicas con componentes hasta los 20 kHz y con relaciones señal a ruido de más de 90 dB.

1.2 Grabación del Sonido

Todo empezó en los tiempos de Thomas Alba Edison, quien inventó la bombilla y el micrófono, sin olvidar el fonógrafo con el cual trataba de simular las funciones de los tímpanos. Edison en resumen lo que inventó fue la transducción (transformación de un tipo de señal en otro distinto). Luego con la llegada del gramófono vino la posibilidad de escuchar lo grabado, la libertad de tener el sonido en el tiempo, la magia de escuchar exactamente la misma interpretación varias veces, todos estos inventos buscaban preservar la voz, protegerla de los estragos del olvido y de su desaparición en el tiempo. Estos inventos llegaron a cambiar radicalmente el entretenimiento.

(19)

Capítulo 1: Antecedentes y estado del arte 6

1.2.1 Grabación analógica y digital

Desde la época de los años 2 ’s se tie e la noción de los conceptos del audio digital pero no fue hasta los años ’s ua do se e pezó a desa olla o e ializa fo al e te te ología de este tipo. Antes de que se introdujera formalmente el concepto de señal digital, éstas eran representadas en forma analógica. Eran guardadas a menudo en cintas de audio o discos. La grabación analógica de sonido es la técnica por la cual se captura el sonido y se almacena en señales analógicas. En la actualidad casi todos los formatos de grabación y reproducción de sonido son digitales. La grabación digital de sonido es la grabación del sonido en la que se obtiene audio digital. Para ello, interviene un proceso previo de conversión A/D (analógico-digital) y, una vez que obtenemos la señal digital, ésta es grabada sobre un soporte o medio. Lo que determina si estamos ante una grabación analógica o digital no es el soporte o medio, sino el tipo de señal grabada en él. 4

Los sistemas analógicos de grabación son tres:

1. Grabación mecánica analógica o Grabación electromecánica analógica. 2. Grabación magnética analógica o Grabación electromagnética analógica. 3. Grabación óptica analógica o Grabación fotográfica del sonido.

Hoy en día la grabación analógica todavía puede preferirse en ocasiones por sus cualidades sonoras. Sin embargo presenta varios inconvenientes con respecto a la grabación digital:

 No admite la multigeneración. Cada nueva copia (copia de copia) produce pérdidas, de forma que, la señal resultante cada vez, tiene más ruido y se parece menos a la original.  Se degrada con facilidad. Las cintas se desmagnetizan si se les acerca un imán, los discos

de vinilo se rayan y los surcos sufren alteraciones con el paso constante de la aguja, etc.  Resulta más complejo y limitado el montaje y la edición de las grabaciones.

Existen 3 tipos de grabación digital:

1. Grabación magnética digital: sobre soporte magnético, cinta como el DAT u otros formatos similares; o bien sobre soportes magnéticos informáticos como el disco flexible.

2. Grabación óptica digital: la señal es grabada sobre el soporte de forma óptica, mediante un láser. Es el caso del CD.

3. Grabación magneto-óptica digital: sistema combinado que graba de forma magnética, pero reproduce de forma óptica. Es el caso del minidisc o de los CD regrabables (CD-RW) y del propio disco duro de cualquier ordenador.

(20)

Capítulo 1: Antecedentes y estado del arte 7

1.2.2 Almacenamiento digital del audio.

La manera general de almacenar audio digital es muestreando el voltaje de audio, que al reproducirlo, corresponde a un nivel de señal en un canal individual con una cierta resolución el número de bits por muestreo en intervalos regulares (creando la frecuencia de muestreo). Estos datos después pueden ser almacenados sin comprimir o comprimidos para reducir el tamaño del formato.

Formato de archivo de audio

Un formato de archivo de audio es un contenedor multimedia que guarda una grabación de audio (música, voces, etc.). Lo que hace a un archivo distinto del otro son sus propiedades; cómo se almacenan los datos, sus capacidades de reproducción, y cómo puede utilizarse un archivo en un sistema de administración de archivos. 5

Tipos de formatos

Existen diferentes tipos de formato según la compresión del audio. Es importante saber distinguir entre formato de archivo y códec. El códec codifica y decodifica los datos del audio mientras estos datos son almacenados en un archivo que tiene un formato de audio específico. La mayoría de los formatos de archivo de audio públicamente documentados pueden ser creados con uno de dos o más codificadores o códecs. Aunque la mayoría de formatos de archivo de audio solo soportan un tipo de datos (creado con un códec de audio) un contenedor de formato de multimedia como MKV (Matroska) o AVI (Audio Video Interleave) puede soportar múltiples tipos de datos de audio y vídeo.

Formatos de audio sin comprimir

Hay un formato principal sin comprimir, PCM, que normalmente esta archivado como .wav en Windows y .aiff en MAC. Los formatos PCM contienen toda la información que salió del convertidor analógico digital, sin ninguna omisión y por eso tienen la mejor calidad. Los archivos de audio digital almacenan toda la información que ocurra en el tiempo, el tamaño del archivo no a ía así o te ga sile io o sonidos muy complejos. WAV y AIFF son formatos flexibles creados para almacenar varias combinaciones de frecuencia de muestreo o tasa de bits, esto los hacen adecuados para archivar grabaciones originales. El formato AIFF está basado en el formato IFF, mientras que el formato WAV está basado en el formato RIFF, que realmente son muy similares. BWF (Broadcast Wav Format) es el formato de audio estándar creado por la Unión Europea de Radiodifusión como sucesor a WAV y permite el almacenamiento de datos en el archivo.

(21)

Capítulo 1: Antecedentes y estado del arte 8

Formatos de audio comprimido sin pérdida (Lossless)

El formato sin pérdida requiere más tiempo de procesamiento que los formatos sin comprimir pero más eficiente en cuanto el espacio que ocupa. Los formatos de audio sin comprimir codifican tanto audio como silencio con el mismo número de bits por unidad de tiempo. Codificar un minuto de silencio en un formato sin comprimir produce un archivo del mismo tamaño que codificar un archivo sin comprimir de un minuto de música de orquesta. Sin embargo en estos archivos la música ocupa un archivo ligeramente más pequeño y el silencio no ocupa casi nada.

Estos formatos de compresión proporcionan un ratio de compresión de más o menos 2:1. El desarrollo de estos formatos intenta reducir el tiempo de procesamiento manteniendo un buen ratio de compresión. Dentro de estos se encuentran el FLAC y el Apple Lossless Encoder, cuyo tamaño suele ser de aproximadamente la mitad de su equivalente PCM.

Formatos de audio comprimido con pérdida

En este sistema de codificación se comprimen los datos descartando partes de ello. El proceso intenta minimizar la cantidad de datos que mantiene el archivo reduciendo su peso y por lo tanto su calidad. Realmente solo pierde los canales no audibles al oído humano, de tal modo que conservan gran parte de su calidad.

Tabla 1. 1 Formatos de archivos de audio libres

Formatos abiertos libres

aiff Formato estándar de Apple. Se puede ser considerado el equivalente de wav de Windows.

au El formato de archivo estándar utilizado por Sun, Unix y Java. El audio de archivos au puede ser PCM o comprimido con a-law o G.729.

flac (free lossless audio códec) un códec de compresión sin pérdida.

ogg Un archivo de formato de código abierto que apoya una variedad de códecs, de los cuales el más popular es el audio códec Vorbis. Vorbis ofrece compresión similar al de mp3, pero es menos popular.

mpc Musepack o MPC ( anteriormente conocido como MPEGplus o MP+ ) es un formato código abierto, específicamente optimizado para la compresión transparente de audio estéreo a una velocidad de 160-180 bits/s.

raw Un archivo raw puede contener audio de cualquier códec aunque suele ser utilizado con datos de audio PCM. Suele ser utilizado solo en pruebas técnicas.

TTA (The true audio) un códec de audio sin pérdida en tiempo real.

wav Formato contenedor de archivo de audio utilizado principalmente en Windows. Comúnmente utilizado para almacenar archivos de calidad de CD sin comprimir, lo que significa que pueden ser de gran tamaño, alrededor de 10 mb por minuto. Archivos de wav también pueden contener datos codificados por una variedad de formato con pérdida para reducir el tamaño del archivo (por ejemplo codecs mp3 o GSM). Los archivos wav utilizan una estructura RIFF.

Vorbis Formato de archivo de audio digital general, con pérdidas, desarrollado por la Fundación Xiph.org. Opus Formato de archivo de audio digital con pérdidas, muy versátil, desarrollado conjuntamente por

(22)

Capítulo 1: Antecedentes y estado del arte 9

Tabla 1. 2 Formatos de archivos de audio abiertos

Formatos abiertos

GSM Diseñado para el uso de telefonía en Europa. GSM es un formato muy práctico para voces de

calidad teléfono. Es un buen compromiso entre calidad y tamaño. Los archivos de wav pueden ser codificados con GSM.

dct Es un códec variable diseñado para dictar.

vox Este formato es comúnmente utilizado para el códec ADPCM Dialógico (Adaptive differential pulse code modulation). Similar a otros formatos ADCPM comprime a 4 bits. Los archivos vox son similares a archivos wav, salvo que no contienen información sobre el archivo, de modo que la frecuencia de muestreo y el número de canales debe ser especificado para reproducir un archivo vox.

mmf Un formato de audio creado por Samsung, utilizado en tonos de móvil.

Tabla 1. 3 Formatos de archivos de audio propietarios

Formatos propietarios

mp3 Formato MPEG layer 3 es el más popular para bajar y almacenar música. Eliminando

porciones del archivo que sean menos audibles, mp3 comprime a aproximadamente un décima parte de un archivo PCM sacrificando su calidad.

Aac (Advanced Audio Coding) este formato está basado en MPEG2 y MPEG4. Los archivos acc suelen ser contenedores ADTs o ADIF.

mp4 MPEG-4 audio más a menudo ACC pero a veces MP2/MP3, MPEG-4 SLS, CELP, HVXC y otros

tipos de objetos de audio pueden ser definidos en MPEG-4 audio.

Wma (windows media audio) este formato fue creado por Microsoft y está diseñado con

habilidades de gestión de derechos digitales para protegerlo de copia.

Atrac El estilo antiguo de formato Sony ATRAC. Siempre contiene una extensión de formato .wav. Para abrir estos formatos hay que instalar unos drivers ATRAC3.

ra & rm Un formato RealAudio diseñado para el streaming de audio por Internet.

Ram Un archivo de texto que contiene un enlace a una página web donde el archivo RealAudio

está almacenado. Archivos ram no contienen audio.

Dss (digital speech standard) Es un formato de propiedad de la corporación Olypus. Es

relativamente viejo y su códec es mediocre.

Msv Un formato de Sony para archivos de voz comprimidos en tarjeta de memoria.

Dvf Un formato de Sony para archivos de voz comprimidos, normalmente utilizado en

grabadoras de dictado.

IVS Un formato desarrollado por 3D solar UK ltd., con gestión de derecho digital utilizado para

descargar música de su tienda digital Tronme y en su reproductor interactivo de música y vídeo.

m4p Una versión de ACC en mp4 desarrollada por Apple con gestión de derecho digital para la

utilización de descargas de la tienda de Itunes.

Iklax Es un formato de audio digital multi pista que permite varias acciones en datos musicales como arreglos de volumen y mezclas.

(23)

Capítulo 1: Antecedentes y estado del arte 10

Códecs

En la actividad del procesamiento de una señal, surge la necesidad de crear archivos de audio o video a partir de otro, con un tamaño reducido a comparación del inicial y manteniendo la misma calidad que presentaba. En resumen, el beneficio es obtener un archivo con un tamaño reducido y buena calidad. El proceso anterior lo desarrolla una herramienta llamada códec.

Los códecs surgen como dispositivos hardware, software o la combinación de ambos, dedicados al procesamiento digital de audio, video e imágenes con el fin de llevar a cabo la codificación-decodificación y en algunos casos también la compresión de un flujo de datos obteniendo un archivo en otro formato más apropiado para el almacenamiento, reproducción o manipulación del mismo. Sabemos que, como en todos los casos, no existen dispositivos ideales, y en este, durante el proceso nos encontraremos con pérdidas de información en el proceso de querer conseguir un tamaño muy reducido. Una vez realizada la compresión, es importante considerar si el archivo final se seguirá procesando en un futuro ya que esto iría dañando demasiado su calidad. 6

Hoy en día, la mayoría de las técnicas de codificación digital de audio, tales como MP3, AAC y muchos más, son códec con pérdidas. Por otra parte, muchos de los algoritmos de compresión sin pérdidas están disponibles en el mercado o son distribuidos gratuitamente. La compresión con pérdidas dio un cambio radical debido a la necesidad de la música portable. Después de la introducción de cintas grabables, se pudo lograr transportar la música a todas partes, reproduciéndola en dispositivos pequeños capaces de caber en nuestra palma de la mano.

Así pues la tendencia de los códecs actuales, es llevar a cabo una codificación y decodificación lo más rápida posible con la mejor tasa de muestreo y a la hora de realizar la compresión de un archivo, que sea lo más compacta posible minimizando al máximo las pérdidas para obtener, de esta manera, un archivo que ocupe un espacio muy pequeño a la hora de almacenarse en algún dispositivo con la misma calidad de origen.

Para cubrir el espectro audible (20 a 20 KHz) suele bastar con tasas de muestreo de algo más de 40 KHz, con 3200 muestras por segundo se tendría un ancho de banda similar al de la radio FM, es decir, permite registrar componentes de hasta 15 KHz, aproximadamente. Para reproducir un determinado intervalo de frecuencias se necesita una tasa de muestreo de poco más del doble (Teorema del muestreo de Nyquist-“ha o . Po eje plo e los CD’s ue ep odu e hasta KHz, emplean una tasa de muestreo de 44.1 KHz).

El formato más usado de audio digital PCM lineal es el del CD de audio: 44.1 de tasa de muestreo y cuantificación lineal de 16 bits (mide 65536 niveles de señal diferentes) y que permite registrar señales analógicas hasta los 20 KHz.

(24)

Capítulo 1: Antecedentes y estado del arte 11

Figura 1. 3 Cassette

Figura 1. 5 Grabadora Digital de voz

1.3 Evolución del hardware y software para grabación de audio

Figura 1. 2 Disco de Vinilo

Figura 1. 4 Compact Disc (CD) Figura 1. 1 Fonógrafo

El registro del sonido ha sufrido diversos cambios, involucrando con esto la evolución de diferentes formas de grabación y reproducción del sonido en forma artificial. Es un campo que se renueva a la par de los avances tecnológicos. En la última década dichos avances permitieron grandes logros con respecto a factores como la calidad y duración del sonido registrado.

Nuestra relación con la música ha cambiado un poco, ahora compramos menos discos y bajamos la música por internet. Se puede decir que el siglo XX, el siglo de las guerras y cambios tecnológicos, se puede denominar como el siglo del sonido.

Después de una larga pausa, esperando a que cesaran los ruidos de la segunda guerra mundial, llegarían los sonidos en los discos de vinilo de 16, 33, 45 y 78 revoluciones por minuto. Ya en los años ’s, apa e ió la i ta ag éti a o la ue Phillips la zo el compact cassette, que con la ayuda del tiempo se conocería simplemente como cassette. A fines de los años 70´s aparecería la palabra digital en la música, con el sistema de audio digital Compact Disc (CD). El conocido CD, como todos los inventos de esta historia en sus inicios no tendría mucha acogida, pero después en los años ’s ’s, o la a uda de la úsi a lási a la i fo áti a, se ía el soporte de almacenamiento de mayor aceptación. La industria de la música obtendría con esta un formato fiel, pero al mismo tiempo este sistema digital, sería el primero gran enemigo de la industria al permitir fácilmente el copiado, la distribución y el almacenamiento. Es decir hemos pasado del cilindro al vinilo, del vinilo a la cinta, de la cinta a lo óptico; todo este gran progreso llevo a la portabilidad, pero también con ella las tensiones y a los problemas legales entre los creadores, dueños y consumidores.

(25)

Capítulo 1: Antecedentes y estado del arte 12

La siguiente tabla muestra los acontecimientos más importantes en la evolución de los instrumentos así como dispositivos grabadores y reproductores de la voz y sonidos: 7

Tabla 1. 4 Evolución de artefactos y dispositivos grabadores y/o reproductores de audio digital

1857 Fonoautógrafo

Este artefacto es considerado el primero en ser capaz de registrar sonidos en un medio visible, fue patentado por Leon Scott.

Podía transcribir sonido a un medio visible, pero no tenía un modo de ser reproducido después. Era usado para determinar la frecuencia de un tono musical, y para estudiar el sonido y el habla.

1877 Fonógrafo

Creado por Thomas Alba Edison, fue el primer aparato capaz de grabar sonidos mediante un sistema mecánico – analógico, que posteriormente los reproducía.

En 1889 Theo Wangeman grabó un segmento de las Danzas Húngaras de Johannes Brahms que aunque todavía se conserva, presenta una calidad pésima.

1887 Gramófono

Emile Berliner patentó el primer sistema de grabación y reproducción de sonido que utilizó un disco plano de metal tratado químicamente. El costo de las grabaciones era mucho menor que el del fonógrafo, pero los usuarios no podían hacer sus propios registros.

E la fá i a de juguetes ale a a Ka e & Rei ha dt e pezó a p odu i el g a ófo o de juguete

de Berliner y sus discos de 12.7 cm.

1900 Telegráfono

Valdemar Poulsen obtuvo el Gran Premio de la Exhibición Mundial de París con este invento que grababa magnéticamente los sonidos sobre un carrete de hilo de acero. Fue el primer instrumento de lectura magnético.

La intención de Poulsen era la de grabar un mensaje de voz para utilizarla en el caso de que se produjera una llamada telefónica en su ausencia. En realidad podría decirse que inventó el primer contestador automático.

1926 Gramófono Eléctrico

La empresa Brunswick-Balke-Collender introdujo el primer gramófono totalmente eléctrico. Ya no se necesitaba girar la manivela para generar el movimiento del motor.

El proceso de grabación eléctrico iniciado por la compañía Victor fue anterior a la reproducción eléctrica hogareña, debido al alto costo inicial de los aparatos.

1934 Tocadiscos Wurlitzer P10

Insertando una moneda, se podía seleccionar una canción de entre 10 títulos de discos de goma laca. Este primer tocadiscos resultó indispensable en restaurantes y bares.

El Wu litze la zado e fue el ás ve dido de todos los to adis os del siglo XX: . u idades

en 18 meses.

1935 Magnetófono

AEG comercializó los primeros aparatos que grababan el sonido magnéticamente sobre un alambre de acero. Contaban con una extensa duración mejor calidad sonora.

Los magnetófonos fueron empleados por emisores alemanes de radio para grabar sus programas con antelación y evitar los errores de la transmisión en directo.

1948 Disco de vinilo

Este nuevo material permitió una reducción importante del ruido superficial en la grabación mecánica analógica. Columbia Records presento en Nueva York el primer LP de 33 rpm y un año más tarde, RCA Victor lanzó su primer simple de 45 rpm.

Los discos de vinilo deben su nombre al material con el que están fabricados: policloruro de vinilo (PVC).

(26)

Capítulo 1: Antecedentes y estado del arte 13

1950 Magnetófono Revox

La empresa suiza Studer lanza su modelo para aficionados con carrete de cinta abierta. También desarrolla el magnetófono Studer 27 para estudios discográficos, con una mejor calidad sonora.

La p estigiosa g a a ió del Festival i te a io al de Músi a de Lu e a se ealizó o u p ototipo de

primer grabador profesional Studer 27.

1958 Sonido Estereofónico

Audio Fidelity de EEUU y Pye de Gran Bretaña realizan las primeras grabaciones en dos canales. Este sistema de sonido sustituyo a la grabación mono-aural por su mayor fidelidad y sonido equilibrado.

El sistema estéreo fue desarrollado y patentado por EMI en 1931, pero su comercialización se llevó a cabo casi un cuarto de siglo más tarde.

1963 Reproductor de cassette compacto

Phillips lanza al mercado el primer reproductor para cintas de cassette compactas. Por su tamaño reducido se podía transportar fácilmente. Además, su consumo era bajo.

En 1965 Ford ofreció para sus modelos de 1966 la opción de un reproductor de cassette de 8 pistas. Vendió 65.000 aparatos durante el primer año.

1979 Walkman

El primer Walkman TPS-L2 de Sony que salió a la venta en Japón introdujo un cambio en los hábitos de escucha de las personas. Ahora cada uno podía llevar consigo su propia música.

En los primeros 10 años Sony vendió 50 millones de unidades y el té i o Walk a se i o po ó al lenguaje como sinónimo de un reproductor de audio estéreo portátil.

1982 Reproductor de CD

El sistema de audio digital Compact Disc fue presentado a la industria en 1980. Phillips desarrollo el sistema óptico y Sony la lectura y codificación digital. El CDP-101 fue el primer reproductor de CD lanzado por Sony.

El p i e ál u de úsi a e fo ato CD fue d “t eet de Billy Joel.

1987 DAT Audio Digital

La DAT (cinta de audio digital) desarrollado por Sony, fue el primer formato de cassette digital capaz de almacenar y reproducir audio con una altísima calidad.

Para prevenir la proliferación de copias ilegales de CDs, las casas discográficas trataron de impedir la masificación del sistema DAT, quedado relegado su uso al ámbito profesional.

1992 MiniDisc

El MiniDisc fue desarrollado por Sony, combinando la capacidad de un grabador de cassette con la calidad de sonido de un CD. Su pequeño disco es una maquina capacitada tanto para reproducir como para grabar. El MiniDisc no resultó exitoso ni en EEUU ni en Europa debido al escaso número de álbumes a la venta y al elevado costo del reproductor.

1998 Reproductor de MP3

MPMan fue el primer reproductor de audio digital basado en flash, creado por la empresa coreana SaeHan Information System, con una capacidad de almacenamiento de 16 MB.

La tecnología de formato MP3 fue aprobado por la Moving Picture Experts Group (MPEG) en 1992. Su nombre técnico es ISO MPEG Audio Layer 3.

2001 IPOD

El primer reproductor de música digital de Apple basado en la tecnología de disco duro, es conocido por implementar una forma de navegación sencilla mediante una única rueda táctil.

Poco después de que Apple anunciara que el iPod sería compatible con PC, en EEUU se vendía un iPod por segundo.

Siglo XXI Reproductor de MP4

Este dispositivo multimedia digital puede almacenar, organizar y reproducir archivos de videos, audio e imágenes. La compresión de los archivos es mayor a la del MP3 y las canciones en este formato sólo son distribuidas con previa autorización del artista.

E o e ep odu to de MP su gió e Chi a o o u a est ategia de a keti g ás ue o o u a

(27)

Capítulo 1: Antecedentes y estado del arte 14

La primera aplicación de digitalización del sonido se sitúa en la telefonía digital, para ésta aplicación es preciso realizar un muestreo de 4 KHz, con esta frecuencia se asegura el correcto muestreo de aquellos timbres de voz más agudos (timbre máximo de la voz humana 3.4 KHz aproximadamente), para esta aplicación se emplea una resolución de 8 bits en la digitalización de cada muestra. Esta técnica es conocida como PCM.

El software para grabación y reproducción de voz es una idea innovadora con los beneficios de poder escuchar una y otra vez grabaciones registradas anteriormente de manera clara, pero que tuvo sus limitaciones en su creación. Los primeros productos de voz de software tenían muchas cuestiones y problemas que les hizo difícil trabajar en cuanto a la calidad del sonido. Durante los últimos años, ha mejorado mucho y ahora software para grabación y reproducción de voz están demostrando ser una solución de un gran negocio. En la actualidad hay inmensa cantidad de software que nos permiten desde la comodidad de nuestra casa manipular el audio digital así como hacer grabaciones de en tiempo real. Muchos de éstos permiten modificar parámetros como la duración del sonido, la tasa de muestreo, la resolución utilizada, el formato en que deseamos que se guarde la grabación procesada, el número de canales, efectos tales como la reverberación, mezcla de dos o más pistas, etc. Por mencionar algunos ejemplos del software más utilizados tenemos:

Audacity: Es una aplicación informática multiplataforma libre, que se puede usar para grabación y edición de audio, fácil de usar, distribuido bajo la licencia GPL. Es un software libre y multiplataforma.8

Características:

- Grabación en tiempo real mediante un micrófono, las líneas de entrada u otras fuentes. - Importa archivos de sonido, permite editarlos y combinarlos con otros archivos o nuevas

grabaciones. Exporta las grabaciones en varios formatos de sonido. También permite la conversión entre formatos de tipo de audio.

- Edición sencilla mediante cortar, copiar, pegar, borrar, deshacer y mezclar sonidos. - Recuperación automática tras bloqueo en el caso de terminación anormal del programa.

8 Véase referencia 8.

(28)

Capítulo 1: Antecedentes y estado del arte 15

- Posibilidad de agregar efectos al sonido (eco, inversión, tono, etc.). Elimina ruidos, normaliza, ecualiza, amplifica, modifica tonos.

- Graba y edita muestras de 16-bits, 24-bits y 32-bits. Graba hasta un máximo de 96 KHz. - Posibilidad de usar plug-ins para aumentar su funcionalidad

Free Audio Editor: es una sencilla herramienta de edición de archivos de audio, que permite realizar unas cuantas opciones de edición y configuración de este tipo de archivos.9

Características:

- Edición del audio de archivos de videos. - Interfaz fácil de usar.

- Puedes aplicar diversos efectos fácilmente - Herramienta potente de reducción de ruido

- Es compatible con vista previa para ver los cambios en tiempo real - Administrador de marcadores y regiones fácil de usar.

- Admite varios formatos de archivo incluyendo WAV (múltiples códecs), MP3, WMA, OGG y muchos más.

- Permite grabar archivos de audio en un CD. - Incluye herramientas para sintetizar la voz

Adobe Audition: Es un programa para edición y grabación de música digital, con el cual puedes obtener una gran variedad de opciones, y puedas obtener y realizar un trabajo de calidad y obtener un buen producto. Diseñado para los profesionales de audio y video más exigentes, ofrece funciones avanzadas de mezcla, edición y efectos de sonido.10

9 Véase referencia 9. 10 Véase referencia 10.

Figura 1. 7 Software Free Audio Editor

(29)

Capítulo 1: Antecedentes y estado del arte 16

Características:

- Edita y mezcla audio.

- Aplica efectos de sonido y agrega filtros de ruido. - Utiliza multipista y crea música.

- Compila y edita una banda sonora. - Limpia el audio de una película. - Graba y mezcla proyectos.

Pro Tools: Es una estación de trabajo de audio digital, una plataforma de grabación, edición y mezcla multipista de audio y midi, que integra hardware y software. Por sus altas prestaciones, es el considerado el estándar de grabación, edición y mezcla en estudios profesionales y postproducción, usado mundialmente.11

11 Véase referencia 11.

(30)

Capítulo 2: Marco teórico 17

Capítulo 2: Marco teórico

Capítulo 2

Marco teórico

2.1 Estructura de un sistema de grabación de audio

digital

2.2 Etapa de acondicionamiento analógico

2.3 Conversión analógico-digital

2.4 Transmisión serie de datos

(31)

Capítulo 2: Marco teórico 18

Capítulo 2: Marco teórico

En el presente capítulo expone las etapas necesarias para llevar a cabo el procesamiento de la voz y así poder convertirla a su análoga digital, grabarla en un formato de archivo de audio y con la capacidad de ser reproducida posteriormente. Cada una de esas etapas cumple con una tarea específica e indispensable para el correcto funcionamiento del sistema de grabación digital de voz.

Un sistema está definido como un conjunto de elementos que están interrelacionados entre si y su entorno, que interactúan, para lograr un objetivo. Un sistema en general se compone de una entrada, un proceso y una salida, puede o no existir retroalimentación de la salida a la entrada, y el proceso puede estar conformado a su vez de varios procesos.

El diagrama 3.2 muestra las partes que conforman un sistema en general.

Entrada: es el ingreso de las variables necesarias que se utilizan en el proceso. Proceso: es la ejecución de una secuencia de pasos para obtener un resultado. Salida: es el resultado de la ejecución del proceso.

Retroalimentación: es la revisión desde la entrada para la corrección y/o mejoramiento del sistema

Los sistemas digitales son un conjunto de procesos que involucran elementos electrónicos para el procesamiento y transmisión de datos representados por valores estrictamente discretos.

La transmisión de datos es el proceso de envío de información de un punto a otro. En el caso de la transmisión digital la información transmitida es en forma de pulsos digitales, la cual no necesariamente puede provenir de una fuente donde estos se encuentren en forma digital, sino que puede tratarse de una señal analógica que deberá ser discretizada para ser transmitida y a la recepción, ésta será reconstruida para hacerla nuevamente variante en el tiempo. Para poder realizar la comunicación entre los dos puntos, es necesario usar un medio de transmisión que puede ser aire, un par de hilos metálicos, cable coaxial, o en un caso riguroso fibra óptica. 12

12 Tomasi, 2003: 607-613.

Proceso Entrada

Voz humana

Salida

Grabación de voz digitalizada en un archivo de formato

WAV

Retroalimentación

(32)

Capítulo 2: Marco teórico 19

2.1 Estructura de un sistema de grabación de audio digital

Los sistemas de medición electrónicos están compuestos de instrumentos y componentes interconectados para poder realizar una función específica. Cada componente del sistema no solo debe realizar su función individual correctamente sino también trabajar efectivamente con los demás componentes para que todo el sistema opere correctamente.

A continuación se muestra el diagrama de las etapas funcionales que conforman el sistema de la grabadora digital de voz.

Sensor seleccionado

Micrófono Shure C606N Señal analógica de entrada

Voz humana

Etapa de acondicionamiento de la señal

Amp. Operacional 358N Cuarto Orden (-80 dB/Década)

Amplificador de pequeña señal

Filtro Pasa-bajas a 4000 Hz

(33)

Capítulo 2: Marco teórico 20

Codificación de la señal acondicionada

Módulo ADC PIC 18F4550

Interfaz de comunicación entre el microcontrolador y la PC

Estándar RS-232 Visual Studio C#

(34)

Capítulo 2: Marco teórico 21

2.1.1 Micrófonos

El micrófono es un transductor electroacústico, es decir, un dispositivo capaz de captar las ondas sonoras emitidas por el medio ambiente, como la voz, por ejemplo, o cualquier otro tipo de energía acústica y transformarla en energía eléctrica; y viceversa en proceso de grabación y reproducción de sonido. 13

A su vez este transductor puede considerarse dividido en dos partes: un transductor acústico-mecánico (T.A.M) y otro acústico-mecánico-eléctrico (T.M.E):

 El T.A.M. convierte las variaciones de presión de la onda sonora a las que la membrana o diafragma del micrófono están expuestas, en oscilaciones mecánicas.

 El T.M.E. convierte estas oscilaciones mecánicas en variaciones de tensión o corriente eléctrica (normalmente de +1V a -1 V).

Energía acústica

Energía mecánica Energía eléctrica

De esta forma podemos guardar y manipular sobre algún dispositivo o soporte analógico o digital. Finalmente estos impulsos eléctrico se vuelven a transformar en ondas de presión a través de los altavoces, por ello se define al micrófono como transductor.

Características de los micrófonos

Los micrófonos poseen una serie de características que son las que nos va definir en gran medida su calidad y sus posibilidades de uso en las diferentes situaciones que se nos presenten.

1. Sensibilidad: Nos indica la capacidad del micrófono para captar sonidos de poca intensidad. Es la relación entre la tensión generada por el micrófono, respecto de la presión sonora que recibe. Se mide a 1 kHz y se expresa en mV/Pa. Cuanto mayor sea la sensibilidad, mayor es el nivel de la señal de salida con igual presión incidente. No es recomendable el uso de micrófonos con una sensibilidad menor a 1 mV/Pa.

2. Fidelidad: Representa la capacidad del micrófono para reproducir exactamente la onda de presión que incide sobre el diafragma, una vez transformada en señal eléctrica. Nos indica la variación de la sensibilidad respecto de la frecuencia. Se mide para todo el espectro audible y así nos proporcionan sus curvas en frecuencia que informan de las desviaciones sobre la horizontal de 0 dB. Cuanto más lineal sea esta curva mayor fidelidad.

13 Véase referencia 13.

Transductor acústico - mecánico

Transductor mecánico -

(35)

Capítulo 2: Marco teórico 22

La fidelidad de un micrófono depende de tres factores:

Respuesta en frecuencia. Define cómo se comporta la sensibilidad del micrófono dentro del margen de las frecuencias del espectro audible

Regulación. Es aquel cuya respuesta es plana y se extiende a toda la banda de frecuencias.

Linealidad. Es la cualidad de un micrófono para proporcionar una tensión de salida proporcional a la tensión de entrada.

Un micrófono con buena fidelidad es aquel cuya respuesta es plana y se extiende a toda la banda de frecuencia.

Figura 2. 4 Micrófono es tanto mejor cuanto más rectilíneo sea su curva de respuesta de frecuencia. 1) Micrófono de calidad. 2) Micrófono con poca sensibilidad a tonos bajos. 3) Micrófonos con poca sensibilidad

a los tonos altos. 4) Micrófono de baja calidad

3. Directividad: Señala la variación de la respuesta del micrófono dependiendo de la dirección de donde provenga la fuente sonora (cobertura total de la captación de sonido para cada uno de los ángulos de incidencia de la presión acústica), es decir, muestra como varia la sensibilidad según de donde venga el sonido (en función de la incidencia de las ondas sonoras). La directividad se representa mediante diagramas polares. En estos se dibuja para distintos ángulos de incidencia del sonido respecto del micrófono (que está en 0 grados). Se prueba con varias frecuencias para ver su comportamiento en dichas frecuencias.

Hay tres tipos de directividad fundamentales: Los unidireccionales, los bidireccionales y los omnidireccionales.

(36)

Capítulo 2: Marco teórico 23

4. Impedancia interna: Es la resistencia que opone el micrófono al paso de tensión. De acuerdo con su impedancia los micrófonos se clasifican:

 Mi ófo o de alta i peda ia. > MΩ .

 Micrófono de media i peda ia e t e KΩ, .3 a 0.6 mV).  Micrófono de baja impedancia ( 5 KΩ, V 0.3mV).

La i peda ia i te a de los i ófo os se ide e oh ios Ω pa a u a f e ue ia de KHz. Si el micrófono es de alta impedancia y tiene un cable largo se produce una pérdida muy grande.

Impedancia de salida: Es la resistencia que proporciona el micrófono a la salida del is o. La aja i peda ia está e t e Ω a kHz. Ha ue te e e cuenta que la impedancia de salida del micrófono tienen que ser la tercera parte como máximo de la del equipo a la que se conecta para evitar la pérdida de señal y el incremento de ruido de fondo.

5. Distorsión: Es la tensión o señal que nos entrega el micrófono sin que exista ningún sonido incidiendo sobre él; y se refiere al conjunto de señales que aparecen en la salida de un sistema que no estaban en la entrada. En de los micrófonos, los fabricantes no suelen dar el valor de la distorsión.

Existen varias causas por las cuales se puede crear distorsión en los micrófonos.

Distorsión interna: Efecto proximidad, resonancia interna, respuesta lenta a los ataques y vibraciones parciales, en diagramas grandes.

Distorsión externa: Sobrecarga o sobresaturación, poping, Ruido de viento y ruido de vibración o golpeteo.

6. Dinámica: Es el margen existente entre el sonido más débil y el sonido más fuerte, que se transforman en señal eléctrica sin distorsión, que es capaz de captar un micrófono.

7. Factor de sensibilidad a los campos magnéticos: Si un micrófono dinámico se encuentra en las proximidades de un fuerte campo magnético y se mueve dentro de él, se originan tensiones parásitas que dan origen a ruidos. También las líneas de campo eléctrico en las proximidades de un micrófono pueden dar origen a tensiones parásitas, puesto que todo campo eléctrico va acompañado de un campo magnético. Para subsanar este inconveniente algunos micrófonos se fabrican dotados de una bobina de compensación, que anula la tensión parásita generada por la bobina.

(37)

Capítulo 2: Marco teórico 24

Clasificación de los micrófonos

El dividir un micrófono en dos transductores nos da la posibilidad de clasificarlos según el tipo de transductor empleado. Así los micrófonos se pueden dividir según varias clasificaciones:

1. T.A.M. que dan lugar a las diferentes directividades.

Micrófono de presión: El diafragma va a estar expuesto por una de sus caras a la presión incidente y por la otra a una cavidad cerrada, en la que exista una determinada presión gracias a un tubo ecualizador. La diferencia de presiones a las que es sometida producirá el movimiento al transductor mecano eléctrico.  Micrófono gradiente: El diafragma está expuesto por su cara exterior a la onda

incidente de presión y por su cara posterior a la misma onda pero después de que éste haya recorrido un cierto camino, por lo sobre el diafragma existe una diferencia de gradiente de presión, que lo hace moverse.

Micrófono combinado de presión y gradiente: El diafragma se mueve por la presión ejercida en la cara exterior de la membrana y por el gradiente de presión que aparece entre sus caras. Así la cara anterior recibe la onda directamente, mientras la cara posterior recibe la onda con un desfase controlado, debido a que el camino recorrido por esta onda es diferente según su dirección de incidencia.

2. T.M.E. que indica la eficiencia del micrófono en la conversión de energía (onda) acústica a energía (señal) eléctrica.

Dinámicos

- Micrófono de bobina móvil: Basan su funcionamiento en el fenómeno de generación de una tensión electromotriz, o inducida, en un condensador que se desplaza, por efecto de la presión acústica, en el interior de un campo magnético.

- Micrófono de cinta: Se basan en el mismo principio que los de bobina, pero ahora el conductor que se mueve en el campo magnético es una cinta metálica de aluminio en forma de zigzag, que se encuentra situada, y puede oscilar, entre los polos de un potente imán.

Electrostáticos

- Micrófono de condensador: Es un micrófono de alta calidad cuyos principios de funcionamiento está basado en la atracción y repulsión de cargas eléctricas. Consiste en un condensador formado por una placa fija y otra móvil. Para funcionar necesita de una polarización de tensión continua que mantenga cargado el condensador.

Figure

Figura 2. 2 Diagrama de las etapas funcionales que conforman el sistema de la grabadora de voz
Figura 2. 5 Diagramas polares de campos unidireccionales, micrófonos bidireccionales y omnidireccionales
Figura 2. 7 Terminales de un amplificador operacional de propósito general
Figura 2. 8 Polaridad de voltaje y dirección de corrientes para amplificadores no inversores
+7

Referencias

Documento similar

If certification of devices under the MDR has not been finalised before expiry of the Directive’s certificate, and where the device does not present an unacceptable risk to health

In addition to the requirements set out in Chapter VII MDR, also other MDR requirements should apply to ‘legacy devices’, provided that those requirements

The notified body that issued the AIMDD or MDD certificate may confirm in writing (after having reviewed manufacturer’s description of the (proposed) change) that the

 En el apartado 4.6 de la Ficha Técnica y 6 del Prospecto se añade la frase “En muy raras ocasiones se han notificado reacciones de hipersensibiliad, incluyendo anafilaxia (en

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi