Diseño de practicas de la sonoridad en formatos de audio digital

(1)

ESCUELA SUPERIOR DE INGENIERÍA

MECÁNICA Y ELÉCTRICA

DISEÑO DE PRACTICAS DE LA SONORIDAD EN FORMATOS DE

AUDIO DIGITAL

QUE PARA OBTENER EL TITULO DE:

INGENIERO EN COMUNICACIONES

Y ELECTRONICA

PRESENTAN:

GARCIA REYES TANIA DEYANIRA

MARTINEZ BAUTISTA FELIPE DE JESUS

ASESORES:

ING. MUEDANO MENESES JOSE JAVIER

ING. TRINIDAD AVILA LUCERO IVETTE

(2)

(3)

II

CONTENIDO

Contenido II Objetivos IV Introducción V Justificación VI Marco Teórico VII

Antecedente X

CAPÍTULO 1 Conceptos Teóricos

Pág.

1. Conceptos Acústicos 2

1.1. Acústica 2

1.2. Sonido 2

1.2.1. Características del Sonido 2

1.2.2. Propagación del Sonido 5

1.2.3. Fenómenos de Propagación 7

1.3. Nivel de Presión Sonora 8

1.4. Decibel 9

1.5. Ruido 9

1.6. Conceptos Psicoacusticos 12

1.6.1. Sistema Auditivo 12

1.6.2. Oído Interno 13

1.6.3. Oído Medio 13

1.6.4. Oído Externo 16

1.6.5. Funcionamiento del Oído 17

1.7. Sonoridad 17

1.8. Conceptos Básicos de Digitalización 20

1.9. Audio 21

1.9.1. Sonido Analógico 21

1.9.2. Dispositivos de la Reproducción del sonido Analógico 21

1.10. Sonido Digital 22

1.10.1. Digitalización de la Señal de Audio 23

1.10.2. Digitalización del sonido 23

1.10.3. Frecuencia de Muestreo (Frecuencia de Nyquist) 24

1.10.4. Alliasing 26

1.10.5. Cuantificación 27

1.10.6. Codificación 27

1.11. Streaming 28

1.12. Transformada Rápida de Fourier 31

(4)

III

1.14. Formatos de Audio 32

1.14.1. Audio sin Comprimir 32

1.14.2. Audio Comprimido con Perdidas 34

1.14.3. Audio Comprimido sin Perdidas 35

1.14.4. Tabla Comparativa 1 37

1.14.5. Tabla Comparativa 2 38

CAPÍTULO 2 Descripción de la Curricula

2. Perfil de la Curricular 39

2.1 Misión y Visión 40

2.2 Grabación 41

2.2.1 Objetivo de la Materia de “Grabación” 41

2.2.2 Fundamentación de la Asignatura 41

2.2.3 Objetivo Particular de la Unidad V “ Audio Digital” 42

2.3 Acústica Musical 42

2.3.1 Objetivo de la Materia de “Acústica Musical” 42

2.3.2 Fundamentación de la Asignatura 42

2.3.3 Objetivo Particular de la Unidad III “Herramientas Computacionales para el Procesamiento de la Música” 43

CAPÍTULO 3 Propuesta de Practicas

3. Ubicación de la sala de Audio Streaming 44

3.1. Localización de la Cabina de Audio Streaming 45

3.2. Plano del Estudio de Grabación 46

3.3. Fotos de la Sala de Audio Streaming 47

3.4. Practica 1: Archivo Digital 50

3.5. Practica 2: Audición 57

3.6. Practica 3: Voz 62

3.7. Encuesta 66

(5)

IV

OBJETIVO

Diseñar prácticas donde el alumno identifique los cambios que se modifican en las diferentes características de la sonoridad, mediante la compresión de los Formatos de Audio (WAV, MP3, WMA, FLAC).

OBJETIVOS PARTICULARES

 El alumno de la Especialidad de Acústica observe las diferencias en Sonoridad (Intensidad, Tono y Timbre), que existe entre los formatos de audio (WAV, WMA, MP3, FLAC), mediante un análisis de frecuencia visualizado en un software.

 El alumno de la Especialidad de Acústica identifique las características de la Sonoridad (Intensidad, Tono y Timbre), que se modifican al variar la frecuencia.

(6)

V

Introducción

En forma general, el concepto de Sonoridad es una medida subjetiva de la intensidad con la que el sonido es percibido por el oído humano. La Sonoridad depende de la intensidad del sonido pero también de la frecuencia, amplitud y otras variables, como puede ser la sensibilidad del oído de quien escucha y la duración del sonido.

Gracias a la compresión de archivos se puede oír música, en estéreos y dispositivos portátiles. Los distintos formatos de audio se actualizan día tras día para ofrecer, opciones de entretenimiento de alta calidad en diminutos archivos.

Actualmente existen diferentes tipos de software, que permiten visualizar mediante el espectro de frecuencia los diferentes parámetros de la sonoridad.

De igual forma se describe el procedimiento y la forma en cómo se crea un tono, la compresión de un formato a otro y finalmente como visualizar el espectro de frecuencia de dicho tono creado, para identificar los parámetros de la sonoridad, así como las pérdidas que se presentan en el momento en que se comprime de un formato a otro.

(7)

VI

Justificación

Hoy en día existen diversos formatos de audio digital, o métodos de compresión de sonido como puede ser más correcto llamarlos, estos se clasifican en:

 Audio sin Comprimir

 Audio Comprimido con Pérdida.  Audio Comprimido sin Pérdida.

(8)

VII

Marco Teórico

Cassette Compacta

Existen en el mercado otros formatos de audio, tanto domésticos como profesionales. A continuación se mencionan brevemente los más importantes de los últimos 40 años.

Desarrollada por Philips y presentada al público en 1963, la Cassette Compacta (Compact Cassette) es una cinta magnética pequeña, encapsulada en una caja almacén (cassette) que la protege y evita su manipulación directa.

Cassette compacta. Con este sistema se pueden efectuar grabaciones domésticas con una calidad de sonido aceptable, y su reducido tamaño posibilitó la construcción de aparatos grabadores y reproductores portátiles, alimentados con pilas.

La Cassette Compacta fue bien acogida por el público en todo el mundo, y durante muchos años fue el formato usado por la industria musical para presentar sus producciones, junto al disco de vinilo.

Figura I

El Disco Compacto (Compact Disc, o CD), puesto a la venta en 1982, fue el resultado de un trabajo conjunto entre las casas Philips y Sony, que unieron fuerzas para desarrollar un nuevo y revolucionario formato de audio.

Disco Compacto.

(9)

VIII

primero donde se emplearon métodos ópticos para la lectura de la información de audio, realizada mediante un haz láser que explora la superficie del disco. De este modo, al no existir contacto físico entre el medio y la máquina, los discos no se desgastan, y la calidad del sonido es la mejor conseguida hasta el momento por un formato de audio doméstico.

Muy pronto el CD comenzó a desplazar al tradicional disco de vinilo, hasta finalmente hacerlo desaparecer del mercado a fines de la década de 1980. También desplazó a la Cassette Compacta aunque sin causar su desaparición, pues a pesar de las grandes ventajas del CD, no era posible grabar en él.

Figura II

Después de alcanzar el éxito con el CD, Sony y Philips siguieron caminos separados en el desarrollo de un medio regrabable para el consumidor no profesional.

Grabadora de DCC portátil.

Mientras Sony comenzaba a esbozar sus ideas para el Minidisc, Philips decidió desarrollar un producto que fuese compatible con su anterior creación, la Cassette Compacta, y así aprovechar esta atractiva ventaja para producir una transición gradual hacia el nuevo formato. El resultado fue la presentación al público en 1992 de la Cassette Compacta Digital (Digital Compact Cassette o DCC).

(10)

IX

máquinas y las cintas se mantienen muy altos. En 1996, Philips decide descontinuar su fabricación. [1]

Antecedentes Históricos

¿Qué es la digitalización? Es un proceso que permite introducir información a una computadora. Pero la digitalización como tal puede ser por medio de un teclado, por medio de un scanner, por medio de una cámara de video digital o una cámara fotográfica digital, una grabadora de sonidos, etc. Existen miles de accesorios que permiten digitalizar información. El concepto de la digitalización es convertir información que está en papel o en algún otro medio standard analógico a información que pueda ser almacenada de una manera digital o magnética. Esto es que pueda estar y viajar, así como manipularse dentro de una computadora o algún otro aparato electrónico similar.

En los círculos profesionales el audio digital ha sido usado hace más de una década. Con el advenimiento del disco compacto en 1983, el audio digital ha pasado a ser común entre los consumidores, y es un hecho que el audio digital ha significado una mejora de gran magnitud en todos los aspectos referentes a la calidad del sonido y a la señal sin ruidos, sobre los mejores sistemas analógicos que lo precedieron.

¿Qué es el audio digital? Podríamos definir audio digital como la representación de una señal de audio mediante números, en general codificados en forma binaria (es decir con ceros y unos, el lenguaje interno de los ordenadores). Entendemos como señal de audio cualquier objeto sonoro audible, el viento, el agua, nuestra voz, nuestra música preferida y evidentemente esos molestos "ruidos" nocturnos de los vecinos que no nos dejan dormir. Cualquier sonido puede representarse en números, al igual que cualquier imagen o gráfico.

(11)

X

y equipos que procesan la señal de audio en el dominio digital, dominio que ofrece muchas más ventajas ya que es totalmente "tratable" por un ordenador, es decir, permite un grado de manipulación sin precedentes.

(12)

1

Capítulo 1

(13)

2

Conceptos acústicos

1.1. Acústica

Acústica es la ciencia que estudia la generación, transmisión y recepción de energía en la forma de ondas vibraciones en la materia. El fenómeno acústico más común es la percepción del sonido, tanto en el intervalo de la audición humana (20 Hz a 20 KHz) como en las frecuencias ultrasónicas (frecuencias superiores a los 20 KHz) e infra sónicas (frecuencias inferiores a los 20 Hz).

1.2. Sonido

El sonido es un fenómeno perceptual que se produce cuando un objeto entra en vibración mecánica, la cual se traduce a una variación de la presión atmosférica en el aire que envuelve el objeto. La naturaleza de dicha vibración puede ser periódica o no periódica, o incluso una combinación entre las dos. Las vibraciones periódicas generan, en general, una sensación de altura, y las no periódicas una sensación de ruido. [3]

Figura 1.1 El Sonido

1.2.1 Características del Sonido

(14)

3

 La Frecuencia, cantidad de oscilaciones por unidad de tiempo, es la que determina si el sonido es más agudo o más grave. A mayor frecuencia, el tono es más agudo, a menos frecuencia más grave.

Figura 1.2 Frecuencia

A)

 Onda de mayor frecuencia.  Más ciclos por unidad de tiempo.  Tono más agudo.

B)

 Onda de menor frecuencia.  Menos ciclos por unidad de

tiempo.

 Tono más grave.

La frecuencia se mide en Hertz. Un Hz equivale un ciclo por segundo. El oído humano es capaz de percibir sonidos entre los 20 y 20000 Hz (20 KHz).

20 a 500 Hz Tonos Graves 500 a 2 kHz Tonos Medios 2 a 20 KHz Tonos Agudos

 Amplitud, refiere a la altura de la onda y significa la intensidad del sonido. Amplitud cero equivale a silencio, amplitudes pequeñas a sonidos leves y amplitudes altas a sonidos fuertes o intensos.

A)

(15)

4

Figura 1.3 Amplitud

A)

 Onda de menor amplitud.  Sonido suave.

B)

 Onda de mayor amplitud.  Sonido más fuerte.

La amplitud se mide habitualmente en decibeles (dB). La escala auditiva varía entre 0 dB (umbral de audición) y 130 dB. Los sonidos superiores a 110 dB producen sensación dolorosa y la exposición permanente a esos niveles provoca la disminución de la capacidad auditiva (sordera parcial/permanente).

 Distancia, la propagación del sonido en el aire consume energía. Cada vez que se duplica la distancia entre la fuente y el receptor, el volumen disminuye 6 dB.

Esta particularidad del sonido se puede utilizar para crear la sensación de profundidad espacial en la escena: dos personas de dos voces a diferente volumen se perciben como personas ubicadas a distancia distinta.

Distintas investigaciones han mostrado que los humanos no distinguen diferencias de volumen de sonido menores a 3 dB.

 El Timbre, es la cualidad que hace que se pueda distinguir entre dos sonidos de igual frecuencia y amplitud, pero producidos, por ejemplo, por diferentes instrumentos musicales. El timbre modifica la forma de onda.

A)

(16)

[image:16.612.237.372.76.246.2]

5

Figura 1.4 Armónicos

Las curvas no son sinusoidales puras, sino que están compuestas por las superposición de varias, llamadas armónicas.

Cuando se mezclan varias fuentes de sonido, la curva adquiere formas irregulares.

1.2.2 Propagación del Sonido

Una oscilación que se propaga en un medio (con velocidad finita) recibe el nombre de onda. Dependiendo de la relación que exista entre el sentido de la oscilación y el de la propagación, hablamos de ondas longitudinales, transversales, de torsión, etc. En el aire el sonido se propaga en forma de ondas longitudinales, es decir, el sentido de la oscilación coincide con el de la propagación de la onda.

A) Medio

Se puede definir a un medio como un conjunto de osciladores capaces de entrar en vibración por la acción de una fuerza.

(17)

6

Para que una onda sonora se propague en un medio, éste debe cumplir como mínimo tres condiciones fundamentales: ser elástico, tener masa e inercia.

Las ondas sonoras no se propagan en el vacío, pero hay otras ondas, como las electromagnéticas, que sí lo hacen.

El aire en tanto medio posee además otras características relevantes para la propagación del sonido:

 la propagación es lineal, que quiere decir que diferentes ondas sonoras (sonidos) pueden propagarse por el mismo espacio al mismo tiempo sin afectarse mutuamente.

 es un medio no dispersivo, por lo que las ondas se propagan a la misma velocidad independientemente de su frecuencia o amplitud.

 es también un medio homogéneo, de manera que el sonido se propaga esféricamente, es decir, en todas las direcciones, generando lo que se denomina un campo sonoro.

B) Propagación

Es cuando un cuerpo en oscilación pone en movimiento a las moléculas de aire (del medio) que lo rodean. Éstas, a su vez, transmiten ese movimiento a las moléculas vecinas y así sucesivamente. Cada molécula de aire entra en oscilación en torno a su punto de reposo. Es decir, el desplazamiento que sufre cada molécula es pequeño. Pero el movimiento se propaga a través del medio.

Entre la fuente sonora (el cuerpo en oscilación) y el receptor (el ser humano) se tiene una transmisión de energía pero no un traslado de materia. No son las moléculas de aire que rodean al cuerpo en oscilación las que hacen entrar en movimiento al tímpano, sino las que están junto al mismo, que fueron puestas en movimiento a medida que la onda se fue propagando en el medio.

(18)

7

[image:18.612.209.408.184.253.2]

densidad), zonas de condensación, y zonas en las que hay una menor concentración de moléculas (menor densidad), zonas de rarefacción. Esas zonas de mayor o menor densidad generan una variación alterna en la presión estática del aire (la presión del aire en ausencia de sonido). Es lo que se conoce como presión sonora. Ver Figura 1.5.

Figura 1.5 Presión sonora

1.2.3 Fenómenos de Propagación

 Reflexión: La onda sonara se reflejara siempre que encuentre en su trayecto una discontinuidad o un cambio de medio. El ángulo de incidencia es igual al ángulo de reflexión.

 Refracción: cuando la onda sonora pasa de un medio a otro cambia la dirección de propagación en la frontera que separa a los dos medios.

 Difracción: cuando las ondas sonoras encuentran un obstáculo, se difundirán alrededor de los lados del obstáculo. Si la longitud de onda es mayor que la longitud del obstáculo, entonces la onda sonora pasara como si el obstáculo no existiera.

 Atenuación: se presenta cuando hay una pérdida de energía debido a la posición del medio a la propagación de la energía acústica.

(19)

8

una pérdida de energía cuando la onda sonora se propaga en algún medio (por lo general aire), esta pérdida también es conocida como absorción, de aquí el concepto de “absorción del aire”.

 Interferencia: se presenta cuando se superponen dos o más ondas. Se presenta la inferencia destructiva en los puntos en donde las ondas se encuentran en oposición de fase y la interferencia constructiva en los puntos en donde las ondas se encuentran en fase.

 Resonancia: cuando se iguala la frecuencia de oscilación de una fuente y la frecuencia natural de oscilación de un sistema, resultando una amplitud de vibración relativamente grande.

1.3. Nivel de Presión Sonora

El hecho de que la relación entre la presión sonora del sonido más intenso (cuando la sensación de sonido pasa a ser de dolor auditivo) y la del sonido más débil sea de alrededor de 1.000.000 ha llevado a adoptar una escala comprimida denominada escala logarítmica. Llamando Pref (presión de referencia a la presión

de un tono apenas audible (es decir 20 mPa) y P a la presión sonora, podemos

definir el nivel de presión sonora (NPS) Lp

(I) como:

(20)

9

1.4. Decibel

El Decibel es una aplicación usada para medir la intensidad relativa de los sonidos es aproximadamente igual al menor cambio en la sonoridad que puede percibir el oído humano agudo.

El umbral de sensibilidad, I0

(II)

se usa como valor de referencia para definir el decibel.

[image:20.612.108.504.295.522.2]

La escala de nivel de intensidad sonora no sólo es más práctica, también se ajusta mejor a la fisiología y la psicología de la audición.

Figura 1.6 Índices de Decibeles

1.5. Ruido

(21)

[image:21.612.212.400.384.483.2]

10

Figura 1.7 Ruido

A) Ruido Blanco

El ruido blanco es un tipo de señal que contiene todas las frecuencias y todas ellas tienen la misma potencia, con una amplitud constante. Es parecido a un Shshshsh, como el que hace el televisor cuando se corta la emisión. (Como suenan las interferencias televisivas).

Figura 1.8 Espectro de ruido blanco

Usos

 Medir el aislamiento acústico y la reverberación.

 Desorientar a personas antes de un interrogatorio y como técnica de

(22)

11 B) Ruido Rosa

El ruido rosa es un tipo de señal que contiene todas las frecuencias de sonido que están dentro del alcance del oído de un ser humano. Su amplitud disminuye a un ritmo constante para cada octava, por lo general tres decibeles (dB).

[image:22.612.212.400.247.353.2]

Para los oídos de una persona el ruido rosa suena como un zumbido de una estación de televisión vacía o el sonido de las olas del mar. Fsfsfsfsfsfs/ (como suenan las interferencias radiofónicas).

Figura 1.9 Espectro ruido rosa

Usos

 La postproducción de sonido en cine y televisión.  Mediciones y calibraciones de sonido en vivo.

 Para probar la calidad de las cabinas que van a salir a la venta.

C) Instrumento de Medición de Ruido

(23)

12

Figura 1.10 Decibelímetro

1.6. Conceptos Psicoacusticos

1.6.1 Sistema Auditivo

El sistema auditivo periférico (conocido como oído) está compuesto por el oído externo, el oído medio y el oído interno.

Figura 1.11 Sistema Auditivo

(24)

13

1.6.2 Oído Interno

Si en el oído externo se canaliza la energía acústica y en el oído medio se la transforma en energía mecánica transmitiéndola -y amplificándola- hasta el oído interno, es en éste en donde se realiza la definitiva transformación en impulsos eléctricos.

El laberinto óseo es una cavidad en el hueso temporal que contiene el vestíbulo, los canales semicirculares y la cóclea (o caracol). Dentro del laberinto óseo se encuentra el laberinto membranoso, compuesto por el sáculo y el utrículo (dentro del vestíbulo), los ductos semicirculares y el ducto coclear. Este último es el único que cumple una función en la audición, mientras que los otros se desempeñan en nuestro sentido del equilibrio. El oído interno está inmerso en un fluido viscoso llamado endolinfa cuando se encuentra en el laberinto membranoso y perilinfa cuando separa los laberintos óseo y membranoso. La cóclea (o caracol) es un conducto casi circular enrollado en espiral (de ahí su nombre) unas 2,75 veces sobre sí mismo, de unos 35 mm de largo y unos 1,5 mm de diámetro como promedio. El ducto coclear divide a la cóclea en dos secciones, la rampa vestibular y la rampa timpánica.

Figura 1.12 Esquema del Sistema Auditivo Periférico

1.6.3 Oído Medio

(25)

14

El tímpano es una membrana que es puesta en movimiento por la onda (las variaciones de presión del aire) que la alcanza. Sólo una parte de la onda que llega al tímpano es absorbida, la otra es reflejada. Se llama impedancia acústica a esa tendencia del sistema auditivo a oponerse al pasaje del sonido. Su magnitud depende de la masa y elasticidad del tímpano y de los osículos y la resistencia friccional que ofrecen.

La parte central del tímpano oscila como un cono asimétrico, al menos para frecuencias inferiores a los 2.400Hz. Para frecuencias superiores a la indicada las vibraciones del tímpano ya no son tan simples, por lo que la transmisión al martillo es menos efectiva.

Los oscículos (martillo, yunque y estribo) tienen como función transmitir el movimiento del tímpano al oído interno a través de la membrana conocida como ventana oval. Dado que el oído interno está lleno de material linfático, mientras que el oído medio está lleno de aire, debe resolverse un desajuste de impedancias que se produce siempre que una onda pasa de un medio gaseoso a uno líquido. En el pasaje del aire al agua en general sólo el 0,1% de la energía de la onda penetra en el agua, mientras que el 99,9% de la misma es reflejada. En el caso del oído ello significaría una pérdida de transmisión de unos 30 dB.

El oído interno resuelve este desajuste de impedancias por dos vías complementarias. En primer lugar la disminución de la superficie en la que se concentra el movimiento. El tímpano tiene un área promedio de 69 mm^2, pero el área vibrante efectiva es de unos 43 mm^2. El pie del estribo, que empuja la ventana oval poniendo en movimiento el material linfático contenido en el oído interno, tiene un área de 3,2 mm^2. La presión (fuerza por unidad de superficie) se incrementa en consecuencia en unas 13,5 veces.

(26)

15

área real de vibración del tímpano. Además, los valores pueden ser superiores para frecuencias entre los 2.000 Hz y los 5.000 Hz, debido a la resonancia del canal auditivo externo y a las frecuencias de resonancia características de los conos asimétricos, como lo es el tímpano. En general entre el oído externo y el tímpano se produce una amplificación de entre 5 dB y 10 dB en las frecuencias comprendidas entre los 2.000 Hz y los 5.000 Hz, lo que contribuye de manera fundamental para la zona de frecuencias a la que nuestro sistema auditivo es más sensible.

Los músculos en el oído medio (el tensor del tímpano y el stapedius) pueden influir sobre la transmisión del sonido entre el oído medio y el interno. Como su nombre lo indica, el tensor del tímpano tensa la membrana timpánica aumentando su rigidez, produciendo en consecuencia una mayor resistencia a la oscilación al ser alcanzada por las variaciones de presión del aire.

El stapedius separa el estribo de la ventana oval, reduciendo la eficacia en la transmisión del movimiento. En general responde como reflejo, en lo que se conoce como reflejo acústico.

Ambos cumplen una función primordial de protección, especialmente frente a sonidos de gran intensidad. Lamentablemente la acción de esos músculos no es instantánea de manera que no protegen a nuestro sistema auditivo ante sonidos repentinos de muy alta intensidad, como pueden ser los estallidos o impulsos. Por otra parte, se fatigan muy rápidamente de manera que pierden eficiencia cuando nos encontramos expuestos por largo rato a sonidos de alta intensidad.

La acción de estos músculos tienen el efecto de un filtro, por cuanto se ofrece una mayor resistencia a la transmisión de frecuencias menores (más graves), favoreciendo por consiguiente las frecuencias mayores (más agudas), que suelen ser portadoras de un mayor contenido de información útil para el ser humano, tanto en el habla como en situaciones de la vida cotidiana.

(27)

16

otra membrana, la ventana redonda. No obstante la acción del aire sobre la ventana redonda es mínima en la transmisión de las ondas con respecto a la del estribo sobre la ventana oval. De hecho, ambas ventanas suelen moverse en sentidos opuestos, funcionando la ventana redonda como una suerte de amortiguadora de las ondas producidas dentro del oído interno.

La trompa de Eustaquio comunica con la parte superior de la faringe y por su intermedio con el aire exterior. Una de sus funciones es mantener un equilibrio de presión a ambos lados del tímpano. [4]

1.6.4 Oído Externo

El oído externo está compuesto por el pabellón, que concentra las ondas sonoras en el conducto, y el conducto auditivo externo que desemboca en el tímpano. La ubicación lateral de los pabellones derecho e izquierdo en el ser humano ha hecho casi innecesaria la capacidad de movimiento de los mismos, a diferencia de lo que sucede en muchos otros animales que tienen una amplia capacidad de movimiento de los pabellones, pudiendo enfocarlos en la dirección de proveniencia del sonido. De esta manera se contribuye a la función del pabellón, que es la de concentrar las ondas sonoras en el conducto auditivo externo.

La no linealidad de las funciones de transferencia del oído comienza ya en el pabellón, ya que por sus características éste tiene una frecuencia de resonancia entre los 4.500 Hz y los 5.000 Hz.

(28)

17

1.6.5 Funcionamiento del Oído

El sentido del oído funciona de la siguiente manera:

1. Las ondas sonoras penetran en el pabellón auditivo y viajan a través del conducto auditivo hasta el tímpano.

2. El tímpano es una pequeña membrana que vibra transmitiendo el aire a los huesos del oído y haciendo que éstos se muevan.

3. Esos tres pequeños huesos, el yunque, el martillo y el estribo, hacen que sus vibraciones lleguen al oído interno.

4. A través de la cóclea y del líquido que la rellena se transforma el movimiento en señales nerviosas.

[image:28.612.210.406.355.536.2]

5. Estas señales llegan al cerebro que las decodifica e interpreta como sonido o señales auditivas. [5]

Figura 1.13 Partes del Oído

1.7. Sonoridad

La sonoridad es el atributo que nos permite ordenar sonidos en una escala del más fuerte al más débil.

(29)

18

sino también de su frecuencia. Más allá de ello, la sonoridad depende también de otras variables, como pueden ser el ancho de banda, el contenido de frecuencias y la duración del sonido.

A) Nivel de Sonoridad

[image:29.612.211.399.227.365.2]

Una forma práctica de abordar el problema de la sonoridad es medir el nivel de sonoridad, es decir, determinar cuándo un sonido es igual de fuerte que otro.

Figura 1.14 Niveles de Sonoridad

Las curvas de igual sonoridad, establecidas por primera vez por Munson y Fletcher en 1930 y re calculadas posteriormente por Robinson y Dadson), muestran la relación que debe existir entre las frecuencias e intensidades (o presión sonora) de dos sonidos senoidales para ser percibidos igual de fuertes, es decir, con la misma sonoridad.

Los sonidos senoidales contenidos a lo largo de cada curva tienen la misma sonoridad. Esta dependencia de la frecuencia estaría dada principalmente por las características de transferencia del oído externo y el medio. También debe notarse que a medida que aumenta el nivel de presión sonora las curvas se hacen más planas, es decir, la dependencia de la frecuencia es menor a medida que aumenta el nivel de presión sonora.

(30)

19

Para 1 kHz se ha definido que el nivel de presión sonora (en dB) corresponde al nivel de sonoridad (en fon = phon). Así 0 dB es igual a 0 fon y 120 dB es igual a 120 fon. Eso siempre para sonidos senoidales con frecuencias de 1 kHz. Obsérvese, por ejemplo, que un sonido senoidal con (aproximadamente) una frecuencia = 90 Hz y un nivel de intensidad = 40 dB sigue teniendo un nivel de sonoridad = 0 fon.

Las curvas mostradas son válidas para el campo sonoro directo. El sistema auditivo no es sensible por igual a sonidos provenientes de diferentes direcciones. Esa dependencia de la dirección depende, a su vez, también de la frecuencia. Es por eso que las curvas de igual sonoridad no serán iguales en el campo sonoro directo y en el campo sonoro difuso, es decir, en una situación -que es la más usual- en la que el sonido venga de todas direcciones. [6]

B) Escala de Sonoridad

Dado que la escala de fons mide el nivel de sonoridad (y, en tanto tal, está relacionada con una escala logarítmica) no es posible comparar los fons de dos sonidos para determinar cuál es su relación real de sonoridad.

Se ha propuesto el soné como medida de la sonoridad. El soné está definido arbitrariamente como la sonoridad de un sonido senoidal de 1 kHz con un nivel de presión sonora (SPL) = 40 dB.

Los experimentos han sugerido que la sonoridad percibida es una función exponencial de la intensidad física:

(31)

20

Figura 1.15 Primera Aproximación

Esta relación es válida para sonidos con niveles de 40 dB o más, de manera que por ejemplo un sonido senoidal de 1 kHz con un SPL = 50 dB tendrá 2 sones, es decir, tendrá el doble de sonoridad que el mencionado anteriormente. Sin embargo, como se observa en la curva, para sonidos con niveles por debajo de los 40 dB la función planteada anteriormente no se cumple, y la sonoridad cambia más rápidamente con la variación de SPL. [6]

1.8. Conceptos Básicos de Digitalización

(32)

21

1.9. Audio

Es la tensión eléctrica o magnética proporcional a un sonido, se genera por medio de elementos “transductores “como lo son los micrófonos y suele estar acompañado de variados pasos y procesos para tratamiento, almacenamiento y reproducción.

1.9.1. Sonido Analógico

El término "analógico" se refiere, en general, a una serie de valores que varían a lo largo del tiempo en forma continua y se pueden representar en forma de ondas. El sonido analógico es, por tanto, una función continua, porque imita o es análogo de su señal original. Este término se usa como antónimo de digital.

Este tipo de sonido se reproduce y guarda a través de procesos electrónicos. En estos casos, las vibraciones de las ondas sonoras captadas por un micrófono se transforman en señales eléctricas. Estos impulsos eléctricos llegan al dispositivo analógico de grabación a través de un cable.

1.9.2. Dispositivos de Reproducción del Sonido Analógico

La mayoría de los equipos de reproducción y grabación de audio analógico han caído en desuso. Los soportes analógicos más frecuentes eran las cintas de cassette y los discos de vinilo.

(33)

22

Los soportes analógicos van perdiendo calidad a medida que van siendo usados o copiados. Esto se debe al contacto físico de los cabezales o la aguja de reproducción con el soporte del sonido.

1.10. Sonido Digital

El sonido digital es toda aquella señal sonora, normalmente analógica, que se reproduce, guarda y edita en términos numéricos discretos. La señal analógica se codifica a través del sistema binario.

En el sistema binario cualquier valor puede ser representado en términos de 1 y 0. Todas las vibraciones producidas por el aire son transformadas en señales eléctricas y éstas en combinaciones de 1 y 0. Esta codificación se produce utilizando un convertidor de señal conocido como sampler.

Ventajas del sonido digital

Las ventajas del audio digital frente al analógico son numerosas:

1. Los sonidos grabados en un soporte digital no pierden calidad con el paso del tiempo ni por el uso (los soportes como los CDs, en cambio, sí son delicados y se deterioran con facilidad).

2. La calidad de este tipo de sonido es mucho mayor que la calidad del audio analógico (aunque, sobre esto, hay opiniones).

3. La manipulación y edición del sonido digitalizado es más sencilla y ofrece muchas más posibilidades.

4. El almacenamiento de archivos de audio digitales puede ser infinito mientras que en el sonido analógico está limitado por el espacio.

(34)

23

1.10.1. Digitalización de la Señal de Audio

Digitalizar audio es el proceso mediante el cual el sonido analógico se convierte en una secuencia de dígitos (1 y 0) a través del sistema binario. A este proceso se le llama muestreo o, en inglés, sampling.

Existen varias maneras de transformar el sonido analógico en sonido digital. La más común es la captación del sonido digital mediante un micrófono. Este dispositivo recoge las vibraciones sonoras a través de una membrana. Las vibraciones convertidas en electricidad son transmitidas a un ordenador mediante un cable y éste las digitaliza a través de la placa de sonido.

[image:34.612.182.433.293.390.2]

Figura 1.16 Sistema Analógico digital y Digital Analógico.

1.10.2. Digitalización del sonido

Las vibraciones sonoras pueden ser representadas como señales electrónicas a través de algunos dispositivos (por ejemplo, un micrófono), que convierte estas vibraciones en una señal de voltaje o tensión dependiente del tiempo. El resultado de la conversión se denomina señal analógica.

Las señales analógicas son continuas en el sentido en que consisten en un continuo de valores.

(35)

24

electrónicos capaces de producir este tipo de señales adecuadas para la vibración de los altavoces.

Por lo tanto, las señales analógicas pueden ser manipuladas, grabadas y amplificadas mediante técnicas analógicas.

Para trabajar con sonidos en el ordenador, las señales analógicas tienen que ser convertidas a formato digital, es decir, el sonido debe ser representado con números binarios.

En el sentido contrario, las señales digitales deben ser convertidas a formato analógico para escucharlas. Por lo tanto, el ordenador tiene que tener dos tipos de conversores de datos: convertidor analógico al digital (ADC) y digital a analógico (DAC). [3]

Figura 1.17 Se representan los pasos principales de una conversión analógico/digital.

1.10.3. Frecuencia de Muestreo (Frecuencia de Nyquist)

(36)

25

Figura 1.18 Señal Continua

Los sonidos musicales no contienen información significante por arriba de 10KHz, por lo que 20KHz es una frecuencia de muestreo adecuada. Los reproductores de CD a su vez utilizan una frecuencia de muestreo de 44,1KHz. El límite superior de audición de una persona joven y sana es de 20KHz, por lo que podemos decir que los reproductores de CD “exageran” al muestrear. [3]

A) Frecuencias de muestreo más comunes

(37)

26

Calidad Muestreo Bits/muestra Modo

Tasa de

bits Frecuencia

Teléfono 8 Khz 8 Mono 64 Kbps 200-3400 Hz Radio AM 11025 Khz 8 Mono 88 Kbps

Radio FM 22050 Khz 16 Estéreo 7056 Kbps CD 44.1 Khz 16 Estéreo 14112

Kbps

20-20000 HZ DAT 48 Khz 16 Estéreo 1536

Kbps

20-20000 Hz

Figura 1.19 Comparación de formatos de calidad de audio

1.10.4. Alliasing

Una onda compleja puede componerse de sinusoides a frecuencias muy altas, las cuales oscilan tan rápidamente que no son representadas correctamente por las muestras de la señal, al estar éstas demasiado espaciadas entre sí. A este fenómenos se le denomina alliasing, y ocurre cuando la señal que se muestrea tiene componentes de frecuencia que son mayores que la mitad de la frecuencia de muestreo o frecuencia de Nyquist. Para estas frecuencias no se cumple el teorema de muestreo y se produce, por lo tanto, este fenómeno.

Estas componentes de frecuencia corrompen la señal original introduciendo componentes que se denominan alias. Este efecto está ilustrado en la Figura 1.2.13. Las frecuencias que aparecen pueden calcularse como:

Siendo fm la frecuencia de muestre y fx la frecuencia de la señal. En el dominio

(38)

[image:38.612.223.393.73.206.2]

27

Figura 1.20 Señal muestreada

Las soluciones posibles para este problema son las siguientes:

 Aumentar la frecuencia de muestreo para que esta sea mayor o igual al doble de la frecuencia máxima de la señal.

 Realizar un filtrado de las frecuencias por encima de la frecuencia de Nyquist: estos filtros se denominan filtros antialiasing y son filtros de tipo paso bajo (Low-Pass Filter). [3]

1.10.5. Cuantificación

Es conjunto de muestras o de valores continuos de la amplitud de la señal. La cuantización se realiza al limitar los posibles valores de amplitud de una señal, definiendo una serie discreta (no continua) de valores posibles.

(39)

28

Figura 1.21 Ejemplo de Alliasing

1.10.6. Codificación

El proceso de codificación consiste en asignar un código binario o conjunto de bits a cada uno de los valores posibles de las muestras de la señal. Hay muchas posibilidades de realizar este proceso de codificación. Se denomina códec (abreviatura para codificador/decodificador) es el código específico que se utiliza para codificar y decodificar datos. El códec incluye parámetros referentes a todo el proceso de digitalización, indicando cómo se tiene que realizar el proceso de conversión:

 Número de canales: monoaural, binaural o multicanal.  Frecuencia de muestreo.

 Resolución: número de bits. Como hemos visto en el punto anterior, cuanto mayor sea el número de bits que utilicemos, mayor resolución tendremos y menor ruido de cuantización. Por otra parte, tendremos palabras de un tamaño mayor, por lo que se tendrá que llegar a un compromiso entre espacio de almacenamiento y resolución.

 Bit rate: velocidad o tasa de transferencia (en bits por segundo).

(40)

[image:40.612.210.404.73.227.2]

29

Figura 1.22 Cuantizacion

1.11. Streaming

El termino streaming (de inglés stream que significa: corriente, arroyo, flujo, fluir), es una tecnología que permite la recepción instantánea, sin esperas, de información que fluye desde un servidor.

Lógicamente esta tecnología, que muchos pensarían que es de reciente aparición, está muy experimentada en el campo de internet y surge de la necesidad de acceder a tipos de información voluminosa que generan amplios tiempos de espera usando la tradicional descarga de archivos. Esta información es, fundamentalmente, de tipo audiovisual aunque puede ser solo audio (radios en la Red) o video.

Desde sus creación los archivos de audio y video han sido (y seguirán siendo a pesar de las compresiones) muy grandes. Los tamaños de los videos o de cualquier elemento multimedia pueden superar los MB y llegara los GB lo que es impensable para un sistema que aun funciona demasiado lento como puede ser internet. En definitiva, para concretar, muchos megabytes para poder ser transmitidos con facilidad.

(41)

30

llegar información audiovisual a cada usuario que la solicite. De hecho una de las diferencias más importantes entre la radio y el streaming es que, mientras los primeros realizan retransmisiones uno-muchos, el streaming es uno-uno, lo cual puede originar que los anchos de banda disminuyan en el servidor de modo geométrico según se conecten usuarios a su sistema.

Funcionamiento del Streaming

1. El usuario realiza una petición a un determinado servidor para que este transmita.

2. El servidor acepta la petición y establece una comunicación hasta el usuario para hacerle llegar el contenido solicitado mediante un flujo continuo de datos que permite que aquel pueda visualizarlos en tiempo real.

3. El cliente comienza a recibir el fichero y construye un buffer en tiempo real. Cuando se ha llenado el buffer con una pequeña parte del archivo, el cliente lo empieza a mostrar y a la vez continúa con la descarga.

4. El sistema esta sincronizado para que el archivo se pueda ver mientras se descarga, de modo que cuando acaba de descargarse el fichero también ha acabo de visualizarse.

5. Si en algún momento la conexión sufre descensos de velocidad se utiliza la información que hay en el buffer, de modo que se puede aguantar un poco ese descenso.

6. Si la comunicación se corta demasiado tiempo, el buffer se vacía y la ejecución el archivo se cortaría también hasta que se restaurase la señal. Todo a través de internet y usando un protocolo de comunicaciones, que se denomina rtsp.

(42)

31

1.12. Transformada Rápida de Fourier

La TFR es la abreviatura de un eficiente algoritmo que permite calcularla transformada de Fourier discreta (DFT) y su inversa. Es de gran importancia en una amplia variedad de aplicaciones, desde el tratamiento digital de señales y filtrado digital en general a la resolución de ecuaciones en derivadas parciales o los de multiplicación rápida de grandes enteros. El logarítmico pone algunas limitaciones en la señal y el espectro resultante. Por ejemplo: la señal de la que se tomaron muestras y que se va a transformar debe consistir de un número de muestras igual a una potencia de dos. La mayoría de los analizadores TFR permiten la transformación de 512, 1024, 2048 o 4096 muestras. El rango de frecuencias cubierto por el análisis TRF depende de la cantidad de muestras recogidas y de la proporción de muestreo.

Las aplicaciones de la transformada rápida de Fourier son múltiples. Es la base de muchas operaciones fundamentales del procesamiento de señales, donde tiene una amplia utilización. Además, proporciona un medio oportuno para mejorar el reclutamiento de los algoritmos para un conjunto de problemas aritméticos comunes.

1.13. Compresor

(43)

32 Figura 1.24 Señal sin comprimir, recién

grabada desde un micrófono se ha aplicado una compresión 3:1 a Figura 1.25 La misma señal a la que partir de -15 dB y ganancia de salida.

La compresión resulta una técnica imprescindible en cualquier producción mínimamente seria y sus aplicaciones son muy variadas y socorridas. Se puede aplicar a cada pista por separado y a la mezcla final. Permite obtener sonidos con más pegada, con más volumen, temas más "compactos", guitarras más cañeras, mejores voces... y un sin fin de posibilidades más. Y todo ello depende en gran medida de cómo se configuren los distintos parámetros de los que se compone un compresor común.

1.14. Formatos de Audio

Los archivos digitales de sonido pueden ser guardados en multitud de formatos, dependiendo de sus características. Existen tipos de formato que comprimen la información y otros que no lo hacen.

Los formatos de sonido digital comprimidos son aquellos que consiguen una reducción del tamaño de los archivos de audio. Esta reducción puede hacerse con pérdida de datos o sin ella.

Para reducir estos archivos se utilizan unos algoritmos de compresión llamados códec de audio. [7]

1.14.1. Audio sin Comprimir

(44)

33

Los formatos de audio sin comprimir más extendidos son WAV, MIDI, y CD-A. [7]  WAV o Wave Audio Format: Los archivos de sonido digital sin comprimir

de este tipo ocupan mucho espacio.

Fue creado para el entorno de Microsoft en 1995 y fue el estándar de grabación para la música de los CD’s comerciales.

Es un formato muy extendido entre los usuarios de PC, ya que funciona en cualquier aplicación de Windows. Se desaconseja su uso para internet por el gran tamaño de los archivos en este formato.

El formato WAV admite tanto archivos estéreo como mono y diversas velocidades de muestreo y resolución. Su extensión es *.WAV. [8]

 CD-A o Compact Disc Audio: Es el tipo de archivo de sonido digital que utilizan los CD’s de audio comerciales en la actualidad. Es una derivación del formato WAV y sólo pueden ser reproducidos desde un CD-ROM.

El formato CD-A utiliza una frecuencia de muestreo de 44.1 kHz y un tamaño de muestra de 16 bits.

Este tipo de archivo requiere la conversión a otro formato para poder ser almacenado y reproducido en un ordenador. Su extensión es *.cda. [8]  MIDI o Musical Instrument Digital Interface: No es un tipo de formato de

archivos digitales de sonido como tal. Es una descripción musical de un sonido más que un conjunto de muestras del mismo.

El audio resultante depende directamente del reproductor MIDI que se utilice.

(45)

34

1.14.2. Audio Comprimido con Perdidas

Los archivos de sonido digital comprimidos se clasifican en dos categorías: los que han sufrido una compresión con pérdida y los que no la han tenido.

La compresión con pérdida significa que ha sido utilizado un algoritmo con una cantidad menor de información. El archivo resultante difiere del original. [9]

 MP3 o MPEG1 Audio Layer 3: las siglas MP3 responden a una abreviación de MPEG 1 layer 3. Es un algoritmo de codificación perceptual desarrollado por el consorcio MPEG (Moving Picture Expert Group) junto con el Instituto Tecnológico Fraunhofer que finalmente se ha estandarizado como norma ISO-MPEG Audio Layer 3 (IS 11172-3 y IS 13818-3) y que viene a ser un avance importante sobre los anteriores desarrollos (Layer 1 y Layer 2).

Esta tecnología no es nueva, realmente ya lleva desarrollándose más de 10 años, lo que ocurre es que ahora es el momento en el que la velocidad de proceso de los ordenadores la han hecho accesible al usuario medio.

El rango de frecuencias que percibe el oído humano esta aproximadamente entre los 20Hz y los 20kHz siendo más sensible entre los 2Hz y 4Hz. Además cuando tenemos una señal de un volumen alto en una frecuencia y otra de un volumen más bajo en una frecuencia cercana esta queda tapada por la anterior. Esto es lo que se llama efecto enmascaramiento. Así pues de lo que se trata es de aprovechar los "defectos" del oído humano para desechar todo aquello que realmente no vamos a oír. [9]

 WMA o Windows Media Audio: WMA es el formato de compresión de audio de Microsoft. Fue ideado para su reproducción con el programa Windows Media Player.

(46)

35

Recientemente, Microsoft ha desarrollado una variante del formato WMA con compresión, pero sin pérdida. [9]

 OGG Vorbis: Ogg Vorbis es un formato contenedor desarrollado en código abierto, de libre distribución y sin patente. Esta es la mayor diferencia con el resto de archivos de audio comprimidos.

Los archivos en este formato tienen una gran calidad y se pueden reproducir en casi cualquier dispositivo. Su uso está mucho menos extendido que los anteriores aunque, en algunos casos, da mejores resultados.

Su uso está libre de patentes. Por eso, muchos reproductores multimedia, como el popular VLC, incluyen los códecs de Ogg que, por otra parte, se pueden descargar libremente del sitio web Xiph.org. Su extensión es *.ogg. [9]

1.14.3. Audio Comprimido sin Perdidas

Los archivos de sonido digital comprimidos sin pérdida de información son aquellos que utilizan un algoritmo de compresión en el que el audio final es igual al original.

Con este tipo de formatos se puede reproducir exactamente el archivo original pero con un tamaño algo menor. [10]

 AIFF (Audio Interchange File Format): es el formato estándar para el intercambio de audio y su venta para ordenadores. Su uso está muy extendido entre los usuarios de equipos Amiga y Apple. El formato AIFF como tal no está comprimido pero sí su variante AIFF-C.

(47)

36

 FLAC (Free Lossless Audio Codec): es la alternativa al formato mp3 sin pérdida de calidad. Este tipo de archivo de sonido forma parte del proyecto OGG y es de libre distribución.

Como todos los formatos sin pérdida, el archivo ocupa bastante espacio. La reducción es de un tercio del tamaño original. Su extensión es *.flac [10]  MP3HD: es la variante del formato mp3 pero en alta calidad y sin pérdida

de información. Tiene una frecuencia de muestreo de 44.1 kHz y una resolución de 16 bits en estéreo.

(48)

37

1.14.4. Tabla Comparativa 1

FORMATO CARACTERISTICAS

DEL FORMATO VENTAJAS DESVENTAJAS

WAV

Waveform audio format

*Formato digital no comprimido.

*Formato propio de Windows.

*Se utiliza para almacenar sonidos en el PC, admite archivos mono y estéreo a

diversas resoluciones y velocidades de muestreo.

*Extensión es wav.

*Alta calidad de sonido*Proporciona escucha

fiel del audio.

*Funciona en aplicaciones de Windows y en equipos comunes con reproductor de

Cd´s.

*Incluye soporte para casi todos los códec de audio

actual.

*Compatible para convertirse en varios formatos por medio

del software adecuado. Ejemplo pasar de Wav a

Mp3.

*Ocupa mucho espacio en disco.

*Mala relación calidad-espacio.

*Dificultad para distribuir por internet debido al

peso del archivo.

*Permite capturar en mismo archivo hasta 6

horas

WMA

Windows Media Audio

*Formato de compresión de audio con pérdida, aunque hay un desarrollo sin pérdida

más reciente.

*Versión de Windows para comprimir audio.

*Extensión: .wma

*Ideal para transmisión en tiempo real.

*Reduce tamaño de archivos grandes.

* Inclusión de soporte en el reproductor Windows Media

Player.

*Menor calidad.

*Ocupa mucho espacio en la calidad de audio.

*Posee una limitación de grabación.

MP3

MPEG Audio Layer III *Formato digital comprimido

con pérdida. *Tamaño de compresión: 11

a 1.

*Buena compatibilidad. *Puede reproducirse en casi la totalidad de reproductores

de audio.

*Fácilmente distribuible por internet.

*Mejor relación calidad-espacio

*Pérdida del sonido original.

*Soporta dos canales.

*Distorsión en bandas de frecuencias.

*Aumento en las frecuencias graves y subgraves

(250hz-40hz).

*Presenta pautas entre pistas.

FLAC

Free Lossless Audio Codec

*Formato comprimido sin pérdida.

*Extensión: Flac

*Mayor calidad en equipos de alta fidelidad. *-La información es continua

entre pistas separadas.

*No elimina información del contenido original.

*Es un formato de código abierto.

*Codifica y decodifica rápidamente.

*Ocupa mucho espacio en disco.

*No es soportado por todos los reproductores

(49)

38

1.15. Tabla Comparativa 2

Formato de Audio

Desarrollado Frecuencia de

Muestreo Lanzamiento Inicial

WAV Microsoft, _IBM. 11.025 KHz, 22.05 Khz, 44.1 KHz. ₁₉₉₁

WMA Microsoft. 32 KHz, 44.1 KHz, 48 KHz. ?

MP3

Moving Picture Experts

Grouo. 16 Hz-48 KHz. 1993

FLAC

Fundación Xiph.org/Josh

(50)

39

Capítulo 2

(51)

40

2.1 Misión y Visión

Misión

La Escuela Superior de Ingeniería Mecánica y Eléctrica, Unidad Zacatenco del Instituto Politécnico Nacional, con sus carreras de Ingeniería Eléctrica, Ingeniería en Comunicaciones y Electrónica, Ingeniería en Control y Automatización y su Sección de Estudios de Posgrado e Investigación, tiene como función la de formar profesionistas a nivel licenciatura y posgrado en los niveles de diplomado, especialidad, maestría y doctorado, así como realizar investigación científica y tecnológica en el área electromecánica, a fin de satisfacer las necesidades de desarrollo industrial y coadyuvar a la independencia económica, científica y tecnológica del país, a través de la enseñanza de punta y de la investigación científica y tecnológica de alto nivel.

Visión

(52)

41

2.2 Grabación

2.2.1 Objetivo de la Materia de “Grabación”

El alumno resolverá problemas de grabación y reproducción del audio aplicando los fundamentos físico acústicos, electro acústicos e informáticos que intervienen en la recepción, procesamiento, grabación y reproducción del sonido. Aplicará las técnicas de ingeniería para la medición y el análisis de los diferentes elementos que participan en la grabación del audio.

2.2.2 Fundamentación de la Asignatura

(53)

42

2.2.3 Objetivo Particular de la Unidad V “ Audio Digital”

El alumno describirá y analizará los procedimientos de grabación digital de señales de audio para demostrar las ventajas y desventajas de los mismos.

2.3 Acústica Musical

2.3.1 Objetivo de la Materia de “Acústica Musical”

El alumno diseñará un instrumento musical acústico y/o electrónico-digital, empleando las técnicas para la medición y análisis de los elementos participantes en la acústica musical.

El alumno explicará los conceptos fundamentales acústicos, electroacústicos y las herramientas computacionales que participan en la generación, reproducción y procesamiento de la música.

2.3.2 Fundamentación de la Asignatura

(54)

43

2.3.3 Objetivo Particular de la Unidad III “Herramientas

Computacionales para el Procesamiento de la Música”

(55)

44

Capítulo 3

(56)

45

3.1. Localización de la Cabina de Audio Streaming

[image:56.612.85.522.248.483.2]

La cabina de Audio Streaming se encuentra dentro de las instalaciones de la Escuela Superior de Ingeniería Mecánica y Eléctrica, edifico Z, acceso 1, segundo piso, dentro del Estudio de Grabación del Instituto Politécnico Nacional, ubicada en Unidad Profesional Adolfo López Mateos, Delegación Gustavo A. Madero de la Ciudad de México.

Figura 3.1 Plano del Lugar

El Estudio de Grabación está conformado por cinco áreas, las cuales son usadas para llevar a cabo diferentes actividades para la formación de los alumnos de la Especialidad de Acústica, las cuales son:

 Sala A

 Sala B

 Sala de video

 Sala de Audio

(57)

46

[image:57.612.84.525.189.692.2]

3.2. Plano del Estudio de Grabación

(58)

47

[image:58.612.106.508.128.358.2]

3.3. Fotos de la sala de Audio Streaming.

Figura 3.3 Entrada de la cabina de Audio Streaming

[image:58.612.107.510.421.653.2]

(59)

[image:59.612.107.511.122.352.2]

48

Figura 3.5 Material para evitar ruido

[image:59.612.126.490.414.641.2]

(60)

[image:60.612.123.492.94.375.2]

49

(61)

50

3.4. Practica 1: Archivo Digital

Instituto Politécnico

Nacional

Especialidad

“Acústica”

Escuela Superior de

Ingeniería Mecánica

Eléctrica

Archivo Digital

Practica #1.

Alumno:

a

Objetivo:

No De Boleta: a

El alumno de la Especialidad de Acústica observe las diferencias en Sonoridad (Intensidad, Tono y Timbre), que existe entre los formatos de audio (WAV, WMA, MP3, FLAC), mediante un análisis de frecuencia visualizado en un software.

Introducción:

Sonoridad

(62)

51

La sonoridad depende de la intensidad de un sonido, pero también de su frecuencia y amplitud, como pueden ser la sensibilidad del oído de quien escucha y de la duración del sonido.

Parámetros de la sonoridad:

 Frecuencia

La frecuencia del sonido hace referencia a la cantidad de veces que vibra el aire que transmite ese sonido en un segundo. La unidad de medida de la frecuencia son los Hertz (Hz). La medición de la onda puede comenzarse en cualquier punto de la misma.

Para que el ser humano pueda oír un determinado sonido su frecuencia debe estar comprendida entre los 20 y los 20.000 Hz.

 Amplitud

Se refiere a la altura de la onda y significa la intensidad o volumen del sonido. Amplitud cero equivale a silencio, amplitudes pequeñas a sonidos leves y amplitudes altas a sonidos fuertes o intensos.

La escala auditiva varía entre 0 dB (umbral de audición) y 130 dB.

 El Timbre

Es la cualidad que hace que distingamos entre dos sonidos de igual frecuencia y amplitud, pero producidos, por ejemplo, por diferentes instrumentos musicales. El timbre modifica la forma de onda.

Material:

 Pc

 Software generador de tonos “NCH TONE GENERATOR”.

 Software convertidor de formatos “Free Media Converter”.

(63)

52 Desarrollo:

1. Crear los siguientes tonos:

Formato WAV (1 KHz)

 Señal Triangular (1 kHz, 30000 ms)

 Señal Cuadrada (1 kHz, 30000 ms)

En el Apéndice 1 se muestra como se crea un tono.

2. Comprimir los tonos creados a los siguientes Formatos de Audio:

 WMA

 MP3

 FLAC

En el Apéndice 2 se describe como se comprime Archivo de Audio.

3. Por medio del espectro de frecuencia contestar las siguientes tablas.

En el Apéndice 3 se describe como ver el espectro de frecuencia.

A) Tono Cuadrado

WAV vs WMA (Timbre)

Formato Frecuencia fundamental(hz) Intensidad (dB)

WAV WMA

WAV vs WMA (Tono Hz)

Formato F₀ F₁ F₂ F₃ F₄ F₅ F₆ F₇ F₈ F₉ F₁₀ F₁₁

(64)

53

WAV vs WMA (Tono db)

WAV WMA

Observaciones:

WAV vs MP3 (Timbre)

WAV MP3

WAV vs MP3 (Tono Hz)

WAV MP3

WAV vs MP3 (Tono db)

WAV MP3

(65)

54

WAV vs FLAC (Timbre)

WAV FLAC

WAV vs FLAC (Tono Hz)

WAV FLAC

WAV vs FLAC (Tono db)

WAV FLAC

Observaciones:

B) Tono Triangular

WAV vs WMA (Timbre)

WAV WMA

WAV vs WMA (Tono Hz)

(66)

55

WAV vs WMA (Tono db)

WAV WMA

Observaciones:

WAV vs MP3 (Timbre)

WAV MP3

WAV vs MP3 (Tono Hz)

WAV MP3

WAV vs MP3 (Tono db)

WAV MP3

(67)

56

WAV vs FLAC (Timbre)

WAV FLAC

WAV vs FLAC (Tono Hz)

WAV FLAC

WAV vs FLAC (Tono db)

WAV FLAC

(68)

57

3.5. Practica 2: Audición

Instituto Politécnico

Nacional

Especialidad

“Acústica”

Escuela Superior de

Ingeniería Mecánica

Eléctrica

Audición

Practica #2.

Alumno:

a No De Boleta: a

Objetivo:

El alumno de la Especialidad de Acústica identifique las características de la Sonoridad que se modifican al variar la frecuencia.

Introducción:

(69)

58

Figura 1.2 Frecuencia

A)

 Onda de mayor frecuencia.

 Más ciclos por unidad de tiempo.

 Tono más agudo.

B)

 Onda de menor frecuencia.

 Menos ciclos por unidad de tiempo.

 Tono más grave.

La frecuencia se mide en Hertz. Un Hz equivale un ciclo por segundo. El oído humano es capaz de percibir sonidos entre los 20 y 20000 Hz (20 KHz).

20 a 500 Hz Tonos Graves

500 a 2 kHz Tonos Medios

2 a 20 KHz Tonos Agudos

 Amplitud, refiere a la altura de la onda y significa la intensidad del sonido. Amplitud cero equivale a silencio, amplitudes pequeñas a sonidos leves y amplitudes altas a sonidos fuertes o intensos.

A)

(70)

59

Figura 1.3 Amplitud

A)

 Onda de menor amplitud.

 Sonido suave.

B)

 Onda de mayor amplitud.

 Sonido más fuerte.

La amplitud se mide habitualmente en decibeles (dB). La escala auditiva varía entre 0 dB (umbral de audición) y 130 dB. Los sonidos superiores a 110 dB producen sensación dolorosa y la exposición permanente a esos niveles provoca la disminución de la capacidad auditiva (sordera parcial/permanente).

Material:

 Pc

 Software generador de tonos “NCH TONE GENERATOR”.

 Software editor de audio libre “Audacity”.

Desarrollo:

1. Crear los siguientes tonos:

 Señal Cuadrada (1Khz 30000 ms)

 Señal Cuadrada (20Khz 30000 ms) A)

(71)

60

2. Por medio del espectro de frecuencia contestar las siguientes tablas

A) Contestar la siguiente tabla:

Señal Cuadrada

Frecuencia fundamental(Hz) Intensidad (dB)

1 KHz 5 KHz 10 KHz 15 KHz 20 KHz

3. Escuchar cada uno de los formatos y responder las siguientes preguntas:

 ¿Qué percibiste a medida que fuiste escuchando los tonos?

A a

 ¿La intensidad de los tonos se mantuvo?

A a

 ¿Qué parámetro de la sonoridad se modifica?

A a

(72)

61

 De los cinco tonos generados, ¿Cuál consideras que es más agudo?

A

A a

 De los cinco tonos generados, ¿Cuál consideras que es más grabe?

A a

(73)

62

3.6. Practica 3: Voz

Instituto Politécnico

Nacional

Especialidad

“Acústica”

Escuela Superior de

Ingeniería Mecánica

Eléctrica

Voz

Practica #3.

Alumno:

a No De Boleta: a

Objetivo:

El alumno de la Especialidad de Acústica reconozca los cambios que sufre la voz (en las características de la Sonoridad), cuando se graba en un formato sin comprimir y se comprime a un formato con pérdidas.

Introducción:

La voz humana