• No se han encontrado resultados

Trabajo de Grado presentado para optar al título de Ingeniero de Sonido

N/A
N/A
Protected

Academic year: 2021

Share "Trabajo de Grado presentado para optar al título de Ingeniero de Sonido"

Copied!
88
0
0

Texto completo

(1)

Liliam Patricia Restrepo Cabanzo, liliam.restrepo@gmail.com

Trabajo de Grado presentado para optar al título de Ingeniero de Sonido

Asesor: Sebastian Lopera Gómez, Especialista (Esp) en Postproducción de audio.

Universidad de San Buenaventura Colombia Facultad de Ingenierías

Ingeniería de Sonido Medellín, Colombia

(2)

Estilo/Style: IEEE (2014)

usando el sistema de reproducción Opsodis.”, Trabajo de grado Ingeniería de Sonido, Universidad de San Buenaventura Medellín, Facultad de Ingenierías, 2017.

Grupo de Investigación en Modelamiento y Simulación Computacional (GIMSC). Línea de investigación en Acústica y Procesamiento de Señales

Bibliotecas Universidad de San Buenaventura

• Biblioteca Fray Alberto Montealegre OFM - Bogotá.

• Biblioteca Fray Arturo Calle Restrepo OFM - Medellín, Bello, Armenia, Ibagué. • Departamento de Biblioteca - Cali.

• Biblioteca Central Fray Antonio de Marchena – Cartagena.

Universidad de San Buenaventura Colombia

Universidad de San Buenaventura Colombia - http://www.usb.edu.co/ Bogotá - http://www.usbbog.edu.co

Medellín - http://www.usbmed.edu.co Cali - http://www.usbcali.edu.co Cartagena - http://www.usbctg.edu.co

Editorial Bonaventuriana - http://www.editorialbonaventuriana.usb.edu.co/ Revistas - http://revistas.usb.edu.co/

(3)

Agradezco principalmente a mis padres, Flor Alba Cabanzo y Raúl Darío Restrepo, y a mi hermana, Laura Marcela Restrepo, por ser mi apoyo incondicional durante todo mi proceso académico en los últimos años y durante mi vida, porque han estado siempre conmigo y son la

razón de que aún haya mucho camino por recorrer. Son mi motor.

A Luis Tafur, por ayudarme en un principio con el desarrollo de la idea del presente trabajo de grado. A Diana Ojeda, la directora del cortometraje, quién me dejó usar su cortometraje para el

desarrollo de este proyecto, mil gracias.

A mi asesor, Sebastián Lopera, por acompañarme y ayudarme en momentos de duda con mi proyecto. A los profesores que han aportado uno o muchos granitos de arena para el fortalecimiento de mis conocimientos durante mi carrera. A los estudiantes, compañeros y

amigos que fueron parte de las pruebas subjetivas, gracias por su tiempo y disponibilidad.

A Lariana, Paul y Evelyn por prestar sus voces para el doblaje del cortometraje. Y en general a todas las personas que de alguna u otra forma hicieron y hacen parte de este

(4)

I. INTRODUCCIÓN ... 11

II. PLANTEAMIENTO DEL PROBLEMA ... 13

A. Antecedentes ... 13

1) Antecedentes sistemas de Reproducción Multicanal ... 13

2) Antecedentes Mezcla Binaural ... 16

3) Antecedentes mediciones de sonoridad ... 17

III. JUSTIFICACIÓN ... 19

IV. OBJETIVOS ... 20

A. Objetivo general ... 20

B. Objetivos específicos ... 20

V. PROBLEMA DE INVESTIGACIÓN ... 21

VI. MARCO TEÓRICO ... 22

A. Percepción del sonido ... 22

B. Audición Binaural ... 22

C. Sonoridad (Loudness) ... 23

1) Medida de la Sonoridad ... 24

a) Método de Zwicker ... 24

b) Recomendación ITU-R BS 1770-4 – Algoritmos para medir la sonoridad de los programas radiofónicos y el nivel de cresta de audio real ... 25

c) Recomendación EBU R-128 ... 26

D. Diseño Sonoro ... 27

1) Elementos de la Banda Sonora ... 27

a) La palabra ... 27

(5)

E. Post-producción de Audio Envolvente ... 28

1) Grabación de audio envolvente ... 28

2) Dolby Digital 5.1 ... 30

3) Mezcla de audio envolvente 5.1 ... 30

4) Sistema de Reproducción 5.1 ... 32

F. Post-producción de Audio Binaural ... 32

1) Grabación Binaural ... 32

2) Mezcla de audio binaural ... 33

3) Sistema de Reproducción Binaural Opsodis (Optimal Source Distribution) ... 35

G. Conceptos de Estadística ... 35

1) Población y muestra ... 36

2) Medidas de tendencia central ... 36

3) Medidas de dispersión ... 37

VII. METODOLOGÍA ... 39

A. Diseño sonoro del cortometraje ... 39

1) Descripción técnica de los movimientos para cada plano ... 40

2) Grabación de foley y efectos ... 43

a. Grabación para Sonido Envolvente ... 43

b) Grabación Binaural ... 44

3) Doblaje ... 44

a) Doblaje para audio envolvente ... 45

b) Doblaje para audio binaural ... 46

(6)

b) Mezcla de audio binaural ... 50

B. Medición de la sonoridad ... 52

1) Medición Objetiva ... 52

a) Desarrollo ... 52

2) Prueba Subjetiva ... 54

a) Definición del lugar para la prueba ... 54

b) Nivel de Escucha ... 55

c) Población y muestra ... 55

d) Método de Evaluación ... 56

VIII. RESULTADOS ... 59

A. Medición Objetiva ... 59

B. Resultados Pruebas Subjetivas ... 60

1) Resultados Percepción de cambios de sonoridad ... 60

2) Resultados Comparación Sonoridad entre 5.1 y Binaural ... 62

IX. DISCUSIÓN ... 64

A. Comparación objetiva de la sonoridad ... 64

B. Comparación subjetiva de la sonoridad ... 65

X. CONCLUSIONES ... 67

REFERENCIAS ... 69

(7)

Tabla II. Perspectiva para cada escena del cortometraje ... 39

Tabla III. Diagrama técnico de los planos del cortometraje ... 40

Tabla IV. Selección de escenas para la medición de sonoridad ... 53

Tabla V. Orden primera encuesta de la prueba subjetiva ... 57

Tabla VI. Orden segunda encuesta prueba subjetiva ... 57

Tabla VII. Escala de calificación ... 57

Tabla VIII. Orden de escenas presentadas, tercera encuesta ... 58

Tabla IX. Escala calificación en la tercera encuesta ... 58

Tabla X. Comparación de sonoridad entre plugin y algoritmo implementado en matlab para 5.1 59 Tabla XI. Comparación de sonoridad entre plugin y algoritmo implementado en matlab para binaural ... 60

Tabla XII. Medidas de tendencia central para los niveles de sonoridad de muestras de audio 5.1 61 Tabla XIII. Medidas de tendencia central para los niveles de sonoridad de muestras de audio binaural ... 61

Tabla XIV. Medidas de tendencia central para la comparación de sonoridad entre 5.1 y binaural ... 63

Tabla XV. Comparación de diferentes niveles de sonoridad entre 5.1 y binaural para una escena ... 64

Tabla XVI. Coeficientes filtro previo en el algoritmo ... 74

Tabla XVII. Coeficientes de ponderación en el algoritmo ... 74

Tabla XVIII. Coeficientes de ponderación para cada canal de audio ... 74

(8)

Fig. 2 Arreglo del "Equidome". Plano frontal ... 16

Fig. 3 Curvas isofónicas ... 23

Fig. 4 Diagrama de bloques del medidor de sonoridad multicanal ... 25

Fig. 5 Configuración de parlantes típica de Dolby Digital AC-3 ... 32

Fig. 6. Cabeza binaural para grabación donde (1) es el plano horizontal y (2) el plano medio ... 33

Fig. 7 Panoramizador Binaural de Logic Pro. Procesador psicoacústico capaz de simular posiciones arbitrarias de la fuente de sonido ... 34

Fig. 8 Panorama 5 Wave Arts. Herramienta especializada para crear escenas de audio 3-D realista utilizando sonido estéreo regular ... 34

Fig. 9 Desplazamiento por banda de frecuencia del Opsodis ... 35

Fig. 10 Grabación de foley – pasos niña ... 43

Fig. 11 Grabación de foley para escenas de interrogación ... 44

Fig. 12 Doblaje Maria Antonieta (niña) ... 45

Fig. 13 Grabación doblaje joven ... 46

Fig. 14 Grabación doblaje madre ... 47

Fig. 15 Sesión de Mezcla 5.1 ... 50

Fig. 16 Sesión de mezcla binaural ... 52

Fig. 17 Vista en planta de la sala de grabación Estudio A y configuración de la prueba. ... 56

Fig. 18 Montaje Prueba Subjetiva Sala de grabación Estudio A ... 56

Fig. 19 Resultados de percepción de sonoridad en audio 5.1 ... 61

Fig. 20 Resultados de percepción de sonoridad en audio binaural ... 62

(9)

RESUMEN

El presente proyecto pretende evaluar y comparar la sonoridad de manera objetiva y subjetiva en un cortometraje entre la mezcla desarrollada para audio envolvente 5.1 y binaural. Para esto se propuso medir la sonoridad del cortometraje de acuerdo con la recomendación ITU-R BS.1770-4 que especifica los algoritmos para medir la sonoridad multicanal en un programa de audio y comparar estos resultados con pruebas subjetivas en individuos que tengan un conocimiento en el área audiovisual. A partir de esta comparación se buscó determinar si los individuos pueden identificar cambios de sonoridad entre las diferentes muestras de audio del cortometraje cuando se presentan en el sistema de reproducción Opsodis.

La comparación objetiva entre el algoritmo utilizado en el presente trabajo y el plugin de medición de sonoridad arrojó diferencias entre -2 y -3 unidades de sonoridad entre ambos métodos de medición, mientras que en la comparación objetiva entre la mezcla de audio 5.1 y la mezcla binaural – usando el algoritmo –, se observaron diferencias de aproximadamente -1 unidad de sonoridad.

Las pruebas subjetivas mostraron resultados donde los cambios de sonoridad, en mezcla de audio 5.1 y mezcla binaural, son percibidos por los individuos a partir de 2 unidades de sonoridad por encima y por debajo de un nivel de sonoridad de referencia.

Palabras clave: Sonoridad, Sistema Opsodis, Binaural, Sonoridad objetiva, Sonoridad

(10)

ABSTRACT

This project intends to evaluate and compare the loudness in an objective and subjective way in a short film between de sound mix developed for surround sound 5.1 and binaural. For this purpose, it was proposed to measure loudness in the short film according to the Recommendation ITU-R BS. 1770-4 that specifies the algorithms to measure multichannel audio program loudness and compare these results with subjective tests in individuals with knowledge in audiovisual area. From this comparison, we sought to determine if the subjects can identify loudness changes between different audio samples of the short film when played through the Opsodis sound reproduction system.

The objective comparison between the algorithm used in this project and the loudness measurement plugin, showed differences between -2 and -3 loudness units in both measurement methods, whereas in the objective comparison between the 5.1 sound mix 5.1 and the binaural sound mix – using the algorithm -, differences of approximately 1 loudness unit were observed.

Subjective tests showed results where loudness changes, in 5.1 sound mix and binaural sound mix, are perceived by individuals from 2 loudness units above and below a reference loudness level.

(11)

I. INTRODUCCIÓN

Actualmente existen muchos tipos de reproducción sonora multicanal, entre ellas la más común es la estéreo usando dos fuentes de reproducción (canal izquierdo y canal derecho) que permite la percepción de espacialidad de una fuente entre los parlantes [1]. Otro sistema de reproducción muy utilizado, especialmente en la industria del cine es el de sonido envolvente 5.1 que consiste de seis fuentes de reproducción por pares de altavoces que generan una mejor impresión del espacio en el oyente [1]. Por otro lado, la reproducción binaural se ha limitado al uso de audífonos para brindar una percepción del campo sonoro de manera tridimensional sin embargo, el uso de audífonos restringe a la escucha individual y la simulación del espacio no es completamente fiel [2], pues la percepción de la distancia y localización de los sonidos puede cambiar. Frente a esto, recientemente se han hecho avances en la reproducción tridimensional usando arreglos de parlantes para optimizar la percepción acústica del espacio produciendo una representación mucho más realista sobre un área de escucha más grande [3].

El uso de técnicas grabación binaural han sido estudiadas pero no son muy abordados actualmente en proyectos audiovisuales debido a que su viabilidad se puede ver limitada por los sistemas de reproducción binaurales disponibles que no sea el uso de auriculares, mientras que la grabación de sonido envolvente 5.1 se realiza mediante técnicas tradicionales de grabación estéreo con la utilización de 2 o 3 micrófonos ubicados particularmente para dar una “imagen sonora” cuando se reproduce en un sistema de múltiples parlantes.

(12)

Por otra parte, la industria audiovisual, especialmente la radiodifusión en televisión, en temas operativos se enfoca principalmente en los niveles de señales a uno que equilibre el nivel general de la señal con la necesidad de mantener un volumen de audio consistente (sonoridad) en toda su programación [4]. La unión internacional de comunicaciones ha desarrollado algoritmos que permiten medir la sonoridad en programas multicanal para garantizar un nivel constante de audio y evitar molestias al oyente cuando por ejemplo cambia entre programación y percibe saltos de volumen o inconsistencias entre diferentes programas y canales que esté viendo.

(13)

II. PLANTEAMIENTO DEL PROBLEMA

Una de las quejas más comunes de la población cuando están viendo televisión son los cambios de nivel de sonido que perciben cuando cambian entre programas, para dar solución a este interrogante, varias organizaciones internacionales han creado estándares y directrices que le permitan a los programadores regular la sonoridad, o intensidad de sonido, con que emiten toda su programación incluyendo anuncios comerciales o programación musical. Frente a esto, también se han desarrollado medidores de sonoridad como recurso para regular esta medida y evitar cambios abruptos en el nivel de sonido transmitido y tener un ajuste constante de nivel de volumen.

Por otro lado, el avance en la creación de contenidos audiovisuales que se escuchen o se asemejen a la realidad, ha llevado a que de manera experimental se desarrollen proyectos audiovisuales con técnicas de grabación binaural pero debido a que su reproducción comúnmente es por medio de audífonos, este tipo de proyectos no son viables para la reproducción comercial, esto está cambiando con el desarrollo de tecnologías de reproducción como el Opsodis, para evitar el uso de auriculares y aun así disfrutar de un campo sonoro tridimensional.

Debido a que el desarrollo de proyectos binaurales audiovisuales comienza a ser atractivo, también es necesario velar porque su reproducción sea correcta y compatible con los niveles de sonoridad ya establecidos para su difusión en el ámbito comercial, especialmente cuando se utiliza un sistema de sonido externo que permite reproducir formatos de audio envolvente 5.1 y binaural, enriqueciendo así la experiencia del espectadoral ver una pieza audiovisual, se acerque a una inmersión sonora tridimensional.

A. Antecedentes

1) Antecedentes sistemas de Reproducción Multicanal

(14)

reproducción sonora que aborden la necesidad de emular la realidad para presentar una imagen sonora más real, precisa y natural.

Los primeros formatos de audio multicanal fueron inicialmente desarrollados a inicios de los años 1950 para el cine; en ese entonces, el sonido estereofónico era aún nuevo para el público y fue promovido – por la industria del cine que se veía amenazada por el crecimiento de la televisión - a la par con los nuevos formatos de largas pantallas para la imagen. El sonido para películas comenzó con un mínimo de cuatro canales o pistas de audio, estos canales de sonido eran grabados en las bandas del material magnético del film. Los proyectores estaban equipados con unidades de reproducción individuales y los cines se equipaban con amplificadores y parlantes adicionales.

Las películas estéreo que se presentaban en cine tenían varios parlantes en el frente y había un canal adicional entre los parlantes traseros de los cines, éste último al principio fue conocido como el canal de efectos y era reservado para los efectos dramáticos ocasionales. Durante las décadas de 1960 y 1970, muchos continuaron experimentando con este canal de efectos hasta el punto de utilizarlo incluso para agregar sonidos de ambiente para envolver a la audiencia. Esta aplicación llegó a ser conocida como “sonido envolvente” y el canal de efectos como “canal envolvente.”

Mientras la industria del cine se asociaba con la industria de la televisión y las pantallas se volvían más pequeñas, hacia finales de los años 80 los laboratorios de Dolby tomaron la aplicación del audio digital hacia el sonido de las películas de 35mm, desarrollando la configuración 5.1 que se compone de 5 canales de audio discretos de rango completo más un sexto canal para los efectos de baja frecuencia y hasta ahora es la configuración de parlantes que satisface mejor los requisitos para presentar una película [5].

(15)

de 3 líneas de parlantes ubicados en un cuarto de la siguiente manera: para la línea superior se posicionan 9 parlantes, en la línea media hay 10 parlantes y para la línea baja se colocan 3 parlantes. Este sistema fue desarrollado para reproducir una inmersión natural y tridimensional del campo sonoro manteniendo una mayor presencia y aproximación de la realidad, sin embargo es muy complejo y su uso es enfocado a cines [6]. Su configuración se puede apreciar en la Fig. 1.

Fig. 1 Configuración sistema multicanal 22.2

Fuente: K. Hamasaki, S. Komiyama, H. Okubo, K. Hiyama y W. Hatano, «5.1 and 22.2 Multichannel Sound Productions Using an Integrated Surround Sound Panning System.,» de 117th Audio Engineering Society Convention - Paper 6226, 2004, pp. 1-11

(16)

effects, para bajas frecuencias menores a 120Hz) [7]. Todos los altavoces se ubican a una misma distancia del oyente y en un cuarto pequeño como se muestra en la Fig. 2.

Fig. 2 Arreglo del "Equidome". Plano frontal

Fuente: J. L. Barbour, «The Equidome, a Personal Spatial Reproduction Array,» de 132th Audio Engineering Society Convention - Paper 8598, 2012, pp. 1-7.

2) Antecedentes Mezcla Binaural

El desarrollo de proyectos relacionados con captura y mezcla de audio binaural vienen desde los años 70, inicialmente de manera musical con un disco realizado por Zucarelli Labs [8], utilizando por primera vez la holofonía. Luego de esto, en 1982, la banda Pink Floyd llevó a cabo un experimento parecido en su álbum “The Final Cut” para reproducir audio tridimensional a partir de sonido estéreo [9] y la banda concluyó que con el sistema binaural identificaban imágenes sonoras que permitían el posicionamiento de las fuentes sonoras. [10]

(17)

El Opsodis (Optimal Source Distribution) es un sistema de reproducción sonora que ha sido investigado ampliamente desde 1996 hasta el presente en el desarrollo de sistemas de sonido 3D. En la universidad de Southampton se ha expuesto un proyecto con el objetivo de desarrollar algoritmos basados en el principio de Opsodis para simular el audio 3D. Lo que pretendía era adaptar la tecnología desarrollada por el Instituto de Investigación de vibraciones y sonido a productos de consumo casero como televisores, videojuegos e incluso para autos [12].

3) Antecedentes mediciones de sonoridad

La sonoridad es un parámetro subjetivo del sonido que depende de su intensidad y frecuencia, está relacionada con las curvas de sonoridad planteadas por Fletcher y Munson que especifica las combinaciones de nivel de presión sonora y las frecuencias de tonos puros continuos que son percibidos igualmente fuerte por oyentes humanos, donde el nivel de sonoridad se mide en fonios. La medición de este parámetro es realmente beneficioso en muchas áreas como la televisión, donde siguiendo el interrogante frente a la necesidad de un ajuste constante de la señal de audio, se han explorado varios métodos de medición objetiva, tales como los métodos de Zwicker, Moore y Glasberg [13] con el fin de aplicar estos modelos para la elaboración de medidores comerciales.

Históricamente, los operadores de audio usaban sus oídos para equilibrar y controlar los niveles de sonido de radiodifusión, instintivamente normalizaban la sonoridad percibida de distintos programas, aunque era un ambiente de sonoridad normalizado esto llevó a años de quejas de los espectadores hacia las compañías de televisión por anuncios excesivamente ruidosos y en respuesta a esto es que la Unión Internacional de Telecomunicaciones, en el 2006, publicó una recomendación (ITU-R BS 1770) que establece los algoritmos para una medida estándar de la sonoridad que muestra una aproximación a la sonoridad que percibe el oído humano [14].

(18)
(19)

III. JUSTIFICACIÓN

El desarrollo de proyectos audiovisuales con técnicas binaurales aún está en proceso de experimentación, pero eso no quiere decir que no sea atractivo, especialmente cuando la reproducción de archivos de audio que han sido grabados o procesados bajo técnicas binaurales, emulan la sensación de escuchar de forma tridimensional y el campo sonoro se asemeja más a la realidad. Con el desarrollo de estos proyectos, también se abre la necesidad de que la reproducción sea cómoda y amable con el oyente. En un entorno donde los sistemas de reproducción caseros que permiten la sensación envolvente son atractivos para los oyentes, muchas veces se tornan difíciles de configurar o su implementación se ve dependiente del número de parlantes. Sin embargo recientemente se desarrolló un sistema de reproducción compatible con la reproducción de audio binaural.

Con el desarrollo de estos sistemas de sonido, también es necesario evaluar los parámetros sonoros del material que se quiera reproducir. Uno de esos parámetros es la sonoridad, que hace referencia al nivel de intensidad percibida de una pieza sonora. Y como es precisamente el oyente quién se queja de los cambios abruptos de sonoridad entre diferentes programas de audio, su medición y regulación es de gran importancia en el medio comercial.

(20)

IV. OBJETIVOS A. Objetivo general

Comparar la sonoridad en un cortometraje entre una mezcla de audio desarrollada para sonido envolvente 5.1 y binaural usando el sistema de reproducción Opsodis, mediante el método de medición multicanal Leq(RLB) y prueba subjetiva, de acuerdo con la recomendación ITU-R BS.1770-4.

B. Objetivos específicos

• Emplear técnicas de grabación y postproducción de sonido envolvente 5.1 y binaural para la sonorización de un cortometraje que serán comparadas mediante pruebas objetivas y subjetivas.

• Realizar pruebas objetivas que permitan establecer las diferencias de sonoridad entre el audio de un cortometraje en sonido envolvente 5.1 y binaural.

• Diseñar e implementar una prueba subjetiva para determinar si los individuos

(21)

V. PROBLEMA DE INVESTIGACIÓN

Una de las quejas más comunes de la población cuando están viendo televisión son los cambios de nivel de sonido que perciben cuando cambian entre programas, para dar solución a este interrogante, varias organizaciones internacionales han creado estándares y directrices que le permitan a los programadores regular la sonoridad con que emiten toda su programación incluyendo anuncios comerciales o programación musical. Frente a esto, también se han desarrollado medidores de sonoridad como recurso para regular esta medida y evitar cambios abruptos en el nivel de sonido transmitido y tener un ajuste constante de nivel de volumen.

Por otro lado, el avance en la creación de contenidos audiovisuales que se escuchen o se asemejen a la realidad, ha llevado a que de manera experimental se desarrollen proyectos audiovisuales con técnicas de grabación binaural pero debido a que su reproducción comúnmente es por medio de audífonos, este tipo de proyectos no son viables para la reproducción comercial, esto está cambiando con el desarrollo de tecnologías de reproducción como el Opsodis, para evitar el uso de auriculares y aun así disfrutar de un campo sonoro tridimensional.

(22)

VI. MARCO TEÓRICO A. Percepción del sonido

El oído humano percibe una sensación producida por las ondas sonoras que se transmiten por un medio físico y se traducen en información en el cerebro sobre lo que se está escuchando. A su vez la audición humana ubica los sonidos que escuchamos, esto debido a que los humanos poseemos dos oídos ubicados a la misma altura que permiten determinar la localización de una fuente sonora en una determinada posición [2].

Sin embargo, existen tres factores importantes que se usan para identificar la posición de los sonidos que están alrededor del sujeto. “El primero y probablemente el más importante es la diferencia de los tiempos de llegada del sonido a cada oído, seguida por las diferencias de nivel (intensidad) entre los oídos para sonidos de alta frecuencia, es decir, aquellos que superan los 2000 Hz, y finalmente están los efectos independientes de filtrado desde el oído externo” [15] o en otras palabras, es el efecto producido por la combinación de varios sonidos de diferente intensidad en el que el sonido más fuerte enmascara (cubre) al más suave y por lo tanto sólo se escucharía el sonido de mayor intensidad.

B. Audición Binaural

La audición binaural se refiere a la percepción del sonido por los dos oídos, esto no sólo permite percibir la información de frecuencia e intensidad de una señal sonora sino también localizar de donde proviene dicha fuente sonora [16].

Las diferencias de tiempo y de intensidad que hay entre una señal de audio que llega a un oído y al otro, permiten que el cerebro localice la fuente sonora. Algunas de las ventajas de la audición binaural son [16]:

• Mejor entendimiento en los ambientes ruidosos. • Localización de la fuente del sonido.

(23)

La localización se debe determinar a partir de una dirección y de una distancia, se establecen planos característicos a la hora de estudiar la localización, estos planos son el frontal, el medio y el horizontal [17].

C. Sonoridad (Loudness)

La sonoridad puede ser definida como “un atributo de un sonido que cambia a medida que la intensidad del sonido varía” [18], y en otros términos puede decirse que la sonoridad es la percepción de la intensidad subjetiva del sonido.

Al ser un parámetro subjetivo del sonido, la sonoridad también es una medida expresada en fonios, en donde un fonio es la sonoridad de un tono 1kHz a 40dBSPL [18]. Esto quiere decir que la sonoridad no sólo depende de la intensidad de un sonido, sino también de su frecuencia. El trabajo de Fletcher y Munson sobre la sonoridad los llevó a plantear unas curvas para crear una escala de sonoridad que se relacionara con la frecuencia y el nivel de presión sonora [19], que se puede apreciar en la Fig. 3.

Fig. 3 Curvas isofónicas

(24)

Estas curvas han sido adoptadas como estándar internacional ISO 226:2003 y especifica las combinaciones de nivel de presión sonora y las frecuencias de tonos puros continuos que son percibidos igualmente fuerte por oyentes humanos, donde el nivel de sonoridad se mide en fonios que tienen el mismo valor numérico que el nivel de presión sonora en decibeles de un sonido de referencia [20].

1) Medida de la Sonoridad

La información de las curvas isofónicas aplica únicamente para tonos puros y cuando la fuente del sonido está directamente frente al oyente [20], sabiendo que los oídos reciben información sonora desde varias direcciones y que estas señales sonoras también puede ser música u otro tipo de programación, se evidencia la necesidad de medir o controlar el nivel de sonoridad en otras aplicaciones como transmisiones de radio o televisión donde el contenido de la señal de audio cambia constantemente entre música y diálogo, o una combinación de los dos, y también puede incluir efectos de sonido y ambiente. Estos cambios en el contenido de la señal pueden resultar en cambios dramáticos en la sonoridad percibida por el oyente [21].

a) Método de Zwicker

(25)

b) Recomendación ITU-R BS 1770-4 – Algoritmos para medir la sonoridad de los programas radiofónicos y el nivel de cresta de audio real

Considerando que un espectador u oyente desea que el nivel de sonoridad sea uniforme y teniendo en cuenta que en aplicaciones de radiodifusión y televisión, el contenido del material de audio puede cambiar entre música, la palabra y efectos sonoros, y que estos cambios pueden alterar la sonoridad subjetiva, esta recomendación especifica los algoritmos de audio con el propósito de determinar la sonoridad de los programas de audio que se transmiten.

La base de la recomendación es un filtro de ponderación RLB (Revised Low-frequency B-curve) y una medida de la media cuadrática Leq. El filtro RLB era la mejor solución para señales mono continuas, sin embargo como los programas de emisión puede contener señales mono, estéreo y multicanal es necesario un valor de sonoridad único sin importar el número de canales de audio [23]. El diagrama de bloques que presenta el algoritmo para la medición de la sonoridad multicanal se puede observar en la Fig. 4.

Fig. 4 Diagrama de bloques del medidor de sonoridad multicanal

Fuente: International Telecommunication Union, ITU-R. BS. 1770-4 Algorithms to measure audio programme loudness and true-peak audio level, Ginebra:ITU, 2015.

(26)

filtrado, se evalúa el valor cuadrático medio y finalmente se suman los canales para medir la sonoridad aplicando la ecuación (1):

𝑆𝑜𝑛𝑜𝑟𝑖𝑑𝑎𝑑 = −0,691 + 10𝐿𝑜𝑔 !𝐺!. 𝑍! [𝐿𝐾𝐹𝑆], (1)

Donde 𝐺! corresponde a los coeficientes de ganancia de los canales y 𝑍! es el valor cuadrático medio de cada canal. Los detalles de coeficientes de las etapas de filtro, coeficientes de ponderación de canales y la fórmula de 𝑍! pueden verse en el Anexo 1.

La sonoridad es indicada en unidades LKFS (Loudness K-weighted Full Scale) que es la sonoridad (el nivel) ponderada en K a escala completa. Este filtro de ponderación básicamente “construye un puente entre la impresión subjetiva y la medida objetiva” de la sonoridad [24].

c) Recomendación EBU R-128

La European Broadcast Union toma como base los algoritmos de la recomendación ITU 1770, pero tiene en cuenta cierto tipo de programas que pueden contener largas secuencias con bajo nivel de audio, es decir donde posiblemente se establezcan intervalos de silencio muy largos [25].

Esta recomendación no sólo propone que se use el nivel medio de sonoridad, sino también un rango de sonoridad y un nivel máximo de cresta real para normalizar las señales de audio en la radiodifusión, cumpliendo los límites técnicos en la cadena de la señal, al igual que las necesidades artísticas de cada programa o estación dependiendo de su género y la audiencia destino [25].

(27)

programas de contenido musical y comerciales estén “alineados en sonoridad” [25]. El nivel objetivo de sonoridad es de -23LUFS al cual deben estar todos los programas.

D. Diseño Sonoro

El diseño de sonido es el proceso de creación y mezcla del audio para un determinado proyecto sonoro, en el ámbito audiovisual se busca una interacción entre la imagen y el sonido de forma coherente en la ubicación de las fuentes sonoras y en el momento adecuado de manera que el espectador se involucre en la escena que está viendo y obtenga la experiencia que se tiene por objetivo proporcionar cuando se crea un ambiente sonoro. “La postproducción de sonido es la fase final de la elaboración de la banda sonora que consiste en seleccionar, organizar y manipular los diversos elementos sonoros que se utilizan en una producción audiovisual” [26].

1) Elementos de la Banda Sonora

“La banda sonora debe entablar una relación activa con la imagen” [26], es por eso que hay varios elementos que la componen.

a) La palabra

Expresión verbal en forma de comentario, de voces o de diálogos sincronizados. Puede captarse mediante micrófonos en el lugar de rodaje o haciendo un doblaje en estudio, de manera que la voz se sincronice con la imagen a partir de lo grabado como sonido directo. El doblaje también se puede utlizar cuando una producción requiere el cambio del idioma original, técnicamente se conoce como ADR (Automated Dialogue Replacement - reemplazo automatizado de diálogos) [26].

b) La música

(28)

o puede parecer en la imagen sin que surja desde la acción, usualmente se inserta con el fin de conseguir efectos estéticos (música no diegética)[27].

c) Efectos sonoros y ambientales

Sonidos que contribuyen a la sensación de realismo de la imagen ya que son específicos de cada escena y pueden ser obtenidos a través de librerías de sonido creados a partir de la grabación durante el rodaje o efectos previamente grabados y procesados. También en esta categoría se encuentra el Foley, que es la grabación de sonidos especificos en estudio después del rodaje y cuya sincronía con la acción es de gran importancia. Los ambientes son conocidos como “wildtracks” que son todos los ruidos homogéneos y no sincrónicos con la imagen que acompañan a la acción y definen el espacio [27].

d) El silencio

El silencio está relacionado con algún sonido que es más fuerte que el “silencio” del que estamos conscientes, por ejemplo un “room tone” [28]. Se utiliza como pausa entre diálogos, ambientes, sonidos y música o como recurso de expresión pues puede añadir dramatismo, expectativa e interés [27].

E. Post-producción de Audio Envolvente

El uso del audio envolvente o surround tiene la intención de envolver a la audiencia en el campo sonoro de un proyecto audiovisual mejorando su experiencia sensorial a través de la reproducción con parlantes que rodean al oyente [27].

1) Grabación de audio envolvente

(29)

técnicas [29], incluso se han configurado arreglos de más de 3 micrófonos para lograr mayor espacialidad y envolvimiento [29], un resumen de estas configuraciones puede apreciarse en la tabla I:

TABLA I. TÉCNICAS ESTÉREO Y SURROUND

Técnica de micrófono Configuración Posición

XY

2 micrófonos cardioides con cápsulas coincidentes en un angulación de 90º-135º

Par Espaciado 2 micrófonos cardioides u onmidireccionales separados 1-3 metros.

ORTF 2 micrófonos cardioides espaciados 17cm con un ángulo de 110º),

(30)

Hamasaki Square 4 micrófonos bidireccionales cuyos lóbulos positivos apuntan al centro

Nota: Facultad de Bellas Artes UNLP, «Técnicas de Microfoneo de Sala,» [En línea]. Available: https://goo.gl/RxmRnS.

2) Dolby Digital 5.1

Dolby Digital también es conocido como AC-3. Se compone de 6 canales de audio discretos – Izquierdo (Left), Central (Center), Derecho (Right), Izquierdo envolvente (Left Surround), Derecho envolvente (Right Surround) y Canal de Bajas frecuencias (Low-frequency effects), el cual lleva el contenido por debajo de los 120Hz [30]. Usando la compresión AC-3, que es un sistema de codificación-decodificación que preserva la información en el rango audible humano entre 20Hz y 20KHz, eliminando la información redundante [30] y así los 6 canales son codificados en un sólo archivo de información para imprimirse a la película. Para la proyección, esta información es decodificada de nuevo a sus 6 canales originales y llevados por el sistema de reproducción apropiado. La mayoría de las películas digitales y DVDs son codificados usando este formato.

3) Mezcla de audio envolvente 5.1

(31)

La principal función del canal central es proporcionar un anclaje de los elementos claves de la producción, especialmente los diálogos pero a su vez puede contener elementos como música o efectos sonoros específicos de manera muy sutil. En los canales laterales frontales se encuentra una pequeña divergencia junto con el canal central, pero son más enfocados a los efectos sonoros transientes o no transientes y en ocasiones a contenido musical. Los canales laterales traseros se centran en el contenido de sonidos de ambientes y efectos sonoros que permiten que el oyente sienta la envolvencia dentro del entorno de la imagen ya que proveen la información de la posición espacial. Ahora frente al canal de bajas frecuencias (LFE, Low-frequency effects), éste se ha referido como el canal de ‘boom’ pues se usa para agregar efectos dramáticos con contenidos en bajas frecuencias [32].

La ubicación de estos elementos sonoros en los canales de audio para ser reproducidos en el sistema 5.1, se puede lograr con una de herramienta incluida en la versión 10HD del software Protools. Dicha herramienta permite realizar el paneo (panning), que se refiere a ubicar un sonido en un punto específico del campo sonoro controlando qué tanto debe reproducirse en cualquiera de los parlantes [33]. Aunque esto está abierto a interpretación y depende de qué tipo de narrativa tiene el contenido audiovisual, existen prácticas de paneo comunes para crear un buen ambiente sonoro.

Usualmente en los canales frontales (Left, Center, Right) se ubican todo lo que provenga de una fuente monofónica como diálogos y foley (efectos sonoros), aunque éste último puede ser archivo estéreo y se ubicar en los canales principales estereofónicos (Left, Right) [33].

En los canales envolventes (Left Surround, Right Surround) se ubica todo lo que lleve a dar una sensación de un espacio amplio cuando se quiera rodear al oyente o crear una gran profundidad en el campo sonoro, de esta forma, se ubican los ambientes, efectos sonoros y música [33].

(32)

4) Sistema de Reproducción 5.1

Al igual que los 6 canales de audio para el formato Dolby Digital, el sistema de reproducción 5.1 consta también de 6 parlantes (Left, Center, Right, Left Surround, Right Surround, LFE - Subwoofer) configurados como se observa en la Fig. 5.

Fig. 5 Configuración de parlantes típica de Dolby Digital AC-3

Fuente: R. Tozzol, Protools Surround Sound Mixing, 2ª edición ed., Milwaukee: Hal Leonard Books, 2011

F. Post-producción de Audio Binaural

Con el surgimiento y reciente desarrollo de productos audiovisuales en 3D, se busca que la grabación y mezcla binaural sea una mejor herramienta para obtener un sonido real y coherente frente a la imagen, de manera que el oyente se pueda situar dentro del campo sonoro con diferentes fuentes localizadas en el espacio [35].

El audio binaural tiene su base en la localización de las fuentes sonoras, esta posición es proporcionada por las diferencias interaurales de tiempo y de intensidad, donde la cabeza humana siendo un obstáculo entre los oídos, actúa como una sombra acústica [36]

1) Grabación Binaural

(33)

dos micrófonos omnidireccionales a ambos lados de una cabeza artificial creando así una imagen estéreo bastante fiel en cuanto a proveer información sobre la distancia y dirección de las fuentes sonoras [37]. En la Fig. 6 se puede apreciar un sistema de grabación binaural donde (1) representa el plano horizontal y (2) el plano medio [38].

Fig. 6. Cabeza binaural para grabación donde (1) es el plano horizontal y (2) el plano medio Fuente: https://goo.gl/3qHDj9

2) Mezcla de audio binaural

Poco es lo que se ha estudiado sobre la mezcla de sonido binaural enfocado a la postproducción para proyectos audiovisuales, sin embargo se deben tener en cuenta los mismo principios usados para la mezcla envolvente, ya que el propósito es recrear la audición humana dentro de un entorno. Es por ello que es importante reconocer la dirección y posición de las distintas fuentes sonoras para generar el sentido de espacialidad que se desea proyectar.

(34)

caracterizar las fuentes sonoras mediantes controles de paneo, tal como se ilustra en las Fig. 7 y Fig. 8 respectivamente.

Fig. 7 Panoramizador Binaural de Logic Pro. Procesador psicoacústico capaz de simular posiciones arbitrarias de la fuente de sonido

Fuente: J. A. Torres Viveros, «Aplicación de técnica de grabación y mezcla binaural para audio comercial y/opublicitario,» Proyecto de Grado, Carrera de Estudios Musicales, Facultad de Artes, Pontificia Universidad Javeriana, Bogotá D.C, 2009.

Fig. 8 Panorama 5 Wave Arts. Herramienta especializada para crear escenas de audio 3-D realista utilizando sonido estéreo regular

(35)

3) Sistema de Reproducción Binaural Opsodis (Optimal Source Distribution)

Es un sistema de reproducción en forma de barra que se compone de un arreglo de 3 pares de altavoces que puede crear una imagen sonora en tres dimensiones. El sistema divide la información en las bandas de frecuencia en cada par de transductores e incluye unos filtros especiales de cancelación del efecto de crosstalk [41].

Los parlantes en el arreglo tienen diferente angulación entre ellos y la distribución de las frecuencias se da así: el par de parlantes en el centro se encargan de reproducir las altas frecuencias y presentan poca angulación, los pares de parlantes en los extremos reproducen las bajas frecuencias y tienen una mayor angulación para evitar la pérdida en dichas frecuencias y los parlantes que están en medio de cada arreglo se encargan de reproducir las frecuencias medias, de esta forma presenta en su totalidad respuesta estable [42], un diagrama de esto puede observarse en la Fig. 9.

Fig. 9 Desplazamiento por banda de frecuencia del Opsodis

Fuente: T. Takeuchi, «3D Sound Reproduction with 'OPSODIS' and its commercial applications,» Institute of Sound and Vibration Research, University of Southampton, Southampton.

G. Conceptos de Estadística

(36)

1) Población y muestra

La población es el conjunto de todos los individuos que porten información sobre el fenómeno que se estudia, por lo general se clasifican en poblaciones finitas e infinitas. La muestra es una parte representativa de la población seleccionado para ser estudiado [43]. Una población infinita es considerada cuando consta de más de 100,000 individuos [44], donde la muestra 𝑛 está dada por la ecuación (2):

𝑛 =

!!!.!.!!

(2)

Y la población finita corresponde a aquella que consta de menos de 100,000 habitantes [44], donde la muestra 𝑛 está dada por la fórmula (3):

𝑛 =

!!. !!! !!!!.!.!.!!.!.!

(3)

De ambas ecuaciones, 𝑁 es el tamaño de la población, 𝑃 es la proporción que se espera encontrar, en caso de desconocerse (P=0,5); 𝑄 = 1 − 𝑃; 𝐸 es el margen de error permitido y 𝑍 es la desviación del valor medio que se acepta para lograr el nivel de confianza deseado [43]. Este valor viene dado por la distribución normal, donde los valores más frecuentes son:

Nivel de confianza 90%; 𝑍 = 1,645 Nivel de confianza 95%; 𝑍 = 1,96 Nivel de confianza 99%; 𝑍 = 2,575

2) Medidas de tendencia central

(37)

• Media aritmética: Es la medida más utilizada, se calcula mediante la suma de todo los valores del conjunto de datos y éste se divide entre la cantidad de los datos recolectados. A pesar de que minimiza el error en la predicción de un valor en el conjunto de datos, su resultado se puede ver afectado por valores extremos causando una medida no tan conveniente

• Mediana: representa el punto central de una serie de datos ordenados de forma ascendente o descendente. Su cálculo no se ve afectado por los valores extremos, por lo que resulta más útil. Hay dos formas de calcularla, pues depende del número de datos. Para un número impar de datos ordenados de menor a mayor o de mayor a menor: la mediana es el valor que queda justo al centro, y para un número par de datos se busca la media aritmética entre los dos valores centrales.

• Moda: esta medida es el valor que se repite con mayor frecuencia dentro del conjunto de datos y no depende de valores extremos. [46]

3) Medidas de dispersión

La dispersión es una medida para describir la variabilidad de un conjunto de valores respecto a su media, de esa forma entre menos disperso sea un conjunto más cerca está del valor medio encontrado [47]

• Dispersión estándar: es la medida que representa la distancia promedio de los datos de la media en un grupo o población. Entre más pequeña sea esta, más cercana está la población a la media [47]. Su cálculo se evidencia en la ecuación (4)

𝜎 = (!!!!)!

!!! (4)

Donde 𝑛 es la cantidad total de datos, 𝑥 es la media y 𝑥! es cada dato del conjunto [48]

(38)
(39)

VII. METODOLOGÍA A. Diseño sonoro del cortometraje

Se escogió el cortometraje, “Love thy Neighbor”, y se comenzó a desarrollar el diseño sonoro plasmado en un documento técnico (ver Anexo 2), a partir de la elección de los efectos sonoros (foley y librería), música, ambientes y doblaje de las voces de los personajes de manera que se analizara la importancia de cada uno de los sonidos de acuerdo con el plano y narrativa de la historia, para la eventual captura de los mismos mediante técnicas tradicionales de grabación estéreo y la técnica de grabación binaural. Se tomó la decisión de dividir el corto en 5 escenas de manera que en cada una de ellas se plasmara una idea diferente para la perspectiva del espectador a medida que vea el cortometraje y pueda sentirse inmerso en cada situación. Debido a que el idioma original del cortometraje es inglés y al no poder tener acceso a las grabaciones originales del mismo, se planteó un libreto con el doblaje al español (ver Anexo 3), donde se especifican los personajes, la situación de cada escena y los diálogos. La tabla II resume el enfoque sobre el cual se tomó la decisión de manejar la perspectiva para cada escena del cortometraje.

TABLA II. PERSPECTIVA PARA CADA ESCENA DEL CORTOMETRAJE

ESCENA LUGAR RESUMEN PERSPECTIVA DEL

ESPECTADOR 1 Sala de

Interrogación

Maria Antonieta se da vuelta para comenzar su interrogatorio a los vecinos que acaban de mudarse al barrio

Vecinos

(frente a Maria Antonieta)

2 Sala de Interrogación

Continúa el interrogatorio, y Maria Antonieta pasea por detrás de los vecinos dejando en contexto lo que está pasando

Vecinos

(Se emula el movimiendo de la niña por detrás de los vecinos) 3 Sala de la casa Alguien golpea la puerta y Maria

Antonieta se dispone a abrir la puerta cuando encuentra un joven en la puerta

Maria Antonieta (Frente al joven que tocaba la

(40)

Interrogación Antonieta tiene algo más a su favor, una grabación del juguete como evidencia

(Frente a Maria Antonieta)

5 Sala de la casa La madre interrumpe a su hija en medio del interrogatorio, se disculpa con los vecinos y algo inesperado sucede

Maria Antonieta (en el momento en que entra la

madre) – Vecinos (frente a la madre)

1) Descripción técnica de los movimientos para cada plano

Personajes: niña (Maria Antonieta), vecinos, madre, marioneta, joven Lugar en que se desarrolla el cortometraje: sala de una casa.

En la tabla III, se presenta un diagrama que muestra en detalle cada plano del cortometraje, en donde la perspectiva del plano o el punto del oyente están representado por el círculo negro.

TABLA III. DIAGRAMA TÉCNICO DE LOS PLANOS DEL CORTOMETRAJE Plano/Duración

(minuto:segundo)

Descripción del plano Diagrama

(41)

2) 1:05 – 1:25 La niña está de pie al lado derecho de los vecinos mientras vierte un poco de café en una taza, comienza a hablar a medida que camina por detrás de los vecinos hasta llegar el lado izquierdo de ellos donde finaliza momentáneamente su diálogo

3) 1:25 – 1:42 La niña camina hacia su posición inicial frente a los vecinos al otro lado de la mesa donde continúa con su diálogo

(42)

5) 1:47 – 2:38 En la puerta la niña habla con el joven predicador por un momento.

6) 2:38 – 2:50 La niña despide al joven predicador y cierra la puerta, luego regresa a su silla frente a la mesa, y desde afuera el joven golpea la ventana, la niña lo ignora y vuelve a su posición inicial.

7) 2:50 – 3:50 La niña continúa su interrogatorio a los vecinos desde el otro lado de la mesa

8) 3:50 – 3:58 La madre interviene en medio del interrogatorio, regañando a la niña por la situación en que se encuentra.

(43)

9) 3:58 – 4:24 La madre se disculpa con los vecinos por el comportamiento de su hija y se dirige a la silla que ocupaba la niña hace unos momentos. Sentada frente a los vecinos, al igual que su hija, comienza un interrogatorio hacia ellos.

2) Grabación de foley y efectos

a. Grabación para Sonido Envolvente

Los efectos de Foley enunciados en el Anexo 2 fueron grabados individualmente en el estudio A de la Universidad de San Buenaventura al igual que los estudios Reaktor en la ciudad de Medellín. En ambos casos, el micrófono utilizado para la grabación fue un AKG 414 y un Sennheiser ME66, éste último utilizado únicamente en el estudio A. La grabación se hizo en track monofónico (ver Fig. 10).

Posteriormente se realizó una edición preliminar ubicando cada uno de los efectos en sincronía con la imagen.

(44)

b) Grabación Binaural

La grabación de los efectos sonoros se realizó igualmente en el estudio A haciendo uso de un prototipo de cabeza binaural, para esta grabación los canales son estéreo y el proceso de captura de cada efecto se realizaba de acuerdo con la perspectiva planteada para cada escena y realizando el movimiento de los objetos hacia la cabeza binaural con el fin de evocar la acción tal cual la persona escucharía si estuviera inmersa en cada escena (ver Fig 11).

Fig. 11 Grabación de foley para escenas de interrogación

3) Doblaje

El idioma original del cortometraje “Love Thy Neighbor” es inglés, sin embargo junto a la directora y en vista de la falta de las capturas originales, se tomó la decisión de realizar el doblaje al español para los cuatro personajes de la historia y su eventual captura bajo técnica binaural y técnicas para audio envolvente.

(45)

inconvenientes frente a la disponibilidad de la cabeza binaural y la coordinación de tiempo de las personas que grabarían las voces para el cortometraje, se tomó la decisión de realizar la grabación con cada técnica de forma separada.

a) Doblaje para audio envolvente

La captura de voces en canales monofónicos se realizó en el estudio A de la Universidad de San Buenaventura usando el micrófono Neumann KMS 105 y una pantalla anti-viento, a continuación se detalla cada uno de los personajes del corto y las personas que ayudaron con el doblaje:

• Maria Antonieta (niña): Evelyn Ramírez

• Joven predicador / Marioneta: Andrés Paul Zúñiga • Madre: Lariana Martínez

El proceso de captura de doblaje (Fig. 12) tuvo especial cuidado debido a que debía tener sincronía con los movimientos de labios y el tiempo estimado para cada frase además de evocar las emociones de los personajes conforme a la historia del cortometraje.

(46)

b) Doblaje para audio binaural

Al igual que la grabación para 5.1, la captura del doblaje se realizó en el estudio A. Con uso de la cabeza binaural, el proceso de grabación fue algo diferente para cada personaje y de acuerdo con cada escena. Se tomó como referencia la perspectiva de cada escena del cortometraje con el fin de emular directamente desde la grabación la ubicación del personaje y cómo el espectador escucharía, se realizaron tomas experimentales cambiando la posición desde dónde se capturaría cada una de las voces, una descripción detallada de cada personaje se evidencia a continuación

Joven Predicador:

• Escena 3: la perspectiva para este caso es desde la posición de la niña, en la que el joven está frente a ella, la captura también emula esta posición haciendo la grabación frente a la cabeza binaural, tal como se muestra en la Fig. 13.

Fig. 13 Grabación doblaje joven

Madre de la niña

(47)

Fig. 14 Grabación doblaje madre

El personaje de Maria Antonieta fue el único que no pudo doblarse con la cabeza binaural debido a conflictos con la disponibilidad del prototipo de la cabeza binaural, es por eso que durante los procesos de edición y mezcla sólo se utiliza el audio grabado con la técnica para audio envolvente

4) Montaje y Edición de Audio

Durante este proceso y para ambas sesiones (5.1 y binaural) de audio se realizó la sincronía de los efectos de foley y diálogos frente al video. Una vez hecho esto, se realizó la elección de efectos de librería que apoyaran algunas acciones (ver Anexo 2) dentro del cortometraje al igual que los ambientes que acompañan cada escena, que para el caso sólo se utilizaron 3 tipos de ambiente: un room tone para las escenas de interrogación donde destacaba el silencio, ambiente residencial dentro de casa y ambiente residencial externo. Con uso de estos ambientes, fue posible brindar la información de ubicación de cada escena y permiten la inmersión dentro de la misma.

5) Mezcla de Audio

(48)

a) Mezcla de audio envolvente 5.1

Con el material editado se comenzó el proceso de mezcla en formato 5.1 con el software Pro Tools 10 HD en el que se inicia una pre-mezcla de niveles y distribución espacial de los sonidos de acuerdo con la imagen y de acuerdo a cada escena siempre respetando la idea narrativa de la historia y la perspectiva planteada en el diseño sonoro. Luego, se realizó una distribución de los sonidos en los diferentes canales de audio: las voces en los parlantes centrales, los ambientes distribuidos en los parlantes surround al igual que la música y los efectos sonoros se distribuyeron en los parlantes de acuerdo con la procedencia de la fuente sonora en cada una de las escenas.

Con el fin de mantener la idea narrativa del cortometraje y la perspectiva en cada una de las escenas, algunos sonidos fueron distribuidos de acuerdo con su procedencia, así:

• Escena 1

Los diálogos que para el caso son solo de la niña fueron ubicados en el parlante central con porcentaje a los laterales. Los efectos de foley tuvieron automatización de espacialidad para simular la acción de los objetos en la escena. La música fue mezclada en 5.1 pero no llevando mucho porcentaje al canal LFE pues no era necesario.

• Escena 2

Durante esta escena la niña camina alrededor de los vecinos, en este caso, los diálogos tuvieron una automatización a lo largo de los canales central, laterales y surround para generar el movimiento y procedencia de la voz de acuerdo con la ubicación de la niña. La automatización también se realizó con los efectos de foley (pasos).

• Escena 3

(49)

configuración en 5.0 generando la inmersión necesaria. Los diálogos se mantuvieron en los canales centrales ya que la perspectiva no cambia y tampoco hay movimiento. Durante esta escena se hace uso de música diegética proveniente del reproductor de la madre, para este caso, el nivel fue un poco más bajo, además de una ecualización sobre este canal para generar la sensación de escucha a través de audífonos. Los efectos también se ubicaron de acuerdo con la procedencia del sonido.

• Escena 4

En esta escena se vuelve a la sensación de estar en una sala de interrogación, de nuevo el ambiente es el principal elemento de inmersión, se generó espacialidad y mantiene su configuración 5.0 en los canales de reproducción. Los diálogos, que para el caso son los de la niña y la marioneta, se ubican en los canales centrales pues la perspectiva de la escena así lo requiere, al igual que los efectos de foley.

• Escena 5

(50)

Fig. 15 Sesión de Mezcla 5.1

b) Mezcla de audio binaural

Con el material editado se comenzó el proceso de mezcla en formato binaural con el software Pro tools 10 HD en el que se inicia una pre-mezcla de niveles. En este caso se procuró mantener los mismos niveles y ubicación de las fuentes tal como se realizó durante la mezcla en 5.1. Se utiliza el canal de audio de la niña grabado para audio envolvente.

Ya que esta sesión es tipo estéreo, cada uno de los planos sonoros tuvo procesamiento con el plug-in Panorama 5 tomando ventaja de sus atributos de reverberación que permitían la sensación de ubicación y espacialidad de las fuentes sonoras.

• Escena 1

En el ambiente, la fuente fue ubicada en la posición del espectador para mantener la sensación de inmersión en la escena. Los diálogos que para el caso son solo de la niña fueron ubicados en la parte central, con algo de reverberación para mantener la idea narrativa de la escena. Los efectos de foley también se ubicaron de acuerdo con el lugar de procedencia de cada sonido.

(51)

Los ambientes mantienen su posición al igual que la escena 1. Durante esta escena la niña camina alrededor de los vecinos, frente a esto, desde la captura del diálogo ya se estaba emulando el movimiento del personaje, en este caso se quiso dar prioridad a la grabación experimental y no se utilizó en alto porcentaje el plug-in Panorama 5, esto con el fin de comparar la captura con la automatización entre ambos formatos. Los efectos de foley tampoco tuvieron un procesamiento en el plug-in, ya que la grabación de estos se realizó desde la misma ubicación que tomaron en la escena.

• Escena 3

En esta escena hay un cambio de ambiente, sin embargo se trata de mantener la misma posición anterior para continuar con la inmersión en la escena. Los diálogos se ubicaron en posición frontal, pero sin reverberación pues ambos personajes hablan en un espacio abierto. Los efectos también se posicionaron de acuerdo con la procedencia del sonido. Hay un momento en el que se usa la música diegética, así que se utilizó el mismo track de la mezcla 5.1, y se ubicó de acuerdo con la lejanía en que se escucharía.

• Escena 4

En esta escena se vuelve a la sensación de estar en una sala de interrogación, de nuevo el ambiente mantiene su configuración anterior añadiendo un poco de reverberación. Los diálogos, que para el caso son los de la niña y la marioneta, se ubican al frente del espectador y se les agrega también reverberación para efectos de narrativa. Los efectos, que ya están grabados según su posición, no tuvieron un procesamiento mayor del plug-in.

• Escena 5

(52)

Una imagen general de la sesión de mezcla se puede observar en la Fig. 16.

Fig. 16 Sesión de mezcla binaural

B. Medición de la sonoridad

Debido a que el presente trabajo se basó en la post-producción de un cortometraje y su mezcla de audio fue realizada en formato 5.1 y binaural, la mejor aproximación para evaluar la sonoridad del material es mediante el algoritmo presentado en la Recomendación ITU-R BS 1770-4 [23].

1) Medición Objetiva

Con el fin de medir la sonoridad de manera sencilla y a bajo costo, se pretende usar el software MATLAB_R2011a para implementar un algoritmo que permita evaluar la sonoridad promedio del cortometraje en ambos formatos de audio.

a) Desarrollo

(53)

Es por ello que se hace una división de escenas para luego medir la sonoridad y determinar cómo varía el nivel en el tiempo y qué otros resultados puede aportar dicha medida. En total se seleccionaron 10 escenas de aproximadamente 20 segundos de duración en cada una, para evaluar los cambios de sonoridad que se puedan presentar cuando en cada muestra hay contenido de diálogos, música, efectos y silencios.

La selección de escenas tanto para la mezcla 5.1 como la binaural se puede observar en la tabla IV. Con la intención de comparar diferentes valores de sonoridad, siendo -23LUFS el nivel de sonoridad de referencia de acuerdo a la EBU R-128 [25], se exportaron estas escenas desde el software Protools 10HD a niveles de sonoridad en un rango entre -18LUFS hasta -28LUFS, la herramienta utilizada para este fin fue el plug-in de la suite de Waves, Waves Loudness Meter [49], que provee una medida precisa de sonoridad y cumple con las especificaciones de la ITU (International Telecommunication Union), EBU (European Broadcast Union) y ATSC (Advanced Television Systems Committee).

Debido a que el software MATLAB no reconoce archivos multicanal a excepción de archivos estéreo, es necesario extraer de cada muestra 5.1 los canales discretos (Left, Center, Right, Left Surround, Right Surround, LFE) para la lectura de todos los canales por cada muestra en la implementación del algoritmo.

TABLA IV. SELECCIÓN DE ESCENAS PARA LA MEDICIÓN DE SONORIDAD ESCENAS Posición en tiempo (minutos: segundos) 1 2 3 4 5 1a 1b 2a 2b 3a 3b 4a 4b 5a 5b 0:07-0:27 0:30-0:50 1:04-1:24 1:29-1:49 1:52-2:09 2:18-2:39 2:55-3:15 3:17-3:37 3:37-3:58 4:01-4:22

(54)

La implementación de este código en el presente trabajo requirió, para el caso de la mezcla 5.1, la lectura de cada canal de audio por separado tal como lo indica la recomendación ITU-R BS 1770 [23]. El código en Matlab se puede detallar en el Anexo 4.

Los pasos de implementación en Matlab son los siguientes:

1. Lectura de cada canal de audio.

2. Prefiltrado de cada canal para eliminar los efectos acústicos de la cabeza. 3. Filtro RLB en cada canal.

4. Valores cuadrático medio de cada canal de audio. 5. Ponderación para cada canal según la ITU-R BS 1770. 6. Medida de la sonoridad de acuerdo con la ecuación (1).

Para el caso de la mezcla binaural, no es necesario extraer los canales de audio discretos puesto que Matlab lee directamente el archivo estéreo, de acuerdo con esto, la implementación en el software es más sencilla pero mantiene las mismas etapas planteadas. Este código se puede apreciar en el Anexo 5.

El procesamiento en el software se realizó para las escenas de la Mezcla en 5.1 y la Mezcla Binaural. Cabe resaltar que el algoritmo presentado en la ITU-R BS 1770 no se tiene en cuenta el canal de bajas frecuencias (LFE), por lo que fue descartado durante la medición de la sonoridad.

2) Prueba Subjetiva

El diseño de la prueba subjetiva está basado en los métodos para la evaluación subjetiva recomendados en la ITU-R BS. 1116-3 [51].

a) Definición del lugar para la prueba

(55)

de ruido de fondo bajo de 20,5 dB, además comprende un área de 115.96 𝑚! y un volumen de 82.38 𝑚! [52].

b) Nivel de Escucha

Para garantizar que un nivel de escucha fuera de 𝐿!"# = 78 ± 0.25 𝑑𝐵𝐴 [51], se aseguró que la muestra de audio de referencia a -23LUFS proporcionara este nivel de presión sonora cuando se reproducía por el sistema Opsodis. Esto se realizó con la medida del nivel de presión sonora observado en el sonómetro ubicado en el punto de escucha cuando se calibró el nivel del volumen saliente mientras se reproducía la muestra de audio de referencia en el Opsodis.

c) Población y muestra

Teniendo en cuenta que este proyecto tiene como objetivo medir un parámetro en un material audiovisual, se define una población compuesta por estudiantes de Ingeniería de Sonido de la Universidad de San Buenaventura a partir del octavo semestre que se encontraran cursando o ya habían cursado materias relacionadas con audiovisuales (Foley y Doblaje, Montaje y Edición, Banda Sonora), de manera que se garantizaba un conocimiento previo en mezcla de audio frente a proyectos audiovisuales. Para este proyecto, se aproximó la población a 80 estudiantes.

De acuerdo a la ecuación (3) para el cálculo de la muestra en una población finita, asumiendo:

Nivel de confianza de 95%, 𝑍 = 1,960 Error máximo del 10% (𝐸 = 0,1) 𝑃 = 0,5 𝑄 = 0,5

(56)

d) Método de Evaluación

El esquema de la posición del sistema de reproducción frente al oyente se puede apreciar en la Fig. 17, el opsodis se ubicó a una altura de 0.8m del suelo y a una distancia de 2m del receptor.

Fig. 17 Vista en planta de la sala de grabación Estudio A y configuración de la prueba.

Fuente: S. Bayer Cano y M. Yepes Correa, «Estudio Comparativo de Prototipos de Pabellón Auditivo para Captura Binaural,» Trabajo de Grado, Ingeniería de Sonido, Facultad de Ingenierías, Universidad de San Buenaventura, Medellin, 2014

Antes del inicio de cada prueba, a cada individuo se le explicó el objetivo y cómo sería el desarrollo de la prueba respondiendo a cualquier inquietud que tuviera, una vez pasada esta etapa, se les entregaba a los participantes el consentimiento informado, para comenzar con la prueba subjetiva (Ver Anexo 6). En la Fig. 18 se puede ver el montaje para el desarrollo de la prueba.

(57)

El desarrollo de la prueba para la presentación de las muestras de audio fue a través de la comparación de éstas frente a una referencia. La prueba se dividió en 3 tests:

• Tests 1 y 2: Se presentaban 1 lista de 12 muestras en cada test, en la que el primer estímulo corresponde a la referencia de -23LUFS y los 11 siguientes corresponden a muestras de audio con niveles de sonoridad diferentes en un rango entre -18LUFS y -28LUFS. Se escogieron 2 escenas diferentes del cortometraje con contenido de música, diálogo, silencio y ambiente. El primer test correspondía a la percepción de la sonoridad para una escena mezclada en configuración envolvente 5.1, mientras que el segundo test correspondía a una escena mezclada de forma binaural. El orden y escena que se presentó en los test se evidencia en las tablas V y VI.

TABLA V. ORDEN PRIMERA ENCUESTA DE LA PRUEBA SUBJETIVA Escena 1a - Muestra de audio 5.1

Nº muestra de audio 0 (Ref) 1 2 3 4 5 6 7 8 9 10 11 Sonoridad (LUFS) -23 -18 -22 -26 -21 -19 -24 -20 -28 -23 -27 -25

TABLA VI. ORDEN SEGUNDA ENCUESTA PRUEBA SUBJETIVA Escena 2a - Muestra de audio Binaural

Nº muestra de audio 0 (Ref) 1 2 3 4 5 6 7 8 9 10 11 Sonoridad (LUFS) -23 -20 -19 --26 -22 -24 -27 -18 -25 -23 -28 -21

Durante los 2 primeros tests se le solicitó al estudiante que evaluara la percepción de la sonoridad según la siguiente escala de apreciación (remítase al Anexo 7 para ver las instrucciones de la prueba):

TABLA VII. ESCALA DE CALIFICACIÓN Apreciación Calificación

Menos fuerte 1

Igual 2

Referencias

Documento similar

Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de