Protección de derechos de autor en audio digital por medio de imágenes

(1)

de autor en audio digital por medio de imágenes

Universidad Militar Nueva Granada - Ingeniería de

Telecomunicaciones

Trabajo de Grado

Presenta:

Erika Alexandra Pinto Castro Dirigido Por:

Ing. Dora Maria Ballesteros Larrotta, PhD

(2)

La protección de derechos de autor se ha convertido en un tema importante en la actualidad debido a que el contenido de cualquier creación es almacenado en forma digital, gracias a la facilidad de compartir información de este tipo en Internet sin perder calidad y llegando a muchas personas en todo el mundo. Uno de los principales problemas de compartir información en forma digital es la facilidad de duplicar, modificar o distribuir de forma ilegal el contenido que este presenta quebrantando las políticas de los derechos de autor. Uno de los mecanismos más prácticos actualmente en la protección de contenido musical es el marcado de agua digital, ya que este permite insertar cualquier tipo de información llamada “marca de agua” en el archivo de audio digital de forma robusta y secreta sin afectar la calidad del audio, esta información puede identificar al autor de dicho contenido y así minimizar el problema en cuanto a los derechos de autor.

El objetivo de este trabajo es brindar protección a los derechos de autor de audio digital por medio del marcado con una imagen binaria. Se selecciona el método QIM por su facilidad de implementación y alta calidad de la imagen recuperada, el método se aplica en el dominio wavelet para obtener audios marcados de alta transparencia y finalmente, se adiciona una etapa de aleatorización de datos, para insertar un nivel de seguridad en la marca incrustada. Se realizan diversas pruebas para evaluar la transparencia y robustez frente a tres tipos de ataques pasivos: adición de ruido, compresión MP4 y filtrado. Finalmente, se compara la capacidad de ocultamiento del método propuesto con trabajos similares encontrados en la literatura.

El documento se presenta en formato presentación. Si el lector está interesado en profundizar en el

(3)

Proponente:

Erika Alexandra Pinto Castro

Tutor:

Ing. Dora María Ballesteros Larrotta

UNIVERSIDAD MILITAR NUEVA GRANADA FACULTAD DE INGENIERÍA

INGENIERÍA EN TELECOMUNICACIONES

BOGOTÁ D.C.

(4)

(5)

Según la Ley 23 de 1982 sobre derechos de autor, el derecho de

autor brinda la protección de toda creación en el campo científico,

literario y artístico, protegiendo la obra desde el momento de su

creación intelectual, en relación con sus derechos morales y

patrimoniales como está determinado por la ley [1].

(6)

Uno de los sectores afectados por la distribución ilegal de

contenido y por el plagio en las obras de nuevos artistas es la

industria musical, ya que se encuentran diferentes maneras de

descargar y compartir canciones con programas P2P (peer to

peer) sin tener un control en estas acciones, por ello se hace

necesario proporcionar cierta seguridad al contenido y brindar

protección a los derechos de autor y el uso autorizado de la

información buscando diferentes formas en donde se identifique

el autor de la propiedad del contenido [2].

(7)

(8)

Realizar levantamiento de información acerca de ocultamiento de datos en audio, basado en Marcas de Agua.

Proponer un esquema de protección de datos en señales de audio con imágenes.

Desarrollar por medio del software Matlab el esquema propuesto para el marcado de la señal de audio.

Validar la robustez de la señal de audio marcada aplicando ataques comunes de manipulación de señal.

Implementar una técnica de

ocultamiento de datos para ocultar

una imagen dentro de una señal de

audio con el fin de brindar

protección a los derechos de autor.

(9)

Marcado de agua o watermarking: Capacidad de incrustar información en una señal huésped, esta información puede ser una imagen, un audio, una firma digital, entre otros [3].

Ataques: Existen una variedad de ataques clasificados en ataques pasivos y activos. Los ataques pasivos tienen como principal objetivo destruir, eliminar o degradar la información de la marca de agua, mientras que los ataques activos tienen como principal objetivo modificar o extraer la información de la marca de agua [4].

Imperceptibilidad: Principal requerimiento en el ocultamiento de datos , ya que se quiere que al ocultar una marca no se pierda la calidad de la señal de audio y no haya cambios importantes en la información de la señal. Además la marca solo puede ser detectada mediante procesos especiales [3].

Robustez: Parámetro más importante, ya que la idea principal es que el marcado permanezca ante cualquier clase de ataques que se puedan presentar al momento de que alguien ajeno a la señal de marcado de agua desee eliminar o modificar la marca. Por lo general los ataques pasivos más comunes son: compresión, adición de ruido (AWGN), re- muestreo, re-cuantificación, filtrado pasa-bajo, filtrado pasa-alto, amplificación, recorte de la señal, entre otros [3].

Capacidad de ocultamiento: Se refiere a la cantidad de información que se puede ocultar en una señal de audio. Dependiendo del tipo de señal de audio se determina la máxima cantidad de datos de la marca [3].

(10)

(11)

Fase 1: Levantamiento de Información

Material Base de Datos

10 Papers IEEE, Science Direct

1 Libro Procesamiento Digital de Señales utilizando Matlab y Simulink

Titulo Año Autor

A survey: Digital Audio Watermarking Techniques and Applications.

2013 Sanjay Pratap Singh Chauhan (Uttar Pradesh, India), S.A.M. Risvi (New Delhi, India) [5]

New technique for embedding watermark image into an audio signal.

2009 Sarawut Kaengin, Surapan Airphaiboon y Somasanouk Pathoumvanh (Bangkok, Thailand) [6]

An adaptive audio watermarking based on the singular value decomposition in the wavelet domain.

2010 Vivekananda Bhat K ∗, Indranil Sengupta, Abhijit Das (India)[7]

Tabla 1. Levantamiento de información.

(12)

Fase 1: Levantamiento de Información

Elshazly [8] propone un esquema utilizado la Transformada Wavelet Discreta y agrega cifrado a la marca de agua que se quiere insertar en el audio, para brindar mayor seguridad a la marca y así preservar la integridad de la misma ante un ataque pasivo o activo.

Salma [9] propone un esquema que mejora la robustez de la marca de agua a la compresión MP3, utilizando el método LSB (Least Significant Bit).

Choi y Pun [10] propone un algoritmo que mejora la capacidad de ocultamiento con un ligero desmejoramiento en la calidad del audio marcado.

Tabla 2. Continuación Levantamiento de información.

(13)

Fase 2: Implementación método conocido.

Figura 1. Esquema de QIM

(14)

Procedimiento para Ocultar la Imagen Binaria en una Señal de Audio

Figura 2. Esquema de Ocultamiento

Fase 3: Propuesta esquema mejorado.

(15)

Procedimiento para Extraer la Imagen Binaria de la Señal de Audio

Figura 3. Esquema de Extracción

Fase 3: Propuesta esquema mejorado.

(16)

Fase 4: Validación experimental.

Señales de Audio Duración Frecuencia de Muestreo (Fs)

Rock / Pop

20 Segundos 44100 Hz

Electrónica Hip-Hop

Logo Watermarking Tamaño

150x150 Pixeles

Tabla 2. Elementos de prueba.

(17)

Fase 4: Validación experimental.

Tabla 3. Pruebas Realizadas.

Señal de Audio Delta Ataques Total de Pruebas

15 3 3 135 por esquema

Evaluación de Robustez del logo Watermarking

NC

𝑟 = ^𝑚 ^𝑛(𝐴_𝑚𝑛 − 𝐴)(𝐵_𝑚𝑛 − 𝐵)

( _𝑚 _𝑛(𝐴_𝑚𝑛 − 𝐴)²) ( _𝑚 _𝑛(𝐵_𝑚𝑛 − 𝐵)²) Donde 𝐴 = 𝑚𝑒𝑑𝑖𝑎2 (𝐴), y 𝐵 = 𝑚𝑒𝑑𝑖𝑎2 (𝐵)

BER

𝐵𝐸𝑅 𝐴, 𝐵 =

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑏𝑖𝑡𝑠 𝑒𝑟𝑟ó𝑛𝑒𝑜𝑠

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑏𝑖𝑡𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠

=

¹

𝑁 𝑖=1𝑁

𝑊(𝑖) ⊗ 𝑊

_𝑟

(𝑖)

(18)

Fase 4: Validación experimental.

Tabla 4. Tipos de Ataques.

Ataques Realizados

Ruido Aditivo Ruido blanco gaussiano (AWGN), con amplitud igual a 0.25 veces el valor de delta.

Filtrado

Filtro Pasa-Bajos de segundo orden Butterworth con una frecuencia de corte de 18000 Hz.

Compresión con pérdida de información

El audio marcado se transforma de formato WAV a formato MP4, con un valor de bit rate de 192 kbps (inicialmente el audio tiene un bit rate de 705.6 kbps).

(19)

Tabla 5. Consolidado de resultados imperceptibilidad.

Género SPCC

Rock/Pop 0,9994

Electrónica 0,9995

Hip/Hop 0,9991

Imperceptibilidad

Fase 5: Resultados obtenidos

(20)

Fase 5: Resultados obtenidos

Figura 4. Ejemplo señal de audio original y marcado.

(21)

Fase 5: Resultados obtenidos

Tipo de Ataque

Esquema Original

(NC)

Esquema Propuesto

(NC)

Esquema Original (BER (%))

Esquema Propuesto

(BER (%))

Marca Recuperada Esquema Original

Marca Recuperada Esquema Propuesto

Sin Ataque 1 1 0 0

AWGN 0,9991 0,8279 5,3289 4,9644

Filtro Pasa-

Bajo 0,9951 0,3448 23,0756 28,2711

Compresión

MP4 0,9994 0,5438 4,9911 16,4089

Tabla 6. Logo Watermarking Extraído para Señal de Audio Electrónica.

(22)

Fase 5: Resultados obtenidos

Señal de Audio Ataque Esquema Original (NC)

Esquema Propuesto (NC)

Esquema Original (BER (%))

Esquema Propuesto (BER

(%))

Rock/Pop

Sin Ataque 1 1 0 0

AWGN 0,8139 0,8186 5,4320 5,2898

Filtro Pasa-Bajo 0,7441 0,4080 8,7307 24,7645

Compresión MP4 0,8230 0,5634 5,3618 15,9307

Electrónica

Sin Ataque 1 1 0 0

AWGN 0,8143 0,8182 5,4258 5,2907

Filtro Pasa-Bajo 0,5524 0,2403 17,5218 34,6640

Compresión MP4 0,8104 0,4610 6,2169 21,2667

Hip/Hop

Sin Ataque 1 1 0 0

AWGN 0,8175 0,8150 5,3324 5,4062

Filtro Pasa-Bajo 0,8225 0,3640 6,5733 27,2933

Compresión MP4 0,8496 0,4807 4,8676 20,4320

Tabla 7. Logo Watermarking Extraído para diferentes Señales de Audio.

(23)

Fase 5: Resultados obtenidos

Tabla 8. Cuadro comparativo en términos de HC (Capacidad de Ocultamiento).

Referencia Método Capacidad de

Ocultamiento

Propuesto QIM Mejorado 1125 bps

Bhat K, Sengupta and

Das [11] Adaptative DWT SVD 45,9 bps

Cvejic and Seppanen

[12] Spread Spectrum 27,1 bps

Li et al. [13] Content-based 4,2 bps

Xiang et al. [14] Histogram-based 2 bps

Capacidad de ocultamiento (HC: Hiding Capacity)

(24)

Fase 5: Resultados obtenidos

Figura 5. Logo Watermarking recuperado.

(25)

Fase 6: Documentación

Se realizó un articulo para revista titulado “Protección de derechos de autor en audio digital por medio de una imagen binaria”.

Se presenta una interfaz de usuario para la inserción y

extracción de marcas de agua en audio digital, realizado en

Matlab.

(26)

Conclusiones

El Método propuesto permite marcar un audio con una imagen binaria, con una capacidad de ocultamiento de hasta 0.5 bits/muestra. Este método es una mejora al método tradicional QIM, en términos de la seguridad en la detección de la marca.

Las diferencias entre la propuesta y el método original, son:

a. El proceso de cuantización se realiza en el dominio wavelet, no en el dominio del tiempo.

b. El proceso de inserción se realiza de forma aleatoria, no en estricto orden.

c. La clave además de contener el valor del paso de cuantización, contiene la

familia wavelet, el orden del filtro y las posiciones de los coeficientes de

aproximación seleccionados para ocultar la marca binaria.

(27)

Conclusiones

En términos de imperceptibilidad, con ambos métodos se tienen audios marcados con alta imperceptibilidad de sus marcas. En términos de capacidad de ocultamiento, la máxima capacidad del método propuesto es igual a mitad de la máxima capacidad del método original. Sin embargo, los valores de HC son mucho mayores a otros trabajos reportados en la literatura.

En relación a las pruebas de robustez, se encontró un mayor deterioro global de las marcas recuperadas después de los ataques pasivos aplicados (adición de ruido, filtrado y compresión MP4), sin embargo, el deterioro local es menor y la marca se aprecia con un efecto granular distribuido en toda la imagen.

La principal ventaja del método propuesto, radica en los dos niveles de seguridad

que se adicionan para disminuir la detección de la marca por un usuario no

autorizado. Los niveles se relacionan con la información del proceso de

descomposición/reconstrucción wavelet, y con la selección aleatoria de

coeficientes de aproximación de alta amplitud.

(28)

Referencias

[1] Ley 23 de 1982.

[2] T. Kalker, D. H. J. Epema, P. H. Hartel, R. L. Lagendijk, and M. Van Steen, “Music2share- copyright-compliant music sharing in p2p systems,” Proc. IEEE, vol. 92, no. 6, pp. 961–970, 2004.

[3] a D. N. En and A. Alcalino,“Instituto Politécnico Nacional,” 2007.

[4] María del Pilar Reyes Moreno, “Sellado invisible de imágenes con marcas de agua en

dominios transformados.” [Online]. Available:

http://bibing.us.es/proyectos/abreproy/10862/fichero/Cap%C3%ADtulo+3.pdf.

[5] S. Pratap and S. Chauhan, “A survey : Digital Audio Watermarking Techniques and Applications,” pp. 185–192, 2013.

[6] S. Kaengin, S. Airphaiboon, and S. Pathoumvanh, “New technique for embedding watermark image into an audio signal,” 2009 9th Int. Symp. Commun. Inf. Technol. Isc. 2009, no. 2, pp. 29–32, 2009.

[7] V. Bhat K, I. Sengupta, and A. Das, “An adaptive audio watermarking based on the singular value decomposition in the wavelet domain,” ELSEVIER - Digit. Signal Process., vol. 20, no. 6, pp. 1547–1558, 2010

[8] A. R. Elshazly and M. M. Fouad, “Secure and Robust High Quality DWT Domain Audio Watermarking Algorithm with Binary Image,” pp. 207–212, 2012.

[9] K. Choi and C. Pun, “High Capacity Digital Audio Reversible Watermarking,” 2013 IEEE Int. Conf. Comput. Intell. Cybern., pp. 72–75, 2013.

.

(29)

Referencias

[10] M. Salma, C. Maha, and B. A. Chokri, “A Robust Audio Watermarking Technique based on the Perceptual Evaluation of Audio Quality Algorithm in the Multiresolution Domain”, pp. 326–331, 2011.

[11] V. Bhat K, I. Sengupta, and A. Das, “An adaptive audio watermarking based on the

singular value decomposition in the wavelet domain,” ELSEVIER - Digit. Signal Process, vol.

20, no. 6, pp. 1547–1558, 2010.

[12] N. Cvejic and T. Seppanen, “Spread spectrum audio watermarking using frequency hopping and attack characterization,” Signal Processing, vol. 84, no. 1, pp. 207–213, 2004.

[13] W. Li, X. Xue, and P. Lu, “Localized audio watermarking technique robust against time-scale modification,” IEEE Trans. Multimed., vol. 8, no. 1, pp. 60–69, 2006.

[14] Xiang, S., Kim, H. J., & Huang, J., Audio watermarking robust against time-scale modification and MP3 compression. Signal Processing, 88(10), 2372-2387, 2008

(30)