de autor en audio digital por medio de imágenes
Universidad Militar Nueva Granada - Ingeniería de
Telecomunicaciones
Trabajo de Grado
Presenta:
Erika Alexandra Pinto Castro Dirigido Por:
Ing. Dora Maria Ballesteros Larrotta, PhD
La protección de derechos de autor se ha convertido en un tema importante en la actualidad debido a que el contenido de cualquier creación es almacenado en forma digital, gracias a la facilidad de compartir información de este tipo en Internet sin perder calidad y llegando a muchas personas en todo el mundo. Uno de los principales problemas de compartir información en forma digital es la facilidad de duplicar, modificar o distribuir de forma ilegal el contenido que este presenta quebrantando las políticas de los derechos de autor. Uno de los mecanismos más prácticos actualmente en la protección de contenido musical es el marcado de agua digital, ya que este permite insertar cualquier tipo de información llamada “marca de agua” en el archivo de audio digital de forma robusta y secreta sin afectar la calidad del audio, esta información puede identificar al autor de dicho contenido y así minimizar el problema en cuanto a los derechos de autor.
El objetivo de este trabajo es brindar protección a los derechos de autor de audio digital por medio del marcado con una imagen binaria. Se selecciona el método QIM por su facilidad de implementación y alta calidad de la imagen recuperada, el método se aplica en el dominio wavelet para obtener audios marcados de alta transparencia y finalmente, se adiciona una etapa de aleatorización de datos, para insertar un nivel de seguridad en la marca incrustada. Se realizan diversas pruebas para evaluar la transparencia y robustez frente a tres tipos de ataques pasivos: adición de ruido, compresión MP4 y filtrado. Finalmente, se compara la capacidad de ocultamiento del método propuesto con trabajos similares encontrados en la literatura.
El documento se presenta en formato presentación. Si el lector está interesado en profundizar en el
Proponente:
Erika Alexandra Pinto Castro
Tutor:
Ing. Dora María Ballesteros Larrotta
UNIVERSIDAD MILITAR NUEVA GRANADA FACULTAD DE INGENIERÍA
INGENIERÍA EN TELECOMUNICACIONES
BOGOTÁ D.C.
Según la Ley 23 de 1982 sobre derechos de autor, el derecho de
autor brinda la protección de toda creación en el campo científico,
literario y artístico, protegiendo la obra desde el momento de su
creación intelectual, en relación con sus derechos morales y
patrimoniales como está determinado por la ley [1].
Uno de los sectores afectados por la distribución ilegal de
contenido y por el plagio en las obras de nuevos artistas es la
industria musical, ya que se encuentran diferentes maneras de
descargar y compartir canciones con programas P2P (peer to
peer) sin tener un control en estas acciones, por ello se hace
necesario proporcionar cierta seguridad al contenido y brindar
protección a los derechos de autor y el uso autorizado de la
información buscando diferentes formas en donde se identifique
el autor de la propiedad del contenido [2].
Realizar levantamiento de información acerca de ocultamiento de datos en audio, basado en Marcas de Agua.
Proponer un esquema de protección de datos en señales de audio con imágenes.
Desarrollar por medio del software Matlab el esquema propuesto para el marcado de la señal de audio.
Validar la robustez de la señal de audio marcada aplicando ataques comunes de manipulación de señal.
Implementar una técnica de
ocultamiento de datos para ocultar
una imagen dentro de una señal de
audio con el fin de brindar
protección a los derechos de autor.
Marcado de agua o watermarking: Capacidad de incrustar información en una señal huésped, esta información puede ser una imagen, un audio, una firma digital, entre otros [3].
Ataques: Existen una variedad de ataques clasificados en ataques pasivos y activos. Los ataques pasivos tienen como principal objetivo destruir, eliminar o degradar la información de la marca de agua, mientras que los ataques activos tienen como principal objetivo modificar o extraer la información de la marca de agua [4].
Imperceptibilidad: Principal requerimiento en el ocultamiento de datos , ya que se quiere que al ocultar una marca no se pierda la calidad de la señal de audio y no haya cambios importantes en la información de la señal. Además la marca solo puede ser detectada mediante procesos especiales [3].
Robustez: Parámetro más importante, ya que la idea principal es que el marcado permanezca ante cualquier clase de ataques que se puedan presentar al momento de que alguien ajeno a la señal de marcado de agua desee eliminar o modificar la marca. Por lo general los ataques pasivos más comunes son: compresión, adición de ruido (AWGN), re- muestreo, re-cuantificación, filtrado pasa-bajo, filtrado pasa-alto, amplificación, recorte de la señal, entre otros [3].
Capacidad de ocultamiento: Se refiere a la cantidad de información que se puede ocultar en una señal de audio. Dependiendo del tipo de señal de audio se determina la máxima cantidad de datos de la marca [3].
Fase 1: Levantamiento de Información
Material Base de Datos
10 Papers IEEE, Science Direct
1 Libro Procesamiento Digital de Señales utilizando Matlab y Simulink
Titulo Año Autor
A survey: Digital Audio Watermarking Techniques and Applications.
2013 Sanjay Pratap Singh Chauhan (Uttar Pradesh, India), S.A.M. Risvi (New Delhi, India) [5]
New technique for embedding watermark image into an audio signal.
2009 Sarawut Kaengin, Surapan Airphaiboon y Somasanouk Pathoumvanh (Bangkok, Thailand) [6]
An adaptive audio watermarking based on the singular value decomposition in the wavelet domain.
2010 Vivekananda Bhat K ∗, Indranil Sengupta, Abhijit Das (India)[7]
Tabla 1. Levantamiento de información.
Fase 1: Levantamiento de Información
Elshazly [8] propone un esquema utilizado la Transformada Wavelet Discreta y agrega cifrado a la marca de agua que se quiere insertar en el audio, para brindar mayor seguridad a la marca y así preservar la integridad de la misma ante un ataque pasivo o activo.
Salma [9] propone un esquema que mejora la robustez de la marca de agua a la compresión MP3, utilizando el método LSB (Least Significant Bit).
Choi y Pun [10] propone un algoritmo que mejora la capacidad de ocultamiento con un ligero desmejoramiento en la calidad del audio marcado.
Tabla 2. Continuación Levantamiento de información.
Fase 2: Implementación método conocido.
Figura 1. Esquema de QIM
Procedimiento para Ocultar la Imagen Binaria en una Señal de Audio
Figura 2. Esquema de Ocultamiento
Fase 3: Propuesta esquema mejorado.
Procedimiento para Extraer la Imagen Binaria de la Señal de Audio
Figura 3. Esquema de Extracción
Fase 3: Propuesta esquema mejorado.
Fase 4: Validación experimental.
Señales de Audio Duración Frecuencia de Muestreo (Fs)
Rock / Pop
20 Segundos 44100 Hz
Electrónica Hip-Hop
Logo Watermarking Tamaño
150x150 Pixeles
Tabla 2. Elementos de prueba.
Fase 4: Validación experimental.
Tabla 3. Pruebas Realizadas.
Señal de Audio Delta Ataques Total de Pruebas
15 3 3 135 por esquema
Evaluación de Robustez del logo Watermarking
NC
𝑟 = 𝑚 𝑛(𝐴𝑚𝑛 − 𝐴)(𝐵𝑚𝑛 − 𝐵)
( 𝑚 𝑛(𝐴𝑚𝑛 − 𝐴)2) ( 𝑚 𝑛(𝐵𝑚𝑛 − 𝐵)2) Donde 𝐴 = 𝑚𝑒𝑑𝑖𝑎2 (𝐴), y 𝐵 = 𝑚𝑒𝑑𝑖𝑎2 (𝐵)
BER
𝐵𝐸𝑅 𝐴, 𝐵 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑏𝑖𝑡𝑠 𝑒𝑟𝑟ó𝑛𝑒𝑜𝑠𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑏𝑖𝑡𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
=
1𝑁 𝑖=1𝑁
𝑊(𝑖) ⊗ 𝑊
𝑟(𝑖)
Fase 4: Validación experimental.
Tabla 4. Tipos de Ataques.
Ataques Realizados
Ruido Aditivo Ruido blanco gaussiano (AWGN), con amplitud igual a 0.25 veces el valor de delta.
Filtrado
Filtro Pasa-Bajos de segundo orden Butterworth con una frecuencia de corte de 18000 Hz.
Compresión con pérdida de información
El audio marcado se transforma de formato WAV a formato MP4, con un valor de bit rate de 192 kbps (inicialmente el audio tiene un bit rate de 705.6 kbps).
Tabla 5. Consolidado de resultados imperceptibilidad.
Género SPCC
Rock/Pop 0,9994
Electrónica 0,9995
Hip/Hop 0,9991
Imperceptibilidad
Fase 5: Resultados obtenidos
Fase 5: Resultados obtenidos
Figura 4. Ejemplo señal de audio original y marcado.
Fase 5: Resultados obtenidos
Tipo de Ataque
Esquema Original
(NC)
Esquema Propuesto
(NC)
Esquema Original (BER (%))
Esquema Propuesto
(BER (%))
Marca Recuperada Esquema Original
Marca Recuperada Esquema Propuesto
Sin Ataque 1 1 0 0
AWGN 0,9991 0,8279 5,3289 4,9644
Filtro Pasa-
Bajo 0,9951 0,3448 23,0756 28,2711
Compresión
MP4 0,9994 0,5438 4,9911 16,4089
Tabla 6. Logo Watermarking Extraído para Señal de Audio Electrónica.
Fase 5: Resultados obtenidos
Señal de Audio Ataque Esquema Original (NC)
Esquema Propuesto (NC)
Esquema Original (BER (%))
Esquema Propuesto (BER
(%))
Rock/Pop
Sin Ataque 1 1 0 0
AWGN 0,8139 0,8186 5,4320 5,2898
Filtro Pasa-Bajo 0,7441 0,4080 8,7307 24,7645
Compresión MP4 0,8230 0,5634 5,3618 15,9307
Electrónica
Sin Ataque 1 1 0 0
AWGN 0,8143 0,8182 5,4258 5,2907
Filtro Pasa-Bajo 0,5524 0,2403 17,5218 34,6640
Compresión MP4 0,8104 0,4610 6,2169 21,2667
Hip/Hop
Sin Ataque 1 1 0 0
AWGN 0,8175 0,8150 5,3324 5,4062
Filtro Pasa-Bajo 0,8225 0,3640 6,5733 27,2933
Compresión MP4 0,8496 0,4807 4,8676 20,4320
Tabla 7. Logo Watermarking Extraído para diferentes Señales de Audio.
Fase 5: Resultados obtenidos
Tabla 8. Cuadro comparativo en términos de HC (Capacidad de Ocultamiento).
Referencia Método Capacidad de
Ocultamiento
Propuesto QIM Mejorado 1125 bps
Bhat K, Sengupta and
Das [11] Adaptative DWT SVD 45,9 bps
Cvejic and Seppanen
[12] Spread Spectrum 27,1 bps
Li et al. [13] Content-based 4,2 bps
Xiang et al. [14] Histogram-based 2 bps
Capacidad de ocultamiento (HC: Hiding Capacity)
Fase 5: Resultados obtenidos
Figura 5. Logo Watermarking recuperado.
Fase 6: Documentación
Se realizó un articulo para revista titulado “Protección de derechos de autor en audio digital por medio de una imagen binaria”.
Se presenta una interfaz de usuario para la inserción y
extracción de marcas de agua en audio digital, realizado en
Matlab.
Conclusiones
El Método propuesto permite marcar un audio con una imagen binaria, con una capacidad de ocultamiento de hasta 0.5 bits/muestra. Este método es una mejora al método tradicional QIM, en términos de la seguridad en la detección de la marca.
Las diferencias entre la propuesta y el método original, son:
a. El proceso de cuantización se realiza en el dominio wavelet, no en el dominio del tiempo.
b. El proceso de inserción se realiza de forma aleatoria, no en estricto orden.
c. La clave además de contener el valor del paso de cuantización, contiene la
familia wavelet, el orden del filtro y las posiciones de los coeficientes de
aproximación seleccionados para ocultar la marca binaria.
Conclusiones
En términos de imperceptibilidad, con ambos métodos se tienen audios marcados con alta imperceptibilidad de sus marcas. En términos de capacidad de ocultamiento, la máxima capacidad del método propuesto es igual a mitad de la máxima capacidad del método original. Sin embargo, los valores de HC son mucho mayores a otros trabajos reportados en la literatura.
En relación a las pruebas de robustez, se encontró un mayor deterioro global de las marcas recuperadas después de los ataques pasivos aplicados (adición de ruido, filtrado y compresión MP4), sin embargo, el deterioro local es menor y la marca se aprecia con un efecto granular distribuido en toda la imagen.
La principal ventaja del método propuesto, radica en los dos niveles de seguridad
que se adicionan para disminuir la detección de la marca por un usuario no
autorizado. Los niveles se relacionan con la información del proceso de
descomposición/reconstrucción wavelet, y con la selección aleatoria de
coeficientes de aproximación de alta amplitud.
Referencias
[1] Ley 23 de 1982.
[2] T. Kalker, D. H. J. Epema, P. H. Hartel, R. L. Lagendijk, and M. Van Steen, “Music2share- copyright-compliant music sharing in p2p systems,” Proc. IEEE, vol. 92, no. 6, pp. 961–970, 2004.
[3] a D. N. En and A. Alcalino,“Instituto Politécnico Nacional,” 2007.
[4] María del Pilar Reyes Moreno, “Sellado invisible de imágenes con marcas de agua en
dominios transformados.” [Online]. Available:
http://bibing.us.es/proyectos/abreproy/10862/fichero/Cap%C3%ADtulo+3.pdf.
[5] S. Pratap and S. Chauhan, “A survey : Digital Audio Watermarking Techniques and Applications,” pp. 185–192, 2013.
[6] S. Kaengin, S. Airphaiboon, and S. Pathoumvanh, “New technique for embedding watermark image into an audio signal,” 2009 9th Int. Symp. Commun. Inf. Technol. Isc. 2009, no. 2, pp. 29–32, 2009.
[7] V. Bhat K, I. Sengupta, and A. Das, “An adaptive audio watermarking based on the singular value decomposition in the wavelet domain,” ELSEVIER - Digit. Signal Process., vol. 20, no. 6, pp. 1547–1558, 2010
[8] A. R. Elshazly and M. M. Fouad, “Secure and Robust High Quality DWT Domain Audio Watermarking Algorithm with Binary Image,” pp. 207–212, 2012.
[9] K. Choi and C. Pun, “High Capacity Digital Audio Reversible Watermarking,” 2013 IEEE Int. Conf. Comput. Intell. Cybern., pp. 72–75, 2013.
.
Referencias
[10] M. Salma, C. Maha, and B. A. Chokri, “A Robust Audio Watermarking Technique based on the Perceptual Evaluation of Audio Quality Algorithm in the Multiresolution Domain”, pp. 326–331, 2011.
[11] V. Bhat K, I. Sengupta, and A. Das, “An adaptive audio watermarking based on the
singular value decomposition in the wavelet domain,” ELSEVIER - Digit. Signal Process, vol.
20, no. 6, pp. 1547–1558, 2010.
[12] N. Cvejic and T. Seppanen, “Spread spectrum audio watermarking using frequency hopping and attack characterization,” Signal Processing, vol. 84, no. 1, pp. 207–213, 2004.
[13] W. Li, X. Xue, and P. Lu, “Localized audio watermarking technique robust against time-scale modification,” IEEE Trans. Multimed., vol. 8, no. 1, pp. 60–69, 2006.
[14] Xiang, S., Kim, H. J., & Huang, J., Audio watermarking robust against time-scale modification and MP3 compression. Signal Processing, 88(10), 2372-2387, 2008