3. EXTRACCI ´ ON DE CARACTER´ISTICAS
3.3. Rasgos propuestos
3.3.2. La herramienta BioMetr R Phon
Es una herramienta vers´atil que permite grabar y analizar la voz. Adem´as, a partir de fragmentos de voz de diferentes longitudes es capaz de obtener 72 par´ame- tros diferentes, los cuales se pueden dividir en par´ametros ac´usticos, cepstrales, es- pectrales, biomec´anicos y de temblor, entre otros. La interfaz de usuario de dicha herramienta puede verse en la Figura 3.9, donde puede observarse la representaci´on de la fuente gl´otica, y un tren de pulsos gl´oticos, la se˜nal en el tiempo, y algunos valores de los par´ametros que calcula.
Figura 3.9: Interfaz de usuario de BioMetrRPhon.
No es objeto de este trabajo explicar la interfaz de usuario de dicha herramienta, ni tampoco cada una de sus funcionalidades. Tan solo se van a presentar los diferentes par´ametros extra´ıdos:
3.3. RASGOS PROPUESTOS
fundamental. Sirve con otros par´ametros para distinguir voz masculina de femenina. Valor dado en Hercios (Hz).
2. Abs. Norm. Jitter. Es eljitter relativo, es decir, el c´alculo se basa en el valor inverso de la diferencia entre los periodos de dos ciclos vecinos, dividido por la media aritm´etica de ambos. Sirve, junto con otros, para detectar inestabilidad en la fonaci´on, y ayuda a caracterizar la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
3. Abs. Norm Ar. Shimmer. Es el shimmer relativo en amplitud media por ciclo gl´otico, es decir, es la diferencia entre las amplitudes medias de la fuen- te gl´otica en dos ciclos vecinos, dividido por la media aritm´etica de ambas. Sirve, junto con otros, para detectar inestabilidad en la fonaci´on, y ayuda a caracterizar la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa). 4. Abs. Norm. Min. Sharp. Es el shimmer relativo de ´area, es decir, la esbel-
tez del pico del MFDR: amplitud negativa del pico dividida por su anchura. Sirve, junto con otros, para detectar inestabilidad en la fonaci´on, y ayuda a caracterizar la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa). 5. Noise-Harm. Ratio (NHR). Es la esbeltez del MFDR y mide la agudeza
del cierre gl´otico, es decir, la relaci´on entre las energ´ıas de las componentes no arm´onica y arm´onica del espectro de potencia de la onda gl´otica. Sirve, junto con otros, para detectar emocionalidad en la fonaci´on, y ayuda a caracterizar la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
6. Muc./AvAc. Energy (MAE). Es la relaci´on entre la energ´ıa de la diferen- cia de la fuente gl´otica y su onda ac´ustica promedio. Sirve, junto con otros, para detectar posibles alteraciones neurol´ogicas en un locutor, y ayuda a ca- racterizar la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
7-20. MWC Cepstral 1 al 14. Forman parte de la firma biom´etrica del locutor en forma compacta, y junto con otros, ayudan en la identificaci´on y verificaci´on del locutor, tanto en aplicaciones de acceso seguro como en cotejo forense. Estos par´ametros van desde el primer coeficiente hasta el decimocuarto de la fuente gl´otica.
21-34. Par´ametros de perfil espectral. Forman parte de la firma biom´etrica del locutor, as´ı como del comportamiento normativo o no normativo de ´este, y junto con otros ayudan en la identificaci´on y verificaci´on del mismo (aplicacio- nes de acceso seguro o cotejo forense), y en la determinaci´on de la presencia de disfon´ıa de origen org´anico (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
21. MW PSD 1st Max. ABS. Primer m´aximo de la densidad espectral de la fuente gl´otica.
22. MW PSD 1st Min. rel. Primer m´ınimo de la densidad espectral de la fuente gl´otica.
23. MW PSD 2nd Max. rel.Segundo m´aximo de la densidad espectral de la fuente gl´otica.
24. MW PSD 2nd Min. rel. Segundo m´ınimo de la densidad espectral de la fuente gl´otica.
25. MW PSD 3rd Max. rel. Tercer m´aximo de la densidad espectral de la fuente gl´otica.
26. MW PSD End Val. rel. Valor de la energ´ıa de la densidad espectral de potencia de la onda gl´otica a la mitad de la frecuencia de muestreo. 27. MW PSD 1st Max. Pos. ABS. Frecuencia del primer m´aximo de la
densidad espectral de la fuente gl´otica.
28. MW PSD 1st Min. Pos. rel.Frecuencia relativa del primer m´ınimo de la densidad espectral de la fuente gl´otica con respecto al primer m´aximo. 29. MW PSD 2nd Max. Pos. rel. Frecuencia relativa del segundo m´axi- mo de la densidad espectral de la fuente gl´otica con respecto al primer m´aximo.
30. MW PSD 2nd Min. Pos. rel. Frecuencia relativa del segundo m´ıni- mo de la densidad espectral de la fuente gl´otica con respecto al primer m´aximo.
31. MW PSD 3rd Max. Pos. rel.Frecuencia relativa del tercer m´aximo de la densidad espectral de la fuente gl´otica con respecto al primer m´aximo. 32. MW PSD End Val. Pos. rel. Valor relativo de la mitad de la frecuen- cia de muestreo respecto al primer m´aximo de la densidad espectral de potencia.
33. MW PSD 1st Min. NSF.Esbeltez del primer valle en “V”en la envol- vente espectral de la densidad de potencia de la onda gl´otica: amplitud negativa del pico dividida por su anchura.
34. MW PSD 2nd Min. NSF.Esbeltez del segundo valle en“V” en la en- volvente espectral de la densidad de potencia de la onda gl´otica: amplitud negativa del pico dividida por su anchura.
35-46. Par´ametros biomec´anicos. Constituyen un conjunto robusto de descripto- res del funcionamiento mec´anico de la glotis, y junto con otros, ayudan en la determinaci´on de las posibles causas de una disfon´ıa, y en la cuantificaci´on del grado de la misma (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
35. Body Mass. Masa din´amica equivalente del cuerpo del pliegue vocal para cada ciclo gl´otico.
36. Body Losses. P´erdida por fricci´on equivalente del cuerpo del pliegue vocal para cada ciclo gl´otico.
37. Body Stiffness. Tensi´on transversal medida sobre el cuerpo del pliegue vocal para cada ciclo gl´otico.
38. Body Mass Unbalance. Diferencia entre las masas din´amicas del cuer- po del pliegue observadas en dos ciclos vecinos, dividida por su promedio. En otras palabras, desbalance del par´ametro 35 (Body Mass) en dos ciclos vecinos.
3.3. RASGOS PROPUESTOS
39. Body Losses Unbalance. Diferencia entre las p´erdidas por fricci´on del cuerpo del pliegue vocal observadas en dos ciclos vecinos, dividida por su promedio.
40. Body Stiffnes Unbalance. Desbalance de dos ciclos gl´oticos vecinos del par´ametro 37 (Body Stiffnes). Diferencia entre las tensiones del cuerpo del pliegue vocal observadas en dos ciclos vecinos, divididas por su promedio. 41. Cover Mass. Masa din´amica de la cubierta del pliegue vocal para cada
ciclo gl´otico.
42. Cover Losses. P´erdida por fricci´on de la cubierta del pliegue vocal para cada ciclo gl´otico.
43. Cover Stiffnes. Tensi´on transversal observada sobre la cubierta del plie- gue vocal para cada ciclo gl´otico.
44. Cover Mass Unbalance. Diferencia entre las masas din´amicas de la cubierta del pliegue vocal observadas en dos ciclos vecinos, dividida por su media. En otras palabras, desbalance del par´ametro 41 (Cover Mass) entre ciclos vecinos de fonaci´on.
45. Cover Losses Unbalance. Diferencia entre las perdidas por fricci´on de la cubierta del pliegue medidas en dos ciclos vecinos.
46. Cover Stiffness Unbalance. Desbalance del par´ametro 43 (Cover Stiff- nes) entre ciclos vecinos de fonaci´on, o lo que es lo mismo, la diferencia entre las tensiones de la cubierta del pliegue observadas en dos ciclos vecinos y dividida por su promedio.
47-58. Par´ametros de base temporal. Constituyen un descriptor completo de los instantes de inter´es del ciclo gl´otico (cierre, retorno, apertura), y junto con otros sirven en la caracterizaci´on de la disfon´ıa (aplicaci´on en detecci´on y gradaci´on de disfon´ıa).
47. Rel. Recov. 1 Time. Relaci´on entre el instante del primer tiempo de recuperaci´on y la duraci´on total del ciclo gl´otico.
48. Rel. Recov. 2 Time. Relaci´on entre el instante del segundo tiempo de recuperaci´on y la duraci´on total del ciclo gl´otico.
49. Rel. Open 1 Time. Relaci´on entre el instante del primer tiempo de apertura y la duraci´on total del ciclo gl´otico.
50. Rel. Open 2 Time. Relaci´on entre el instante del segundo tiempo de apertura y la duraci´on total del ciclo gl´otico.
51. Rel. Max. Ampl. Time. Relaci´on entre el instante en que se alcanza el m´aximo de la onda gl´otica y la duraci´on total del ciclo gl´otico.
52. Rel. Recov. 1 Ampl.. Relaci´on entre la amplitud en el primer tiempo de recuperaci´on y la amplitud pico a pico de la fuente gl´otica.
53. Rel. Recov. 2 Ampl.. Relaci´on entre la amplitud en el segundo tiempo de recuperaci´on y la amplitud pico a pico de la fuente gl´otica.
54. Rel. Open 1 Ampl. Relaci´on entre la amplitud en el primer tiempo de apertura y la amplitud pico a pico de la fuente gl´otica.
55. Rel. Open 2 Ampl. Relaci´on entre la amplitud en el segundo tiempo de apertura y la amplitud pico a pico de la fuente gl´otica.
56. Rel. Stop Flow Time. Relaci´on entre el instante de m´ınimo flujo y la duraci´on total del ciclo gl´otico.
57. Rel. Start Flow Time. Relaci´on entre el instante de inicio del flujo y la duraci´on total del ciclo gl´otico.
58. Rel. Closing Time. Relaci´on entre el instante de m´aximo flujo y la duraci´on total del ciclo gl´otico.
59-62. Par´ametros de defecto de cierre gl´otico. Constituyen un descriptor de los defectos de cierre, aducci´on, abducci´on y permanente de los pliegues vocales, y junto con otros, sirven en la caracterizaci´on de las imperfecciones detectadas en el ciclo gl´otico.
59. Val. Flow GAP. Relaci´on entre el escape de flujo durante la fase de contacto y el flujo total durante un ciclo gl´otico (medido sobre el flujo). 60. Val. Contact GAP. Relaci´on entre el escape de flujo durante la fase de
contacto y el flujo total durante un ciclo gl´otico (medido sobre la fuente gl´otica).
61. Val. Adduction GAP. Relaci´on entre el flujo durante la fase de aduc- ci´on y el flujo total durante un ciclo gl´otico.
62. Val. Permanent GAP. Relaci´on entre el flujo durante la fase de recu- peraci´on y el flujo total durante un ciclo gl´otico.
63-72. Par´ametros de temblor en la voz. Proporcionan informaci´on sobre la pre- sencia de defectos o irregularidades en la actuaci´on del sistema neuromotor vinculado al cierre gl´otico, puestos de manifiesto por la aparici´on de tem- blor en la voz (controlado o incontrolado). Tres de los par´ametros sirven de marcadores de la presencia de temblor. Los tres restantes informan sobre su frecuencia, perceptibilidad, y su amplitud relativa.
63. 1st. Order Cyc. Coeff. Primer coeficiente PARCOR en el modelo equi- valente autorregresivo de la tensi´on del cuerpo del pliegue vocal eliminan- do su media.
64. 2nd. Order Cyc. Coeff. Segundo coeficiente PARCOR en el mode- lo equivalente autorregresivo de la tensi´on del cuerpo del pliegue vocal eliminando su media.
65. 3rd. Order Cyc. Coeff. Tercer coeficiente PARCOR en el modelo equi- valente autorregresivo de la tensi´on del cuerpo del pliegue vocal elimi- nando su media.
66. Physiological Tremor Freq. Primera componente de la tensi´on del cuerpo del pliegue vocal eliminando su media. Suele distribuirse entre 2-4 Hz y se atribuye al temblor de car´acter fisiol´ogico.
3.3. RASGOS PROPUESTOS
67. Physiological Tremor Ampl. Amplitud de la primera componente de la tensi´on del cuerpo del pliegue, en % respecto al valor medio de la tensi´on del pliegue.
68. Neurological Tremor Freq. Segunda componente de la tensi´on del cuerpo del pliegue vocal eliminando su media. Suele distribuirse entre 5-8 Hz y se atribuye al temblor de car´acter neurol´ogico.
69. Neurological Tremor Ampl. Amplitud de la segunda componente de la tensi´on del cuerpo del pliegue, en % respecto al valor medio de la tensi´on del pliegue.
70. Fluttering Tremor Freq. Tercera componente de la tensi´on del cuerpo del pliegue vocal eliminando su media. Suele distribuirse entre 9-12 Hz y se atribuye al temblor de car´acter neurofisil´ogico.
71. Fluttering Tremor Ampl. Amplitud de la tercera componente de la tensi´on del cuerpo del pliegue, en % respecto al valor medio de la tensi´on del pliegue.
72. Tremor amplitude (rMSA). Valor eficaz de la tensi´on del pliegue vocal eliminando su media.