• No se han encontrado resultados

Diseño y construcción de un sistema para el control de encendido y apagado de dispositivos eléctricos por medio de comandos de voz

N/A
N/A
Protected

Academic year: 2020

Share "Diseño y construcción de un sistema para el control de encendido y apagado de dispositivos eléctricos por medio de comandos de voz"

Copied!
140
0
0

Texto completo

(1)La versión digital de esta tesis está protegida por la Ley de Derechos de Autor del Ecuador.. Los derechos de autor han sido entregados a la “ESCUELA POLITÉCNICA NACIONAL” bajo el libre consentimiento del autor.. Al consultar esta tesis deberá acatar con las disposiciones de la Ley y las siguientes condiciones de uso: • Cualquier uso que haga de estos documentos o imágenes deben ser sólo para efectos de investigación. o estudio académico,. y usted no. puede. ponerlos a disposición de otra persona. • Usted deberá reconocer el derecho del autor a ser identificado y citado como el autor de esta tesis • No se podrá obtener ningún beneficio comercial y las obras derivadas tienen que estar bajo los mismos términos de licencia que el trabajo original.. El Libre Acceso a la información, promueve el reconocimiento de la originalidad de las ideas de los demás, respetando las normas de presentación y de citación de autores con el fin de no incurrir en actos ilegítimos de copiar y hacer pasar como propias las creaciones de terceras personas.. Respeto hacia sí mismo y hacia los demás..

(2) ESCUELA POLITÉCNICA NACIONAL FACULTAD DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA. DISEÑO Y CONSTRUCCIÓN DE UN SISTEMA PARA EL CONTROL DE ENCENDIDO Y APAGADO DE DISPOSITIVOS ELÉCTRICOS POR MEDIO DE COMANDOS DE VOZ. PROYECTO PREVIO A LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN ELECTRÓNICA Y CONTROL. FÉLIX FABIÁN ROMERO FONSECA [email protected]. DIRECTOR: PhD. ROBIN GERARDO ÁLVAREZ RUEDA [email protected]. Quito, Noviembre 2010.

(3) I. DECLARACIÓN. Yo FÉLIX FABIÁN ROMERO FONSECA, declaro bajo juramento que el trabajo aquí descrito es de mi autoría; que no ha sido previamente presentada para ningún grado o calificación profesional; y, que he consultado las referencias bibliográficas que se incluyen en este documento.. A través de la presente declaración cedo mis derechos de propiedad intelectual correspondientes a este trabajo,. a la. Escuela Politécnica Nacional, según lo. establecido por la Ley de Propiedad Intelectual, por su Reglamento y por la normatividad institucional vigente.. _______________________________ FÉLIX FABIÁN ROMERO FONSECA.

(4) II. CERTIFICACIÓN. Certifico que el presente trabajo fue desarrollado por FÉLIX FABIÁN ROMERO FONSECA, bajo mi supervisión.. _________________________ Robin Álvarez Rueda DIRECTOR DEL PROYECTO.

(5) III. AGRADECIMIENTO. Agradezco a Dios por ser la guía e inspiración de mi vida y por las bendiciones que siempre me ha dado pues sin su amparo seguro nada de lo que hasta hoy he alcanzado hubiera sido posible.. Agradezco a mi familia por el apoyo fundamental e incondicional que siempre recibí de su parte durante el transcurso de mi vida en especial a mis padres Saúl y Fanny que siempre estuvieron a mi lado para darme las fuerzas necesarias para culminar mi carrera.. A mi compañera, gran amiga y ahora esposa Mónica que siempre fue mi aliento, mi apoyo y la que ha sido fiel testigo del sacrificio y lucha que ha significado obtener y culminar esta etapa de mi vida.. A mi director de Tesis y gran persona el Dr. Robin que con sus consejos y su paciencia apoyaron el desarrollo del presente trabajo.. A todos mis profesores que durante mi vida estudiantil me llenaron de conocimiento y me dieron las herramientas necesarias para sacar adelante este trabajo y mi vida profesional y en general a todos los que de alguna u otra forma aportaron en el desarrollo de este proyecto de titulación.. Félix Fabián Romero Fonseca.

(6) IV. DEDICATORIA. Este trabajo se lo dedico a Dios, a mi esposa a mi familia y a mi bebe en camino pues ellos siempre serán parte esencial, inspiración y motivación en mi vida.. Félix Fabián Romero Fonseca.

(7) V. CONTENIDO DECLARACIÓN………………………………………………………..……………….…….II CERTIFICACIÓN…………………………………………………………………………….III CONTENIDO…………………………………………………………………..…………….VI RESUMEN………………………………………………………………….…….……..…XVI PRESENTACIÓN…………………………………………………………..………….…XVIII. CAPÍTULO 1 INTRODUCCIÓN 1.1 RECONOCIMIENTO DE VOZ………………………………...………………………1 1.1.1 TAREAS DE RECONOCIMIENTO DE VOZ………………………………....2 1.2 BREVE HISTORIA….…...…………………..………………………………………....3 1.3 CLASIFICACIÓN…………..…………………………………………………………...5 1.4 DIFICULTADES QUE ENFRENTAN LOS SISTEMAS DE RECONOCIMIENTO DEL HABLA……..………………………………………………………………………6 1.5 FUNCIONAMIENTO DE LOS SISTEMAS DE RECONOCIMIENTO DEL HABLA CON ENTRENAMIENTO PARA PC…………………………………………………7 1.5.1 PRINCIPIO DE FUNCIONAMIENTO………………….…………..……….....7 1.5.2 ETAPAS…………….…….………………………………………………..…….8 1.6 ESTRUCTURA GENERAL DE UN SISTEMA DE RECONOCIMIENTO DE VOZ………………………………………………………………………...…………….9 1.7 PROGRAMAS COMERCIALES PARA RECONOCIMIENTO DE VOZ…….……10 1.7.1 DRAGON NATURALLY SPEAKING PREFERRED…………………..……11 1.7.2 VIA VOICE PRO MILLENNIUM EDITION……………………………...……14 1.7.3 WINDOWS VISTA…………………………………………………………...…15 1.8 APLICACIONES DEL SOFTWARE DE RECONOCIMIENTO DE VOZ….….….16 1.8.1 RECONOCIMIENTO DE VOZ Y AUTOMATIZACIÓN DE LA CASA........16 1.8.2 RECONOCIMIENTO DE VOZ Y MOVILIDAD……………………………...17 1.8.3 RECONOCIMIENTO DE VOZ COMO HERRAMIENTA PARA PERSONAS DISCAPACITADAS…...………………….………………………………….…18 1.8.4 RECONOCIMIENTO DE VOZ EN ATENCIÓN DE LA SALUD……......…19.

(8) VI. CAPÍTULO 2 DESCRIPCIÓN, DISEÑO E IMPLEMENTACIÓN DEL HARDWARE 2.1 REPRESENTACIÓN BÁSICA DEL PROTOTIPO….…………………………..…20 2.2 PLACA PRINCIPAL PP1……………………………………………………………..21 2.2.1 BLOQUE DE COMUNICACIÓN RS 232…………………………………....21 2.2.2 BLOQUE DE COMUNICACIÓN RF………………………………………....22 2.2.3 BLOQUE DE SALIDAS (DO)…………...…………………………………....24 2.2.4 BLOQUE DE ENTRADAS (DI)……………………………………………....28 2.3 TARJETA PARA EL CONTROL DE MOTORES M1 Y M2………….…………...38 2.3.1 BLOQUE DE ENTRADAS (DI)……………………………………………....39 2.3.2 BLOQUE DE SALIDAS (DO)………………….………………….…….…....40 2.4 TARJETA PARA RECEPCIÓN DE RF……………………..….………….………..46. CAPÍTULO 3 DISEÑO DEL SOFTWARE 3.1 TRABAJO DESARROLLADO CON DRAGON NATURALLY SPEAKING…......51 3.2 TRABAJO DESARROLLADO CON VISUAL BASIC 6.5…………..……………..57 3.2.1 PANTALLAS QUE MUESTRA EL HMI DE LA APLICACIÓN…………....57 3.2.1.1 Pantalla de Presentación de la Aplicación…………………...……57 3.2.1.2 Pantallas de Seguridad de la Aplicación……………………..……58 3.2.1.3 Pantalla Principal………………………………………………..……59 3.2.2 COMANDOS DISPONIBLES PARA LA APLICACIÓN…………………....67 3.2.3 CÓDIGO PRINCIPAL DESARROLLADO PARA LA APLICACIÓN EN VISUAL BASIC…………………………………………..…………………....73 3.2.3.1 Control por Comandos de voz………………………………………73 3.2.3.2 Control Manual efectuado a través del HMI……….………………75 3.2.3.3 Control de Encendido Temporizado…………………..……………77 3.2.3.4 Control de Apagado Temporizado …………………………………77 3.2.3.5 Control de Televisión…………………………………………...……78 3.2.3.6 Control Temporizados Para Visualización, Proceso Y Monitoreo del Prototipo …………………………………………………….…78 3.3 PROGRAMACIÓN DESARROLLADA EN LOS MICROCONTROLADORES.....84 3.3.1 PROGRAMACIÓN DESARROLLADA EN EL MICROCONTROLADOR DE LA PLACA PRINCIPAL……………………………………………………....84 3.3.2 PROGRAMACIÓN DESARROLLADA EN LOS MICRO DE LA PLACA PARA RECEPCIÓN DE RF…………………………………………………..88.

(9) VII. CAPÍTULO 4 DIAGRAMAS DE CONEXIONES, LAZOS DE CONTROL E IMPLEMENTACIÓN 4.1 DIAGRAMAS DE CONEXIÓN…………………….….…………………………..…92 4.1.1 DIAGRAMA DE CONEXIÓN PLACA PRINCIPAL………………………….92 4.1.2 DIAGRAMA DE CONEXIÓN PARA ALIMENTACIÓN VDC……………….95 4.1.3 DIAGRAMA DE CONEXIÓN PARA EL CONTROL DE MOTOR DC 1.…96 4.1.4 DIAGRAMA DE CONEXIÓN PARA EL CONTROL DE MOTOR DC 2…..97 4.1.5 DIAGRAMA DE CONEXIÓN GENERAL……………………………..…..….99 4.2 DIAGRAMAS DE LAZO.……………………………………………...…………….100 4.2.1 NOMENCLATURA ASOCIADA PARA EL ETIQUETADO DE LOS CABLES……..…………………………….…………………………………..100 4.3 IMPLEMENTACIÓN………….…………………….….……………………………107 4.4 COSTOS………………………………………………………………………………111. CAPÍTULO 5 PRUEBAS Y RESULTADOS 5.1 PRUEBAS…………….…………………….….………………………………….....112 5.1.1 ENSAYO DE PRECISIÓN DE RECONOCIMIENTO Y RUIDO AMBIENTAL………………………………………………………………......112 5.1.2 ENSAYO DE PRECISIÓN Y ALCANCE PARA CONTROL INALÁMBRICO……………………………………………………………........113 5.2 RESULTADOS…………………………….….…………………………………..…115. CAPÍTULO 6 CONCLUSIONES Y RECOMENDACIONES 6.1 CONCLUSIONES…………….…………………….….……………………………116 6.2 RECOMENDACIONES…………………………….….…………………………....117 REFERENCIAS BIBLIOGRÁFICAS……………………………………………………..118 ANEXOS……………………………………………………………………………………120.

(10) VIII. ANEXO A Data Sheet del Microcontrolador PIC 16F877A…..……………………………………121. ANEXO B Data Sheet del Microcontrolador PIC 16F628A…..……………………………………124. ANEXO C Data Sheet del Microcontrolador ATMEGA 8…..………………………………………127. ANEXO D Data Sheet del Módulo Emisor de RF TLP434A…..………………………………..…130. ANEXO E Data Sheet del Módulo Emisor de RF RLP434…..……………………………………132. ANEXO F Data Sheet Transistor TIP110……………………...……………………….………..…134. ANEXO G Data Sheet Transistor 2N3904……………………...………………………………..…139. ANEXO H Data Sheet Opto-Transistor PC817……………………...…………………………..…143.

(11) IX. LISTA DE FIGURAS CAPÍTULO 1 Figura 1.1 Tareas del Reconocimiento de Voz………..………………………………….2 CAPÍTULO 2 Figura 2.1 Esquemático de bloques del prototipo…………………………..…………..20 Figura 2.2 Bloque de Placa Principal……………..…………………………..…………..21 Figura 2.3 Bloque de Comunicación RS 232..……………..………………..…………..21 Figura 2.4 Esquema de conexión para Comunicación RS 232…….…………..…...…22 Figura 2.5 Bloque de Comunicación RF……..……………..………………..…………..22 Figura 2.6 Esquema de conexión del modulo transmisor de Radio Frecuencia..……23 Figura 2.7 Esquema de Onda generada por el microcontrolador para el microcontrolador por RF…………………………………………….…………………..…23 Figura 2.8 Bloque de Salidas (DO)………………………………………………………..24 Figura 2.9 Esquemático electrónico para el control de cargas AC………..…………..25 Figura 2.10 V(V) vs Ic(mA) para Saturación del Transistor..……………..……..……..27 Figura 2.11 Bloque de Entradas (DI)……………………………………………………..28 Figura 2.12 Esquema electrónico y Formas de onda de voltaje en la carga, voltaje en R, voltaje en el diodo del opto acoplador y voltaje en la entrada del microcontrolador cuando la carga esta energizada………………………………………………………….29 Figura 2.13 Esquema electrónico y Formas de onda de voltaje en la carga, voltaje en R, voltaje en el diodo del opto acoplador y voltaje en la entrada del microcontrolador cuando la carga esta des energizada………………………………………...…………..30 Figura 2.14 Esquema eléctrico equivalente cuando la carga este des energizada………………………………………………………………………..………….31 Figura 2.15 Esquema de interconexión de elementos eléctricos de la placa Principal………………………………………………………………………………………34 Figura 2.16 Ruteo de la placa principal lado 1…………………..………………………35 Figura 2.17 Ruteo de la placa principal lado 2………………….….……………………36 Figura 2.18 Vista Inferior de la Placa Principal …………………..………..……………37 Figura 2.19 Vista Superior de la Placa Principal Lado 1…..……….….……….………37 Figura 2.20 Vista Superior de la Placa Principal Lado 2……….……………….………38 Figura 2.21 Bloque de Control de Motores…………………..…………………………..38 Figura 2.22 Bloque de Entradas para el Control de Motores…………………………..39 Figura 2.23 Esquema de Conexionados de Pulsadores y Sensores de Entrada para la placa de Control de Motores …………………………….…….….……………………39 Figura 2.24 Bloque de Salidas para el Control de Motores…..………………………..40.

(12) X. Figura 2.25 Esquema de Conexionado de Control e Inversión de giro Motores DC……………………………………………………………...……..………………………41 Figura 2.26 V(V) vs Ic(mA) para Saturación del TIP-110 …………...……….….….…43 Figura 2.27 Esquema de Conexionado para Control de Motores……………………..44 Figura 2.28 Ruteo de la Placa para Control de Motores 1 y 2…………………………44 Figura 2.29 Vista Inferior de la Placa para Control de Motores 1 y 2…………………45 Figura 2.30 Vista Superior de la Placa para Control de Motores 1 y 2……….………45 Figura 2.31 Vista Frontal de la Placa para Control de Motores 1 y 2…………………45 Figura 2.32 Bloque de RF……………………………………...…………………………..46 Figura 2.33 Esquema de Conexionado para Placa de Recepción de RF…………………………………………………………………………..…………………47 Figura 2.34 Esquema de Onda recibida por el microcontrolador del módulo de RF………………….….……………………………………………………………..….……47 Figura 2.35 Ruteo de Placa del módulo receptor de RF…………………………….…48 Figura 2. 36 Vista Inferior de la Placa del módulo receptor de RF ……………………48 Figura 2.37 Vista Frontal de la Placa del módulo receptor de RF…………………..…49 Figura 2.38 Vista Superior de la Placa del módulo receptor de RF...…………………49 Figura 2.39 Montaje de la Placa del módulo receptor de RF……………….……….…49 Figura 2.40 Módulo receptor de RF………….………………….….………………….…50 CAPÍTULO 3 Figura 3.1 Formulario de Asistente de usuario………………….………….……………52 Figura 3.2 Formulario para elegir el sistema de sonido …………………..…………...52 Figura 3.3 Formulario para verificar el micrófono……………….………………………53 Figura 3.4 Calibración del volumen…………………………………………..…………...53 Figura 3.5 Calidad de Sonido……………………………………………………….……..54 Figura 3.6 Prueba completada de la Calidad de Sonido……………………………….54 Figura 3.7 Pantalla para entrenamiento………………………………………………….55 Figura 3.8 Entrenamiento del Dragón Natural Speaking……………………….....…..55 Figura 3.9 Pantalla de proceso de información …………………………………………56 Figura 3.10 Pantalla de creación de Usuarios……………………………….…………..56 Figura 3.11 Barra de herramientas del Dragon Naturally Speaking…………………..57 Figura 3.12 Esquema de la Pantalla de Presentación………………………………….58 Figura 3.13 Esquema de la Pantalla de Seguridad……………………………………..58 Figura 3.14 Esquema de la Pantalla Principal……………………………………..…….59 Figura 3.15 Pestaña de Seguridad………………………………………………………..60 Figura 3.16 Pestaña de Control……………………………………………….…………..60 Figura 3.17 Pestaña de Visualización……………………………………………..……..60.

(13) XI. Figura 3.18 Caja de Texto para ejecución de Comandos de voz……………………..61 Figura 3.19 Pestaña de Control de Iluminación de Apagado de Cargas……………..61 Figura 3.20 Pestaña de Control de Iluminación de Encendido de Cargas……….…..61 Figura 3.21 Pestaña de Control del Motor para abrir la cortina o puerta …………….61 Figura 3.22 Pestaña de Control del Motor para cerrar la cortina o puerta……………62 Figura 3.23 Pestaña de Control del Motor para detener la cortina o puerta….…...…62 Figura 3.24 Pantalla del Submenú Temporizado Encendido de Cargas……………..62 Figura 3.25 Pantalla del Submenú Temporizado Apagado de Cargas…….……..…..63 Figura 3.26 Pantalla del Submenú Control de Televisión………………………………64 Figura 3.27 Pantalla de Visualización General…………………………………………..65 Figura 3.28 Pantalla de Visualización Parcial…………………………………………...66 Figura 3.29 Pantalla del Submenú Calendario………………………………………..…66 Figura 3.30 Diagrama de Flujo para Control de Comandos de Voz………………….75 Figura 3.31 Diagrama de Flujo para el Control Manual efectuado a través del HMI..76 Figura 3.32 Diagrama de Flujo para la programación de la carga Cocina……………81 Figura 3.33 Diagrama de Flujo para microcontrolador implementado en la placa principal………………………………………………………………………………………85 Figura 3.34 Diagrama de Flujo para la interrupción en el microcontrolador 16F628A de la placa RF …………………………………………………………………………...….88 Figura 3.35 Diagrama de Flujo para microcontrolador 16F628A de la placa RF.. ….89 Figura 3.36 Diagrama de Flujo para el microcontrolador ATMEGA 8 de la placa RF……………………………………………………………………………………………..90 CAPÍTULO 4 Figura 4.1 Esquema de ubicación de Placas y Cargas en maqueta………………………………………………………………………….…………..91 Figura 4.2 Esquema para Conexión de Placa Principal……………….………....…….94 Figura 4.3 Esquema para Conexión de Placa de Alimentación VDC…………...…….95 Figura 4.4 Esquema para Conexión de Placa de Control de Motor DC 1……….…...97 Figura 4.5 Esquema para Conexión de Placa de Control de Motor DC 2………....…98 Figura 4.6 Diagrama de Conexionado General………………………….……...……....99 Figura 4.7 Etiquetas para Conductores con Referencia Cruzada……………....…..100 Figura 4.8 Nomenclatura de Conductores………………………………………...……101 Figura 4.9 Nomenclatura de Cables…………………………………………...…...…...101 Figura 4.10 Diagrama de Lazo para el Control de las luminarias del garaje, dormitorio y baño……………………………………………………………………..…………..……102 Figura 4.11 Diagrama de Lazo para el Control de las luminarias de cocina y comedor…………………………………………………………………………...……..…103.

(14) XII. Figura 4.12 Diagrama de Lazo para el Control de la luminaria de la sala y ventilador…………………………………………………………………………....…...…104 Figura 4.13 Diagrama de Lazo para Control de Motor DC 1………………...….....…105 Figura 4.14 Diagrama de Lazo para Control de Motor DC 2…………...…………….106 Figura 4.15 Esquemático de la ubicación de los elementos principales……....……108 Figura 4.16 Esquemático de la ubicación de la placa principal y secundaria………109 Figura 4.17 Rutas de Cables entre Elementos y Placas………………………...……110 CAPÍTULO 5 Figura 5.1 Esquema de ubicación de equipos para determinar la precisión de reconocimiento …………………………………………………………….…………...…113 Figura 5.2 Esquema de ubicación del dispositivo receptor para determinar el alcance máximo de los módulos de radio frecuencia………………………………………..….114.

(15) XIII. LISTA DE TABLAS CAPÍTULO 1 Tabla 1.1 Comandos para Edición de Texto ………………………….…………………12 Tabla 1.2 Comandos para inserción de Signos de Puntuación……………….……….13 Tabla 1.3 Comandos para Seleccionar Caracteres ………………………….…………13 Tabla 1.4 Comandos para Controlar Movimiento del Mouse…………………..………14 CAPÍTULO 2 Tabla 2.1 Características eléctricas de las cargas AC del prototipo…….………….…24 Tabla 2.2 Características eléctricas del Relé JQC-3F-1C…………………….………..25 Tabla 2.3 Asignación de pines del microcontrolador…………………….…….………..33 Tabla 2.4 Características Eléctricas de los Motores 1 y 2………………...……………41 CAPÍTULO 3 Tabla 3.1 Descripción de los Comandos Generales de Voz……………………...……67 Tabla 3.2 Descripción de los Comandos de Voz para el Control de TV…………..….67 Tabla 3.3 Descripción de los Comandos de Voz para cambiar la hora de Encendido y Apagado Temporizado para las cargas…………………………………………………..68 Tabla 3.4 Descripción de los Comandos de Voz para cambiar los minutos de Encendido y Apagado Temporizado para las cargas…………………………….……..68 Tabla 3.5 Descripción de los Comandos de Voz para el Control de la iluminación del Baño………………………………………………………………………………………..…70 Tabla 3.6 Descripción de los Comandos de Voz para el Control de la iluminación de la Cocina………………………………………………………………………………..……70 Tabla 3.7 Descripción de los Comandos de Voz para el Control de la iluminación del Comedor……………………………………………………………………………………..70 Tabla 3.8 Descripción de los Comandos de Voz para el Control de la iluminación del Dormitorio…………………………………………………………………………………….71 Tabla 3.9 Descripción de los Comandos de Voz para el Control de la iluminación del Garaje……………………………………………………………………………………...…71 Tabla 3.10 Descripción de los Comandos de Voz para el Control de la iluminación de la Sala………………………………………………………………………………………...71 Tabla 3.11 Descripción de los Comandos de Voz para el Control del Ventilador…...72 Tabla 3.12 Descripción de los Comandos de Voz para el Control de la Puerta……..72 Tabla 3.13 Descripción de los Comandos de Voz para el Control de la Cortina…….72 Tabla 3.14 Programación de Control por Comandos de Voz……………………….…73.

(16) XIV. Tabla 3.15 Programación para el Control Manual efectuado a través del HMI………76 Tabla 3.16 Programación relacionada al evento Change para el cambio en la hora de encendido ……………………………………………………………………………..….…77 Tabla 3.17 Programación relacionada al evento Change para el cambio en la hora de apagado ……………………………………………………………………...……………...77 Tabla 3.18 Programación relacionada con el botón para encendido de la televisión.78 Tabla 3.19 Programación asociada para el control de la carga Cocina…………....…78. CAPÍTULO 4 Tabla 4.1 Características Eléctricas de Alimentación y Control para la Placa Principal………………………………………………………………………………….…..92 Tabla 4.2 Características Eléctricas para Placa de Alimentación VDC………..……..95 Tabla 4.3 Características Eléctricas de Alimentación y Control para el Motor DC 1..96 Tabla 4.4 Características Eléctricas de Alimentación y Control para el Motor DC 2..97 Tabla 4.5 Simbología de Elementos... …………………………………………..……..107 Tabla 4.6 Nomenclatura de Placas………………………………………………...……108 Tabla 4.7 Costos de Materiales.....………………………………………………………111 CAPÍTULO 5 Tabla 5.1 Tabla de precisión de reconocimiento Vs. Volumen……………………….115 Tabla 5.2 Tabla de ubicación del receptor y resultados de ejecución de los comandos…………………………………………………………….…………………….115.

(17) XV. RESUMEN Este proyecto es el resultado de la investigación y del afán de suministrar a las personas con discapacidad motriz una herramienta que facilite y mejore su estilo de vida, de tal forma que aquellas personas a las cuales les es difícil o en extremo imposible el ejecutar acciones típicas dentro de la vida cotidiana como el encender y apagar luminarias, ventilación, abrir puertas, cortinas y manejar las opciones básicas de control de una televisión lo puedan hacer a través de comandos de voz.. Frente al problema planteado se buscó desarrollar una ayuda tecnológica que le provea al usuario una opción para ejecutar estas acciones a través de comandos emitidos verbalmente. con características y ventajas adicionales a las requeridas. que son propias del equipo desarrollado. Es así como se eligió usar un software comercial. para desarrollar el prototipo de tal forma que no solo cumpliese con los. objetivos evidentes que plateaba este requerimiento sino que adicionalmente le proporcionará al usuario. una herramienta para el uso del computador y sus. aplicaciones típicas como manejo de editores de texto, hojas de cálculo e internet, entre otras a través de comandos de voz.. Adicional al trabajo desarrollado en software y hardware para que los comandos emitidos verbalmente se tradujeran en acciones sobre las cargas, se buscó la implementación física para cual se desarrollo una maqueta en la que se ubicó todas las cargas como si estuvieran ubicadas en la vida real en la que el cableado fue centralizado según los esquemas de conexionado lo indican, en el caso que el cableado no pueda ser efectuado según los requerimientos del prototipo, se plantea la opción de la transmisión de los comandos en forma inalámbrica con lo cual el prototipo podrá ser implementado sin problema en cualquier medio según las características y limitaciones propias de cada vivienda..

(18) XVI. Una vez desarrollado el prototipo este fue sometido a ensayos que permitieron determinar la precisión de reconocimiento y la inmunidad al ruido ambiental que posee la aplicación así como el rango máximo dentro del cual es posible implementar el control inalámbrico, dejando así planteada esta solución como una herramienta factible de implementarse en nuestro medio en pro mejora del estilo de vida de las personas con discapacidad motriz..

(19) XVII. PRESENTACIÓN Este trabajo está formado por seis capítulos en los cuales se han incluido las partes esenciales requeridas para su desarrollo así como los resultados y conclusiones obtenidas:. En el capítulo uno se hace una descripción resumida de los tipos, características y limitaciones que poseen los sistemas de reconocimiento de voz, además se hace un análisis de los diferentes programas comerciales disponibles en el mercado y las aplicaciones más usuales que hoy en día están en auge.. En el capítulo dos se describen brevemente los bloques constitutivos de cada una de las tarjetas que conforman el hardware de este prototipo, así como el diseño y selección de los elementos electrónicos que contienen cada una de ellas.. En el capítulo tres se muestran las herramientas de software utilizadas y la aplicación gráfica desarrollada que le permitirá al usuario interactuar con el prototipo, adicionalmente se muestran los diagramas de flujo bajo los cuales se efectuó la programación tanto para el desarrollo del interfaz hombre maquina así como para la de los microcontroladores.. En el capítulo cuatro se muestran los esquemas de conexionado, diagramas de lazo e implementación que facilitaran el cableado e identificación de cada uno de los elementos y su ubicación dentro del prototipo.. En el capítulo cinco se resumen y tabulan las pruebas a las cuales fue sometido el prototipo con el propósito de determinar la precisión de reconocimiento así como el alcance máximo de los módulos de radio frecuencia..

(20) XVIII. El capítulo seis muestra las conclusiones y recomendaciones obtenidas como resultado del término del presente proyecto..

(21) 1. CAPÍTULO 1 INTRODUCCIÓN. 1.1. RECONOCIMIENTO DE VOZ1. El reconocimiento de voz o reconocimiento del habla es el proceso de conversión de un mensaje hablado en texto, que permite al usuario una “comunicación” con la computadora o algunos dispositivos diseñados para el efecto. En este tipo de comunicación, la identidad del interlocutor va a estar fuertemente correlacionada con las características fisiológicas y de comportamiento del mismo (hábitos lingüísticos, entonación de las frases, entre otras). Con la tecnología actual existen tres áreas en las cuales el volumen de utilización de sistemas. de. reconocimiento de voz están creciendo rápidamente y estas son:. servicios de telecomunicación, sistemas de control, sistemas de entrada de datos y acceso a bases de datos. Una de las aplicaciones más inmediatas de los sistemas de reconocimiento de voz como interfaz entre hombre y máquina es la ayuda a discapacitados físicos. Mediante comandos orales se pueden controlar muchas de las funciones y actividades cotidianas. Ejemplos en fase de experimentación son: la silla de ruedas controlada oralmente, camas hospitalarias, control oral de teléfonos (por ejemplo: guía telefónica controlada oralmente) y la activación oral de aparatos y sistemas domésticos.. 1. Referencia: http://www.nichcy.org/pubs/spanish/fs2stxt.htm.

(22) 2. 1.1.1 TAREAS DE RECONOCIMIENTO DE VOZ2 Dependiente de la aplicación que se le quiera dar a los sistemas de reconocimiento de voz se desarrollan sistemas con capacidad para reconocer un número limitado de palabras grabando unos ejemplos como patrones a identificar y otros sistemas más complejos que le permiten al sistema reconocer un vocabulario completo permitiéndole al usuario hablar con naturalidad haciendo que el sistema. identifique. las palabras frases emitidas por el hablante. Cualquiera que sea el sistema de reconocimiento de voz este debe cumplir tres tareas las cuales deberán ser invisibles al usuario de la interfaz y son las siguientes:. Figura 1.1 Tareas del Reconocimiento de Voz. –. Pre-Procesamiento: Convierte la entrada de voz a una forma que el sistema de reconocimiento pueda procesar.. –. Reconocimiento: El reconocimiento es un proceso de clasificación en el cual la señal de voz se analiza en segmentos de corta duración y. 2. Referencia: http://www.slidefinder.net/r/reconocimiento_voz_grupo_pas_universidad/8058093.

(23) 3. representada mediante su contenido frecuencial, de forma análoga al funcionamiento del oído, posteriormente un proceso de clasificación asigna a cada segmento o conjuntos consecutivos de segmentos una unidad con significado lingüístico y finalmente un procesador lingüístico asigna un significado a las secuencias de unidades tomando como referencia. la estructura sintáctica, semántica y pragmática del. lenguaje. –. Comunicación: Envía lo reconocido al sistema o aplicación final (Software/Hardware). 1.2. BREVE HISTORIA3. Durante las últimas décadas, la investigación en el campo del reconocimiento de voz se ha venido desarrollando de una forma intensa, empujada por los avances en el procesamiento de señales, algoritmos, arquitecturas y plataformas de cómputo.. La historia de la investigación en el campo del reconocimiento del habla, se ha venido desarrollando durante un periodo que abarca la segunda mitad del siglo XX. Los primeros intentos por construir máquinas que realicen tareas de reconocimiento se remontan a la década de los 50, cuando diversos investigadores trataban de explotar los principios fundamentales de la fonética acústica, inclusive muchas de las técnicas utilizadas con éxito debieron esperar más de 10 años para pasar de la teoría a la práctica inclusive en laboratorios.. Algunos de sus principales hitos fueron: 1952 en Bell labs, reconocimiento aislado de dígitos, medición de resonancia. espectral en vocales, 1959 reconocimiento de. vocales y algunas consonantes, con analizador de espectro y comparadores de patrones con resultados del 93%.. 3. Referencia: http://catarina.udlap.mx/u_dl_a/tales/documentos/lis/ahuactzin_l_a/capitulo1.pdf.

(24) 4. En los 60 se comenzó a experimentar con normalización temporal según la detección de los puntos de comienzo y fin de las palabras, utilizando en general hardware específico e inicios de uso de computadoras.. En los 70 hubo avances significativos en reconocimientos de palabras aisladas y comienzos de experimentación en reconocimiento independiente del locutor (speaker independent). Se advierte que las fuentes de información semántica, sintáctica y contextual, ayudan a mejorar la calidad de los sistemas. El reconocimiento de una sentencia completa de gramática acotada requería de 50 computadoras (HARPY system del Carnegie Mellon University).. En los 80 se aplicaron los conceptos de dynamic time warping.. Se produce un. importante cambio de paradigma de comparación de plantillas hacia el modelado estadístico/probabilístico como un gran avance de aproximación al reconocimiento de voz.. A mitad de los 80 se hizo masiva una técnica que revolucionó el campo de reconocimiento, se trata de los modelos ocultos de Markov o HMM que obtuvo excelentes resultados en el modelado de señales de voz y virtualmente indispensable hoy en día. Se reintroduce el uso de redes neuronales (ANN) que habían vencido algunos obstáculos de tipo conceptual y de recursos necesarios para su implementación. También se. comenzó a experimentar con. reconocimiento. continuo de vocabularios largos independientes del locutor.. En los 90 se comenzó a hacer énfasis en interfaces de lenguaje natural y recuperación de la información en grandes documentos de voz. Continuó la investigación de reconocimiento continuo en vocabularios grandes. a usarse. masivamente a través de redes telefónicas y en el estudio de sistemas en condiciones de ruido..

(25) 5. Antes y durante la mitad de los ´90 se dio la investigación de sistemas híbridos HMMANN, que también han dado excelentes resultados siendo la excelencia de los motores de reconocimiento de voz de hoy en día.. 1.3. CLASIFICACIÓN4. Los sistemas de reconocimiento de voz pueden clasificarse según los siguientes criterios: • Entrenabilidad: determina si el sistema necesita un entrenamiento previo antes de empezar a usarse. • Dependencia del hablante: determina si el sistema debe entrenarse para cada usuario o es independiente del hablante. • Continuidad: determina si el sistema puede reconocer habla continúa o el usuario debe hacer pausas entre palabra y palabra. • Robustez: determina si el sistema está diseñado para usarse con señales poco ruidosas o, por el contrario, puede funcionar aceptablemente en condiciones ruidosas, ya sea ruido de fondo, ruido procedente del canal o la presencia de voces de otras personas. • Tamaño del dominio: determina si el sistema está diseñado para reconocer lenguaje de un dominio reducido (unos cientos de palabras p. e. reservas de vuelos o peticiones de información meteorológica) o extenso (miles de palabras).. 4. Referencia: http://es.wikipedia.org/wiki/Reconocimiento_del_habla.

(26) 6. 1.4. DIFICULTADES. QUE. ENFRENTAN. LOS. SISTEMAS. DE. RECONOCIMIENTO DEL HABLA Existen muchos factores que influyen en la dificultad del proceso de reconocimiento del habla y por tanto en su rendimiento, pero entre todos ellos destaca la variabilidad de la señal de voz que a su vez depende tanto de factores intrínsecos al fenómeno de producción de voz como a factores externos al mismo. Dentro de los factores intrínsecos destacan los siguientes: • Variabilidad de los sonidos, debido fundamentalmente a los distintos acentos o formas de hablar de cada persona. • Variabilidad en la producción de los sonidos, debido fundamentalmente a las distintas velocidades de producción, coarticulación, inclusión de ruidos (apertura y cierre de labios, respiración, sonidos de duda, por ejemplo: eh, uuh), contexto de la conversación, estado anímico, etc. Entre los factores externos destacan: • Variabilidad en la cadena de conversión y transmisión de la señal eléctrica, debido a las diferencias entre las características de los micrófonos, líneas telefónicas, etc. • Variabilidad en el ruido captado con la señal de voz, debido a la existencia en las proximidades del micrófono de otras fuentes sonoras (TV, radio, carretera, impresoras, otras conversaciones, etc.) • A estos factores de variabilidad acústica habrá que añadir otros factores de variabilidad lingüística relacionados con las distintas formas dialécticas de hablar un idioma, la utilización de palabras no contempladas en el vocabulario de la aplicación, la construcción de frases no permitidas por la gramática del.

(27) 7. lenguaje, la utilización de abreviaturas, los escenarios semánticos de las palabras, etc.. Todo ello hace que el reconocimiento automático del habla por parte de una máquina no sea un problema tan trivial como a primera vista pueda parecer.. 1.5. FUNCIONAMIENTO. DE. LOS. SISTEMAS. DE. RECONOCIMIENTO DEL HABLA CON ENTRENAMIENTO PARA COMPUTADORA. 1.5.1 PRINCIPIO DE FUNCIONAMIENTO5 En una computadora personal, un sistema de reconocimiento de voz suele captar las palabras expresadas en un micrófono conectado a la tarjeta de sonido. El procesador de señales digitales de la tarjeta de sonido transforma el sonido analógico de su voz en datos digitales. Después estos datos son procesados por el software de reconocimiento de voz. El software de reconocimiento de voz analiza los sonidos de su voz y los convierte en fonemas. Luego, el software analiza el contenido de su voz, compara los grupos de fonemas con las palabras de un diccionario digital que en lista las combinaciones de fonemas con las palabras de un idioma (español, francés o cualquier otro). Cuando encuentra una palabra, el software la exhibe escrita correctamente en la pantalla. El primer paso al utilizar una aplicación desarrollada para el reconocimiento de voz es enseñar a la computadora a reconocer su estilo de hablar. La enseñanza consiste en leer una serie de textos breves en un micrófono conectado a su computadora, acción conocida generalmente como proceso de entrenamiento.. 5. Referencia:http://www.spanish-translator-services.com/espanol/preguntas-frecuentes/Reconocimiento -de-voz-como-funciona.htm.

(28) 8. Puede enseñar a su computadora mediante el Tutorial de reconocimiento de voz, el cual exhibe párrafos, espera que usted los lea y crea su perfil de voz personal. Una vez concluido el tutorial, la aplicación le permite emplear el reconocimiento de voz para emitir comandos verbalmente en Windows y dictar texto en Microsoft Word y Excel, y otras aplicaciones de Windows que soporte esta función. El software de reconocimiento de voz se puede integrar con el software de procesamiento de textos para introducir texto con sólo hablar en un micrófono e inclusive podria usarse para activar los controles de Windows en lugar de utilizar mouse. El software de reconocimiento de voz disponible en el mercado también funciona con el navegador, lo cual le permite navegar con su voz por la web. 1.5.2 ETAPAS2 Toda aplicación desarrollada para el reconocimiento de voz efectúa el trabajo en dos etapas básicamente: • Etapa de entrenamiento: en esta etapa el usuario emite una cantidad de pronunciaciones (elementos del habla: unidades básicas de las palabras, palabras, frases, oraciones, etc.) previamente definidas por el programa de reconocimiento de voz para desarrollar un modelo en fusión del motor matemático de la aplicación. • Etapa de reconocimiento (superada la etapa de entrenamiento): se le pide que identifique una pronunciación particular dada, como alguna de las que ya conoce o parecida a las que conoce o simplemente como desconocida. Esto significa que la pronunciación a reconocer no tiene que ser, necesariamente, una de las que se usan en la etapa de entrenamiento..

(29) 9. La información almacenada o retenida por el programa está constituida por propiedades extraídas de todas las pronunciaciones de entrenamiento.. No se almacenan las pronunciaciones, sino propiedades de ese conjunto. Así se evita almacenar datos redundantes y con ello darle al sistema la propiedad de responder en forma rápida, a cualquier solicitud de identificación de alguna señal de entrada.. 1.6. ESTRUCTURA. GENERAL. DE. UN. SISTEMA. DE. RECONOCIMIENTO VOZ2 a. Módulo de adquisición de datos: realiza la conversión analógica a digital.. b. Módulo de extracción de propiedades de la señal de voz: compresión de los datos para obtener un vector de propiedades (energía espectral, tono, formantes, donde empieza el sonido, donde termina el sonido, etc.) de cada segmento y de cada sonido de la pronunciación.. Esto implica el uso de técnicas espectrales, modelos autoregresivos (ARMA) y regresivos (MA), Modelos de Predicción Lineal (Cadenas Ocultas de Markov y redes neuronales), Análisis Cepstral, filtrados, etc.. c. Módulo de cuantificación de los sonidos: identificar los distintos sonidos utilizando la secuencia de vectores de propiedades obtenida en el módulo anterior. Cada vector está asociado a un sonido del habla, luego la salida de este módulo es una secuencia de valores, donde cada valor representa el sonido con el que está asociado un vector de propiedades.. Un mismo valor y por lo tanto un mismo sonido, puede aparecer varias veces en esta secuencia de salida..

(30) 10. d.. Módulo reconocedor propiamente dicho: identifica una pronunciación dada, como conocida, parecida a una conocida o como desconocida. Para ello recibe desde el módulo de cuantificación la secuencia de valores que corresponde a una mezcla de los sonidos que puede tratar el sistema; estos sonidos individualmente corresponden a un segmento de la señal de la voz pero en conjunto y en la secuencia constituyen la señal completa de la pronunciación que se desea reconocer o memorizar. La complejidad de este módulo depende del tipo de identificación que se requiera.. 1.7. PROGRAMAS COMERCIALES PARA RECONOCIMIENTO DE VOZ. En el mercado están disponibles algunos programas de reconocimiento de voz los mismos que son capaces de identificar las palabras dictadas a un micrófono y convertirlas en texto escrito o en órdenes para el computador. No son propiamente una herramienta de traducción, pues escriben exclusivamente en el mismo idioma en que se les dicta, pero permiten escribir todo tipo de textos sin necesidad de teclear.. En la actualidad, existen en el mercado varias marcas, si bien las más conocidas son las siguientes: • Dragon Naturally Speaking (DNS), de la empresa Nuance. • Via Voice (VV), de IBM. • Windows Vista..

(31) 11. 1.7.1 DRAGON NATURALLY SPEAKING PREFERRED6 Requiere: Pentium MMX/200 o equivalente; 48 MB en RAM; 200MB de espacio en disco duro; tarjeta de sonido de 16 bits compatible con Creative Labs Sound Blaster; Microsoft Windows 95, 98 o NT. Dragon Naturally Preferred, aplicación desarrollada por Nuance. constituye una. herramienta útil para los usuarios porque les permite dictar textos al ordenador en lugar de teclearlos, incluso permite trabajar sin tener el ordenador delante y el entrenamiento previo es muy breve, además cuenta con comandos intuitivos que facilitan su aprendizaje. Con una mejor optimización para los nuevos procesadores y avances en el reconocimiento de palabras y comandos, Naturally Speaking ofrece una exactitud de aproximadamente el 98% y cuenta con comandos que no solo fueron desarrollados para la edición de texto, también posee comandos que facilitan su uso en otras aplicaciones como por ejemplo la navegación en internet, hojas de cálculo, manejo del mouse, entre otras. Después de una práctica de 5 minutos, Naturally Speaking tarda alrededor de 2 minutos más en ajustar el modelo de lenguaje de base de acuerdo con su voz y pronunciación. Adicionalmente la aplicación posee la herramienta descrita como Vocabulary Builder que le permite al programa importar palabras solas, listas de palabras o documentos completos, permitiéndole con ello al usuario practicar todas las palabras seleccionadas tan pronto como las importa.. Naturally Speaking tiene atajos intuitivos para el dictado y edición de texto que se convierten en una herramienta útil cuando se está efectuando acciones de dictado, entre ellas podemos mencionar las siguientes:. 6. Referencia: http://www.itq.edu.mx/vidatec/espacio/aisc/ARTICULOS/ASCC/articuloASCC.htm.

(32) 12. Para. Diga. "Aplicar negrita". "Fuente negrita" o "Eso fuente negrita". "Aplicar cursiva". "Fuente cursiva" o "Eso fuente cursiva". "Aplicar negrita y cursiva a la vez". "Fuente negrita cursiva" o "Eso fuente negrita cursiva". "Subrayar". "Fuente subrayado", "Eso fuente subrayado" o "Subrayar eso". "Aplicar efecto tachado". "Fuente tachado" o "Eso fuente tachado". "Eliminar negrita, cursiva, "Restaurar eso", "Fuente normal" o "Eso fuente normal" subrayado y tachado" "Poner en mayúscula las iniciales "Eso formato mayúscula inicial" del texto" "Poner todo el texto en "Eso formato mayúsculas" o "Todas mayúsculas" mayúsculas" "Poner todo el texto en minúsculas" "Eso formato minúsculas" o "Todas minúsculas" "Crear una lista con viñetas". "Eso formato estilo de viñeta". "Alinear el texto a la izquierda". "Eso formato alinear a la izquierda" o "Alinear a la izquierda eso". "Alinear el texto a la derecha". "Eso formato alinear a la derecha" o "Alinear a la derecha eso". "Centrar el texto". "Eso formato centrar" o "Centrar eso". "Poner guiones entre palabras". Diga "guión" donde quiera que se añada el guión en la palabra. "Combinar varias palabras en una". "Juntar eso". "Empezar un párrafo nuevo (pulsar "Nuevo párrafo" la tecla Entrar dos veces) " "Empezar un renglón nuevo (pulsar "Nuevo línea" la tecla Entrar una vez) " (tab). tecla de Tabulación. (espacio). barra espaciadora. "Para deshacer la mayoría de "Deshacer eso" o "Deshacer acción anterior" acciones" "Para deshacer el dictado o un "Tachar eso" comando de dictado" 7. Tabla 1.1 Comandos para Edición de Texto. 7. Ayudas del Naturally Speaking..

(33) 13. Para escribir signos de puntuación por lo general tan solo basta con pronunciar el nombre del signo de puntuación como se muestra en los siguientes ejemplos.. Para escribir. Diga. %. "signo de tanto por ciento". @. "arroba". '. "abrir comilla simple". =. "signo de igual". (. "abrir paréntesis/paréntesis izquierdo". ). "cerrar paréntesis/paréntesis derecho". " ". "abrir comillas" "cerrar comillas". +. "signo de más". ;. "punto y coma". :. "dos puntos". Tabla 1.2 Comandos para inserción de Signos de Puntuación. 7. Es posible utilizar comandos para seleccionar caracteres y palabras, a través de los comandos mostrados en la siguiente tabla.. Diga. "Marcar". Luego. Luego. "carácter". "siguiente(s)". "2 - 20 caracteres". "adelante". "palabra". "anterior(es)". "2 - 20 palabras". "atrás". Tabla 1.3 Comandos para Seleccionar Caracteres. 7. También es posible controlar el movimiento del mouse a través de los siguientes comandos mostrados..

(34) 14. Diga. "Mover Mouse" o "Mouse". Luego la dirección. Luego la velocidad (opcional). "Arriba". "Rápidamente". "Abajo" "A la izquierda" "A la derecha" "Arriba a la izquierda" "Abajo a la izquierda" "Arriba a la derecha" "Abajo a la derecha". "Rápido" "Más rápido" "Mucho más rápido" "Lentamente" "Lento" "Más lento" "Mucho más lento". Tabla 1.4 Comandos para Controlar Movimiento del Mouse. 7. Cuando hace una corrección, Naturally Speaking le pide que diga la palabra correcta y la incorrecta, lo cual le ayuda a aprender cómo pronuncia ambas palabras. La corrección de ortografía funciona en forma adecuada, siempre y cuando hable en forma lenta y sin dudar. 1.7.2 VIA VOICE PRO MILLENNIUM EDITION6 Requiere: Pentium/233 o equivalente; 48 MB en RAM con Microsoft Windows 95 o 98, o 64 MB con Windows NT; 100 MB de espacio en disco duro; tarjeta de sonido de 16 bits. Via Voice Pro Millenium Edition de IBM, ofrece una amplia variedad y funcionalidad tanto para aplicaciones de dictado como de control y excelente precisión. Los novatos empezarán a trabajar con rapidez, mientras que los usuarios de poder apreciarán las capacidades avanzadas de macros del programa. El Via Voice sin embargo posee algunas de las características de edición un tanto complicadas por lo que el programa de alguna manera sugiere emplear una combinación de mouse, teclado y voz para editar, en lugar de usar sólo comandos de voz..

(35) 15. La instalación y el manejo se pueden efectuar sin problemas gracias a las pantallas de asistente bien diseñado y un personaje animado que explica cómo empezar. Los usuarios podrán empezar a dictar de 20 a 30 minutos después de la instalación del software, lo que incluye de 10 a 15 minutos de lectura del texto del registro. Via Voice, al igual que los otros productos, permite controlar los menús y cuadros de diálogo en la mayor parte de los programas de Windows, con comandos en lenguaje natural disponibles para Microsoft Word y Excel, entre otros. Via Voice también le permite navegar en la Web. Via Voice posee. capacidades. limitadas. de corrección, pero excelentes. características de macros y capacidad de guardar audio. 1.7.3 WINDOWS VISTA8 El programa permite al usuario la ejecución de tareas normales sin necesidad de usar el teclado, incluyendo la redacción de emails. Tal como los demás programas, el usuario debe cumplir con Vista un programa de una hora de entrenamiento antes de lograr que la computadora reconozca su voz y su idioma y obedezca sus órdenes. Vista mantiene funcionando de fondo un programa para ejecutar tareas de reconocimiento de voz. El programa de reconocimiento de la voz en Vista trabaja de forma relativamente fiable. No obstante, no se presta muy bien para usuarios profesionales, señalándose que quienes suelen dictar textos como parte de su trabajo diario están mejor servidos con programas especializados. Después de efectuado un análisis de las características, ventajas y desventajas propias de cada programa, junto con la disponibilidad en nuestro medio se eligió Dragon Naturally Speaking para el desarrollo de este proyecto. 8. Referencia: http://www.laflecha.net/canales/blackhats/noticias/sobre-el-software-de-reconocimientode-voz-de-windows-vista.

(36) 16. 1.8. APLICACIONES DEL SOFTWARE DE RECONOCIMIENTO DE VOZ9. Con un programa de reconocimiento básico, los usuarios y programadores pueden personalizar la aplicación en base a sus preferencias. Las dos principales funciones del reconocimiento de voz son la toma de dictado y el control de funciones dentro de la computadora. El reconocimiento de voz también se utiliza para controlar el equipo, mediante el uso de órdenes que pueden ser muy simples o muy complejas. El valor de controlar el equipo mediante el reconocimiento de voz, es que el usuario tendrá las dos manos libres, y a su disposición para realizar otras tareas. Esa es la razón por la que las aplicaciones con reconocimiento de voz están optimizando funciones dentro de los nuevos vehículos, en la industria aeronáutica, militar, de salud y educación. Entre las nuevas tecnologías de hoy en día, el reconocimiento de voz tiene el potencial de proporcionar un fuerte impacto en unos pocos años. Entre las áreas más comunes en nuestro medio se muestran las siguientes: 1.8.1 RECONOCIMIENTO DE VOZ Y AUTOMATIZACIÓN DE LA CASA Una aplicación del reconocimiento de voz, que está muy de moda, es la automatización del hogar. Esta automatización, se aplica mediante diferentes técnicas para aumentar sus niveles de comodidad y seguridad. Si se dispone de una casa controlada por un computador, se puede instalar software de reconocimiento de voz para controlar su hogar por comandos de voz. Las características más usuales de un sistema automatizado de casa, se centran en el control de la iluminación, el clima, las cerraduras y puertas, ventanas, sistemas de vigilancia, equipos multimedia, el riego de plantas y hasta la alimentación de animales.. 9. Referencia: http://www.articulosinformativos.com/Reconocimiento_de_Voz-a963743.html.

Figure

Figura 2.9 Esquema electrónico para el control de cargas AC
Figura 2.15 Esquema de interconexión de elementos eléctricos de la placa principal
Figura 2.25 Esquema de Conexionado de Control e Inversión de giro Motores DC
Figura 2.33 Esquema de Conexionado para Placa de Recepción de RF
+7

Referencias

Documento similar

[r]

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

[r]