Control de luces por voz, una aplicación orientada a

Anuncio
Control de luces por voz, una aplicación orientada a
personas con capacidades especiales.
Prieto, Francisca1 y Martı́nez, Eustaquio2 .
Facultad Politécnica, Universidad Nacional del Este.
Ciudad del Este, Paraguay.
1 [email protected] 2 [email protected]
Resumen
Es muy importante que la tecnologı́a facilite la vida de las personas, en especial de aquellas
con capacidades especiales. Para eso; la Domótica se ocupa del monitoreo y acceso a dispositivos dentro de las residencias, para que las personas puedan tener un mejor control sobre
estas, permitiendo ası́ la accesibilidad y la prevención de accidentes a través del control a
distancia. La incorporación del reconocimiento de voz a la Domótica facilita la comunicación
con sistemas de control al viabilizar comandos mediante voz. En un contexto adecuado, esto
permite también una accesibilidad a los controles a personas con dificultades de movilidad
por restricciones fı́sicas pero con uso pleno de la voz. En el sistema diseñado, construido e
implementado, los comandos son interpretados por un programa computacional instalado
en una computadora personal (PC) que interactúa con un hardware especial que acciona
las luces, de manera que con una sencilla combinación de palabras, se pueda controlar el
encendido y apagado de las luminarias en un recinto o en un conjunto de estos. Además de
la prestación mencionada, el sistema también reacciona a comandos programados y manuales, lo cual permite su utilización por personas que no necesariamente tienen impedimentos,
planteando la posibilidad de su implementación en ambientes compartidos por individuos
con y sin capacidades plenas. Los resultados obtenidos a través de pruebas de funcionamiento
realizadas en situaciones reales en un prototipo del modelo, validan la propuesta.
Descriptores: Domótica, sistema de iluminación, reconocimiento de voz.
Abstract
It is very important that technology makes life easier for people, especially for those with
special needs. For that reason, Domotics makes it possible to monitor and access devices
within residences, so that people can have better control on them, allowing accessibility
and accident prevention through remote control. The incorporation of speech recognition
to Domotics, while enabling voice commands, facilitates the communication with control
systems. In an appropriate context, this also allows accessibility control to people with mobility difficulties from physical constraints but with full use of voice. In the system designed,
built and deployed; the commands are interpreted by a computer program installed on a
personal computer (PC) that interacts with a special hardware that drives the lights, so
with a simple combination of words, one can control the switching on and off of the lights
in a room or a set of these. In addition to the above-mentioned provision, the system also
reacts to programmed and manual commands, which can be used by persons not necessarily
physically impaired, raising the possibility of its implementation in environments shared by
individuals with and without full capabilities. The results obtained from performance tests
conducted in real situations on a prototype model, validate the proposal.
Keywords: Domotics, lighting system, voice recognition.
1. Introducción.
En todo recinto se realiza el control de la iluminación mediante interruptores, esto permite en-
cender o apagar las luces y en algunos casos controlar su intensidad, ya sea de una habitación o
simplemente una lámpara que esté conectada a
una toma de corriente eléctrica. La acción de en-
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
cendido y apagado es trivial, siempre que las personas puedan realizarla sin problemas o dificultades. Desafortunadamente, no todos los individuos
consideran la tarea mencionada como algo trivial,
pues por causa de algún impedimento fı́sico, experimentan dificultades para realizar con facilidad
tareas aparentemente sencillas, por lo tanto, en
ambientes preparados para “todos” en forma inclusiva, el acto de encender y apagar luces deberı́a
presentar alternativas sencillas y accesibles.
Según [9], no existe en el Paraguay una legislación relativa a la accesibilidad; tanto de edificios,
de medios de transporte, como de otros elementos
de infraestructura fı́sica. Además sostiene que en
el sistema educativo nacional, más de 10.000 estudiantes de entre 6 y 18 años presentan alguna
forma de discapacidad o limitación identificada.
Por todo lo expuesto, es relevante plantear soluciones tecnológicas que de alguna manera tiendan a mejorar la accesibilidad a recintos públicos y
privados de las personas con algún tipo de limitación fı́sica, en ese sentido, la tecnologı́a de reconocimiento de voz facilita el control de dispositivos y
parece a primera vista, una alternativa plausible.
El reconocimiento de voz es la conversión de palabras escritas, en el que si se aplica el procesamiento de lenguaje natural se obtiene el entendimiento
de voz, además de establecerse como una interfaz
natural, rápida, flexible y accesible [1].
Existe un área tecnológica denominada
Domótica, palabra que proviene de domus (que
significa casa en latı́n) y tica (de automática, palabra en griego que significa, “que funciona por
si sola”) [2, 6]. Este concepto hace referencia a la
incorporación de tecnologı́as informáticas dentro
de la casa; también se refiere a las comunicaciones que permiten gestionar y automatizar desde
un mismo sistema cada una de las instalaciones
de uso cotidiano en una residencia. Cada una de
estas tecnologı́as convergen en tres objetivos principales: mejorar la comodidad, la seguridad y el
ahorro energético.
Los humanos por naturaleza prefieren realizar
sus actividades de la manera más fácil posible, es
por eso que dı́a a dı́a la tecnologı́a evoluciona para
automatizar y mejorar los procesos cotidianos [1].
La Domótica surgió en respuesta a muchas personas que requerı́an una mayor automatización en
los hogares, de manera a obtener un control fácil
y automático de sus comodidades.
Naturalmente, en el contexto mencionado, la
comodidad es un aspecto clave y por lo tanto deberı́a ser democrático en el sentido de estar accesible a todos, tengan o no impedimentos fı́sicos,
de ahı́ es que se puede considerar a la Domótica
como aliada para eliminar ciertas barreras a aquellos individuos con ciertas dificultades fı́sicas. Es
por eso que en este trabajo se propone un sistema
compuesto por un programa computacional y una
interfaz capaz de controlar el encendido y apagado de luces de una residencia, con el sólo uso de
comandos de voz de manera sencilla y eficaz.
Las tecnologı́as de reconocimiento de voz están
abriendo nuevas oportunidades para desarrollar
sistemas inteligentes que puedan dialogar con las
personas en forma verbal. Es de suma utilidad que
personas discapacitadas pero que posean uso pleno
de la voz, puedan realizar procesos tan triviales
para otros, como el encendido y apagado de luces
de un recinto con el sólo uso de la voz.
2. Objetivos
Objetivo general.
Diseñar, desarrollar e implementar en forma de
prototipo, un sistema para el control de iluminación de un recinto por órdenes de voz.
Objetivos especı́ficos.
− Aplicar tecnologı́as de reconocimiento de voz
a comandos emitidos por voz;
− Diseñar y construir un circuito electrónico
interfaz para controlar el encendido y apagado de luces;
− Diseñar y construir un sistema que controle
la interfaz a través de comandos de voz;
− Construir un prototipo para verificar el funcionamiento del sistema.
3. Materiales y Métodos
El reconocimiento de voz.
Genéricamente, el principal objetivo que el reconocimiento de voz persigue es proporcionar una
tecnologı́a “apropiada” de interacción hombremáquina a través de órdenes habladas. Ası́, los resultados que esta tecnologı́a proporcione deberán
contrastarse con los derivados de otras alternativas como son: teclados, paneles, ratones, etc., en
cuanto a si proporcionan un control de tales procesos de interacción de manera al menos apropiada.
Las principales caracterı́sticas que diferencian
a los sistemas basados en reconocimiento de voz
frente a otras alternativas son: la naturalidad que
supone, utilizar la voz en las operaciones de comando y control, y la precisión y robustez en la
comunicación para diferentes usuarios y en diferentes entornos. La primera de ellas deberı́a representar la ventaja natural de los sistemas basados
en la tecnologı́a del habla. Aunque la experiencia
ha enseñado que, si bien el habla es la forma natural de comunicación entre personas, en el diálogo
hombre-máquina esto no parece obvio; por ejemplo, en los diversos estudios se refleja el elevado
número de personas incapaces de responder frente
44
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
a una máquina, si bien es cierto que este tipo de
rechazos va disminuyendo paulatinamente.
El estado actual de la investigación en reconocimiento de voz muestra excelentes resultados
en sistemas trabajando en entornos controlados
de laboratorio. Sin embargo, una aplicación real
de esta tecnologı́a exige un funcionamiento en el
mundo real, donde el grado de dificultad de los
problemas es de un orden de magnitud mayor [5].
Bajo esta premisa se buscar una aplicación
real, el modelo genérico de comunicación que el
reconocimiento de voz propone para el diálogo
hombre-máquina, que pueda representarse de forma simplificada, tal y como muestra el diagrama
de la figura 1, para un caso de acceso a una base
de datos.
− Preprocesamiento: Convertir la entrada
de voz a una forma que el reconocedor pueda
procesar, es decir, convertir la señal análoga
a digital.
− Reconocimiento: Identificar lo que se dijo
(traducción de señal digital a texto).
− Comunicación: Enviar lo reconocido al
software de aplicación.
Existe una comunicación bilateral en aplicaciones (Ver Figura 2[7]), en las que la interfaz de voz
está ı́ntimamente relacionada al resto de la aplicación. Estas pueden guiar al reconocedor especificando las palabras o estructuras que el sistema
puede utilizar. Otros sistemas sólo tienen una comunicación unilateral.
Figura 7. Modelo genérico de comunicación de Reconocimiento de voz.
En el diagrama de la figura, el acceso a la información contenida en una base de datos comienza
con la producción de un mensaje hablado por el
usuario, pero utilizando una forma o estilo de habla restringido; por ejemplo, utilizando palabras
de un vocabulario reducido pronunciadas de forma aislada (como los dı́gitos), frases tipo, etc.. Entonces a partir de la señal de voz, un proceso de
clasificación, basado en reconocimiento de patrones, asociados a diferentes unidades lingüı́sticas
(palabras, fonemas, sı́labas, etc.), permite a una
interfaz de comunicaciones, extraer de la base de
datos la información solicitada por el usuario.
Reconocedores de voz.
Reconocimiento de voz es el proceso automático de conversión de palabras habladas a palabras
escritas[10]. El objetivo del reconocimiento de voz
es que las computadoras tengan la capacidad para
comprender el lenguaje hablado y una vez entendido puedan ejecutar funciones especı́ficas o almacenar datos. Los campos de aplicación de los reconocedores de voz son [5][7]: computadoras, sistemas
de seguridad, telefonı́a, etc.
El reconocimiento de voz generalmente es utilizado como una interfaz entre humano y computadora por algún software y básicamente debe ejecutar tres tareas especı́ficas[7].
Figura 8. Componentes en una aplicación.
Los procesos de preprocesamiento, reconocimiento y comunicación deberı́an ser transparentes
para el usuario, es decir el usuario lo deberı́a notar
de manera indirecta como: certeza en el reconocimiento y velocidad. Estas caracterı́sticas se utilizan para evaluar una interfaz de reconocimiento
de voz[7]. En términos de taxonomı́a, existen varias formas de clasificar los reconocedores de voz:
de acuerdo a su propósito y de acuerdo al tipo de
habla.
De acuerdo a su propósito, pueden ser de
propósito general (cuando reconocen palabras de
cualquier dominio) y de propósito especı́fico (cuando reconocen palabras de un dominio en particular) y de acuerdo al tipo de habla.
De acuerdo al tipo de habla que reconocen,
pueden ser aisladas, que obligan al locutor a hacer
pausas entre las palabras para hacer más fácil el
trabajo del reconocedor, ya que ası́ puede saber el
principio y el fin de una palabra, pueden ser también de habla continua, en que se trata de emplear
45
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
la forma más común del habla, la forma continúa,
aunque para el reconocedor suele ser más difı́cil
ya que se pueden dar confusiones entre palabra y
palabra.
En términos de generales existen tres tipos de
datos utilizados para construir reconocedores[7]
Datos del entrenamiento, Datos de las pruebas y
Datos de la evaluación. En el primer tipo, se utilizan para construir el reconocedor y ajustar sus
parámetros. Dependiendo de la cantidad de información que se tenga, será el resultado del reconocimiento. A mayor información, mayor precisión
en el resultado.
En el segundo tipo se usan para evaluar nuevos
algoritmos en la fase de desarrollo del reconocedor
y en el tercero se utilizan para medir el funcionamiento del sistema, por lo que esta información
debe ser oculta; es decir, que ninguna parte del sistema haya trabajado con este tipo de información.
La cantidad de información de pruebas y de evaluación influye en la fiabilidad de los resultados.
Por ello, hay que esperar una desviación máxima
de los resultados originales cuando se pruebe con
un grupo de pruebas distinto.
Proceso de reconocimiento de voz.
El proceso de reconocimiento de voz consiste
básicamente en transformar una señal a sı́mbolos
y darle algún significado para realizar una acción,
consistente en [7].
− Obtener los archivos de voz (la señal de voz)
y digitalizarlos;
− Extraer un conjunto de caracterı́sticas esenciales de la señal (este conjunto de caracterı́sticas será la entrada al clasificador);
− Introducir el conjunto de caracterı́sticas a un
clasificador para obtener probabilidades;
− Búsqueda para encontrar la secuencia permitida más probable. Ya que se tienen las
probabilidades y con la ayuda de una estructura que tenga las pronunciaciones posibles, se aplique el algoritmo de búsqueda
que dará como resultado el reconocimiento
de la palabra.
Estos pasos describen de manera general como funciona un reconocedor de voz independientemente de la tecnologı́a que utilice. Existen varias metodologı́as para desarrollar reconocedores
de voz, dos de las más importantes son[5][7]: las
Redes Neuronales Artificiales y los Modelos Ocultos de Markov.
Las redes neuronales artificiales (RNAs)[5],
son modelos matemáticos inspirados en sistemas
biológicos que son simulados en computadoras
convencionales. Están compuestos de varios nodos
simples que operan en paralelo y son organizados
en patrones que simulan redes neuronales biológicas.
Los modelos ocultos de Markov [7], son modelos matemáticos basados en probabilidades que
pueden ser adaptados para resolver problemas de
reconocimiento de voz. El modelo capaz de describir hechos acústicos del habla y que se queda
completamente definido por medio de una serie
de variables estadı́sticas. Los modelos de Markov
están constituidos por dos procesos estocásticos:
el oculto, que es el paso de unos estados a otros y
el no oculto, que es la generación de sı́mbolos que
se produce en cada estado.
Accionamiento de dispositivos electrónicos
por voz.
Una de las aplicaciones más inmediatas de los
sistemas de reconocimiento de voz como interfaz
entre hombre y maquina es la ayuda a discapacitados fı́sicos. Mediante comandos orales se pueden
controlar muchas de las funciones y actividades
cotidianas. Ejemplos en fase de experimentación
son la silla de ruedas controlada oralmente, camas
hospitalarias, control oral de teléfonos y la activación oral de aparatos y sistemas domésticos. En el
caso del teléfono controlado oralmente, el usuario
puede almacenar y acceder a una lista de números
telefónicos utilizando comandos orales. En este tipo de aplicaciones, el sistema de reconocimiento
de voz es dependiente del locutor y trabaja normalmente bajo la configuración de reconocimiento
de palabras aisladas con capacidad de localización
de los comandos en habla extraña. El sistema tiene que tener la capacidad de ser entrenado por
el usuario para de esa forma hacer el acceso a los
números telefónicos mediante el nombre de la persona que se quiera llamar.
La activación oral de aparatos y sistemas
domésticos, incluida dentro del campo de la
Domótica, tiene como objetivo el controlar a estos
mediante comandos orales a través de un sistema
de diálogo. Son susceptibles de control oral, aparatos como el televisor (encender/apagar, cambiar
de canal, volumen), encender y apagar luces, abrir
y cerrar puertas, abrir y cerrar persianas, control
de una cámara de seguridad, activar el teléfono, la
calefacción, el horno, etc.
Otra área de aplicación de los sistemas de reconocimiento de voz es la aviación tanto civil como
militar. En aplicaciones militares se ha experimentado la introducción de interfaces orales para interactuar con los sistemas básicos de un avión de
combate[7]. Los sistemas de reconocimiento suelen ser de palabras aisladas y tienen que ser capaces de dar unas prestaciones muy buenas trabajando con relaciones señal - ruido muy pequeñas.
En la aviación civil se pueden encontrar aplicacio46
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
nes en procesos de experimentación para el control aéreo utilizando sistemas de reconocimiento
de habla continua.
Una de las áreas con más aplicaciones potenciales son las telecomunicaciones y servicios
añadidos[7]. En ciertos servicios añadidos a la red
telefónica, el uso de interfaces orales permite una
reducción efectiva del coste del servicio. Ejemplos
de estas aplicaciones son la automatización de los
servicios de operadora y la validación de compras
con tarjetas de crédito. En el primer caso, existen
aplicaciones en uso en los EE.UU. por parte de
las compañı́as telefónicas AT&T y Northen Telecom para automatizar el servicio de facturación de
llamadas asistidas por operadora[5]. La incorporación de interfaces orales ha permitido también incrementar el número de servicios proporcionados
por una red de telecomunicaciones. Ejemplo de estas aplicaciones son los servicios de información y
transacciones bancarias, servicios de telefonı́a interactiva (por ejemplo el sistema VIP - Voice Interactive Phone - de AT&T que permite acceder
a ciertos servicios pronunciando el nombre asignado al mismo en lugar de pulsar un código con
el teclado multifrecuencia[7]) y servicios de acceso a información (por ejemplo sistemas de audiotex). En relación a la telefonı́a móvil en vehı́culos,
los sistemas de reconocimiento de voz comienzan a
ser introducidos para permitir controlar el teléfono
(funciones de marcado, respuesta, etc.) mediante
comandos orales.
Con el auge de Internet, han aparecido ya
navegadores que incorporan tecnologı́as del habla. En concreto existen navegadores que permiten realizar la navegación por voz, sólo hace falta
pronunciar los enlaces y permiten igualmente una
interacción con el usuario utilizando un conversor
texto-voz. Un ejemplo es el navegador WebConversa [7].
te un software de reconocimiento de voz. El tercer
componente es el circuito interfaz que recibe los
comandos que pueden ser el encendido y apagado de las luces. Luego de ejecutar las órdenes la
computadora (el software) retorna en audio pregrabado el estado actual del sistema.
El sistema recibe las órdenes de los comandos
de voz para que realizar los procesos deseados pero
antes, verifica que el comando recibido sea correcto para procesar las órdenes (Figura 4).
Figura 10. Diagrama de Flujo principal.
Prestaciones del control de iluminación.
Con el control de la iluminación integrado en
un sistema de control por voz se puede lograr un
importante ahorro energético y gran aumento del
confort. Se puede controlar desde una sola lámpara (o luminaria) hasta todas las lámparas conectadas al interfaz del sistema. En términos de prestaciones el sistema puede encender y apagar las
luces por:
a) Control por voz;
Arquitectura del sistema propuesto.
b) Control manual, a través del teclado y mouse;
c) Programación horaria;
d) Control manual mediante interruptores tradicionales;
A continuación ejemplos de la interfaz de usuario
de cada prestación del sistema
Figura 9. Arquitectura del Sistema de control de
Iluminación por voz.
En la Figura 3 se puede observar que la entrada de datos se realiza mediante micrófono, el
actor principal es el usuario que tiene la posibilidad de cambiar la iluminación de un estado a
otro según lo desee. El segundo componente es la
computadora que reconoce los comandos, median-
a)Control por voz
El usuario da las instrucciones mediante un
micrófono, el software de reconocimiento de voz
Dragon Naturally Speaking [8], interpreta los comandos y escribe en el CODIFICADOR DE TEXTOS (Figura 5) para comparar con los comandos
previamente cargados en el sistema, si la orden es
correcta el circuito interfaz enciende y apaga las
luces. Por ejemplo, en la figura 5, para encender
47
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
la luz de la sala el comando seria: “Prender luz
sala”.
Los comandos de voz que se utilizan en el sistema de control por voz son:
− Prender luz (ejemplo: patio, sala, escritorio,
cocina, pasillo, dormitorio, etc.)
− Apagar luz (ejemplo: patio, sala, escritorio,
cocina, pasillo, dormitorio, etc.)
Figura 11. Codificador de textos.
− Encender todas las luces
En el menú Configuraciones del Codificador de
textos (Fig. 6), se permite al usuario modificar el
texto comparativo y el archivo de audio, que informa al usuario el estado actual del sistema. Por
ejemplo; para encender y apagar las luces de la
sala, el texto comparativo seria: “prender luz sala” y “apagar luz sala”, estas opciones pueden ser
modificadas cuando el usuario desee.
− Apagar todas las luces
− Manejo general del sistema (Menú, cerrar
sistema, etc.)
− Bloqueo del micrófono (a dormir)
− Habilitación del micrófono (a trabajar)
b)Control manual a través del teclado.
Figura 12. Configuraciones del Codificador de
texto.
Figura 13. Interfaz Principal de luces.
En la interfaz del control manual a través del
teclado, Figura 8, se observa el estado actual del
sistema, están las ubicaciones de las luces a ser
controladas de un recinto (ejemplo: luz patio, sala, escritorio, pasillo, cocina, dormitorio), las luces
pueden ser encendidas o apagadas individualmente presionando uno de los botones correspondiente
a la ubicación del recinto, como también se pueden
encender y apagar todas de una vez.
Figura 14. Ubicación de luces.
48
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
los bits de datos viajan juntos, enviando un byte
(8 bits) completo a la vez. Para la comunicación
entre la computadora y la interfaz de control se
han utilizado los registros de Datos a través de
la dirección estándar 0378H (Hexadecimal), que
corresponde al LPT1, en en contexto computacional. Una vista del circuito mencionado se puede
observar en la figura 10.
Figura 15. Ubicaciones de la interfaz principal y sus
archivos.
c)Control manual mediante interruptores
tradicionales.
Al presionar el botón MODO MANUAL de la
interfaz Figura 8, desactiva los demás botones de
la interfaz, permitiendo controlar las luces por interruptores tradicionales En el menú Editar de la
Interfaz se tiene las opciones de Configuraciones y
Ubicaciones. Ası́ también, en Configuraciones Figura 9 permite al usuario definir la dirección de
la aplicación, y los comandos internos para el encendido y apagado que se debe enviar al sistema,
tornando la aplicación más dinámica. Del mismo
modo en la figura 10 se puede cambiar el nombre
de los botones de la interfaz y el icono del encendido y apagado de las luces, también permite
desactivar y activar el estado de los mismos.
d)Programación horaria.
La programación permite programar el control
del apagado y encendido de la iluminación según
la hora del dı́a y el dı́a de la semana, se puede
seleccionar la ubicación de cada punto de luz. Por
ejemplo la luz del pasillo y del patio pueden estar apagados durante el dı́a, pero encenderse automáticamente por la noche. Cuenta con un reporte de las programaciones realizadas y la situación
de cada punto de luz, si se encuentra activada o
desactivada.
Diseño del hardware.
Algunos detalles del desarrollo del hardware
interfaz para el proyecto de control de voz, se presentan en este apartado y por cuestiones de sencillez, se optó, como puerto de comunicación, el
Puerto Paralelo (LPT), fundamentalmente por la
economı́a en el momento de diseñar y construir
dispositivos controladores. Básicamente, el puerto paralelo es una interfaz entre un ordenador y
un periférico cuya principal caracterı́stica es que
Figura 16. Circuito interfaz, conectado al puerto paralelo LPT1.
En términos de programa de control, se han
implementado funciones en Dev C++[4] para controlar los puertos paralelos, y para verificar su funcionamiento, se han realizado varias pruebas con
una estructura electrónica compuesta de un conector de puerto paralelo, resistores y LED’s (Diodos
Emisores de Luz), lo que permitió visualizar las
señales enviadas de la computadora al dispositivo, y con ello comprobar el buen funcionamiento
del programa de control y del hardware interfaz
diseñado.
El referido Circuito interfaz (Figura 10) tiene al capacidad de controlar hasta 7 componentes
eléctricos de 220 Voltios, posee además un sistema de activación - desactivación y un sistema de
respaldo con las siguientes prestaciones:
− Control de los componentes: cada uno
de los siete relés es activado cuando cada
transistor relacionado recibe una cantidad
X, un código entre 1 y 127 en decimal, el
LED es una indicación visual de que el pulso
eléctrico “1”, enviado por el puerto paralelo
ha sido recibido.
− Activación y desactivación del circuito: una vez que recibe el código 128 el transistor activa un relé, y de esa manera desactiva el circuito, para activarlo es necesario
que se envı́e el código 127 en decimal. También cuenta con un interruptor para activar
y desactivar el circuito en forma manual.
− Circuito Backup: se activa cuando el servidor de control está apagado o desactivado,
el circuito pasa a funcionar en modo escalera, que permite al usuario encender y apagar
las luces controladas a través del interruptor
convencional.
49
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
4. Resultados.
A los efectos de verificar el funcionamiento del
sistema y comprobar su efectividad en situaciones
de usos, se construyó una maqueta Figuras 10, y
11, de manera a simular el control de iluminación
con las distintas prestaciones del sistema. De hecho para este proceso se ha entrenado al reconocedor de voz con la voz de un usuario, de manera a
realizar las pruebas, el sistema también permite el
entrenamiento del reconocedor para varios usuarios.
las respuestas fueron de acuerdo a lo esperado, el
sistema respondió adecuadamente, encendiendo y
apagando las luces en el los momentos indicados
en la configuración de programación. Finalmente, en el experimento d) las luces fueron controladas sin inconvenientes, utilizando los interruptores
manuales, existentes en la maqueta.
Experimentos.
a) Control por voz.
El objetivo de este experimento es verificar si
el Codificador de textos escribe los comandos emitidos por la voz. La palabra clave utilizada para
abrir el Codificador de textos es “Abrir codificador”
b) Control manual, a través del teclado y
mouse.
Figura 17. Todas las luces apagadas.
En este caso el objetivo es utilizar la interfaz
visual el control manual a través del teclado y el
mouse, de manera a verificar funcionamiento de
los botones de encendido y apagado de las luces.
c) Programación horaria.
Con este experimento se busca verificar la efectividad de la programación horaria del encendido y apagado de las luces, en horas determinadas
del dı́a. El procedimiento consiste en seleccionar
la ubicación del recinto, la fecha de inicio, hora y
minuto para encender la luz, luego la fecha de finalización, hora y minuto para apagar la luz, por
último guardar la programación.
d) Control manual mediante interruptores
tradicionales.
Con esto, la idea es determinar la efectividad
del botón MODO MANUAL de la interfaz, lo que
permitirı́a controlar las luces por interruptor.
Figura 18. Todas las luces encendidas.
5. Discusión.
Resultados de los experimentos.
En todos los casos los resultados fueron satisfactorios, puesto que se ha verificado el funcionamiento correcto de las funcionalidades. En el
experimento a) el software de reconocimiento de
voz interpretó correctamente el comando y lo escribió en el codificador de textos y las luces se
encendieron y apagaron como resultado de los comandos respectivos. En el caso del experimento
b) todos los botones, respondieron correctamente
al mando y las luces se encendieron y apagaron
adecuadamente. Por su lado, en el experimento c)
En términos generales se puede afirmar, en
función al diseño y fundamentalmente en base a
las pruebas realizadas, que el sistema diseñado
cumple con los objetivos propuestos, pues se ha
logrado poner en funcionamiento un sistema de
control de iluminación controlado por la voz. La
indicación del estado actual del sistema constituye una gran ayuda al momento de la interacción
entre el usuario y el sistema, la facilidad de minimizar acciones innecesarias, hace que el programa
reaccione de tal manera que ante de un comando de voz mal pronunciado o que no haya podido
50
Control de luces por voz, una aplicación orientada a personas con capacidades especiales.
ser interpretado correctamente, el usuario tiene la
posibilidad de volver a realizarlo. Esto permite al
usuario conocer el momento exacto en el cual debe
pronunciar los respectivos comandos y para conocer el estado actual del sistema, es decir, si las
luces se encuentran encendidas o apagadas, lo que
en principio se establece como un entrenamiento
no programado del usuario. Ası́ también, gracias a
las facilidades diseñadas e implementadas, el sistema puede ser de gran ayuda para personas discapacitadas, especialmente aquellas con problemas
de locomoción o limitaciones en el movimiento de
extremidades como manos y brazos, pues la activación mediante la voz, estas personas podrán
controlar todas las luminarias del hogar. Del mismo modo, la programación horaria del encendido
y apagado de las luces, permite un significativo
ahorro de energı́a y trabajo.
[4] Bloodshedsoftware, “Dev C++”[Online].
http://www.bloodshed.net/devcpp.html
03/05/2013
[5] Guarasa, M., “Arquitecturas y métodos en sistemas de reconocimiento automático de habla
de gran vocabulario”. Universidad Politécnica
de Madrid, Escuela Técnica Superior de Ingenieros de Telecomunicación, 2001. 12/05/2013
[6] Instituto
Tecnológico
de
Informática.
Domótica [Online] http://web.iti.upv.
es/actualidadtic/2004/06/2004-06domotica.pdf 29/11/2012
[7] Lleida, E., “Reconocimiento automático del
habla”. [Online] http://dihana.cps.unizar.
es/investigacion/voz/rahframe.html
03/05/2013
Referencias bibliográficas
[1] Aguas, G., “Verificación de Pronunciación Basada en Tecnologı́a de Reconocimiento de Voz
para un Ambiente de Aprendizaje”. Tesis Licenciatura. Ingenierı́a en Sistemas Computacionales. Departamento de Ingenierı́a en Sistemas
Computacionales, Escuela de Ingenierı́a, Universidad de las Américas Puebla. 29/11/2012
[2] ABC Color, “Domótica por voz el futuro
de la vivienda”. [Online]. http://www.abc.
es/hemeroteca/histrico-21-05-2007/abc/
Tecnologia/domtica-por-voz-el-futurode-la-vivienda\1633227338354.html
29/11/2012
[3] Crockett, K., “Puerto Paralelo ”[Online].
http://chinto.ham-radio.ch/310\68\
ParallelPort.htm 04/05/2013
[8] Nuance.es, “Software de Reconocimiento
de voz”. [Online] http://www.nuance.es/
dragon/ 01/06/2013
[9] OPDs paraguayas, Informe de OPDs paraguayas al Comité de la CDPD de Naciones.
[Online] http://www.ohchr.org/Documents/
.../ARIFA_ACIP_Others_Paraguay8_sp.doc
06/06/2013
[10] Reyes P., K. Gyssel, “Domótica”. [Online]
http://www.monografias.com/trabajos35/
domotica/domotica.shtml 30/03/2013
[11] Wikipedia, Domótica. [Online] http:
//es.wikipedia.org/wiki/Dom\%C3\%B3tica
11/05/2013
51
Descargar