Los 4 elementos clave para diseñar una computadora verdaderamente manos libres y por qué el diseño es importante para el futuro de la realidad aumentada
El término informática manos libres se ha andando alrededor durante años como el Santo Grial de computación portátil. Pero hacer una computadora manos libres que funcione realmente no es un paseo por el parque.
Todos hemos usado el reconocimiento de voz antes. En un entorno prístino, con poco ruido, el habla funciona bien si un usuario emite los comandos esperados (y enuncia cada sílaba). En entornos más ruidosos, sin embargo, obtiene una respuesta familiar como esta:
“Lo siento, no entendí eso. ¿Puedes intentarlo de nuevo?
Pero retrocedamos ... ¿qué es realmente la informática manos libres, de todos modos?
En el mundo de la informática móvil, la informática verdaderamente manos libres significa que tiene la capacidad de operar una computadora completa sin la necesidad de tocar físicamente ningún botón, deslizar las pantallas con los dedos o incluso saludar frenéticamente frente a la cámara de la computadora (en el caso de dispositivos de entrada de gestos).
Por lo tanto, la computación verdaderamente manos libres requiere al menos un modo de interacción o modalidad, típicamente tecnología de voz o seguimiento ocular. Registro visual pueden funciona, pero es demasiado limitado para impulsar un entorno informático completo.
La tecnología del habla es la respuesta real, pero es solo una parte de la solución para una informática verdaderamente manos libres.
Por qué se necesita la informática manos libres en entornos industriales
Para muchos de nuestros clientes empresariales e industriales, la informática verdaderamente manos libres se ha convertido en el nuevo requisito empresarial y es el nuevo regalo.
Los trabajadores usan guantes para el agarre y la seguridad, transportan herramientas pesadas o realizan acciones con los brazos y las manos mientras necesitan la ayuda de datos y comunicación. Ahora no se debe esperar que los trabajadores industriales conectados usen sus manos o dedos para controlar un dispositivo.
Imagínese a un trabajador a mitad de camino en la torre de una turbina eólica, o en la mitad de un túnel para inspección o control de calidad.
Se requiere el uso de las manos para mantener el equilibrio en una escalera o plataforma; esto es más crítico que acceder a la pantalla de una computadora para obtener información. Luego está la persona con guantes protectores gruesos; Por lo general, las pantallas táctiles no pueden responder, y los botones en sí tienen que ser bastante grandes para poder presionarlos con precisión.
Finalmente, el trabajador debe sostener herramientas en sus manos mientras aún necesita acceder a la información en el lugar. ¿Quién quiere dejar las herramientas para interactuar con una pantalla antes de volver a utilizarlas?
Estos son los 4 elementos clave para diseñar una computadora verdaderamente manos libres para la industria
Hay cuatro desafíos que superar antes de que el reconocimiento de voz pueda ser útil en todos los entornos:
Buenos micrófonos
Si vamos a confiar en el habla como nuestra interfaz principal, será mejor que tengamos micrófonos realmente buenos y una cantidad útil de ellos en los auriculares. Nuestro RealWear Las computadoras portátiles reforzadas utilizan actualmente una matriz de cuatro micrófonos, colocados en lugares estratégicos alrededor de la cabeza del usuario. Esto permite que se escuche la voz del usuario y, lo que es más importante, el ruido ambiental.
Uno de los desafíos que hemos superado es lograr un nivel insuperable de consistencia en la fabricación de nuestros micrófonos. Eso significa que todos los micrófonos de cada dispositivo se comportan igual que todos los demás, y cada uno se ensambla y prueba para garantizar un comportamiento idéntico de un dispositivo a otro. Debido a que el habla es tan importante para el funcionamiento de nuestro dispositivo, hemos ido más allá para garantizar esta consistencia de fabricación y, al hacerlo, hemos desarrollado una IP significativa para que las fábricas respalden esta tarea.
Reducción de ruido / amplificación de voz
Ahora que tenemos garantizado un nivel consistentemente bueno de adquisición de datos de audio, podemos incorporar esto a la última generación de algoritmos de reducción de ruido y amplificación de voz para eliminar los sonidos ambientales no deseados. Empleamos una serie de algoritmos diferentes, cambiando constantemente entre ellos en función de los tipos de ruido y los entornos. Algunos algoritmos son de formación de haces; algunos se centran en eliminar el ruido; algunos utilizan IA de aprendizaje profundo; y otros se especializan en extraer señales de voz humana. Todos estos algoritmos son sutilmente diferentes, pero cuando se utilizan en el momento adecuado, en las condiciones adecuadas, pueden producir la señal más limpia y audible.
Reconocimiento de voz sin necesidad de conexión a Internet
Gracias a los micrófonos de alta calidad y la reducción de ruido bien diseñada, ahora podemos enviar señales de audio limpias a nuestro reconocedor de voz, confiando en que estas señales no contienen nada más que los comandos del usuario. Hacemos uso de uno de los motores de reconocimiento de voz más sofisticados disponibles en la actualidad, que funciona sin conexión a Internet. Nuestro sistema de voz funciona completamente fuera de línea, en más de 40 idiomas.
Por diseño, el sistema de RealWear es extremadamente receptivo y comprende lo que dice el usuario dentro de los 200 milisegundos posteriores a la emisión de un comando. Básicamente, eso es brindarle al usuario retroalimentación instantánea justo cuando el usuario dice algo.
Y gracias a la reducción de ruido, nuestro reconocimiento de voz de respuesta rápida funciona incluso en el entorno industrial más hostil, con niveles de ruido cercanos a los 100 dB.
Software - ¿Cómo se usa el reconocimiento de voz para impulsar una aplicación?
Incluso con micrófonos, reducción de ruido y reconocimiento de voz en juego, todavía hay una pieza muy importante que debemos abordar: ¿Cómo se usa el reconocimiento de voz para impulsar una aplicación?
"Seguro que no nos vas a dar un SDK y nos pedirás que reescribamos por completo todas nuestras aplicaciones para manos libres.? "
La respuesta es un gran "NO". Hemos hecho todo este trabajo e integrado la tecnología de voz y audio en el sistema operativo Android. Todo lo que necesita hacer es escribir su aplicación de Android como lo haría normalmente para el tacto (adelante, coloque botones, casillas de verificación y todo tipo de widgets de control en la pantalla). Una vez que su aplicación se esté ejecutando en nuestro auricular HMT-1, se habilitará automáticamente para hablar; ahora ya no necesita presionar el botón; basta con decir el nombre del botón para activarlo. Todo gratis, no se requiere programación adicional.
(Además, no tenemos ninguna de esas palabras de inicio que tienes que repetir; no hay, 'Oye Siri', 'OK, Google' o 'Alexa'. Solo di lo que está en la pantalla del HMT-1, cuando quieras.)
Terminando
En resumen, tenga cuidado cuando alguien hable de su sistema operativo verdaderamente manos libres. Pregúntese: ¿es realmente manos libres? ¿Puedo manejar todo el sistema operativo con voz o es solo una aplicación? ¿Puede funcionar en entornos con mucho ruido? Por último, ¿necesito volver a escribir mi aplicación con un SDK para manejar la interfaz de voz? Se sorprenderá de las pocas ofertas que realmente cumplen estos requisitos.