Envision Glasses, otra forma de «ver» lo que nos rodea

Enviado por santiago el Vie, 05/02/2021 - 20:18
Identificación
Fuente
TecnoAccesible
País
España
Publicado
Tipo de noticia
Novedades
Idioma
Español
Imagen de una persona utilizando Envision Glasses (foto Sadjad Frogh)

El eslogan de la empresa Envision, «Escuche lo que quiere ver», define perfectamente lo que ofrece el producto. La persona ciega, colocándose unas gafas, puede informarse de cuanto le rodea en un sentido bastante amplio, tan amplio como recibir una descripción de lo que nos rodea cuando paseamos por un parque, leer los carteles y números de las casas caminando por una calle, reconocer la persona que está frente a nosotros en una reunión o leer los ingredientes de un producto en el supermercado: las gafas leen, reconocen y nos lo cuenta al oído.

Ayudándose de inteligencia artificial, el software de Envision analiza las imagenes que se toman con la cámara de las gafas y la información extraída se comunica verbalmente al usuario. Combina dos tecnologías conocidas y utilizadas en muchas aplicaciones: el reconocimiento de objetos y el reconocimiento de caracteres para leer documentos (OCR). De todas las funciones de las que dispone, llama la atención la descripción de escenas, que interpreta a partir de una foto lo que hay delante de nosotros; por ejemplo, en el vídeo incluido en esta página se muestra como se describe una escena: «parece una masa de agua que atraviesa un campo de hierba».

Imagen del reconocimiento de escenas de Envision Glasses
Descripción de escenas de Envision Glasses

La descripción de escenas nos proporciona una interpretación del conjunto de cosas que tenemos delante, pudiendo servir para orientarnos si estamos buscando algún sitio o simplemente para conocer o deleitarnos con nuestro entorno. Otras funciones nos leen los letreros y los números de los portales de forma dinámica mientras andamos por la acera. No pensemos que el dispositivo va diciendo cosas constantemente según movamos la cabeza de un sitio a otro, estas funciones las vamos activando o desactivando; en ocasiones hará falta hacer una foto para leer y otras veces activar el vídeo para reconocer los rótulos, nunca recibiremos la información involuntariamente.

El producto ofrece una serie de funciones que resuelven distintas situaciones cotidianas, también descritas en el video anterior1:

Leer texto permanente: esta función está destinada a leer fragmentos breves de texto, como números de habitaciones, nombres de calles, etiquetas de alimentos, etc. Funciona con una transmisión de video en vivo, por lo que las gafas mientras esté acivada la función continuarán leyendo los textos que tenga en su foco.

Escanear texto: permite leer textos densos como cartas, libros o revistas. Tomando una foto con las gafas, se presentará el documento de una manera fácil, accesible y explorable. También puede exportarse el texto a varios formatos.

Texto escrito a mano: en cualquier documento escaneado, se puede identificar y reconocer de forma inteligente el texto escrito a mano. Permite así leer fácilmente tarjetas de felicitación o notas adhesivas.

Describir la escena: cuando tomamos una foto con esta opción, la inteligencia artificial hará todo lo posible para describir lo que hay en la imagen. Esto es idóneo para hacerse una idea general de lo que nos rodea. También se pueden guardar estas imágenes, lo que convierte las gafas en un excelente instrumento para tomar fotografías.

Detectar colores: se trata de una función simple pero muy útil. Cuando se activa, nombrará los colores dominantes que se tienen en frente. Útil cuando se quiere elegir la ropa adecuada y conjuntarla.

Buscar persona: cuando se activa esta función y se escanea con las gafas, emite un pitido leve cada vez que ve a una persona en el marco visual. También puede entrenarse a Envision a reconocer las caras de amigos y familiares, de modo que cuando sus caras aparezcan en el foco, les nombrará.

Buscar objetos: el usuario puede seleccionar un objeto de una lista y a continuación escanear con las gafas, avisando éstas con un sonido cada vez que ese objeto esté en el marco visual. Ideal para encontrar el mando a distancia al rededor del sofá o un cubo de basura en una habitación.

Explorar: con la función Explorar, las gafas hablarán constantemente sobre los objetos y las personas que detecten a su alrededor. Tiene utilidad para familiarizarse con un lugar nuevo o, simplemente, como una actividad lúdica dando un paseo para saber qué hay a nuestro alrededor.

Videollamada: es posible realizar videollamadas con las gafas a personas de nuestro entorno conocido, como un amigo o familiar que tenga una aplicación complementaria. De esta forma, el interlocutor verá una transmisión de video en directo tomada por las gafas, función destinada a consultar dudas o resolver situaciones difíciles con la ayuda de otra persona que vea la escena. Adicionalmente puede compartirse con esa persona la ubicación.

Lógicamente, para configurar el dispositivo no es necesario «ver», la configuración se realiza mediante una interfaz vocal, aunque para aquellas personas que tengan resto visual también puede visualizar el menú en la pantalla de las gafas; el sistema cuenta con una serie de pantallas o páginas de configuración que son leídas al usuario y éste interactúa mediante gestos, cambiando las opciones que precise. Las gafas pueden configurarse en español. El único botón físico con que cuenta permite encender o apagar el dispositivo.

Esquema del método de configuración de Envision Glasses
Mapa conceptual de las diferentes pantallas y cómo navegar por ellas utilizando diferentes gestos

 

El dispositivo Google Glass Enterprise Edition 2 cuenta con dos modelos, uno sin cristales muy ligero y otro para incorporar ópticas. El dispositivo cuenta con varias opciones de conectividad:

  • Precisa conexión a internet para varias de sus funciones.
  • La conexión Bluetooth permite emparejarse con la aplicación Envision de nuestro móvil, pero también sirve para conectar auriculares o altavoces.
  • El puerto USB-C, además de servir para cargar la batería, permite conectar auriculares o altavoces.

Por último, destacar que la página web del producto proporciona abundante información para configurar el dispositivo y aprender a utilizarlo.

En cuanto a la comercialización en España o países hispanohablantes, la página web no aporta información al respecto. El precio, con IVA incluido, asciende a 3.268.91 €.

  • 1. El audio del vídeo está en inglés, pero en la configuración de YouTube pueden activarse los subtítulos con traducción automática al español.
Contenidos TecnoAccesible
Productos
Directorio