Thinkepi: Sobre Google Project Glass

Uno de los vídeos que ha corrido como la pólvora estos días por Twitter y que sin duda ya habréis visto todos es el del nuevo proyecto de las gafas de Realidad Aumentada de Google.

En una puesta en escena que recuerda a la propuesta de productividad de Microsoft para los años venideros, los ingenieros de Mountain View presentan su propio concepto del futuro (quizá relativamente cercano) de vida conectada, que tiene algunos elementos sobre los que merece la pena pararse un poco a pensar:

 

Como comenta Isabelle Olsson, miembro del equipo de desarrollo del producto, uno de los aspectos que están teniendo en cuenta a la hora de hacerlo realidad es que las gafas puedan ser utilizadas por todas las personas, lleven o no las suyas propias. Para ello plantean una montura “al aire” en la que en el ojo derecho figuraría el visor en el que supuestamente se reflejarían las imagenes digitales superpuestas, lo que a su vez plantea la duda de cómo van a resolver el tema de la visión a través de ambos ojos tal y como se ve en el vídeo ¿?:

Concepto de gafas de Realidad Aumentada de Google

En uno de los fotogramas del vídeo se pueden apreciar los servicios por los que apuestan ¿serán los únicos o habrá más contextuales en función del lugar y del momento en el que se encuentre la persona? ¿Se podrán invocar más a través de voz? ¿Cambiarán o serán los definitivos?:

Servicios de Google para sus Gafas de Realidad Aumentada

De izquierda a derecha y de arriba a abajo los servicios que proponen son:

  • Calendario / agenda personal.
  • Voz. En el vídeo se vé como la persona que lleva puestas las gafas habla con un amigo y con su chica. ¿Cómo convivirán las gafas con el móvil?
  • Google+ para toda la faceta social.
  • Hora
  • Tiempo y temperatura
  • Mensajería instantánea
  • Fotografías
  • Ajustes
  • Google Places
  • Música
  • Búsquedas
  • Vídeos
  • Búsqueda de amigos (geoposicionamiento de personas).
  • Checkins

Relación de servicios interesante que al menos da una primera pista de aquellos que consideran más importantes o en los que van a basar parte de su estrategia futura. Entre otras cosas llama la atención:

  • La búsqueda aparece en el medio de todos los servicios en la parte inferior ¿posición de mayor relevancia visual?.
  • Otorgan una gran importancia a la comunicación por videoconferencia (nuevamente la pregunta de cómo va a convivir con el móvil y de por qué es tan importante para ellos).
  • Tiempo y temperatura ¿Incorporarán sensores para medir la temperatura y detectar el tiempo cruzándolo con el de miles de dispositivos del entorno cercano para trazar mapas meteorológicos con una precisión nunca vista? La era de los dispositivos con sensores y sensibles al entorno está empezando ¿Qué aplicaciones pueden tener?
  • Google+ es igualmente relevante. Están centrando muchísimo los esfuerzos en toda la faceta social que constituye una parte crítica de la estrategia de Google para el futuro.
  • La mensajería instantánea complementa la videoconferencia y agrega una faceta de comunicación indirecta entre un grupo (WhatsApp está siendo una aplicación totalmente disruptiva -ha acabado con el negocio de los SMS- y habrán tomado buena nota de ello).
  • Google Places es igualmente un servicio crítico. Google se quiere meter literalmente en los comercios y tiendas. Ya ofrecen la opción de visitar y grabar el interior de los mismos para ponerlos a disposición de todos a través de Google Maps y es uno de los servicios que mayor potencial de retorno económico tienen. No sólo se trata ya de digitalizar colecciones de libros de forma masiva, ni de digitalizar las calles y ciudades, se trata de tener conocimiento sobre el mundo y los objetos del mundo especialmente de todos aquellos que se compran y venden. El reconocimiento de imágenes y objetos es un servicio crítico que están desarrollando. Las bases tecnológicas las tienen: Google Goggles y toda la experiencia tecnológica acumulada desde la adquisición de YouTube que les permiten tratar y extraer conocimiento de forma automática de los vídeos. De lo que ahora se trata es de saber dónde están los productos, de geoposicionarlos, de agregar valoraciones a los mismos basadas en la popularidad de los lugares (por ejemplo a través de los checkins), de la frecuencia de compras de los usuarios, de sus comentarios o anotaciones, de saber qué lugares son más valiosos y por supuesto todo ello con la figura del usuario como eje central beneficiario de toda la experiencia.
  • Ya no se trata tan sólo de aprender sobre las personas como individuos para conocer sus preferencias y gustos, los ingenieros de Google dan un paso más allá y se plantean empezar a entender con mayor profundidad la dinámica de cada individuo con el conjunto de personas con el que se relaciona y aprender sobre sus hábitos y gustos individuales y grupales para poder refinar más y mejor los intereses de cada uno. Aprender de sus dinámicas y patrones de conducta, qué sitios visitan, cuándo, con qué frecuencia y con quién…   El geoposicionamiento de las personas es clave para añadir contexto a una posible venta de un producto o para mostrar publicidad contextual, para generar ventas cruzadas a familiares o amigos… (por citar tan sólo tres ejemplos). Saber quién está y dónde en todo momento para poder ofrecer servicios y productos ad-hoc en el momento adecuado, en el lugar que se está visitando.

Las personas se van a convertir en los nuevos generadores de contenido y lo más interesante es que lo harán como lo tienen que hacer para que la idea tenga éxito: sin necesidad de realizar ningún tipo de esfuerzo. Una vez más la tecnología lo hará por ellos. Tan sólo hay que llevar las gafas puestas.

¿Las utilizaremos? ¿Más allá de su faceta comercial qué utilidad puede tener un producto como éste para, por ejemplo, un discapacitado visual?

Google Glass puede ser el siguiente paso para superar la crisis económica que estamos viviendo, el nuevo estadio de evolución que tome el relevo a la Web 2.0 y que vaya más allá del concepto de buscador tradicional y de la Web entendida como biblioteca de información y medio de comunicación. Algo nuevo que tenga un impacto equivalente al que tuvo el lanzamiento del Buscador en 1998.

Project Glass pueden ser millones de sensores concentrados en áreas geográficas muy concretas y pocos en áreas dispersas, captando información del entorno y de las personas, registrando el Mundo y añadiéndole semántica.

¿Qué se puede hacer con la información obtenida las 24 horas del día de las actividades cotidianas de las personas, y no sólo ya de información textual sino además de vídeo, imagen, voz e información medioambiental?

¿Es la siguiente revolución informacional? ¿Cómo redefine al individuo?

¿?

—–

Bola extra:

—–

--

 

Thinkepi: Ecosistemas tecnológicos

LA MOVILIDAD, PRECURSORA DEL CAMBIO

En los tres últimos años el acceso a la Web y a las redes sociales desde dispositivos móviles está teniendo literalmente un crecimiento explosivo sustentado por:

  • El desembarco masivo de smartphones y tablets: el iPad y el iPhone han abierto el camino y junto a la avalancha de tablets y móviles con Android están marcando un cambio profundo en nuestra vida y en cómo nos relacionamos con nuestro ambiente, desde cómo nos comunicamos con los familiares y amigos hasta como obtenemos información del entorno para aprender, para educar, para movernos, para el ocio o para llevar a cabo actividades de cualquier otra índole. Nunca antes hemos estado tan comunicados y tan instantaneamente.
  • El desarrollo de dos grandes sistemas operativos: iOS de Apple y Android de Google. A ellos hay que sumarles la entrada tarde, aunque fuerte de un tercer actor -Windows Phone de Microsoft- y la posible llegada a lo largo de 2012 de un cuarto Sistema Operativo móvil abierto: Boot To Gecko de Mozilla.
  • El abaratamiento y mejora de las telecomunicaciones -redes 3G- y el despliegue de las primeras redes 4G que van a suponer velocidades de conexión mayores que las que disfrutamos en nuestros ordenadores de escritorio permitiendo desarrollar nuevas aplicaciones a distancia (teleasistencia médica, vídeo y teleconferencia de alta calidad en tiempo real, realidad aumentada, etc).
  • La adopción por parte de las operadoras de planes de consumo relativamente más asequibles para los usuarios dado que ahora son todavía insuficientes por el coste y el reducido volumen de tráfico de datos a consumir mensualmente que ofrecen.

ECOSISTEMAS TECNOLÓGICOS ABIERTOS Y PROPIETARIOS

En este contexto cabe reflexionar sobre algunas cuestiones interesantes en tornos a los ecosistemas tecnológicos -conjunto de sistemas operativos, redes sociales, aplicaciones de software, tecnologías y estándares, y dispositivos hardware- existentes:

  • La World Wide Web es un ecosistema de estándares abiertos con el que llevamos conviviendo y trabajando 22 años. A día de hoy resulta difícil imaginar su desaparición ni a corto ni a medio plazo tanto por su imbricación en nuestras vidas como porque es la plataforma sobre la que se sustenta buena parte del funcionamiento del resto de ecosistemas tecnológicos cerrados.
  • Aproximándose rápidamente a los mil millones de usuarios Facebook se ha convertido en una web paralela a la World Wide Web. Con sus propias reglas de diseño de interacción social, sus propias reglas de publicación de contenidos, su contenido cautivo, su propia tecnología y su propia economía. Lo único que le falta a Facebook es ofrecer dispositivos físicos propietarios y cerrados aunque en rigor no les hace falta dado que están desarrollando aplicaciones que garantizan una experiencia de usuario homogénea y una interfaz consistente con independencia del dispositivo desde el que se acceda, ya sea ordenador de escritorio, portátil, smartphone o tablet.
  • Google a su vez, se está convirtiendo igualmente poco a poco en una Web paralela a la propia World Wide Web desarrollando un ecosistema propio, una capa de interfaz que tiene a Android como sistema operativo móvil, Google Docs como conjunto de aplicaciones ofimáticas en la nube, Chrome como navegador y Google+ como red social. Google se Facebookiza y Facebook se Googleliza (un reciente paso más para ello por parte de Facebook para dar la batalla en el ámbito de la geolocalización es la compra de Gowalla). El objetivo es lograr acaparar la atención y el mayor tiempo de uso y consumo informativo, social y de ocio de los usuarios así como analizar y conocer con la mayor profundidad posible sus necesidades y su comportamiento en su ecosistema en aras a sacar el mayor retorno económico posible de ello. Un modelo de negocio Freemiun en el que todo se mide y todo se monetiza.
  • Microsoft se está transformando. Se juega mucho con Windows 8 y Windows Phone. Microsoft hereda un sistema tecnológico de escritorio que se sustenta sobre una filosofía de trabajo de hace 22 años (Windows 3.1 apareció en 1990). Sobre ello Ray Ozzie advertía y alentaba a promover un cambio en la compañía cambio que ahora empieza a despuntar. Windows Phone, su sistema móvil, tiene una gran calidad y comienza a dar más relevancia a la persona que a la propia tecnología por sí misma. Atrás han quedado esos teléfonos móviles de Nokia con Symbian, con decenas de funcionalidades inútiles que no se usaban ni interesaban y una interfaz tremendamente complicada de utilizar, y atrás ha quedado la idea de que un dispositivo -el móvil- como objeto, era el objetivo último y el producto estrella para vender de la empresa.

Interfaz de Windows Phone vs iPhone

La interfaz de Windows Phone cuenta una historia para una persona, las llamadas que ha recibido, su gente, los mensajes de texto o correo que le han escrito, las fotos de los lugares en los que ha estado, sus juegos y su identidad digital. La interfaz del iPhone cuenta asimismo esa historia pero de manera diferente,  priorizando en la parte inferior del “escritorio” (mantiene la consistencia con el ordenador de sobremesa) la comunicación -teléfono-, el correo, Safari para la navegación por Internet y música- En el resto del escritorio de nuestro “espacio digital/vida personal” encontramos mensajes, calendario, fotos, cámara, mapas, contactos y una tienda de aplicaciones, App Store, digitales.

  • Windows 8 parece que va a ser un híbrido tecnológico pensado para dar respuesta a dos modelos de interacción sustancialmente diferentes:
    • Una capa de interfaz táctil, orientada a cubrir la faceta de vida personal (ocio, relaciones sociales y media).
    • Otra orientada más a productividad y al ámbito profesional basada en el modelo de interacción pensado para el ordenador “personal” y los periféricos a los que estamos acostumbrados -el ratón, el teclado y el monitor-.

    Es interesante notar que Microsoft está siguiendo con el desarrollo de su próximo sistema operativo un proceso inverso a Apple con el iPhone ya que está trasladando la interfaz de Windows Phone (conocida con el nombre de Metro) al ordenador de sobremesa. Es una apuesta arriesgada pero en algún momento tiene que producirse la ruptura con el modelo de Interacción Hombre-Ordenador imperante hasta ahora. Se está dando el salto a un modelo de Interacción Hombre-Dispositivo y a un tercer modelo emergente: el de Interacción Hombre-Ambiente. El Wearable Computer -dispositivos tecnológicos que llevaremos puestos o en nuestra ropa de vestir- y las interfaces ambientales -paredes de nuestros edificios, mesas, electrodomésticos, coches, nuestra propia piel- serán superficies digitales táctiles con las que algún día podremos interactuar. Así, Microsoft está llevando a cabo en sus Labs interesantes proyectos de investigación tales como Microsoft OmniTouch y PocketTouch.


En cuanto a las gafas de Realidad Aumentada y traducción simultánea (segundo 8 y siguientes) parece que, de momento, Google lleva un cuerpo de ventaja.


Las interfaces holográficas o retroproyectadas son de momento un concepto pero cuando aparecen de forma reiterada en el vídeo de productividad de Microsoft (y en otros como en el vídeo del concepto de móvil de Mozilla -Seabird-), es que se está trabajando en esta dirección. Kinect ya permite interactuar con las interfaces mediante gestos tal y como se muestra en el vídeo de Microsoft.

  • Apple está configurando asimismo un cuarto ecosistema que quizá sea el más sólido y consistente de todos hasta la fecha, aunque igualmente, cerrado y propietario. La compañía de Cupertino está siendo la punta de lanza en el desarrollo de la Web Móvil y ubicua con iCloud -un medio para poder tener nuestro contenido personal siempre disponible con independencia del dispositivo que utilicemos y del lugar en el que nos encontremos-. Ésta, es una fuerte tendencia emergente por la que todos los principales actores tecnológicos están apostando, así como por el desarrollo de la Internet de las Cosas y el “diálogo” entre los propios objetos:

 

Smarcos: Proyecto para garantizar una usabilidad e interacción consistente entre dispositivos

Ya no se trata tan sólo de un simple cambio de interfaz en sus productos sino de una manera de concebir de forma integral nuestra vida digital experiencia que abarca (de momento) el móvil -iPhone- el ordenador de escritorio ya sea en casa -iMac- o portátil -MacBooks-, el nuevo lector digital que tiende a sustituir al libro -la tableta iPad- y un quinto que entra con fuerza este nuevo año: la televisión.

El foco se está poniendo por fin decididamente en la persona y no en los sistemas operativos o en la tecnología en sí misma: no en nombres de ficheros, no en el diseño de exploradores de archivos, no en actualizaciones diarias interminables, ni en formatos de archivo, ni en drivers, ni en discos duros, ni en otras jergas ininteligibles para las personas.

Se están centrando en ofrecernos una experiencia de comunicación, aprendizaje, compartición y trabajo común y homogénea a través de cualquier dispositivo que usemos en nuestra casa, en la oficina o en la calle. Se están centrando en permitirnos ver la cara de nuestros familiares a través del móvil con aplicaciones como Facetime (y no sólo en escuchar su voz), en facilitar la comunicación de grupo (iMessage), en compartir nuestras vivencias a través de imágenes y sonidos de forma instantánea o diferida y permanente en el tiempo, y en interactuar de una manera más humana con el propio móvil mediante nuestra voz con asistentes personales como SIRI, sin tener que teclear de forma interminable en teclados virtuales.


Siri. Asistente personal de voz del iPhone 4S

 

RECUPERANDO EL PAPEL CENTRAL DE LA WORLD WIDE WEB COMO ECOSISTEMA ABIERTO PARA EMPUJAR EL CAMBIO

¿Y la Web? La World Wide Web es la plataforma, pero dado que es medio y soporte está tendiendo a diluirse en dichos ecosistemas propietarios y cerrados e interfaces controladas. Lo que ganamos en facilidad de uso para las personas por un lado lo perdemos por otro en privacidad y control de los contenidos y de los dispositivos.

No creo que la World Wide Web desaparezca en tres años. Pero cuando menos es para pensar un poco en el nuevo cambio que ya nos alcanza:

  • En cómo vamos a superar las barreras de software que imponen los ecosistemas tecnológicos cerrados como iOS o Facebook, las tiendas de aplicaciones cerradas y propietarias y el nuevo paradigma para ganar dinero, las apps, aplicaciones cerradas que dependen de cada plataforma concreta y que poca o ninguna comunicación permiten entre ellas (en ello está Mozilla con el desarrollo de aplicaciones abiertas sobre la plataforma de la Web).
  • En cómo vamos a superar las barreras de hardware que imponen los dispositivos cerrados como el iPad o el iPhone para permitir que se comuniquen con otros dispositivos de su entorno, con los de terceras compañías y con otros objetos cotidianos como el espejo en el cual nos miramos por la mañana, el salpicadero de nuestro coche, nuestro frigorífico o el cristal de la parada del autobús.
  • En cómo vamos a garantizar que el contenido sea de las personas y privado, no de las compañías tecnológicas, ni público.
  • En cómo se va a gestionar la Identidad Digital personal y única con independencia del ecosistema tecnológico que sea. No en mantener múltiples identidades digitales -Apple ID, Windows Live, Google Accounts, Facebook… ni en estar atados a un único ecosistema propietario y cerrado ni a una única compañía.

En todo ello la World Wide Web debería ser una vez más el ecosistema tecnológico abierto de referencia para el desarrollo de la nueva Internet de las Cosas que empieza a vislumbrarse.

Hay más objetos en los que tenemos que comenzar a pensar como próximos soportes de nuestra vida digital que los móviles, ordenadores, tabletas y televisión. Hay que empezar a considerar nuestra vida digital como un todo y ver qué soluciones como Diseñadores de Interacción podemos aportar.

Hay negocio más allá de la distribución de contenidos que no se pueden prestar a quien nosotros queramos (libros, vídeos, música) y hay negocio más allá de tiendas de aplicaciones cerradas y propietarias.

Cuanto mayor y mejor sea la comunicación entre ecosistemas y la compartición de contenidos, mayores serán los retornos económicos para las compañías tecnológicas y mayores los beneficios para las personas.

La World Wide Web lo demuestra y es el mejor ejemplo de ello.

–O–

Grupo Thinkepi

–O–

--

 

Atención y Locus de Atención: Implicaciones de usabilidad y repensar el diseño de las interfaces

UN CASO DE ESTUDIO

Hace poco estaba prototipando una interfaz que permitía al usuario gestionar las etiquetas asociadas a una imagen. Concretamente estaba pensada y diseñada para que el usuario pudiese llevar a cabo dos tareas:

  • Borrar una etiqueta concreta
  • Visualizar las imágenes asociadas a una etiqueta para, con posterioridad, añadir más etiquetas a dichas imágenes o realizar otras operaciones sobre ellas.

Después de un rato salieron dos opciones:

 

Alternativa A:

Interfaz para la gestión de etiquetas - Listado de etiquetas agrupadas en conjuntos por letrás mayúsculas

 

Alternativa B:


Interfaz para la gestión de etiquetas sin agrupar en conjuntos por letras mayúsculas

 

En la alternativa A las etiquetas se agrupan alfabéticamente por la primera letra. El objetivo es facilitar la búsqueda de una etiqueta concreta para lo que se recurre a una doble solución:

  • Por un lado se utiliza el espacio en blanco para introducir una separación visual entre letras que sea lo suficientemente significativa para que rápidamente se perciba la “ruptura” de cada bloque,
  • Por otro, se añaden las letras del alfabeto en mayúsculas, agrupando en conjuntos las etiquetas que empiezan por la misma. Con ello se pretende crear un punto focal sobre las letras mayúsculas de inicio de cada bloque para facilitar la búsqueda de las etiquetas una vez localizado rápidamente el grupo.

 

En la alternativa B por el contrario se eliminan las letras mayúsculas agrupadoras y se usa el espacio en blanco como único recurso para separar los conjuntos de etiquetas.

Aunque lo mejor para un escaneado más rápido y una lectura óptima es tener una sola columna con la relación de todas las etiquetas, se optó por distribuirlas en tres paralelas con el fin de evitar un excesivo scroll vertical.

El caso es que después de estar un rato mirándolas se me planteó la pregunta de cual de las dos opciones sería la mejor por usabilidad.

¿?

 

ATENCIÓN, LOCUS DE ATENCIÓN E IMPLICACIONES PARA LA USABILIDAD DE LAS INTERFACES

En su libro The Humane Interface (me encanta este libro y lo voy a seguir utilizando como fuente de inspiración para futuros posts) Jef Raskin reflexiona sobre dos conceptos que vienen al caso, la atención y el Locus de Atención.

En cuanto a la atención Fernández-Abascal, Dolores Martín y Domínguez Sánchez (1) (2009, p. 52) la definen como:

  • Un estado de concentración en algo.
  • Capacidad de procesamiento que puede distribuirse o compartirse en el tiempo entre las diversas tareas y estímulos que exigen atención.

Ahondando en la definición, Tejero (2) menciona que:

“La atención puede definirse como el mecanismo cognitivo mediante el que ejercemos control voluntario sobre nuestra actividad perceptiva, cognitiva y conductual, entendiendo por ello que activa/inhibe y organiza las diferentes operaciones mentales requeridas para llegar a obtener el objetivo que pretendemos y cuya intervención es necesaria cuando y en la medida en que estas operaciones no pueden desarrollarse automáticamente”.

Los procesos en los que media nuestra atención son procesos conscientes. La atención nos permite centrarnos en parte de la información que recibimos a través de nuestros órganos sensoriales y controla y orienta nuestra actividad de forma consciente para conseguir un objetivo concreto. Por el contrario hay ocasiones en que las tareas las llevamos a cabo guiadas por un hábito, las hacemos de forma automática o insconciente.

No obstante, ambos procesos, no se dan plenamente por separado sino que puede haber un cierto grado de interacción entre los mismos.

Un buen ejemplo es el el de escribir en el ordenador. Si hemos aprendido mecanografía ejecutamos esta acción de manera inconsciente. Una vez que posamos las manos sobre el teclado no sómos conscientes de dónde se encuentran posicionadas las teclas que corresponden a los caracteres del alfabeto. Cuando pensamos en una palabra nuestros dedos se mueven de manera automática presionando las que hagan falta y como resultado aparece la palabra en pantalla. El proceso de escribir está guiado por nuestro hábito adquirido a través de un proceso de aprendizaje. Y si el hábito está mal adquirido, los errores tenderán a repetirse.

Por el contrario,si tuviésemos que pensar en los caracteres que conforman una palabra determinada, por ejemplo -g-a-z-p-a-c-h-o- y decidiéramos escribirlos uno a uno, en el proceso entraría en juego nuestra consciencia: En tal caso las operaciones serían:

  • ¿Cuál es el primer carácter de la palabra que estamos escribiendo? –> la “g”
  • ¿Dónde está la tecla que se corresponde con el carácter “g”– > en la parte central del teclado, la localizamos –> y la presionamos continuando la tarea con el resto de caracteres en un proceso recursivo hasta completar la palabra.

Raskin sumariza las diferencias entre los procesos cognitivos conscientes e inconscientes de la siguiente forma (3):

Propiedad Cognitivos conscientes Cognitivos inconscientes
Guiados por La novedad 

Emergencias

Peligro

Repetición 

Eventos esperados

Seguridad

Usados en Nuevas circunstancias Situaciones rutinarias
Puede manejar Decisiones Tareas no ramificadas
Admiten Proposiciones lógicas Lógica o incosistencias
Opera Secuencialmente Simultáneamente
Los controla La voluntad Hábitos
Capacidad Pequeña Grande
Persistencia durante décimas de segundos Décadas (toda la vida)

Por último, en cuanto al concepto de Locus de atención comenta que (4):

“Uso el término locus porque significa un lugar, o en el sitio. El término foco, que a veces se utiliza de forma similar, se puede entender como un verbo, por lo que transmite una falsa impresión sobre cómo trabaja la atención. Cuando uno está despierto y consciente, el Locus de Atención es una característica, un rasgo de, o un objeto en el mundo físico, o una idea sobre la que está pensando activamente y con atención”

¿Cómo influye la atención y el locus de atención en el desempeño de las tareas que acometemos cuando interactuamos con el ordenador?

Volvamos a la interfaces planteadas al principio del post.

Considerando el ejemplo A, cuando el usuario busca una etiqueta específica como por ejemplo “invertebrado” el locus de atención se centra en la búsqueda de palabras que empiecen por “i”. Este proceso lo ejecutamos en un primer momento de manera inconsciente. La separación de las etiquetas en grupos usando el espacio en blanco no interfiere con la tarea, no añade “ruido”, ni visual, ni cognitivo, sino más bien lo contrario, aporta una pista sutil y que, de manera insconsciente, nos ayuda a diferenciar unos grupos de otros rápidamente.

El problema se presenta cuando la persona se topa con la letra mayúscula que abre cada grupo de etiquetas. -¿?- -¿Qué es esto…?- piensa. En ese momento se rompe el proceso inconsciente al encontrarse el usuario con algo inesperado que le lleva a tener que razonar e interpretar lo que está viendo. A partir de ahí el proceso requiere de su consciencia y atención:

  • ¿Una letra mayúscula? ¿? –> ha de interpretar que las letras mayúsculas agrupan conjuntos de etiquetas que empiezan por las mismas.
  • A continuación pasa a preguntarse por qué letra empieza la etiqueta buscada –> por “i” –> pasa a buscar el grupo de la “I” mayúscula –>una vez que lo ha localizado –>
  • ¿Qué etiqueta estaba buscando y cuál es el siguiente carácter de la misma? –> “invertebrados” –> busca la palabra invertebrados en el conjunto de etiquetas identificado.

El diseño con letras mayúsculas para separar los grupos de etiquetas rompre nuestro locus de atención e interfiere directamente con la acción que se está llevando a cabo.

La altenativa de diseño B es más óptima dado que se juega con los espacios en blanco y no se incluyen terceros elementos como las letras mayúsculas que desencadenen un proceso de razonamiento consciente. La mirada fluye de manera natural por el listado, los espacios en blanco organizan las letras marcando los diferentes conjuntos de etiquetas y el locus de atención no se rompe, siendo el proceso mucho más rápido. La interfaz es más óptima.

 

REPENSAR LA INTERACCIÓN Y LAS METÁFORAS DE LOS SISTEMAS OPERATIVOS: DECONSTRUIRLOS

Las metáforas que utilizamos para dar forma a, y modelar los espacios de información, y los procesos de interacción de los actuales sistemas operativos requieren de un importante esfuerzo por parte del usuario para comprenderlos o llevarlos a cabo.

Las interrupciones son parte inherente de cualquier actividad. No obstante podemos optimizar los flujos de interacción de los actuales sistemas operativos para disminuir el esfuerzo cognitivo necesario para realizar las tareas que ejecutamos con ellos.

Si quiero modificar una imagen que estoy viendo en el navegador antes, tengo que llamar a una aplicación para llevar a cabo dicha actividad rompiéndose nuestro locus de atención ¿Por qué tenemos que usar una “aplicación” para editar una imagen si mi tarea es modificar una imagen, no lanzar una aplicación? ¿? A continuación tengo que pensar qué aplicación he de utilizar para ello. Ésta podría ser por citar una Photoshop. La siguiente tarea para conseguir nuestro objetivo sería dilucidar cómo lanzarla ¿Tendría que acudir al escritorio o al menú de inicio? En el menú de inicio, en Windows ¿debería buscarla en el box de búsqueda o ir a la lista de “Todos los programas” para localizarla. Si opto por esta última opción… ¿bajo qué carpeta -grupo de programas- la encontraría? ¿Carpeta? ¿? ¿Por qué usamos la metáfora de una carpeta del mundo real para representar algo que guarda una “aplicación” utilizando la misma metáfora para agrupar aplicaciones y documentos? ¿? Cuando he localizado la carpeta con la aplicación tengo que hacer clic en el icono que la abre, esperar a que se abra lo cual lleva un tiempo variable de ¿15 – 40 segundos…? ¿más? con la consiguiente distracción del usuario hasta que se abre. A continuación he de abrir la imagen que previamente debería haber salvado en el disco duro haciendo clic con el botón derecho del ratón sobre la misma en el navegador, de seleccionar la “carpeta” donde guardarla, y de pulsar el botón “Guardar” del correspondiente cuadro de diálogo.

El proceso y el tiempo que media desde que el usuario decide modificar la imagen que está viendo en el navegador hasta que empieza a editarla puede ser de… ¿3 minutos? ¿5? El proceso de modificar la imagen que estamos viendo en un navegador se termina subdividiendo en multitud de tareas con constantes interrupciones para llevar a cabo toda la serie de pasos intermedios que finalmente nos permitan dar cumplimiento a lo que queremos.

Opciones del menú secundario de Windows 7 de una imagenOpciones del menú secundario que se abre al pulsar el botón derecho del ratón sobre el icono de una imagen en el escritorio de Windows 7. Un total de 27 tareas posibles sin contar las que hay detrás de los submenús como el de la opción “Abrir con” de la captura de la imagen. El usuario tiene que hacer el ejercicio de identificar cuál es la tarea adecuada para modifica la imagen: “Abrir” “Edita con Fireworks” “Editar” “Abrir con” > “Adobe Fireworks CS4″, “Adobe Photoshop CS4″,  “Microsoft Picture Manager”, “Paint”, “Snagit Editor” ¿Cuál elijo y a qué coste cognitivo? ¿?

Windows 7. Opciones que aparecen cuando se posiciona el cursor encima de una imagen y se pulsa en el botón derecho del ratón

De todas las opciones que se me ofrecen sólo me interesa una: la editar.

¿Cómo podemos diseñar interfaces más optimizadas? ¿Interfaces más orientadas al modelo mental de las personas y no condicionadas por las limitaciones impuestas por el software o el Sistema Operativo?

Una posible solución es lo que Donald Norman denomina”Informática basada en actividades” (Activity-Based Computing, ABC) (5) :

“La idea básica es sencilla: tener a mano todo el material necesario para una tarea, con poco o ningún esfuerzo mental”

Sencillo de explicar, muy difícil hacerlo realidad…

Al menos hasta hoy día sólo se ha conseguido en parte, y sólo ahora comienzan a verse interfaces más centradas en las personas que en la propia tecnología.

iPhone - Control por vozCaptura de pantalla del “Control por voz” del iPhone
Ahora… ¡¡podemos hablar con nuestros móviles para decirles lo que queremos que hagan…!! Ya iba siendo hora de que por fin podamos comunicarnos por voz con un dispositivo pensado para hablar por voz con otras personas… y aún así… ¿por qué se rotula la pantalla como “Control por voz”?
¿Por qué no mejor algo como… ¿Qué quieres hacer?? ¿? … La complejidad se carga en la tecnología, no en la interfaz.
También se puede prescindir del botón de “Cancelar” dado que ya tenemos el propio del teléfono para volver a la “Home” o “escritorio”.

 

Todavía hoy estamos anclados por el paradigma de las interfaces de unas máquinas y unos lenguajes de programación conceptualizados hace tres décadas y unos modelos de negocio empresariales orientados a maximizar la obtención de beneficios económicos antes que el beneficio para las personas, ejemplo del cual, por citar tan sólo uno, es el actual modelo de aplicaciones que se ha desarrollado para los nuevos móviles “inteligentes”, una oportunidad de oro perdida para centrar de verdad la informática en donde tiene que estar centrada, en las personas, no en la forma de hacer dinero.

Norman (6) establece una jerarquía en los procesos que está conformada por (desde la más alta a las más bajas):

  • Actividades: conjunto de tareas dirigidas a unos objetivos concretos -poner al día las cuentas de casa- -llamar a un amigo- son dos posibles ejemplos de actividades.
  • Tareas: aquellos pasos que seguimos para llevar a cabo los objetivos subordinados de las actividades.
  • Acciones: conjunto de operaciones que llevamos a cabo para ejecutar una tarea, por ejemplo, una operación al escribir una palabra puede ser teclear un carácter y la acción, escribir la palabra.

La Interfaz Humana (prefiero éste término al de Sistema Operativo, ajeno a las personas) ha de estar centrada en las actividades, no en las tareas. No en tener que pensar en qué programas o aplicaciones “estancas” necesito para llevarlas cabo.

No en algo llamado Mozilla Thunderbird sino en escribir un mensaje y en mandárselo a mi hermana.

Aza Raskin explica muy bien un nuevo modelo de negocio que podría convertirse en una alternativa al de la informática actual (que está basado en aplicaciones y programas, algo que entra en constante conflicto con nuestro modelo mental que tenemos como personas que somos) y que es igualmente viable desde un punto de vista económico y más centrado en las personas.

Un ejemplo de ello es la evolución que están sufriendo los navegadores. El navegador se está transformando en una capa que está envolviendo a los sistemas operativos convirtiéndolos en interfaces “más humanas” orientadas a responder nuestras actividades cotidianas:

  • las necesidades de interrelación social -redes sociales –> Facebook, Tuenti-
  • las necesidades de comunicación –> Twitter, Skype, Google Voice, GMail, Hotmail…-
  • las de productividad -búsqueda y localización de información –> Google, Bing-
  • para servirnos como memoria –>almacenamiento en la nube –> Google Docs, Dropbox-
  • y para la recuperación, gestión y aprovechamiento de la información –> Google, Bing, Google Docs…

Y lo están empezando a hacer de forma bastante más eficaz que los sistemas operativos. Integrando todo ello en una interfaz deconstruida que se centraliza en un campo de entrada de texto que está dejando de ser “barra de navegación” para convertirse en “barra de interacción”:

AwesomeBar HD, nuevo proyecto de MozillaLabsLa AwesomeBar HD permite seleccionar un comando para, a continuación, escribir la necesidad de información.
Pulsando a continuación retorno se ejecuta la acción (por ejemplo, se presenta la página de resultados de Amazon
con los títulos de los libros que coinciden con las palabras escritas

El binomio Web-navegador está reemplazando a los sistemas operativos por algo más cercano a nosotros y ha de seguir evolucionando.

Un posible camino para ello y hacia una interfaz más humana puede ser el proyecto en el que está trabajando MozillaLabs –> AwesomeBar HD que no es sino una pequeña adaptación de algo mucho más potente, Ubiquity, una metainterfaz que se sitúa por encima del sistema operativo y que se integra plenamente en el navegador. La comunicación tanto con la AwesomeBar HD como con Ubiquity se da mediante palabras escritas y comandos muy específicos aunque el día de mañana quizá podra darse también a través de la voz y en un lenguaje natural. Una interfaz como Ubiquity permitiría simplificar el proceso de editar una imagen para que fuese algo así como seleccionarla en el navegador, hacer clic en la barra de navegación, escribir “modificar”, y lanzar la interfaz en la misma ventana para llevar a cabo la acción. Compararlo con el anterior proceso descrito…

Desde un punto de vista cognitivo mucho mejor.

La AwesomeBar HD da continuidad al proyecto Ubiquity, un éxito tan rotundo y algo tan innovador e importante que posiblemente lo estarán desarrollando internamente. La AwesomeBar HD no es más que un vistazo a lo que veremos a medio plazo.

Google podría hacer algo similar y la verdad, es que es sorprendente que todavía no lo hayan hecho, evolucionar su interfaz para pasar de un buscador a un asistente personal que guíe al usuario en su interacción con la Web. Medio trabajo ya lo tienen hecho, la pregunta que deberían plantearse los ingenieros de Google es la de cómo podrían unificar las funcionalidades de los diferentes box de búsqueda-interacción de los distintos servicios que ofrecen: Gmail, Google Docs, Google Calendar, Google Translate… en el box del buscador principal.

Recuperar la idea del sistema operativo, ubicuo, multimodal y humano, vamos

Quizá mañana, Mozilla, Google, Microsoft o Apple vuelvan a sorprendernos.

Seguro que sí.


–O–

BIBLIOGRAFÍA:

  1. Fernández Abascal, Enrique G.; Martín Díaz, María Dolores; Domínguez Sánchez; Javier. Procesos psicológicos. Madrid : Ediciones Pirámide, p. 52. ISBN 978-84-368-1605-1
  2. – Ibid. p. 36.
  3. Raskin, Jef. The Humane Interface: New directions for designing interactive systems. Boston : Addison Wesley, p. 16, ISBN: 0-201-37937-6
  4. – Ibid. p. 17.
  5. Norman, Donald. El ordenador invisible. Paidós : Barcelona, p. 101. ISBN 84-493-1089-X
  6. –Ibid, p. 102.

--

 

Switch to our mobile site