Una visión realista de los robots de voz

La tecnología de voz que impulsan dispositivos como Alexa de Amazon y Google Home es la próxima frontera para las empresas tecnológicas emergentes.
El reciente anuncio de Facebook de lanzar ParlAI no ha hecho sino intensificar la ambición del sector por alcanzar el objetivo final de mantener conversaciones significativas con ordenadores mediante la voz.
Pero no nos engañemos: aún no hemos llegado a ese punto.
En MediaMonks, estamos recibiendo cada vez más peticiones de marcas deseosas de explorar esta utilidad emergente y, al mismo tiempo, estamos trabajando con equipos de ingeniería y productos para comprender exactamente lo que puede hacer la tecnología. De momento, aún nos quedan pasos por dar, pero una cosa es segura: La tecnología activada por voz va a ser cada vez más inteligente, y rápido.
Hace poco hablaba con un alto ejecutivo de una empresa líder mundial en productos de consumo. Mientras veía la televisión, vio un interesante anuncio de un producto similar al suyo. Esto le llevó a probar Alexa. Preguntó cuál era la mejor marca para la categoría del producto, y Alexa respondió rápidamente con una lista de competidores. Más tarde, uno de ellos se ofreció a enviarle una muestra y otro le indicó los mejores precios. Esto demuestra que, aunque todavía no estemos manteniendo conversaciones significativas, la tecnología activada por voz está en alza y también lo están las oportunidades para que las marcas la aprovechen.
Lo bueno, lo malo y lo prometedor
Un estudio reciente muestra que el mercado estadounidense de asistentes activados por voz ha crecido casi un 130% desde 2016.
En la actualidad, Amazon Echo (Alexa) y Google Home -que se diferencian de Siri y Google Now de Apple en que son dispositivos independientes y fijos- dominan el mercado. Su función principal es proporcionar un "hogar más inteligente" llamando a la música, recordando su agenda e incluso respondiendo preguntas de trivial.
Una de las mayores ventajas de la tecnología activada por voz es que ahorra tiempo. Hablar es más natural que escribir y, al no tener que sacar el teléfono, es más rápido. También es más accesible para quienes, por una razón u otra, no pueden utilizar teclados o pantallas.
Pronto, escribir y pulsar un teclado sin necesidad será un recuerdo del pasado lejano.
Tal vez. Pero esta función sigue siendo propensa a errores. Cuando muchas personas hablan cerca de un dispositivo a la vez, éste tiende a tener dificultades para oír realmente la frase de activación. Al final, si tienes que repetir tu petición una y otra vez, puede llevarte más tiempo que acercarte a pulsar un interruptor.
También hay que tener en cuenta la cuestión de la privacidad. El reciente anuncio televisivo de Burger King en el que se utilizaba "OK, Google" es un buen ejemplo de ello. El anuncio utilizaba la palabra "OK, Google" para pedir a los dispositivos que describieran sus hamburguesas, pero a las pocas horas de su publicación -y de las divertidísimas ediciones de la página de Whopper en Wikipedia- el anuncio fue retirado. La amplia cobertura de este anuncio puso de relieve el hecho de que la tecnología de voz es todavía nueva para muchos, y la idea de que alguien, o cualquier cosa, escuche a la gente es desconcertante.
Sin embargo, estos problemas no son más que fallos. El mayor reto es que, aunque hemos creado procesos que permiten a los ordenadores mejorar en traducción, reconocimiento de voz y síntesis de voz, la mayoría de los ordenadores siguen sin entender el significado del lenguaje.
Ningún sistema de inteligencia artificial es lo bastante bueno como para entender una conversación. [Se basa tanto en escuchar lo que dices como en predecir lo que dirás a continuación. El habla estructurada sigue siendo mucho más fácil de entender que la conversación no estructurada.
Y los estudios confirman que el ciudadano medio se esfuerza por encontrar valor a la hora de adoptar esta tendencia tecnológica emergente en su vida cotidiana.
Las marcas deben prepararse para el mañana, empezando hoy mismo
La lista de limitaciones actuales es larga. A pesar de estos inconvenientes, los avances en el aprendizaje automático hacen que los ordenadores sean cada vez mejores a la hora de reconocer lo que dice la gente. Aún no hemos llegado a ese punto, pero la ambición de Zuckerberg de una IA que entienda el habla conversacional puede no estar muy lejos.
En 2011, el mercado mundial del reconocimiento de voz estaba valorado en casi 47.000 millones. Seis años después, esa cifra se ha duplicado con creces hasta alcanzar los 113.000 millones. Junto con la nueva inversión anunciada por Facebook, hay prisa por acelerar la transición del reconocimiento de voz al procesamiento del lenguaje natural a escala. Una vez conseguido, el deseo de Zuckerberg de que los ordenadores mantengan conversaciones más sofisticadas será posible.
Las marcas pueden empezar a prepararse hoy mismo para esta nueva frontera. Como demuestra mi anterior ejemplo de Alexa, pronto serán cada vez más los consumidores que recurran a estos productos para comparar opciones y realizar compras. Las marcas deben anticiparse a este cambio integrando estos dispositivos en sus estrategias de comercio electrónico y marketing. De la misma manera que las compras en línea transformaron la experiencia de las tiendas físicas, la tecnología de activación por voz llevará esto al siguiente nivel.
Cada día evoluciona la promesa de conversaciones significativas y soluciones orientadas a los resultados que ofrecen los seres humanos que interactúan con los ordenadores. Sigamos explorando y contribuyendo a estas tecnologías a medida que se vuelven más inteligentes y significativas... palabra a palabra.
Related
Thinking
-
Entrada de blog
The One Show nombra a Monks primera organización pionera en IA Por Monks 3 mins de lectura -
Entrada de blog
¿Estás preparado para la CyberWeek ? Por Sol Sanchez 3 mins de lectura -
Entrada de blog
Enhanced Conversions
La clave para potenciar tus resultados en Google Ads Por Sol Aguirre 2 mins de lectura
Aumenta tu ventaja en un mundo que no espera
Suscríbete para recibir actualizaciones por correo electrónico con información práctica, estudios de vanguardia y estrategias de eficacia probada.
Monks necesita la información de contacto que usted nos proporciona para ponerse en contacto con usted acerca de nuestros productos y servicios. Puede darse de baja de estas comunicaciones en cualquier momento. Para obtener información sobre cómo darse de baja, así como sobre nuestras prácticas de privacidad y nuestro compromiso con la protección de su privacidad, consulte nuestra Política de privacidad.