Uma tomada de voz realista

A tecnologia de voz que alimenta dispositivos como o Alexa da Amazon e o Google Home é a próxima fronteira para as empresas de tecnologia emergente.
O anúncio do Facebook de lançar o ParlAI recentemente apenas intensificou a ambição da indústria de alcançar o objetivo final de ter conversas significativas com os computadores por voz.
Mas vamos agarrar nossos cavalos; ainda não estamos lá.
Na MediaMonks, estamos recebendo cada vez mais solicitações de marcas ansiosas para explorar esta utilidade emergente e, ao mesmo tempo, estamos trabalhando com equipes de engenharia e produtos para entender exatamente o que a tecnologia pode fazer. Na sua forma atual, ainda temos saltos a dar, mas uma coisa é certa: A tecnologia ativada por voz está pronta para se tornar mais inteligente e rápida.
Recentemente, eu estava falando com um executivo de alto nível de uma empresa líder mundial de produtos de consumo. Enquanto assistia TV, ele viu um anúncio interessante para um produto semelhante ao seu próprio. Isto o levou a testar o Alexa. Ele perguntou qual era a melhor marca para a categoria de produto, e Alexa respondeu prontamente com uma lista de concorrentes. Mais tarde, um se ofereceu para lhe enviar uma amostra, e outro listou os melhores preços. Isto mostra que embora ainda não estejamos tendo conversas significativas, a tecnologia ativada por voz está aumentando, assim como as oportunidades para que as marcas a abracem.
O Bom, o Mau e o Promissor
Um estudo recente mostra que o mercado norte-americano de assistentes ativados por voz cresceu quase 130 por cento desde 2016.
Hoje, o Amazon Echo (Alexa) e o Google Home - which diferem do Siri da Apple e do Google Now por serem independentes, estacionários no mercado which- dominate. Sua principal função é proporcionar uma "casa mais inteligente", chamando a atenção para a música, relembrando sua agenda e até mesmo respondendo a perguntas triviais.
Um dos maiores benefícios da tecnologia ativada por voz é que ela economiza tempo. Falar é mais natural do que escrever, e como você não precisa tirar seu telefone, é mais rápido. Também é mais acessível para aqueles que, por uma razão ou outra, não são capazes de usar teclados ou telas.
Em breve a digitação e o toque desnecessários em um teclado serão uma memória do passado distante.
Talvez. Mas esta característica ainda é suscetível a erros. Quando muitas pessoas estão falando perto de um dispositivo ao mesmo tempo, ele tende a ter dificuldade de realmente ouvir a frase de ativação. No final, se você tiver que repetir seu pedido uma e outra vez, pode ser mais demorado do que simplesmente passar por cima para virar um interruptor.
Há também a questão da privacidade a ser considerada. O recente anúncio da Burger King na TV usando "OK, Google" é um excelente exemplo disso. O anúncio usou a palavra de velório "OK, Google" para solicitar dispositivos para descrever seus hambúrgueres, mas em poucas horas após release - and foram tiradas edições hilárias do comercial Whopper Wikipedia page - the. A ampla cobertura deste anúncio destacou o fato de que a tecnologia de voz ainda é nova para muitos, e a idéia de qualquer um, ou qualquer coisa, escutar as pessoas é enervante.
Estas questões, no entanto, são meras falhas. O maior desafio é que, embora tenhamos criado processos que permitem aos computadores melhorar a tradução, o reconhecimento da voz e a síntese da fala, a maioria dos computadores ainda não entende o significado da linguagem.
Nenhum sistema de IA é bom o suficiente para entender o discurso conversacional ainda. [Ele] depende tanto de ouvir o que você diz quanto de prever o que você vai dizer em seguida. O discurso estruturado ainda é muito mais fácil de entender do que uma conversa não-estruturada.
E a pesquisa confirma que a pessoa média está lutando para encontrar valor adotando esta tendência tecnológica emergente em sua vida diária.
As marcas devem se preparar para o amanhã, começando hoje
A lista de limitações atuais é longa. Apesar destes inconvenientes, os avanços no aprendizado de máquinas significam que os computadores estão ficando melhores no reconhecimento do que as pessoas estão dizendo. Ainda não chegamos lá, mas a ambição de Zuckerberg de uma IA que entenda o discurso conversacional pode não estar muito longe.
Em 2011, o mercado global de reconhecimento de voz foi avaliado em quase 47 bilhões. Seis anos depois, esse número mais do que dobrou para 113 bilhões. Junto com o novo investimento anunciado no Facebook, há uma pressa para acelerar a transição do reconhecimento de voz para o processamento de linguagem natural em escala. Uma vez que isso seja alcançado, o desejo de Zuckerberg de que os computadores tenham conversas mais sofisticadas se tornará possível.
As marcas podem começar hoje a se preparar para esta nova fronteira. Como meu exemplo anterior do Alexa demonstra, em breve mais e mais consumidores estarão se voltando para estes produtos para comparar opções e fazer compras. As marcas precisam antecipar esta mudança agora, integrando estes dispositivos em suas estratégias de comércio eletrônico e marketing. Da mesma forma que as compras on-line transformaram a experiência do varejo de tijolos e argamassas, a tecnologia de ativação de voz levará isto para o próximo nível.
A cada dia, a promessa de conversas significativas e soluções orientadas a resultados fornecidas por seres humanos que fazem interface com computadores está evoluindo. Vamos todos continuar a explorar e contribuir para estas tecnologias à medida que elas se tornam mais inteligentes e mais significativas... uma palavra de cada vez.
Conteúdos Relacionados
-
Postagem no blog
O presente (e o futuro) do planejamento de marketing: a IA por trás das decisões Por Daniel Aranha 6 minutos de leitura -
Postagem no blog
Debate estratégico no Rio2C: IA e a reinvenção da criatividade e do conteúdo Por Monks 3 minutos de leitura -
Postagem no blog
Monks, da S4 Capital, é a primeira agência do Brasil reconhecida pelo TikTok Marketing Partners Program Por Monks 3 minutos de leitura
Faça nosso coração digital bater mais rápido
Receba nosso boletim informativo com insights acionáveis sobre as últimas tendências, projetos e muito mais.
A Monks precisa das informações de contato que você nos fornece para entrar em contato com você sobre nossos produtos e serviços. Você pode cancelar a assinatura dessas comunicações a qualquer momento. Para obter informações sobre como cancelar a assinatura, bem como sobre nossas práticas de privacidade e nosso compromisso com a proteção de sua privacidade, consulte nossa Política de Privacidade.