Neste ano, durante o TheDevConf – São Paulo, eu palestrei sobre o tema “Autenticação via Reconhecimento Facial e de Fala”, explorando a parte técnica do uso de serviços de Inteligência Artificial, disponibilizados pela Microsoft, para desenvolver sistemas que permitam autenticar uma pessoa por meio de sua foto e voz (http://microsoft.com/cognitive).

Na ocasião, buscando elucidar o assunto, eu apresentei um chatbot desenvolvido por mim mesmo, que permite o cadastro de pessoas com o registro de foto e voz, e posterior autenticação, utilizando somente foto e áudio. Durante a demonstração destaquei que a utilização de autenticação facial e de fala podem ser burladas por pessoas mal-intencionadas utilizando fotos ou gravação de falas. Neste caso, é possível incorporar outras técnicas para garantir mais segurança, como análise de vídeo, em que podem ser extraídos a face e a voz da pessoa.

Como atuo no Microsoft Innovation Center Campinas (MIC), dentro do Eldorado, busquei destacar, na minha palestra, iniciativas e soluções do Instituto na área de Inteligência Artificial e, também, as ações do MIC voltadas para divulgação, engajamento e capacitação da comunidade nos temas relacionados à Inteligência Artificial (IA).

Autenticação via Reconhecimento Facial

No ato do cadastro, o usuário fornece fotos de rosto para serem utilizadas posteriormente na autenticação. Devem ser cadastradas uma ou mais fotos. Nesse momento, o serviço de IA da Microsoft extrai as características da pessoa na foto, as quais, posteriormente, permitem autenticá-lo.

Depois da autenticação, o usuário fornece uma nova foto, que é comparada com todas as fotos, de todos os usuários. Assim, o serviço de IA de reconhecimento facial identifica quem mais se parece com a foto enviada.

Case Uber:

https://customers.microsoft.com/pt-br/story/uber-transportation-microsoft-cognitive-services-portuguese-usa

Autenticação via Reconhecimento de Fala (Locutor)

No ato do cadastro, o usuário fornece falas diversas para serem utilizadas posteriormente na autenticação. Devem ser cadastrados pelo menos 5 segundos de fala. Nesse momento, o serviço de IA da Microsoft extrai características como o timbre de voz, que permite autenticá-lo posteriormente.

Depois, na autenticação, o usuário fornece uma nova fala, que é comparada com todas as falas, de todos os usuários. Desse modo, o serviço de IA de reconhecimento de fala identifica quem tem a voz mais parecida com a fala enviada.

Experimente o serviço:

https://azure.microsoft.com/pt-br/services/cognitive-services/speaker-recognition/

Questões de Segurança

Ambos os serviços trazem informações de grau de confiabilidade. Eles podem ser utilizados separadamente ou em conjunto. Porém, esses serviços podem ser burlados por pessoas mal-intencionadas utilizando fotos ou gravação de falas. Uma forma de minimizar isso, por exemplo, é por meio da solicitação de um vídeo em que a pessoa deve falar algo específico. O sistema pode, então, analisar tanto o rosto de quem fala, como, também, a voz, e ainda verificar o que foi dito para comparar com o que foi solicitado.

Política de Privacidade

Todas as fotos e sons armazenados no servido de IA da Microsoft são protegidos e não podem ser recuperados.

Competências do Eldorado

O Instituto de Pesquisas Eldorado, por meio do Microsoft Innovation Center Campinas, desenvolve soluções que utilizam os diversos serviços de IA da Microsoft como reconhecimento facial e de locutor. Esses sistemas podem ser incorporados em várias soluções diferentes, como chatbots e sistemas de monitoramento.