Tendências - 31 de outubro, 2019

O próximo passo da inteligência artificial? Entender vídeos

  •  
Algoritmo permite que IA compreenda vídeos

Segundo dados da própria plataforma, mais de 500 horas de vídeo são postadas no YouTube por minuto. Fazendo os cálculos, esse número equivale a mais de 82 anos (sim, anos) de novos vídeos postados todos os dias. E esses dados são apenas de uma plataforma – se somar os dados de todas as principais plataformas onde são postados vídeos diariamente, os números ficam quase incompreensíveis em comparação com a longevidade humana média.

A partir desses dados, fica fácil concluir que não existem humanos suficientes para revisar todo esse conteúdo. Além das questões básicas de segurança e controle de spam, a compreensão do que se passa em um determinado vídeo pode abrir novas portas para as recomendações de vídeos com conteúdo semelhante para a propaganda, que poderá se adaptar ao que o espectador está assistindo, e para a acessibilidade, na criação de descrições das ações mostradas no vídeo.

Por isso, no campo da inteligência artificial, um dos maiores focos de estudo é na criação um algoritmo que seja capaz de reconhecer ações em vídeo e transformá-las em descrições, além de fazer com que o poder de processamento necessário para rodar esse algoritmo seja o menor possível.

Apesar dos grandes avanços da IA nos últimos anos, essa ainda é uma tarefa desafiadora, devido à enorme quantidade de variação e movimento existente em vídeos. Estima-se que para um algoritmo de aprendizagem profunda são necessárias 50 vezes mais dados e 8 vezes mais poder de processamento para interpretar um vídeo, em comparação ao que é necessário para interpretar uma imagem. Isso acontece porque as ações em vídeo estão menos abertas a interpretação do que em imagens estáticas: em uma foto de uma pessoa segurando a maçaneta de uma porta, não é possível saber se ela está abrindo ou fechando a porta, mas em vídeo, é possível saber, baseado na ação que ocorre imediatamente após o contato com a porta.

Um grupo de cientistas do Massachusetts Institute of Technology (MIT) e da gigante da tecnologia IBM desenvolveram um algoritmo que é capaz de processar e reconhecer ações realizadas em vídeos com uma surpreendente quantidade de precisão. O algoritmo usado foi adaptado de outro que processava imagens estáticas com um conceito de passagem de tempo, e foi testado em uma base de dados em vídeo chamada de “Something Something”. Essa base de dados foi criada com a ajuda de milhões de pessoas que se filmaram fazendo tarefas de descrição simples, como “abrindo um pote de vidro” ou “esticando um elástico”.

Fonte:
https://www.wired.com/story/technique-easier-ai-understand-videos/

Algoritmo permite que IA compreenda vídeos

Twitter
 

Enviar por e-mail