O que é processamento de linguagem natural? [NLP]O que é deepfake e por que você deveria se preocupar
O trabalho da DeepMind — que é uma subsidiária da Alphabet, assim como o Google — envolveu criar modelos de jogadores humanoides com 56 pontos de articulação e restrições de movimento.
A escolinha virtual
O primeiro passo foi ensiná-los o básico do movimento humano: ficar de pé, andar e correr. Pode parecer simples para a gente, mas para um monte de código que era sedentário até então, isso tudo é novidade. Usando dados de motion capture, os humanoides começaram a limitar seus movimentos que, até então, eram aleatórios e improdutivos. O treinamento envolveu também uma população enorme destas inteligências, que eram recompensadas ao fazer os movimentos certos. A segunda fase foi imitar jogadas individuais, como conduzir a bola e chutar. Isso foi feito também por aprendizagem e recompensa. Os melhores movimentos eram consolidados, e as melhores inteligências passavam a ensinar as demais. A terceira e última fase envolvia jogadas em grupo, como passar a bola e bloquear o adversário. O ponto era antever consequências das suas próprias jogadas. Mais uma vez, foi usada a aprendizagem com recompensa, mas, dessa vez, nas partidas em si. Cada vez que um time fazia um gol, todos os jogadores daquela equipe eram recompensados.
Alguma coisa parecida com futebol
O futebol praticado pelas inteligências artificiais é bem simplificado. É um jogo entre duplas, sem goleiro, sem faltas, com bloqueios invisíveis para a bola não sair pelas linhas laterais e de fundo. E claro, nada de impedimento ou VAR. O jogo também é feio. As inteligências mal param em pé e estão toda hora se trombando enquanto disputam a bola. Mesmo assim, os humanoides conseguiram aprender algumas coisas interessantes. No vídeo divulgado pela DeepMind com melhores momentos das partidas, um jogador dá um drible seco com a parte de fora do pé e se livra dos dois adversários. Em outro lance, a inteligência artificial percebe que está prestes a perder a bola e deixa de tentar dominá-la, se concentrando em bloquear o adversário enquanto seu companheiro de time chega. Também tem movimentações sem bola para ficar com sobras de divididas, lançamentos altos para encobrir a defesa e passes em profundidade para armar contra-ataques. O objetivo, porém, não é criar um Messi ou um Cristiano Ronaldo artificial para o próximo jogo da EA ou da Konami.
Craques no mundo real
Segundo Nicolas Heess, pesquisador científico da DeepMind e um dos co-autores do estudo, a meta é aproveitar as habilidades de baixa complexidade que os agentes aprenderam e usá-las em robôs físicos, para que eles se mexam de maneiras mais seguras e naturais no mundo real. Além disso, todo o trabalho de treinamento não-estruturado de aprendizagem por reforçamento poderia danificar as máquinas ou desperdiçar energia. Então, é melhor levar as inteligências delas para a escolinha de futebol antes de instalar em um monte de metal e plástico. Com informações: TheNextWeb, Wired.