O Google desenvolveu uma rede neural para extrair automaticamente nomes de ruas a partir de fotografias coletadas pelo Street View. A tecnologia já é capaz de transcrever nomes de vias francesas com precisão de 84,2%. No Brasil, o Google também está preparado para lidar com a despadronização nas nomenclaturas e nos formatos das placas.
Analisando as quatro imagens acima, um humano pode saber que existe uma avenida, e que ela se chama Presidente Castelo Branco. No entanto, a rede neural do Google teve que aprender a extrair o texto correto (há uma propaganda e placa de outra rua na mesma foto) e normalizar os nomes, transformando “AV.” em “Avenida” e “PRES.” em “Presidente”. Há situações mais complicadas, como quando a resolução da foto não é boa o suficiente. Mesmo um humano que enxerga teria dificuldades para nomear esta avenida francesa: Com a rede neural e as imagens do Street View, o Google pode criar mapas do zero, inclusive com nomes de ruas que até então eram desconhecidas pelo Maps. Além disso, como você sabe, o Street View consegue identificar números de casas e prédios, o que também contribui para aumentar a precisão dos mapas: mais de 90% dos endereços no Brasil foram melhorados pelo Google por meio da tecnologia. O interessante é que a rede neural também aprendeu a extrair informações de fachadas de estabelecimentos (e você certamente foi um bom professor marcando as fotos certas no reCaptcha). A partir das imagens do Street View, o Google sabe que ali existe um comércio de pneus chamado Zelina Pneus, não Bridgestone ou Firestone — mesmo sem saber a localização em que a imagem foi capturada.
Os dados já estão sendo extraídos e publicados com base nas 80 bilhões de imagens (!) do Street View, que são processadas nos Tensor Processing Unit (TPU), circuitos construídos pelo Google especificamente para tarefas de aprendizagem de máquina.