A visão é o sentido que nos permite compreender e interpretar o mundo ao nosso redor. Com ela, conseguimos enviar uma quantidade absurda de dados ao nosso cérebro todos os dias, o que nos faz pensar de maneira ininterrupta sobre muitos aspectos.
Algo semelhante ocorre no universo digital. Com o intuito de fazer com que os computadores imitem a capacidade de percepção visual dos seres humanos, criou-se o campo de estudo conhecido como Visão Computacional (VC). Tendo a Ciência da Computação como base, a VC é interdisciplinar por natureza, pois envolve conhecimentos em matemática, estatística, engenharia, inteligência artificial (IA), mecatrônica, entre outros. Seu principal objetivo é criar tecnologias de hardware e softwarecapazes de interpretar imagens e vídeos, possibilitando uma série de aplicações inovadoras e até polêmicas, além de novos modelos de negócio.
A essência da VC está em sua capacidade de extrair informações relevantes de dados visuais, que podem ser imagens estáticas (fotos, desenhos, gráficos, pinturas etc.) ou vídeos. Inicialmente, os dados são convertidos em matrizes de duas ou mais dimensões, dependendo do tipo de aplicação. Assim, algoritmos de processamento de imagem são utilizados para a identificação de padrões e objetos. Nos dias atuais, é fácil identificar, isolar e classificar todos os objetos presentes em uma imagem, o que permite diversas aplicações.
O reconhecimento de objetos é uma delas. Essa tecnologia possibilita a identificação de rostos, gestos e sorrisos pelas câmeras de smartphones e é capaz de fazer com que veículos autônomos reconheçam sinais de trânsito, pedestres e outros veículos, auxiliando os algoritmos na tomada de decisão.
Na medicina, a VC atua como um assistente em diagnósticos por imagem, sendo amplamente utilizada na detecção de tumores em exames de tomografia e ressonância magnética.
No varejo, há aplicações que fazem a análise de imagens de câmeras de segurança, fornecendo insights sobre o comportamento do cliente, o que auxilia as empresas, por exemplo, a otimizar a disposição de produtos, com o objetivo de aumentar as vendas.
A agricultura de precisão também é um dos campos que mais crescem, considerando aplicações de VC. Com o uso de drones e câmeras especiais, é possível ajudar os agricultores na monitorização de safras, detecção de doenças vegetais e planejamento da irrigação.
Apesar dos inúmeros pontos positivos, há aqueles que torcem o nariz para tecnologias de VC, pois, de fato, há uma série de aplicações capazes de violar um dos direitos mais fundamentais: a privacidade. O governo chinês, por exemplo, possui o maior e mais eficiente sistema de vigilância do mundo, com mais de 170 milhões de câmeras inteligentes capazes de identificar os cidadãos considerando o reconhecimento facial e até o jeito de andar. Apesar de ser capaz de identificar criminosos e possíveis ações suspeitas, há aqueles que afirmam ser a real intenção do “Big Brother Chinês” controlar a população pelo medo.
De qualquer forma, é assustador pensar que as máquinas são capazes de enxergar o mundo real, além dos bits e bytes. Mais assustador ainda é saber que as empresas que detêm as tecnologias de VC estão nos observando. Talvez o futuro esteja indo rumo a uma distopia tecnocrata, análoga ao que foi descrito por George Orwell, em sua clássica obra “1984”.
Prof. Me. Jorge Luís Gregório
Professor e Coordenador do Curso de Análise e Desenvolvimento de Sistemas da Fatec Jales