Uma das primeiras formas de comunicação direta entre homem e máquina foram as linguagens de programação. Assim, durante muitas décadas, os programadores foram os únicos intermediários entre os usuários e os computadores, os únicos capazes de “conversar” com as máquinas e, por consequência, extrair o poder computacional delas.
Isso começou a mudar com o crescimento das tecnologias low-code (pouco código) e no-code(nenhum código), que proporcionam meios para a concepção de sistemas usando ferramentas gráficas e linguagens declarativas, que são mais próximas à linguagem natural e mais simples do que as linguagens de programação. Essas tecnologias proporcionam ao usuário leigo um meio para que ele transforme suas ideias em aplicações reais. Elas ainda estão na alvorada, mas possuem um potencial absurdo de transformar diversas profissões.
Indo além, eis que no século XXI surge a inteligência artificial (IA) generativa, tecnologia capaz de gerar informações sintéticas a partir de dados reais. Um dos principais exemplos desse tipo de tecnologia é o revolucionário e polêmico ChatGPT, que consiste em um assistente virtual no formato de chatbot, que responde às perguntas digitadas pelo usuário de maneira natural. A ferramenta é tão poderosa que ela não se limita a responder perguntas, por mais complexas que sejam, mas também é capaz de criar histórias, roteiros, artigos, códigos de programação e outros conteúdos textuais, dos mais simples ao mais complexos.
Um outro exemplo de IA generativa é o Midjourney, que gera imagens a partir de descrições fornecidas pelo usuário. Assim, textos como “um astronauta cavalgando um dinossauro na lua”podem gerar imagens muito próximas daquilo que se espera. Designers e artistas estão preocupados com o poder “criativo” dessa ferramenta.
Sim, são ferramentas absurdamente fantásticas, entretanto, por mais milagrosas que possam parecer, não são seres humanos. Logo, não há interpretação dos prompts (comandos/solicitações) dos usuários, mas sim a execução de relações lógico-matemáticas entre o pedido do usuário e os dados existentes. Dessa forma, o resultado da criação pode não ser exatamente aquilo que se espera, exigindo dos usuários técnicas para elaborar prompts claros, não para o ser humano, mas para a máquina.
Por exemplo, a exatidão das respostas fornecidas pelo ChatGPT irá depender do quão semântico, contextualizado e detalhado é o prompt fornecido pelo usuário. É de conhecimento de seus entusiastas que essa ferramenta evolui a cada nova interação com o usuário, principalmente se o contexto for mantido. Percebi isso ao manter “diálogos” com eles sobre diversos temas específicos.
De maneira semelhante, a similaridade entre o resultado e o prompt das imagens geradas pelo Midjourney dependem de como o usuário expressa suas ideias. Por exemplo, o prompt “dois cachorros jogando videogame em um bar” gerou uma imagem interessante, mas longe do que eu esperava. Quando eu detalhei para “dois cachorros grandes, rindo, em frente a uma TV, jogando videogame em um bar cheio de pessoas” o resultado foi bem próximo do que eu imaginei.
Assim surge a engenharia de prompt, que pode ser uma das novíssimas profissões nascidas na era da IA. De fato, comunicar-se com essas “entidades inteligentes” a fim de que elas gerem os resultados esperados não é fácil, visto que não conhecemos os detalhes do seu funcionamento. Assim, é necessário experimentar, explorando as diversas possibilidades sintáticas e semânticas da linguagem natural, a fim de criar estruturas textuais para prompts mais exatos e mais assertivos.
No século XXI, conversar com máquinas pode ser uma das principais habilidades profissionais exigidas pelo mercado. Estamos testemunhando o surgimento de uma nova forma de comunicação, e, infelizmente, de um novo tipo de analfabetismo.
Prof. Me. Jorge Luís Gregório
Professor e Coordenador do Curso de Análise e Desenvolvimento de Sistemas da Fatec Jales
www.jlgregorio.com.br