A teoria dos jogos: jogando com algoritmos
Imagine dois robôs trancados em uma sala branca, cada um com um contador luminoso no peito marcando o tempo até o desligamento final. Eles sabem que só um sobreviverá. Sabem também que há uma chance de ambos continuarem funcionando se cooperarem, mas o código-base de cada um diz que trair é sempre a melhor resposta para evitar o risco de ser apagado primeiro. Um deles calcula dez mil cenários por segundo. O outro roda simulações alternativas para tentar achar uma brecha. No fim das contas, mesmo sem emoções, sem medo e sem ego, ambos tomam a mesma decisão.
Eles traem.
Não porque são malignos, mas porque são racionais demais. E talvez essa seja a parte mais perturbadora: máquinas não precisam odiar para nos derrotar, basta que sigam a lógica que nós mesmos programamos.
É aqui que a teoria dos jogos entra no mundo moderno com uma força que John Nash nunca imaginou. Ele estudava decisões entre seres humanos com hesitações, emoções e imperfeições. Mas o mundo digital criou algo fora da previsão de qualquer matemático da década de 1950. Criou jogadores que não são humanos. O algoritmo virou agente. Ele observa, calcula e reage. Ele ajusta estratégia em frações de segundo. Ele identifica padrões que nós nem percebemos. Ele entende nossos impulsos antes de nós mesmos. Ele escolhe o próximo lance como se estivesse jogando mil partidas simultâneas de xadrez enquanto nós ainda estamos olhando para o tabuleiro tentando entender a primeira peça.
O algoritmo não dorme. Ele não descansa. Ele não erra por distração. Ele não tem crise existencial. Ele só persegue o payoff que alguém programou nele. Retenção, clique, tempo de tela, engajamento, conversão, expansão de base. Nada mais. E isso muda tudo porque o equilíbrio de Nash deixou de ser uma teoria sobre comportamento humano e virou código operacional. Nash imaginou cenários estratégicos; engenheiros transformaram esses cenários em máquinas que rodam vinte e quatro horas por dia.
O algoritmo não compete conosco. Ele nos substitui como jogadores. E quando não somos mais jogadores plenos, viramos apenas peças do tabuleiro.
Nós já entramos nesse jogo e, para ser sincero, perdemos várias rodadas sem perceber. As plataformas controlam as regras, o ambiente, o ritmo, o que é visível, o que é oculto e o tempo que cada um de nós permanece dentro do jogo. O algoritmo entra em equilíbrio com milhões de usuários ao mesmo tempo e ajusta suas estratégias continuamente para maximizar o objetivo central. Nós somos previsíveis. Ele é adaptativo. Nós somos lentos. Ele é instantâneo. Nós temos limites. Ele não tem nenhum relevante.
O velho dilema do prisioneiro sempre foi sobre dois seres humanos que precisavam escolher entre cooperar ou trair. Mas hoje esse dilema acontece entre o usuário e o algoritmo. Entre o criador e o sistema de recomendação. Entre o debate público e o filtro automático. A estratégia dominante de curto prazo sempre favorece o algoritmo. Ele delata. Ele maximiza. Ele desvia primeiro. Cooperar com o usuário não faz sentido para ele, porque seu payoff não é social, é comercial.
E enquanto isso, todos nós continuamos presos na pior decisão coletiva possível.
Criadores querem conteúdo melhor. Usuários querem tempo melhor gasto. Sociedade quer ambientes mais saudáveis. Mas o jogo foi desenhado para empurrar todos para o lado errado.
E quando todo mundo opera preso à estratégia dominante do algoritmo, o resultado é o que estamos vivendo: conteúdo mais raso, estímulo mais intenso, polarização mais explosiva, ciclos emocionais mais curtos, tempo de atenção mais frágil. Parece que as pessoas estão escolhendo isso. Não estão. É o jogo que está determinando.
A lógica do sistema vence a vontade individual todas as vezes.
Por isso a desalgoritmização não é um gesto romântico. É estratégia pura. É mudar incentivos. É forçar transparência. É devolver poder ao jogador humano. É reduzir assimetria de informação. É abrir espaço para cooperação possível. É retirar do algoritmo a vantagem absoluta de ser o único jogador racional perfeito dentro de um tabuleiro que ele mesmo redesenha o tempo inteiro.
O PL 2338/2023 entra nisso como a primeira tentativa de iluminar o tabuleiro. Não para controlar o algoritmo, porque isso é irreal e ingênuo, mas para corrigir os incentivos que movem suas decisões. Lei não regula inteligência artificial. Lei regula o ambiente em que essa inteligência opera. Lei ajusta os payoffs. Lei corrige o jogo.
E é aí que a reciprocidade da inovação se torna a peça que faltava. Abordei o tema em artigo no Jota (https://www.jota.info/opiniao-e-analise/artigos/o-principio-da-reciprocidade-da-inovacao-no-desenvolvimento-de-ia)
Ela equilibra forças. Ela impõe condições semelhantes às que as tecnologias impõem a nós. Ela tira vantagem unilateral e restabelece chance de cooperação estável. É teoria dos jogos aplicada à regulação tecnológica em sua forma mais concreta.
O jogo está em andamento. O algoritmo já entendeu nossas estratégias antes de nós. Ele define o ritmo, o fluxo, o humor, a lógica e o formato do que consumimos. Mas ainda há como reequilibrar. Não com nostalgia, não com moralismo, mas com estratégia. Nash não previu robôs tomando decisões estratégicas. Ele também não previu que nós jogaríamos contra eles. Mas a lição dele continua valendo. O jogo só muda quando as regras mudam. E as regras só mudam quando alguém tem coragem de mexer nos incentivos.
Se não mudarmos agora, a próxima versão do jogo nem vai precisar de nós.
