Não é novidade que nossa vida deixou de ser particular há um tempo. Propagandas personalizadas enquanto navegamos na rede, sugestões de onde passar o sábado a noite ou as férias de verão são apenas alguns exemplos sutis de como nosso cotidiano é constantemente monitorado, uma versão orwelliana de não-ficção. Em 2013, Edward Snowden apenas escancarou uma verdade indigesta, que insistíamos em esquivar: podemos ter nossa vida totalmente mapeada apenas com nosso uso corriqueiro da Internet. Foi nesse mesmo ano, no entanto, que a cidade americana de Boston sofreu um dos maiores atentados terroristas de sua história, com a explosão de duas bombas durante a tradicional maratona. Essa sequência de acontecimentos revela uma realidade que apequena o Grande Irmão que nos observa. Geramos toneladas virtuais de bytes de informação a cada milissegundo em todo o planeta, mas não chegamos nem perto de processar todos esses dados e extrair alguma informação relevante de todos eles.
Essa avalanche de dados que geramos todo dia, em nossos mais de 5 bilhões de dispositivos móveis, é conhecida como Big Data e é o mais novo desafio na era contemporânea da computação. A grande dificuldade no processamento do Big Data reflete uma das características da sociedade informatizada pós-moderna que resume-se na rápida obsolescência e perda de relevância de tudo que geramos. Os dados digitais são o exemplo mais ilustrativo desse processo. Do que adianta a mim como empresa saber se meus clientes pretendiam comprar meus produtos em 2011? Quem gostaria de receber sugestões de onde comer no almoço as cinco horas da tarde? Do que importa a NSA (agência de segurança estadunidense) identificar o plano do atentado de Boston nas redes dois meses após o incidente? No processamento do Big Data o importante é o agora, análise imediata de informação. Coletar e armazenar esses dados é etapa mais simples do processo. Entender o que eles significam em conjunto, em grande escala é um obstáculo que nem os gênios da ficção científica puderam prever.
Para entendermos na prática a dificuldade em realizar a interpretação do Big Data, podemos usar uma ferramenta gratuita do Google que registra as tendências de busca em sua plataforma ao longo dos anos, o Google Trends. Comparando as tendências para os termos “Lula”, “Geraldo Alckmin” e “Tiririca” encontramos picos de nos anos de 2006, 2008, 2010, 2014, por exemplo. Nos últimos anos, por outro lado, esses termos aparecem em alta por diversos momentos aleatórios. A análise desses dados é trivial para um humano brasileiro e politizado. Os pontos principais de citações e buscas na internet relacionados aos nomes dessas personalidades deve-se ao fato de que esses anos são datas eleitorais e esses indivíduos, políticos. Além disso, o turbilhão político de instabilidade que o país vive atualmente é refletido no padrão de buscas do Trends, observando os dados dos últimos anos. Parece simples, mas ensinar um software a realizar essa análise sem intermédio humano, cruzar todas as informações relevantes (e descartar as relações inúteis) transcende o limite da simplicidade, é extremamente complexo de ser realizado, especialmente em tempo real. Finalmente, é necessária uma análise das conclusões obtidas. Mais buscas recentes de nomes de políticos significa necessariamente que o brasileiro tem se tornado mais engajado politicamente? Dado o histórico dos anos eleitorais, o brasileiro só se interessa por política em períodos de eleição? Nossos algoritmos antropólogos ainda estão distantes de chegarem a esse socrático grau de interpretação.
O que a CIA pôde nos mostrar em 2013 (e continua demonstrando, se olharmos atentamente) é que, mesmo com acesso aos maiores bancos de dados do planeta, a maior parte dessa informação não passa de pulsos elétricos em transistores dentro de um computador. Assim como um livro para um analfabeto, as informações estão lá, esperando para serem lidas. Como um jogador de truco que consegue ver todas as cartas do oponente e mesmo assim perde várias partidas, a informação bruta pouco interessa sem que seja conectada e aplicada de forma adequada ao contexto a que pertence. O Big Data apresenta um horizonte praticamente infinito de novas descobertas quanto ao comportamento do gênero humano, podendo mudar profundamente as sociedades modernas. Imagine viver em um mundo cujas suas experiências cotidianas são adequadas aos seus gostos pessoais, em tempo real? A matéria prima existe, flutua sobre nossas cabeças, basta uma fábrica bem equipada para transformá-la em um produto. Ou nos transformar nesse produto.
---- Publicado originalmente pelo autor em <http://penseegratis.org/>