Há muitos grafos sobre temas importantes de 2015 que gostaria de ter gerado: o dos refugiados, o da chacina de Osasco, o da cop 21, o da eleição argentina, enfim, são muitos acontecimentos. O consolo está no fato de que os dados sobre eles foram coletados. Mas a rede que NÃO analisei, por decisão pessoal, foi sobre o crime ambiental da Samarco/Vale/BHP. Por um motivo importante: quis fechar (metodologicamente) e abrir (teoricamente) um ciclo novo de trabalho com redes a partir de estudos ambientais, como é o caso do ecocídio em Mariana e por todo Rio Doce. Coletamos o caso da Samarco desde o dia 01 de novembro, antes do rompimento da barragem. Mas incluímos um elemento novo na nossa metodologia de análise estrutural de redes.
É o seguinte. A maior parte dos grafos na análise de redes sociais é voltado à visualização em torno da difusão das mensagens (retweets, compartilhamentos, likes do Insta etc). Considero relevante a cartografia em torno da disputa de popularidade das mensagens. Afinal, a viralidade é um fator fundamental para entendermos a agenda pública hoje. Mas sempre achei isso incompleto (sobretudo depois que o Labic popularizou a figura de Bots nas disputas eleitorais). Daí numa dessas viagens longas, rascunhei à mão uma proposta de análise de conversação em rede. Qual é a diferença entre difusão e conversação? Tecnicamente a difusão está mais no ato de compartilhar (em geral, ato realizado para irradiar uma ideia ou fato que se pretende publicizar). A conversação está no ato de responder (de comentar e discutir). Compartilhamos mais (muito mais) do que comentamos. Porque a conversa, sobretudo quando é uma discussão, requer repertório para argumentar e contra-argumentar, demanda lidar com revides e até violência e má-educação. Minha hipótese passou a ser que comentar é a raiz da ampliação de sentidos sobre ideias e opiniões. Naquela confusão entre Malafaia e Boechat (um dos grandes momentos de 2015), o jornalista publicou esse tweet (https://goo.gl/ctTAiY), gerando um assustador número de comentários (replies, na linguagem do Twitter). Comecei então a rascunhar ali a ideia de coletar replies e dispô-los no formato de rede (quem comenta quem). Na prática isso já era possível, mas de modo limitado. Por quê? Porque quando coletamos dados precisamos pedir à API do Twitter que nos entregue posts com determinado conjunto de termos. Exemplo. Se simplemente pedimos “boechat+malafaia”, o sistema retornará apenas os comentários contendo frases com essas duas palavras, o que faz com que toda a riqueza que vocês viram aí no link não apareça na coleção de dados recolhidos pelo pesquisador. Isso é o motivo de pesquisadores e analistas não trabalharem com a conversa, ela é intensamente rizomática, com muitos centros de atenção e muitas conversas paralelas. Pensei então em fazer scraping dos comentários (https://goo.gl/BnaOp4), recolhendo os IDs dos tweets e depois recoletá-los pela API do Twitter (isso permite o acesso aos 42 metadados de um tweet). Feito isso poderia mapear concretamente as conversas juntando com os tweets já coletados, dando um salto assim nas minhas pesquisas, cujo meu ciclo laboratorial (mais hard) se fecha em 2015. Devo a equipe do Labic, em particular ao Gustavo e ao Nelson, que minha ideia virasse um programa. 2016 então será só de (re)escritura. Isso tudo para dizer que a rede abaixo representa 37 mil conversas (replies) sobre o crime da Samarco, coletados apenas no mês de novembro no Twitter. Sem o programa seria menos de 10 mil.
Algumas hipóteses estruturais para entender redes de replies (conversações):
1. Clusterização densa é um fenômeno de dificil ocorrência em redes de conversação. Isso porque um cluster, em rede de conversação, é formado por perfis com pontos de vista conflitantes, diferente de redes de difusão, onde clusters são formados por pontos de vistas comuns. Os diferentes estão mais próximos quando comentam do que quando retuitam.
2. Redes de comentários tendem aglutinar mais conversas em torno de: (1) perfis noticiosos, que geralmente possuem seguidores com pontos de vistas heterogêneos, como é o caso de veículos de imprensa; (2) perfis que são alvos de ataque em função de questionamentos sobre atos considerados danoso à sociede. como foi o caso do perfil da Vale, uma das sócias da Samarco; ou aqueles perfis envolvidos em alguma controvérsia nas redes sociais (tretas, disputas, etc).
3. Quanto maior é a família de uma conversa, mais múltipla será uma discussão. O Twitter denomina de ancestral aquele reply que gera uma onda de comentários em torno dele. Um tweet pode assim gerar vários ancestrais, que funcionam como tópicos de discussão numa conversa (no tweet aqui – https://goo.gl/ctTAiY – você verá-los, pois são separados por um “mostrar mais”). Isso permite medirmos os tweets pela sua capacidade de gerar ancestralidades.
4. Quanto maior é a periferia, maior é a multiplicação de conversas, que gera multiplicação de sentidos expandindo e sobrecargas interativas em perfis. Toda rede de conversação tende a um paralelismo de discussão, por fragmentar-se em rede de múltiplas conversas, cuja localização preferencial está na periferia, que, em determinados casos, pode ser muito maior que o centro de gravidade da rede. No caso da rede #Samarco, a periferia (grafo 2) representa 1/3 do total das conversações.
5. Bots e Spammers não conversam. Seria uma perda de tempo para eles. Que maravilha!
6. Redes de conversações são capazes de revelar relações de poder em regime de tensão. como é o caso da entrada em cena da Vale – nó conversador no grafo – ao tentar se defender através de argumentos baseados na ideia que está a proteger os humanos, os bichos e o local da tragédia. Veja https://goo.gl/NUEhUl. Ou o tweet de Miriam Leitão (https://goo.gl/oFZ7TN), em que a jornalista coloca o dedo na ferida, gerando uma onda de comentários, de crítica à Vale e aos governos que ela financia.
2016 está chegando. Um feliz ano novo de muitos estudos, felizes estudos, com saúde e paz para vocês, amigos e amigas!