sexta-feira, outubro 28, 2011

Plotagem mostra padrões de trocas de mensagens na Lista de Discussão da COMPÓS

O pesquisador Marco Toledo Bastos fez um plot das mensagens trocadas na Lista Compós, que agrega pesquisadores em Comunicação, em torno da Associação Nacional dos Programas de Pós-Graduação em Comunicação.
O resultado é visualmente impressionante.
Na lista da Compós, o pesquisador descreve seu projeto e apresenta algumas considerações:
"Tenho feito alguns experimentos com PCA e correlações em listas de discussão e mensagens do Twitter. Achei que seria divertido plotar a rede da compos@yahoogroups.com porque a lista é um importante veículo para a área. Quem quiser se divertir com o plot pode clicar no endereço abaixo.

http://www.eca.usp.br/netclustering/compos.html

Esse é um plot de todas as mensagens que receberam reply na lista. A primeira mensagem foi de Milton José Pinto no dia 06.06.2000 e o primeiro reply foi de Albino Rubim no dia seguinte (em resposta a Jose Luiz Aidar Prado).

O tamanho do nó é proporcional ao volume de mensagens recebidas como resposta. A espessura dos edges pe proporcional às mensagens enviadas. O layout é ForceAtlas II e as cores deveriam indicar comunidades internas. Primeiras observações a partir do plot:

1. O Juremir é o rei dos replies. Não há mensagem enviada pelo Juremir que não tenha gerado uma mensagem-reply.

2. Redes sociais exibem um alto coeficiente de clusterização. A lista/comunidade da Compós não é exceção.

3. A lista está segmentada em uma minoria que alimenta o grupo com informações e uma maioria que alimenta a lista com perguntas.

Encontrei alguns problemas na análise dos dados porque o Yahoo! não disponibiliza as mensagens no formato MIME. Além dessa limitação, o plot também não mostra:

1. Uma quantidade desanimadora de mensagens-reply que não configuram perguntas, muito embora tenham efeito cascata. Tratam-se das mensagens institucionais de congratulação. Ainda não consegui filtrar essa interação que não configura conversa.

2. Cerca de 700 mensagens-reply cujos usuários não foram reconhecidos (NA). O dataset conta com cerca de 12000 mensagens das quais 5000 são mensagens-reply.

3. Alguns usuários postaram mensagens na lista com emails diferentes. Meus scripts não são espertos o suficiente para fazer uma match perfeito de cada user/account.

4. Alguns usuários mudaram o display name ao longo dos anos. Exemplo: Denilson Lopes / Denilson Lopes Silva. O script mapeia cada screenname como um usuário independente.

A análise da rede foi feita com R e o plot com Gephi. Quem quiser brincar com os dados pode baixar o dataset aqui (http://www.eca.usp.br/netclustering/mtblYgr_compos.xlsx)."

marcos palacios

Marcadores: , , , ,

1 Comments:

Blogger Gonzalo said...

Interesante trabalho de pesquisa. Já baixei e instalei o programa Gephi em meu computador, excelente software ( e o melhor ainda que é de livre donwload). Valeu pela dica Marcos.
abz, Gonzalo Prudkin

5:23 PM  

Postar um comentário

Links to this post:

Criar um link

<< Home