domingo, janeiro 20, 2008

Explorando proximidades semânticas e imagéticas entre palavras: um dicionário visual

Três pesquisadores do MIT, Antonio Torralba, Rob Ferguns e William Freeman, embarcaram em um experimento dos mais interessantes e visualmente instigantes.Trata-se da construção de um Dicionário Visual em forma de mosaico, correlacionando imagens a 53.463 substantivos concretos da língua inglesa.
As imagens foram obtidas usando-se o Google e outros sites de busca. Cada imagem utilizada foi correlacionada a pelo menos um substantivo concreto.
Cada elemento no mosaico é uma palavra.
Ao se clicar sobre um ponto do mosaico, revela-se uma caixa associada à palavra, contendo uma imagem maior produzida pela média de 140 outras. A média revela a característica visual dominante em cada palavra. Algumas vezes a dominante é uma imagem reconhecível, outras vezes apenas um conjunto de cores. As demais imagens mostradas na caixa são as primeiras 16 das 140 que, de alguma forma, aproximaram-se da palavra que está sendo visualizada.
A proximidade imagética cria agrupamentos de cores semelhantes no mosaico.
A lista de palavras foi obtida no Wordnet, uma base de dados compilada por lexicógrafos, que registra as relações semânticas entre as palavras. Dai resultou uma hierarquia semântica em forma de árvore (tree-structured), que foi utilizada para organizar o mosaico. Assim, o resultado final explora tanto a relação visual, quanto a proximidade semântica entre as palavras.
Clicando-se sobre qualquer parte do mosaico, obtem-se uma palavra e as imagens "médias" correspondentes a ela. Ao seu redor estão outras que lhe são semâtica e visualmente próximas. Conjuntos azuis, por exemplo, podem guardar relação com mar, céu, coisas assim; vermelhos, com sangue, organismos vivos; verdes com a natureza, plantas... Daí para combinações de cores e tons...
Parece muito complicado, mas ao utilizar-se, a coisa se mostra intuitiva.
Só é pena que as 16 imagens produzidas para cada palavra não possam ser ampliadas.
Uma explicação técnica de como tudo isso foi produzido também está disponível em pdf.Para se chegar ao mosaico, cerca de 80 milhões de imagens foram previamente indexadas e associadas a palavras, para que fosse montada a base de dados a partir da qual o mosaico foi construído. É uma festa.
Divirtam-se.

Alberto Marques
marcos palacios

Marcadores: , , , ,

0 Comments:

Postar um comentário

Links to this post:

Criar um link

<< Home