Datamining art - Tecnoetica

Questa immagine che sembra un quadro astratto (concettuale, meglio) è in realtà la visualizzazione delle pagine di wikipedia editate dallo stesso bot. A colore diverso corrisponde una pagina diversa.
L’immagine è frutto delle elaborazioni di Fernanda B. Viégas, Martin Wattenberg, e Kate Hollenbach, il famoso gruppo di ricerca dell’IBM di software per la visualizzazione dei dati, autori del progetto Many Eyes (altro nome noto per chi bazzica tecnoetica).
L’immagine illustra lo special di Wired di luglio 2008 “The end of theory“, secondo cui la ricerca contemporanea, grazie a tecniche di datamining sofisticate si può permettere di non curarsi dell’uso di teorie scientifiche (avrò modo di tornarci con un post ad hoc).
La domanda metodologica è: perché un esperto di analisi quantitativa si interessa alle forme di rappresentazione di dati testuali?
Lo stesso Wattenberg risponde:

Language is one of the best data-compression mechanisms we have. The information contained in literature, or even email, encodes our identity as human beings. The entire literary canon may be smaller than what comes out of particle accelerators or models of the human brain, but the meaning coded into words can’t be measured in bytes. It’s deeply compressed. Twelve words from Voltaire can hold a lifetime of experience.

[infopusher: Wired webzine]