formats

Quei follower sono veri o sono falsi? Truthy lo sa

Gli italiani in questi ultimi mesi, stanno facendo una sbornia di Twitter. Infatti Twitter è senza dubbio la piattaforma social media che ha attirato maggiormente l’interesse dell’opinione pubblica italiana non necessariamente legata alle culture digitali. VIP, attori, giornalisti, cantanti, calciatori: ormai è piuttosto trendy avere (ed usare) un account Twitter, grazie anche alla voglia che hanno gli italiani di diventare follower del proprio VIP preferito. Un ruolo a parte hanno i politici: anche loro sono entrati nel meccanismo e abbiamo assistito in questi mesi ad una crescita esponenziale dei parlamentari twitteri. Quello che desta in alcuni casi qualche sospetto è che i parlamentari italiani hanno un successo di follower piuttosto altalenante. In pratica mentre è chiaro che i politici più mediatizzati hanno un tasso di crescita dei follower piuttosto costante, alcuni meno presenti sulla ribalta alternano periodi in cui i follower crescono lentamente con periodi di crescita repentina. Il buonsenso

(continua)…

formats

Qual è il vostro circolo della fiducia su Google Plus?

I social networks non sono tutti uguali dal punto di vista strutturale e funzionale. Una delle principali distinzioni è fra social network simmetrici e asimmetrici. I social network simmetrici sono quelli che in cui è necessaria la reciprocità di relazioni. Ovvero A segue B se e solo se B segue A. Esempio classico: MySpace e Facebook. I social network asimmetrici sono quelli in cui la reciprocità di relazione non è necessaria. In pratica A segue B, ma B può anche non seguire A. Ovvero: Twitter e Google Plus In questo secondo caso è interessante vedere chi segue chi e magari visualizzare la rete che viene a crearsi. I creativi di D3 hanno sviluppato un progetto che si chiama Circle of Trust, che consente di visualizzare l’appartenenza alle diverse cerchie.

formats

Moneyball: come le statistiche hanno salvato una squadra di baseball

Quanti di voi conoscono il termine sabermetrics? Io l’ho scoperto qualche giorno fa leggendo le mie fonti blog su datamining e dintorni. La sabermetrics sono le statistiche sul baseball messe a punto dalla Society for American Baseball Research (SABR) da cui il nome. La società è attiva dalla metà degli ‘anni 70 e lo scopo è quello di elaborare delle misure che aiutino a valutare il valore dei giocatori e il loro contributo alle vittorie della squadra. Il termine è piuttosto diffuso negli Stati Uniti (le sabermetriche sono stampigliate sul retro delle figurine del baseball) e fra chi si occupa di fantasy sport (la versione USA del Fantacalcio applicati a varie attività sportive) oppure chi ha seguito la serie TV Numbers. Il termine fra qualche mese sarà piuttosto famoso, o comunque sarà più celebre l’idea che per valutare l’efficienza di una squadra, è necessario avere dati oggettivi o comunque non opinabili

(continua)…

formats

Cinemetrics: studiare i film attraverso la loro l’impronta digitale

Un modo interessante per analizzare le informazioni è attraverso strategie visuali, così come indica la visual analytics. Spesso infatti la possibilità di vedere diversamente è anche un modo per studiare un fenomeno. Non suoni strano: esistono interi settori della medicina diagnostica che esistono grazie alla capacità delle macchine di vedere all’interno del corpo umano. Un esempio? La TAC. Le cose sono ancora più affascinanti quando ad essere analizzate sono i prodotti culturali, come i film. E’ questo lo scopo di Cinemetrics.

formats

Qual è l’impatto dei social media sulla ricerca sociale?

Qualche giorno fa, Radar Blog di O’Reilly pubblica una interessante intervista a Drew Conway sul quale è stato l’impatto dei social media, dell’open source e del datamining sulle scienze sociali. Per capire chi è Conway e qual è il suo lavoro, metto qui le slide di uno speech sull’uso di R per la social network analysis in ambiente social media da lui tenuto a maggio 2010. Ovviamente, Conway ha un suo blog molto interessante (Zero Intelligence Agents) che mescola scienza politica, programmazione con il software statistico (open source) R, social media ed altro ancora. Qui ho messo un estratto delle sue risposte, ma credo che valga la pena di leggere l’intervista nel suo complesso

formats

La curva di Rogers e i social network

Uno dei modelli più utilizzati per spiegare la diffusione delle tecnologie è la cosiddetta curva a campana o curva di Rogers, uno strumento che parte dal presupposto che una innovazione – tecnologica, ma non solo – si propaga per contagio fra gli utilizzatori e gli utenti potenziali, secondo un modo standard, definito dalla diversa propensione al cambiamento degli utenti e dalla variabile tempo Per il motivo di cui sopra, gli utenti utilizzatori di tecnologia si distinguono in innovatori, primi utilizzatori (early adopters), maggioranza iniziale, maggioranza tardiva e ritardatari. Ho usato questo modello qualche tempo fa per provare a spiegare gli elementi “strutturali” del successo di Facebook. Vincenzo Cosenza, ha svolto una ricerca per vedere chi – nell’attuale panorama dei social network – ha raggiunto la maggioranza tardiva, ovvero il numero di utenti che preannuncia la saturazione. Per fare questo ha ipotizzato un numero di utenti potenziali pari a un miliardo

(continua)…

formats

Cascade: il 3D per visualizzare la diffusione delle notizie su Twitter

Twitter è senza dubbio uno strumento per la diffusione delle news: lo dicono varie ricerche, lo dico anch’io nel mio studio fatto in collaborazione con Hassen (Benhotman) e Alessandro (Panconesi). Quello che è interessante è capire in che modo si diffondono le news: quale il contributo dei retweet? [risp.: dipende] Serve davvero avere milioni di follower? [risp.: no] Project Cascade è un progetto del New York Times che ha lo scopo di visualizzare in forma tridimensionale la circolazione delle notizie del quotidiano su Twitter. Per rendere conto delle dinamiche delle news, il progetto ha sviluppato dei video che rappresentano tridimensionalmente come si muovono i link delle news del NYT.

formats

Oscar e botteghino: caratteristiche dei film

Per chiunque abbia un benchè minimo interesse per il mondo del cinema, sa che esiste una controversia inerente al rapporto critica cinematografica e popolarità. Ovvero: perché i film più maltrattati dai critici sono i film più amati dal pubblico, mentre i film apprezzati dalla critica non sempre incontrano il favore del pubblico? Non è facile rispondere a questa domanda (nel senso che ognuno ha la sua risposta), ma un buon approccio potrebbe essere una verifica empirica di questa affermazione. Ovvero: quali sono le caratteristiche dei film che piacciono ai critici e quali le caratteristiche dei film che hanno il maggior successo al botteghino?

formats

SanValentino datamining: mercato, diamanti e cellulari piccanti

Oggi è san Valentino, la celebre festa che nonostante abbia una sua consistenza storica, in realtà è stata re-inventata a tavolino per motivi commerciali (sociologicamente il processo si chiama “invenzione della tradizione“). La cosa in realtà non è un problema particolare, d’altronde esistono festività più o meno religiose completamente assorbite dalle strategie del marketing (leggi: Halloween). Dato che è un rituale collettivo consumeristico, mi sembra interessante dedicare alla festività una serie di visualizzazioni che rendono conto di alcuni processi sociali. Cominciamo con i processi economici.

formats

Il discorso di fine anno del Presidente Napolitano

Giovani, futuro, opportunità, Napoli, paese reale. Sono queste le parole chiave che potrebbero descrivere il discorso che il Presidente della Repubblica Giorgio Napolitano ha tenuto all’Italia per fare i suoi auguri di Buon 2011. Dato che a leggere i titoli dei giornali di oggi, soprattutto le dichiarazioni (di apprezzamento) dei politici, non è chiaro quale siano stati i punti centrali del discorso, mi sembrava interessante iniziare l’anno con un approccio più “scientifico” alla questione. Grazie a Massimo Mantellini, ho scaricato il pdf del discorso del Presidente Napolitano e ne ho fatto un paio di analisi: la tagcloud per vedere tipo e frequenza di parole utilizzate, e la wordtree per verificare in che contesto le varie parole sono state utilizzate. Lascio a chi interessato il compito di vedere quali siano stati i temi affrontati da Giorgio Napolitano.

Home Post Archive for category "Datamining"
credit
© Davide Bennato