Statistiche sperimentali, politiche data-driven e nuovi indicatori. L’Italia vince l’European Big Data Hackathon

  • da IlSole24ore.it 29 maggio – “L’European Big Data Hackathon è un evento biennale organizzato dalla Commissione Europea (Eurostat) a partire dal 2017. Lo scopo è realizzare un prodotto che combina statistiche ufficiali e big data e supportare in prospettiva i decisori politici su questioni che l’Europa deve affrontare avvalendosi di strumenti in grado di leggere e interpretare i fenomeni economici quasi in tempo reale“.

A marzo il teams di Istat ha vinto l’hackathon superando 22 squadre e arrivando prima di Polonia e Lituania che sono salite sul  podio. Hanno realizzato in 72 ore un tools interattivo che utilizza banche dati di Eurostat sul commercio internazionale per studiare in tempo reale l’impatto del covid-19 sull’interscambio, e le vulnerabilità delle catene commerciali internazionali in caso di uno shock come quello della pandemia o in prospettiva per eventuali guerre di dazi o tensioni internazionali. Pensate a quello che è successo sui mercati internazionali per una barca che ha bloccato il traffico nei canali di Suez. Con noi c’erano tre ricercatori del team di smart statistics di Istat: Mauro Bruno, Barbara Guardabascio e Fabrizio de Fausti.

Qui trovate la dashboard con il tools che ha vinto 

Hanno analizzato l’influenza della pandemia e delle politiche adottate per superare la crisi sugli scambi con l’estero (in termini di prodotti, paesi, mezzi di trasporto utilizzati). A tale scopo, il team ha implementato una dashboard open source (Cosmopolitics) realizzata utilizzando moderni framework javascript per la componente client e un’architettura a micro-servizi per la componente server. L’architettura messa a punto è scalabile e consente di integrare i linguaggi Python e R in una pipeline di elaborazione dati.

Il team Istat ha utilizzato tecniche di analisi dei social network (implementate in Python) e studiato sia l’effetto degli shock nei trasporti che gli effetti delle interruzioni delle relazioni. Ha inoltre analizzato i dati sulla mobilità di Google fornendo un indicatore sperimentale (implementato in R) che rappresenta la restrizione imposta dalla pandemia da Covid-19.

Qui invece trovate su Github i dati e i meta-dati sul tool