Dopo un anno di sperimentazione, Google ha finalmente inaugurato Dataset Search, uno strumento gratuito che consente di ricercare dati e informazioni tra 25 milioni di dataset pubblicamente disponibili sugli argomenti più disparati.

Si tratta di un’enorme mole di dati organizzati diversamente da quanto avviene con i consueti dataset quali, ad esempio, il registro di Amazon: in questi casi, infatti, è il proprietario dei dati a dettarne le regole di gestione e fruizione. Google, invece, non detiene alcun dataset ma si limita (si fa per dire) a trovarli e ad aggregarli dai relativi proprietari e/o editori, senza gestirli in prima persona. Grazie agli standard open suorce di schema.org, ai quali devono dunque essere conformi i dataset pubblicati, il motore di ricerca ne indicizza i metadati relativi e ne mette a disposizione dei suoi utenti il contenuto, sulla base dei suoi consueti parametri di ricerca.

Tutto ciò, dobbiamo aspettarcelo, determinerà nel prossimo futuro un forte incremento dei dataset compatibili con le direttive di schema.org, in particolare di tutti quelli pubblicati a scopo di lucro. Basti pensare agli istituti di ricerche di marketing, che avranno adesso un importante nuovo canale per promuovere – e vendere – i risultati del proprio lavoro: un’occasione importante, per molti, per ridisegnare le proprie strategie di business!

Questo tool di ricerca include filtri per selezionare i risultati sulla base della licenza (gratuita o a pagamento), al formato (csv, pdf, jpg ecc.) e alla data ai quali risalgono. Tra i risultati è possibile ottenere anche informazioni sulla tipologia di contenuti e sugli autori dei dataset. Per il momento, Google non fornisce ancora un’API per la ricerca o il download di dataset gratuiti, ma diamo tempo al tempo.

A oggi, Google Dataset Search ospita soprattutto dati di istituti e agenzie statunitensi (oltre 2 milioni sono i dataset delle agenzie governative USA) e gli argomenti più produttivi riguardano geoscienze, biologia e agricoltura.

Siamo appena agli inizi, ma ci aspettiamo che questo nuovo strumento venga presto compreso e utilizzato da un numero crescente di professionisti dei più vari settori. Non resta che mettersi a studiare gli standard di schema.org, e contribuire a popolare la rete di numeri utili e di qualità. La condivisione, mai come oggi, è infatti la base di partenza per lo sviluppo reciproco: in ogni professione, in ogni ambito della nostra vita.

Maggiori informazioni su Google Datasearch sono disponibili sul blog di Google.