Un'introduzione a Elasticsearch

Tipo di attività: 
FormAzione 04/06/2017
Livello di difficoltà: 
Intermedio
Durata: 
120 minuti

Tra i database è alla soglia della top 10 mondiale di popolarità, tra i motori di ricerca è saldamente in testa. Si tratta di Elasticsearch, un database nosql basato su Apache Lucene e ottimizzato per ricerca full-text, analytics, data discovery, indicizzazione e interrogazione near real-time, scalabilità orizzontale. È anche una componente importante del progetto Ricostruzione Trasparente, per la raccolta e l'analisi dei flussi di atti ufficiali delle PA locali (albi pretori, a partire dai feed del progetto AlboPOP) in merito al processo di ricostruzione dopo i terremoti dell'anno scorso.

  1. Breve panoramica dei database nosql e delle API di Elasticsearch
  2. Discussione del problema "raccolta, aggregazione, indicizzazione e ricerca" dei documenti degli albi pretori
  3. --- Strutturazione dei dati
  4. --- Mapping e analisi dei testi (natural language processing)
  5. --- Query di ricerca e di aggregazione
  6. Esempio di interfaccia grafica e visualizzazione dati (da Elasticsearch a D3JS)

Per i partecipanti in possesso di pc e connessione a internet sarà possibile effettuare query sul database e seguire gli esempi esercitandosi. Per chi viene con nuove idee di riuso dei dati di Ricostruzione Trasparente e la voglia di mettere le mani in pasta, voti altissimi a prescindere... :)