OpenCUP: Focus PNRR

L’ultima versione dei dati OpenCUP con focus sul PNRR è quella di maggio 2023.

Molto importante la nota relativa che si legge sul sito:

Si sottolinea che i dati oggetto del rilascio open data, rappresentano gli interventi candidati nell’ambito del PNRR, così come segnalati dai soggetti titolari dei singoli interventi in fase di generazione CUP, ma che potrebbero non essere ammessi ai finanziamenti del Piano e successivamente finanziati da altre misure di spesa. Per la lista definitiva dei progetti PNRR, si rimanda agli elenchi ufficiali emanati dalle Amministrazioni responsabili dei finanziamenti.

Fai attenzione

Per la ragione sopra indicata, non è detto che un progetto in questo elenco sia stato con certezza finanziato dal PNRR. È però un punto di partenza per fare approfondimenti sul sito della Pubblica Amministrazione correlata al progetto.

Il file si chiama CUP_PNRR_05_05_2023.xlsx, ed è composto da 256.022 righe e 36 colonne.

Inoltre:

  • il numero di codici CUP è pari a 204.372;
  • sono progetti riferibili a 25 stati, e per l’Italia (più del 99% dei progetti) a 20 regioni, 110 province e 7.921 comuni.
  • fanno riferimento a 11 settori di intervento;
  • l’importo finanziato totale è pari a 189,0 miliardi di €.

Il numero di Province e Comuni è maggiore del loro numero totale in Italia, perché probabilmente si fa riferimento a Comuni e Province che sono stati soppressi.

Alcune note utili sul file:

Formato di pubblicazione alternativo

Proporremo a OpenCUP di pubblicare questo dataset anche in formato parquet1. È un formato aperto, che rende l’accesso ai dati e la loro elaborazione molto rapida e efficiente. Qui lo stesso file in formato parquet.

Si può generare con duckdb:

echo "COPY (SELECT * FROM read_csv_auto('opencup-focus-pnrr.csv',dateformat='%Y%m%d')) TO 'opencup-focus-pnrr.parquet' (FORMAT 'PARQUET', CODEC 'Snappy');" |  duckdb
Torna in cima