Created
February 3, 2026 20:16
-
-
Save aborruso/3c943a7a94cc436be06a60dc510d963b to your computer and use it in GitHub Desktop.
Revisions
-
aborruso created this gist
Feb 3, 2026 .There are no files selected for viewing
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters. Learn more about bidirectional Unicode charactersOriginal file line number Diff line number Diff line change @@ -0,0 +1,62 @@ # Data Quality Report — Ordinanze viabili (Comune di Messina) **Dataset:** Ordinanze viabili **Portale:** https://dati.comune.messina.it **Risorsa analizzata:** `ordinanze_viabili_latest.csv` **Data analisi:** 2026-02-03 ## 1) Sintesi Dataset generalmente utilizzabile, ma presenta criticità nei campi temporali (timestamp non standard e date non valide) e carenze di documentazione (schema e tag). Necessarie correzioni per garantire piena interoperabilità e parsing automatico. ## 2) Metadata Quality - **Titolo/Descrizione:** OK, chiari e descrittivi. - **Publisher/Organizzazione:** OK. - **Tag:** assenti (discoverability ridotta). - **Schema/descrizione campi:** assente. - **`issued`:** vuoto. ## 3) File Format Readiness - **Encoding:** UTF-8 (OK) - **BOM:** assente (OK) - **Separatore:** virgola (OK) - **Righe:** 2043 + header - **Colonne:** 7 ## 4) Struttura e Tipologie Colonne: - `numero` - `data_pubblicazione` - `inizio_validita` - `fine_validita` - `aree` - `tipo` - `sintesi` Valori mancanti: - `aree`: 18 valori NULL ## 5) Criticità (Severità) **MAJOR** - `fine_validita` contiene timestamp non standard `T24:00:00` (205 righe). - `fine_validita` contiene date invalide `2026-02-29T00:00:00` (2 righe; 2026 non è bisestile). - Assenza di documentazione schema (campi, tipi, significato). **MINOR** - Tag assenti. - Incoerenza metadati risorsa: `distribution_format` = AAC, formato reale CSV. - `issued` vuoto. ## 6) Raccomandazioni 1. Normalizzare `fine_validita` in ISO 8601: - sostituire `T24:00:00` con `T23:59:59` o `T00:00:00` del giorno successivo. - correggere date invalide (`2026-02-29`). 2. Pubblicare schema dei campi (Table Schema o JSON Schema), con descrizioni e tipi. 3. Aggiungere tag tematici per migliorare discoverability. 4. Allineare i metadati della risorsa (`distribution_format`, `issued`). ## 7) Note tecniche - Parsing automatico in DuckDB rileva `fine_validita` come `VARCHAR` a causa dei valori non standard/invaldi. - Encoding UTF-8 verificato. --- Report generato automaticamente.