Skip to content

Instantly share code, notes, and snippets.

@aborruso
Created February 3, 2026 20:16
Show Gist options
  • Select an option

  • Save aborruso/3c943a7a94cc436be06a60dc510d963b to your computer and use it in GitHub Desktop.

Select an option

Save aborruso/3c943a7a94cc436be06a60dc510d963b to your computer and use it in GitHub Desktop.

Revisions

  1. aborruso created this gist Feb 3, 2026.
    62 changes: 62 additions & 0 deletions note.md
    Original file line number Diff line number Diff line change
    @@ -0,0 +1,62 @@
    # Data Quality Report — Ordinanze viabili (Comune di Messina)

    **Dataset:** Ordinanze viabili
    **Portale:** https://dati.comune.messina.it
    **Risorsa analizzata:** `ordinanze_viabili_latest.csv`
    **Data analisi:** 2026-02-03

    ## 1) Sintesi
    Dataset generalmente utilizzabile, ma presenta criticità nei campi temporali (timestamp non standard e date non valide) e carenze di documentazione (schema e tag). Necessarie correzioni per garantire piena interoperabilità e parsing automatico.

    ## 2) Metadata Quality
    - **Titolo/Descrizione:** OK, chiari e descrittivi.
    - **Publisher/Organizzazione:** OK.
    - **Tag:** assenti (discoverability ridotta).
    - **Schema/descrizione campi:** assente.
    - **`issued`:** vuoto.

    ## 3) File Format Readiness
    - **Encoding:** UTF-8 (OK)
    - **BOM:** assente (OK)
    - **Separatore:** virgola (OK)
    - **Righe:** 2043 + header
    - **Colonne:** 7

    ## 4) Struttura e Tipologie
    Colonne:
    - `numero`
    - `data_pubblicazione`
    - `inizio_validita`
    - `fine_validita`
    - `aree`
    - `tipo`
    - `sintesi`

    Valori mancanti:
    - `aree`: 18 valori NULL

    ## 5) Criticità (Severità)
    **MAJOR**
    - `fine_validita` contiene timestamp non standard `T24:00:00` (205 righe).
    - `fine_validita` contiene date invalide `2026-02-29T00:00:00` (2 righe; 2026 non è bisestile).
    - Assenza di documentazione schema (campi, tipi, significato).

    **MINOR**
    - Tag assenti.
    - Incoerenza metadati risorsa: `distribution_format` = AAC, formato reale CSV.
    - `issued` vuoto.

    ## 6) Raccomandazioni
    1. Normalizzare `fine_validita` in ISO 8601:
    - sostituire `T24:00:00` con `T23:59:59` o `T00:00:00` del giorno successivo.
    - correggere date invalide (`2026-02-29`).
    2. Pubblicare schema dei campi (Table Schema o JSON Schema), con descrizioni e tipi.
    3. Aggiungere tag tematici per migliorare discoverability.
    4. Allineare i metadati della risorsa (`distribution_format`, `issued`).

    ## 7) Note tecniche
    - Parsing automatico in DuckDB rileva `fine_validita` come `VARCHAR` a causa dei valori non standard/invaldi.
    - Encoding UTF-8 verificato.

    ---
    Report generato automaticamente.