Info e metodologia

Come funziona il dataset e cosa significano i numeri che vedi.

Cos'è

Schema.org pubblica, in collaborazione con Google, un dataset pubblico sull'uso reale dei termini del vocabolario (tipi come Person o proprietà come price) su milioni di domini del web. Questa dashboard ne offre una lettura visuale, in stile osservatorio.

Come sono raccolti i dati

  • Raccolta: le frequenze dei termini sono misurate dall'infrastruttura di crawling pubblico di Google e aggregate per dominio (non per pagina): usare un termine su 100 pagine dello stesso sito conta come un dominio.
  • Raggruppamento: invece di numeri esatti (rumorosi), i siti sono raggruppati in fasce di popolarità per stabilità e privacy.
  • Pubblicazione: un nuovo file viene pubblicato su GitHub ogni mese.

Le fasce di domini

Ogni termine è classificato in una di queste fasce, dal numero più basso al più alto di domini unici:

< 1K1K - 10K10K - 100K100K - 1M1M - 10M10M+

La fascia < 1K include sia termini nuovissimi sia termini molto specialistici (es. medici o governativi): non significa che siano ignorati.

Note importanti

  • I dati non distinguono tra JSON-LD, Microdata o RDFa: sono conteggiati insieme.
  • Le statistiche riflettono il web così come indicizzato da Google; nessun crawl copre l'intera rete.
  • Il formato è aperto: altri crawler possono contribuire con le proprie statistiche nello stesso formato.

Scarica i dati

Scarica i dati grezzi dell'ultimo mese:

Questo progetto

Sito statico costruito con Next.js: i dati vengono incorporati al momento del build e serviti dalla CDN, senza database né funzioni a runtime. Una GitHub Action mensile scarica eventuali nuovi snapshot e rigenera il sito, mantenendo i costi vicini allo zero.

Mesi disponibili: Maggio 2026.

Fonti