Info e metodologia
Come funziona il dataset e cosa significano i numeri che vedi.
Cos'è
Schema.org pubblica, in collaborazione con Google, un dataset pubblico sull'uso reale dei termini del vocabolario (tipi come Person o proprietà come price) su milioni di domini del web. Questa dashboard ne offre una lettura visuale, in stile osservatorio.
Come sono raccolti i dati
- Raccolta: le frequenze dei termini sono misurate dall'infrastruttura di crawling pubblico di Google e aggregate per dominio (non per pagina): usare un termine su 100 pagine dello stesso sito conta come un dominio.
- Raggruppamento: invece di numeri esatti (rumorosi), i siti sono raggruppati in fasce di popolarità per stabilità e privacy.
- Pubblicazione: un nuovo file viene pubblicato su GitHub ogni mese.
Le fasce di domini
Ogni termine è classificato in una di queste fasce, dal numero più basso al più alto di domini unici:
La fascia < 1K include sia termini nuovissimi sia termini molto specialistici (es. medici o governativi): non significa che siano ignorati.
Note importanti
- I dati non distinguono tra JSON-LD, Microdata o RDFa: sono conteggiati insieme.
- Le statistiche riflettono il web così come indicizzato da Google; nessun crawl copre l'intera rete.
- Il formato è aperto: altri crawler possono contribuire con le proprie statistiche nello stesso formato.
Scarica i dati
Scarica i dati grezzi dell'ultimo mese:
Questo progetto
Sito statico costruito con Next.js: i dati vengono incorporati al momento del build e serviti dalla CDN, senza database né funzioni a runtime. Una GitHub Action mensile scarica eventuali nuovi snapshot e rigenera il sito, mantenendo i costi vicini allo zero.
Mesi disponibili: Maggio 2026.