Info e metodologia

Come funziona il dataset e cosa significano i numeri che vedi.

Cos'è

Schema.org pubblica, in collaborazione con Google, un dataset pubblico sull'uso reale dei termini del vocabolario (tipi come Person o proprietà come price) su milioni di domini del web. Questa dashboard ne offre una lettura visuale, in stile osservatorio.

Come sono raccolti i dati

Raccolta: le frequenze dei termini sono misurate dall'infrastruttura di crawling pubblico di Google e aggregate per dominio (non per pagina): usare un termine su 100 pagine dello stesso sito conta come un dominio.
Raggruppamento: invece di numeri esatti (rumorosi), i siti sono raggruppati in fasce di popolarità per stabilità e privacy.
Pubblicazione: un nuovo file viene pubblicato su GitHub ogni mese.

Le fasce di domini

Ogni termine è classificato in una di queste fasce, dal numero più basso al più alto di domini unici:

< 1K1K - 10K10K - 100K100K - 1M1M - 10M10M+

La fascia < 1K include sia termini nuovissimi sia termini molto specialistici (es. medici o governativi): non significa che siano ignorati.

Note importanti

I dati non distinguono tra JSON-LD, Microdata o RDFa: sono conteggiati insieme.
Le statistiche riflettono il web così come indicizzato da Google; nessun crawl copre l'intera rete.
Il formato è aperto: altri crawler possono contribuire con le proprie statistiche nello stesso formato.

Scarica i dati

Scarica i dati grezzi dell'ultimo mese:

CSV (Luglio 2026)JSON (Luglio 2026)

Questo progetto

Progetto indipendente, non affiliato a Schema.org o Google.

Mesi disponibili: Maggio 2026, Giugno 2026, Luglio 2026.

SchemaStatsBot

Quando qualcuno usa il validatore, il nostro crawler scarica quella pagina per conto dell'utente. Rispetta robots.txt, non esplora il web in massa e può essere bloccato in qualsiasi momento.

Documentazione del bot