SEO

Sitemap XML

Anche: sitemap, mappa del sito XML, sitemap.xml

Una sitemap XML è un file che elenca gli URL di un sito che vuoi far conoscere ai motori di ricerca, in modo che i crawler possano scoprire e dare priorità alle pagine per l'indicizzazione, invece di affidarsi solo ai link interni per trovarle.

Una sitemap dice a un motore di ricerca quali pagine esistono e, se vuoi, quando ognuna è stata modificata l'ultima volta. Shopify ne genera una in automatico su /sitemap.xml, che a sua volta rimanda a sitemap secondarie per prodotti, collezioni, pagine e articoli del blog. Inviare quell'URL in Google Search Console fornisce a Google un elenco diretto e autorevole da scansionare, e questo di solito accelera la scoperta delle pagine nuove e aggiornate, soprattutto su un catalogo ampio o su un negozio appena aperto con pochi link in entrata. La data lastmod conta più di quanto pensino molti gestori: è il segnale che un crawler legge per decidere se vale la pena riscaricare una pagina, quindi una marca temporale accurata su una pagina davvero cambiata è una delle poche leve oneste che hai sui tempi di riscansione.

Vale la pena essere precisi su cosa una sitemap non fa. Elencare un URL è una richiesta, non un comando: non garantisce che una pagina venga indicizzata, non migliora il posizionamento e non scavalca un tag noindex o un blocco in robots.txt. Una pagina può restare nella sitemap ed essere comunque esclusa perché Google la giudica scarna, duplicata o di poco valore. La sitemap è un aiuto alla scoperta, non un fattore di posizionamento, e trattarla come tale porta solo a sprecare lavoro.

Prendi un negozio Shopify che pubblica quaranta nuovi prodotti stagionali un giovedì mattina. Senza ancora nessun link in entrata che punta a quegli URL, Google deve trovarli scansionando la navigazione interna, cosa che può richiedere giorni. Inviare la sitemap secondaria dei prodotti, con ogni nuovo URL che porta un valore lastmod aggiornato, dà al crawler un elenco lineare che può leggere in un solo passaggio, così le pagine nuove tendono a comparire nei report di copertura molto prima. Se in seguito lo stesso negozio rimuove una linea fuori produzione, quegli URL dovrebbero uscire dalla sitemap invece di restare come pagine 404 che minano in silenzio la fiducia nel file.

Mantieni la sitemap onesta e resta utile: deve contenere solo URL canonici e indicizzabili che restituiscono uno stato 200. Le sitemap con redirect, pagine morte o duplicati da parametri sprecano crawl budget e indeboliscono il segnale. Inviala una volta in Search Console, poi usa i report di copertura e indicizzazione come tuo ciclo di feedback per capire se le pagine che hai elencato vengono davvero raccolte.

La sitemap conta anche per la ricerca AI e i motori di risposta. Strumenti come ChatGPT, Perplexity e Google AI Overviews dipendono ancora dall'indice web sottostante, o dai propri crawler, per trovare e leggere i tuoi contenuti prima di poterli citare. Una pagina che non è mai stata scoperta non può essere riassunta o citata in una risposta. Una sitemap pulita e aggiornata aumenta le probabilità che le tue pagine prodotto, collezione e guida siano nel corpus da cui questi sistemi attingono, e questa è la condizione, silenziosa ma necessaria, perché le tue pagine possano essere richiamate in una risposta generata. Non scriverà la risposta al posto tuo, ma fa in modo che le tue pagine siano presenti nel momento in cui la risposta viene composta.