Gli status code HTTP e la SEO

Come gli status code HTTP influenzano la SEO? Lo vediamo in un post che introduce un documento dettagliato pubblicato recentemente da Google.

Gli status code HTTP e la SEO

Google ha recentemente pubblicato un documento che spiega come gli status code HTTP influenzano la presenza di un sito web nei risultati di ricerca.

Un tweet di Gary Illyes fa intuire il suo contributo in questa risorsa, che di fatto rappresenta un riferimento quando si hanno dei dubbi su come gli status code influiscono sulla SEO.

Il tweet di Gary Illyes in cui linka il documento sugli status code di Google

Per i più esperti, di certo, si tratta di informazioni scontate e ripetitive, ma credo che sia importante che Google diffonda questo tipo di cultura dando dei riferimenti a chi lavora nel settore.
In questo post vorrei introdurli presentandone le principali categorie.

Come gli status code influenzano la ricerca

Il documento di Google si riferisce ai principali 20 codici che Googlebot incontra scansionando i siti web.

Cosa sono gli status code HTTP?

Gli status code HTTP vengono generati dal web server ogni volta che una risorsa viene richiesta da un browser o da un crawler.

Ad esempio, se un browser richiede una pagina che non è più disponibile nel server, verrà generato uno status code 404 (not Found).

Le principali categorie

HTTP 2xx (success)

Questa serie di codici indica che Googlebot può eseguire la scansione della risorsa e trasmettere i dati alla "pipeline di indicizzazione".

Attenzione: uno status code 2xx non garantisce l'indicizzazione, significa semplicemente che non sono stati riscontrati errori. L'eccezione è lo status code 204, il quale indica che l'accesso alla pagina è riuscito ma non è stato trovato alcun contenuto.

Google potrebbe mostrare un "soft 404" in Search Console per le pagine che generano uno status code 204.

HTTP 3xx (redirect) 

Non tutti i redirect sono uguali.  Uno status code 301, ad esempio, invia un segnale più "forte" di un 302, 303 o 307 relativamente all'URL da considerare canonico. Uno status code 304 segnala a Google che il contenuto è lo stesso dell'ultima volta che è stato sottoposto a scansione. Non ha alcun effetto sull'indicizzazione, ma può causare il ricalcolo dei segnali per l'URL.

Quando viene segnalato errore di redirect? Googlebot effettua 10 tentativi. Se durante tali tentativi non ottiene una risposta dalla risorsa verrà segnalato un errore in Search Console nel rapporto relativo alla copertura dell'indice.

HTTP 4xx (client error)

Le pagine che restituiscono uno status code 4xx non vengono considerate per l'indicizzazione nei risultati di ricerca di Google. Tutti i codici 4xx, eccetto 429, vengono trattati allo stesso modo. Segnalano a Googlebot che il contenuto non esiste. Se il contenuto esisteva in precedenza, l'URL verrà rimosso dall'indice di ricerca di Google. 

Un esempio banale: se nel server hai un PDF, digitando l'URL nel browser lo visualizzerai. Se lo elimini dal server e usi lo stesso URL, si verificherà un 404.

Un esempio di messaggio relativo ad uno status code 404
Un esempio di messaggio relativo ad uno status code 404

Uno status code 429 indica che Googlebot non ha potuto accedere a un URL perché il server è sovraccarico. Tali URL verranno conservati nell'indice di Google.

HTTP 5xx (server error) 

Gli errori del server 5xx indicano a Googlebot che il server è in errore, quindi dovrà temporaneamente rallentare con la scansione. Un esempio banale: se in una pagina PHP facciamo un errore di sintassi, otterremo un errore 500.

Gli URL precedentemente indicizzati che presentano un errore del server verranno eventualmente eliminati dall'indice se continuano a fornire un codice di stato 5xx.


Il post è ispirato ad un articolo di Search Engine Journal che indico tra gli approfondimenti.


Per approfondire

How HTTP Status Codes Impact SEO
A new document from Google explains how HTTP status codes impact a site’s appearance in search results.
How HTTP status codes, and network and DNS errors affect Google Search
Learn how HTTP status codes, and network and DNS errors affect Google Search.