L’indicizzazione di un sito web è una delle numerose componenti del SEO. Ma che cosa significa indicizzare un sito web? Come si può indicizzare un sito web?
Che cos’è l’indicizzazione di un sito web?
Per indicizzazione di un sito web si intende l’inserimento di un sito web e delle sue pagine all’interno di un motore di ricerca come ad esempio il noto Google. Questa attività non è svolta direttamente da chi si occupa di SEO e posizionamento nei motori di ricerca, ma è gestita direttamente dagli stessi motori di ricerca che in maniera autonoma analizzano e registrano le pagine web che compongono un sito e le inseriscono nei loro indici.
Indicizzare un sito web è quindi compito dei motori di ricerca che, dopo essere stati avvisati dell’esistenza di un sito web, si occuperanno del lavoro di indicizzazione.
A questo punto è però importante distinguere l’indicizzazione dal posizionamento: spesso infatti si tende a confondere questi due aspetti del SEO, anche se invece sono ben diversi. Il primo, l’indicizzazione, è l’inserimento delle pagine nell’indice dei motori di ricerca come Google ed è una procedura automatica che dipende dagli stessi motori di ricerca. Mentre il secondo aspetto, il posizionamento, comprende tutte le tecniche e le metodologie applicate da chi si occupa di SEO per fare in modo che un sito web venga visualizzato nelle prime posizioni dei motori di ricerca.
«Un sito web è indicizzato quando è presente su Google. Un sito web è ben posizionato quando si trova nei primi posti su Google!»
Si può influenzare l’indicizzazione di un sito su Google?
Quando si crea un sito web e lo si posiziona su Google, è necessario realizzarlo tenendo conto delle esigenze dell’indicizzazione. Bisogna infatti permettere ai motori di ricerca di poter analizzare, archiviare ed indicizzare le pagine di un sito web senza inserire degli ostacoli tecnici all’indicizzazione. Un sito web ben costruito non dovrebbe porre dei vincoli e di conseguenza l’indicizzazione sarà sempre effettuata a meno che non venga specificato diversamente.
Perché è importante l’indicizzazione di un sito web su Google?
Indicizzare un sito web su Google significa fare in modo che Google memorizzi nei propri database le pagine con testi, foto, documenti e collegamenti. Gli algoritmi di Google sono quindi in grado di catalogare ed archiviare i contenuti così da permettere delle ricerche. Solo le pagine indicizzate potranno infatti essere posizionate nei risultati delle ricerche.
Il motore di ricerca Google ha diversi modi per scoprire quali pagine compongono un sito web. Fare in modo che Google sia a conoscenza delle pagine di un sito è il primo passo perché esse vengano indicizzate.
Informare Google della presenza di un sito
Il modo più semplice per dire a Google che esiste un sito è quello di utilizzare gli strumenti per i webmaster comunicando l’indirizzo del dominio di primo livello. A questo punto Google ha la facoltà (non l’obbligo) di effettuare una scansione dell’intero sito a partire dall’URL indicato. La scansione del sito avverrà seguendo i collegamenti ipertestuali presenti nella prima pagina. Ciò significa che se delle pagine non sono collegate da delle altre pagine non potranno essere trovate dal crawler di Google (ovvero quel particolare software che viene usato per scorrere le pagine dei siti web).
Inviare una sitemap con l’elenco delle pagine
Un modo efficacie per informare Google della presenza di nuove pagine web è l’invio di una Sitemap. La Sitemap è un file in formato XML che contiene l’elenco completo di tutte le pagine che si desidera indicizzare presenti in un sito web. Tra le varie caratteristiche interessanti di questo sistema troviamo la possibilità di indicare anche delle immagini con la Sitemap per le immagini, ed inoltre per ogni pagina si può segnalare la data dell’ultima modifica e la priorità/importanza di ogni singola pagina rispetto alle altre. In ogni caso Google potrà scegliere quali pagine indicizzare: tutte, alcune o magari anche delle pagine non inserite nella sitemap.
Inserire l’indirizzo in altri siti
Oltre ai due metodi sopracitati, Google può scoprire un nuovo sito seguendo dei link presenti in altri siti. Questo metodo è però sconsigliato in quanto l’autorevolezza di tali siti potrebbe influire nella qualità dell’indicizzazione prima e del posizionamento poi. Inoltre non è detto che Google segua tali link pertanto non è un sistema sicuro.
Come scoprire se Google ha indicizzato tutte le pagine di un sito?
Esistono diverse modalità per capire quante e quali pagine sono indicizzate da Google. Solitamente si usano gli strumenti per i Webmaster di Google e l’operatore site: per la ricerca. Talvolta può capitare che che non tutte le pagine vengano indicizzate da Google, pertanto è utile capire il motivo così da prendere delle contromisure adeguate.
Perché Google non indicizza tutte le pagine?
Google utilizza diversi parametri per stabilire quali pagine memorizzare e quali invece ignorare. In particolare la qualità dei contenuti è il fattore chiave che determina l’indicizzazione di una pagina. Al contrario le pagine di scarso valore, con contenuti duplicati o che fanno parte di reti di link innaturali (spam), sono alcuni validi motivi che possono contribuire alla mancata indicizzazione.
Inoltre, a proposito di reti di link, il motore di ricerca Google riconosce quando dei collegamenti sono realizzati per «imbrogliare», in tal caso Google può semplicemente decidere di non seguirli, ciò influirà nuovamente nell’indicizzazione e nel posizionamento. Le regole usate da Google per l’indicizzazione sono quindi molto simili a quelle usate per determinare il posizionamento dei risultati nelle ricerche dove troviamo nuovamente al primo posto la qualità dei contenuti e dei link che collegano le pagine all’interno di un sito o tra siti differenti.