L’indicizzazione è la fase in cui il motore di ricerca raccoglie, analizza ed archivia i dati per facilitare la rapida e accurata ricerca di informazioni da parte degli utenti di internet.
La progettazione dell’indice del motore di ricerca incorpora i concetti interdisciplinari, dalla linguistica, psicologia cognitiva, matematica e informatica.
Nomi alternativi per il processo d’indicizzazione nel contesto dei motori di ricerca progettati per trovare le pagine web su internet è l’indicizzazione web o indicizzazione nei motori di ricerca.
I motori di ricerca utilizzano crawler automatici per trovare pagine web da indicizzare.
Se un sito non viene indicizzato, non può comparire nei risultati di ricerca.
L’indicizzazione è dunque la prima e importante operazione che i motori di ricerca compiono per poter trasmettere i risultati nelle loro pagine di risultato di ricerca, dette SERP.
Non va però confusa con il posizionamento, o con l’ottimizzazione.
Infatti, se una pagina è indicizzata, significa che il motore di ricerca è a conoscenza della sua esistenza, ma ciò non garantisce affatto che ottenga un buon posizionamento nelle classifiche.
Motori popolari (come Google) si concentrano solo sull’indicizzazione “full-text indexing”, ossia leggono il contenuto testuale delle pagine web.
Prima dell’avvento di questa tecnologia, che ha iniziato a consolidarsi verso la metà degli anni ’90, l’indicizzazione era basata unicamente su parole chiave inserite nei meta tag (come tag title e meta description), dati inseriti nel codice HTML nati appositamente per fornire informazioni sulle pagine ai motori di ricerca.
Oggi questi metadati, grazie alla “full-text indexing”, hanno perso importanza in favore dei contenuti presenti nella pagina, che costituiscono il vero valore di un sito per i motori di ricerca, così come per gli esseri umani.