I motori di ricerca imparano a leggere

Rich SnippetsVi siete mai chiesti, cercando qualche cosa su Google, come mai nella ricerca c’era la foto dell’autore vicino all’articolo oppure come mai era evidenziato un evento? E sopratutto vi siete mai chiesti come faceva Google a tirare fuori questi dati dalle pagine che indicizzava?

Una volta un motore di ricerca, come il glorioso Altavista, o lo sfortunato Yahoo indicizzavano il testo di un sito. Lo visitavano, ne analizzavano il contenuto e con un algoritmo più o meno complesso lo archiviava nella propria memoria permettendoci, attraverso delle ricerche più o meno articolate, di trovare quello che cercavamo.

In seguito è arrivato Google che con i suoi algoritmi ci ha sbalordito sempre di più. Oggi siamo arrivati ad un grado di intelligenza dei crawler (cosi si chiamano i programmi dei motori di ricerca che indicizzano il cyberspazio) da far paura.

Oggi i motori di ricerca fanno un indicizzazione semantica dei siti. Il nostro sito non viene indicizzato in maniera sterile per il contenuto testuale che esso contiene. Viene analizzato dal software del motore di ricerca ogni elemento della pagina, dalle foto ai colori utilizzati, per cercare di dare un significato ad ogni parola presente sulla nostra pagina. Ed in base al significato che il motore di ricerca assegna queste parole, riesce ad indicizzare in maniera sempre più precisa il nostro sito web.

Qualche anno fà un motore di ricerca non faceva molta distinzione tra il sito di Fabio Carta e quello di una cartiera, perchè per lui la parola carta aveva sempre lo stesso significato a prescindere dal contesto che la conteneva. Oggi riescono oltre a distinguere il contesto, riescono a capire anche noi quale “carta” cerchiamo. Però non sempre è farina del loro sacco.

Di recente si sta sviluppando una tecnologia che si chiama “rich snippet” con la quale vengono taggati i dati. In pratica questa tecnologia permette di taggare il testo che stiamo scrivendo. Al contrario dell’HTML che tagga il testo per formattarlo graficamente,  il “rich snippet” tagga il testo per strutturarlo e dargli un significato.

Il “rich snippet” ci permette di dire al motore di ricerca che il testo che stiamo scrivendo descrive un prodotto che stiamo vendendo, pittosto che un evento a cui vogliamo invitare delle persone. Che una determinata stringa è il nome dell’autore di un articolo pittosto che un numero di telefono.

I tag “rich snippet” si integrano con quelli HTML, anzi per la verità sono delle proprietà che si assegnano all’HTML in modo da essere trasparenti ai browser. Questo però ci permette di creare facilmente due pagine web con lo stesso codice, una per i nostri visitatori umani ed una per i visitatori elettronici che hanno bisogno di un aiutino per capire che cosa hanno sotto mano.

Anche se è nata come semplice estensione per aggraziare la rappresentazione che Google fà del nostro sito nelle sue ricerche, secondo me è una tecnologia potentissima per la strutturazione “semantica” del testo e che può riservarci delle belle sorprese in futuro.

Per ulteriori informazioni provate su Google oppure su schema.org.

Scritto da

Share

Informazioni su Vincenzo Iacobelli

Esperto sistemista, con esperienza ultradecennale nella gestione di sistemi Linux/Unix based, Cisco Systems e di telecomunicazioni in generale. Ad oggi marito e padre felice, che condivide con la propria compagna di vita la dolce è difficile esperienza di genitore.
Aggiungi ai preferiti : Permalink.

Lascia un commento