Hummingbird asocialman

Hummingbird: un Google semantico

Lo zoo di Google: panda, pinguini e colibrì

Hummingbird, Penguin, Panda…io e Google andiamo d’accordo perché entrambi amiamo gli animali!

Che c’entra Google con questi animali? Ultimamente si è parecchio parlato del panda…

I tre esemplari di cui sopra sono anche i nomi di tre algoritmi che il colosso di Mountain View ha messo a punto negli anni (li ho elencati in ordine dal più recente al più vecchiotto) e che hanno parzialmente il compito di determinare l’ordine di visualizzazione nelle SERP (Search Engine Result Page). Responsabilità da nulla. Forse conosco qualcuno che sarebbe disposto ad ammazzare per conoscere i segreti nascosti dietro tali algoritmi.

In realtà non tutto ciò che tali algoritmi implicano resta un segreto. Anzi, molte pratiche favorite e prescritte da questi codici sono più che conosciute, esplicitate. Non voglio però fare una disamina dei tre spaventosi prodotti degli ingegneri della Silicon Valley. Voglio soffermarmi su uno degli aspetti che caratterizza l’ultimo neonato (ormai già bambino): Hummingbird.

Hummingbird e la rete semantica in cui si avvolge Google

2 anni fa l’amico e SEO Francesco Margherita ne parlava e poi ha fatto grossi passi in tal senso: i contenuti, seppur di qualità, per Google non prescindono dalla semantica e dalla sintassi.

Hummingbird determina un principale cambiamento: con questo algoritmo, ad ogni ricerca, il motore cercherà di ricostruire il contesto analizzando il significato delle parole presenti nella query. Google si allontana dalla totale dipendenza dalle parole chiave per avvolgersi sempre di più in un abbraccio “semantico”.

hummingbird

Il Knowledge Graph (no, proprio ora non posso spiegare proprio bene cosa è) costituisce la base del funzionamento di Hummingbird: si tratta di un potentissimo strumento implementato nella tecnologia del motore di ricerca americano, una vera e propria intelligenza artificiale. Il “grafo di conoscenza” è capace di  associare e analizzare le relazioni tra oggetti e concetti, tra entità. Dal punto di vista linguistico è interessante pensare di verificare il comportamento del nuovo algoritmo con le ricerche redatte in lingua italiana, magari composte in maniera complessa.

Altro spunto molto interessante per la mia anima linguista deriva da “A Cross-Lingual Dictionary for English Wikipedia Concepts” uno studio di Valentin I. Spitkovsky e Angel X. Chang, dedicato fondamentalmente a Google e Wikipedia.  Ancora non ho letto il saggio in maniera approfondita, ma mi riservo di commentarlo qui sul blog. In sintesi, lo studio sviluppato da Google Research e dal Computer Science Department della Stanford University, ha visto i due Googleisti fare esperimenti sull’associazione automatica di stringhe di testo con concetti presi da Wikipedia (un database niente male). Se si riflette che nello studio si è pensato di concepire ogni singolo articolo di Wikipedia come un concetto (entità) identificato dal suo URL e rappresentato da un’espressione o stringa di testo…beh qui dentro ci sta tanta linguistica e tanta filosofia del linguaggio da rimettersi sui libri di università.

a cross-lingual dictionary for english wikipedia concepts asocialman
Intestazione dello studio di Spitkovsky e Chang

Ad ogni modo, lo studio in questione fa parte di tutta una serie di analisi messe in atto per implementare nel motore di ricerca di Google l’aspetto semantico. Se voleste analizzare i dati risultanti, vi allego il link (spariti) della Stanford dove vedere, ad esempio, la lista di coppie stringhe-concetti o la lista di URL. Vi avviso, i risultati sono di circa 300 milioni nella prima e di più di 3 miliardi nella seconda!

Cosa cambia per chi lavora nel Web?

Hummingbird è qualcosa di nuovo. Che ad occuparsi di questa rivoluzione del motore di ricerca sia tutto l’algoritmo o solo una delle sue componenti (RankBrain vi dice nulla?) resta il fatto che il cambiamento è enorme e lo assorbiremo lentamente. Siamo nel mondo del machine-learning, un mondo dove le macchine imparano ad associare correttamente parole e frasi, su base statistica, matematica.

Basti pensare che l’algoritmo Pagerank (quello che valuta ogni singola pagina web sulla base dei link che si riferiscono ad essa) ora fa gruppo insieme alle altre 199 componenti utilizzate per Hummingbird. Naturalmente determinare i fattori di successo di una pagina web nella SERP è praticamente quasi impossibile e il tutto non si esaurisce con un algoritmo. Bisogna sbatterci la testa. Stonck.

C’è sempre da darsi da fare nel mondo virtuale…reale…virtuale. Ora, c’è da dare peso alle parole. Che sia la volta buona per insegnarlo a un po’ di persone?

Contenuti, persone e relazioni

Things, not strings

Cito Google. Per un ultimo dato sul Knowledge Graph (che fondamentalmente come risultato visivo si esaurisce in quel box in alto a sinistra che compare con alcune ricerche su Google…ma quanto c’è dietro eh?). Parafrasando sempre parole di Google (facciamo di chi lavora per Google, che altrimenti qui si antropomorfizza un po’ troppo sto’ fatto) esso permette di cercare cose, persone, luoghi di cui Google è a conoscenza e ricevere immediatamente informazioni rilevanti relazionate alla query.

Google inizia a ragionare un p9788887319163o’ di più come noi, come quella che parrebbe essere l’unica (ci riserviamo dubbi) specie simbolica (come direbbe Terrence William Deacon).

Vi piazzo pure la foto copertina del libro di Deacon perché si tratta di un grande libro.

E pure una citazione per incuriosire chi non l’ha letto già:

 

“The structure of the whole system has a definite semantic topology that determines the ways symbols modify each other’s referential functions in different combinations”.

Insomma si tratta del primo passo verso la prossima generazione di intelligenza artificiale dietro i motori di ricerca e non solo.

Ricordate. Cose, non stringhe di parole.

Ciro Bocchetti

Napoli: 5/2/1985 - Digital Marketing Specialist, Social Media Manager Laurea magistrale in Linguistica e traduzione specialistica - Inglese/Spagnolo

5 thoughts to “Hummingbird: un Google semantico”

  1. Post Interessante Ciro!
    Che direzione sta prendendo Google secondo te con i suoi continui cambi di algortimo? Come vedi il futuro della SEO?

    A presto

    1. Ciao Giulio. Come vale praticamente per qusi tutti quelli che lavorano nel nostro ambito, Google questo 1 agosto mi ha lasciato abbastanza a bocca aperta.
      Per non parlare del fatto che mi ha un po’ rovinato le vacanze 🙂
      Detto ciò, credo che numerosi cambi di algoritmo non possono essere altro che indice di cambiamento. E ho imparato con l’esperienza che il cambiamento è sempre un fatto positivo. C’è un’altra cosa che però il cambiamento implica. Ed è una selezione: chi si evolve, si adatta, si reinventa, rimette in gioco tutto, va avanti. Gli altri restano indietro. Non condanno chi ha paura dei cambiamenti, semplicemente credo che sia così. Ti ringrazio per aver letto il mio post e sono felice che tu lo abbia trovato stimolante. Io il futuro della SEO lo vedo molto legato alla progettazione dell’esperienza utente, ai dati di permanenza sul sito web (comportamento incluso, pensa alle mappe di calore) e alla capacità di mostrare chiaramente tutto ciò che di importante c’è nel nostro sito a mister G. Magari tramite una pertinente compilazione di microdati. Tu che ne pensi?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *