Google Hummingbird

Hummingbird è l'algoritmo semantico del motore di ricerca Google. Con l'introduzione di questo algoritmo nel 2013, la ricerca è passata dalle tradizionali stringhe ( string ) di lettere della query alle cose ( thing o entità ).

Come funziona Hummingbird

Uno dei punti di forza di questo algoritmo è la comprensione e l'elaborazione del linguaggio naturale ( NLP ). Si tratta di un notevole passo in avanti di Google nella ricerca semantica.

Cos'è la ricerca semantica? La ricerca semantica è un processo IR basato sul significato contestuale dei termini all'interno di una query o in un documento.

L'algoritmo analizza le co-occorrenze nei testi su un particolare argomento e le utilizza per migliorare il ranking sui documenti più a tema.

La ripetizione della singola keyword principale perde importanza. Non è più importante che un documento presenti al suo interno esattamente il termine digitato dall'utente nella query. Con Hummingbird ciò che conta è il contesto.

Nota. Grazie a questo algoritmo non è più necessario creare più pagine, ognuna per ogni sinonimo o variante della keyword. Ad esempio, scrivere "come fare un sito web" o "come realizzare un website" porta agli stessi risultati perché il significato è lo stesso.

Questo consente di far emergere i risultati più pertinenti e rilevanti, in quanto viene preso in considerazione il contesto dei termini e non più le singole keyword, senza distinguere tra sinonimi, genere delle parole (maschile o femminile), plurale o singolare, ecc.

L'utente non deve più districarsi nella digitazione della parola chiave esatta ( exact match keyword ). A partire da una stessa parola chiave l'algoritmo risale al suo significato primario o primitivo. Il che è un bel vantaggio.

In questo modo il search engine risale al reale bisogno informativo dell'utente che sta effettuando l'interrogazione, delimita il campo dei risultati ed esclude tutti i risultati non pertinenti.

I limiti della comprensione associativa. La ricerca semantica si basa su una comprensione associativa, sull'analisi delle co-occorrenze e delle corrispondenze. Tuttavia, non interpreta il reale significato di una frase, come farebbe un uomo. La macchina non riesce sempre a comprendere il messaggio o l'informazione. Ad esempio, non può capire le metafore o l'ironia.

Il problema delle query complesse

L'algoritmo Hummingbird ha migliorato le performance sulle query semplici, quelle in cui l'utente digita una domanda elementare.

Nel caso delle query complesse non è detto che porti a risultati altrettanto efficaci. Da questo punto di vista Hummingbird ha manifestato alcune debolezze.

Quando un utente digita una query complessa, sta cercando un singolo aspetto specifico del campo semantico di pertinenza. Il fatto di fornire risultati pertinenti con l'argomento non soddisfa l'utente, è necessario che le risposte siano anche rilevanti.

Può anche accadere che la conoscenza non sia ancora acquisita nella knowledge base del motore di ricerca.

In questi casi, il search engine non riesce a capire la query e l'intento dell'utente, ed è costretto a mostrare una panoramica di risultati differenti, tutti pertinenti ma forse non rilevanti per l'utente.

Per correggere questo handicap il motore di ricerca ha affiancato Hummingbird con altri algoritmi basati sul machine learning e l'intelligenza artificiale. Uno tra i più conosciuti è Rank-Brain.

 


 

Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. Gli algoritmi di Google
  2. Google Penguin
  3. RankBrain