RankBrain

RankBrain ( o Rank Brain ) è un algoritmo di Google. E' un sistema di intelligenza artificiale utilizzato dal motore di ricerca Google per interpretare il significato di una query a monte ed elaborare i risultati di ricerca a valle.

Qual è la funzione di RankBrain

E' impiegato per ordinare le pagine estratte dal processo di selezione, a seguito di una query da parte dell'utente, escludendo quelle che contengono parole non direttamente collegate con il campo semantico della query dell'utente.

Attualmente RankBrain è un elemento integrante dell'algoritmo Hummingbird dentro il search engine di Mountain View. Non sostituisce Hummingbird ma è solo un componente aggiuntivo.

Come funziona RankBrain

Probabilmente l'algoritmo si avvale di un algoritmo di stemming e di una lista di parole, sinonimi, le similitudini e connessioni a concetti, in gran parte elaborati dal knowledge graph o da altri basi di conoscenza, nonché dal machine learning e dal lavoro umano di programmazione.

Le parole di un vocabolario sono interconnesse tra loro tramite relazioni matematica, formando così dei vettori.

Esempio. Scrivendo la query A, il motore di ricerca restituisce la pagina dei risultati X. La stessa Serp è il risultato della query B. Quindi, il motore di ricerca considera simili le due query A e B, elaborandole allo stesso modo. Un algoritmo del motore di ricerca ha individuato la relazione tra le due query, nonostante utilizzino una forma e parole differenti.
esempio di query con RankBrain

Una stessa parola può appartenere a diversi vettori ed essere collegata a concetti differenti.

Esempio. Il termine "apple" può essere collegato al frutto ma anche alla marca produttrice dei computer, tablet e smartphone.

Nel processo di machine learning RankBrain apprende le nuove informazioni tramite processo offline. Analizza le query storiche su particolari argomenti per cercare di risalire al reale bisogno informativo dell'utente.

Nota. Secondo un'intervista rilasciata da Google su Bloomberg nel 2015, RankBrain è il terzo elemento di ranking per importanza nel motore di ricerca Google. Non sono noti il primo e secondo, ma si pensa si tratti dei backlink ( pagerank ) e delle parole nel contenuto della pagina ( semantica ).
http://www.bloomberg.com/news/articles/2015-10-26/google-turning-its-lucrative-web-search-over-to-ai-machines

E' molto probabile che RankBrain non si limiti soltanto a interpretare le query e filtrare i risultati di ricerca, ma contribuisca anche al computo del ranking insieme agli altri fattori del search engine.

Probabilmente, l'algoritmo è utilizzato per controllare la qualità contenutistica delle pagine web e attribuire loro un punteggio ( score ).

RankBrain perfeziona Hummingbird

RankBrain usa l'intelligenza artificiale per trasformare le informazioni in vettori ed entità matematiche.

Se su una parola o una frase la macchina non ha familiarità, può fare un'ipotesi sul loro significato, filitrare i risultati e imparare dall'esperienza.

Esempio. Digitando una combinazione inusuale di parole chiave, si può vedere quest'algoritmo in azione. Quando Google non conosce le relazioni tra i termini di una query e le entità, non riesce a dedurre il contesto e il significato delle cose. Non può capire quali risultati sono rilevanti e quali no per l'utente.

Quando si digita una singola parola nel campo di ricerca, il search engine di Mountain View mostra dei suggerimenti di autocompilazione tramite la funzione Google Suggestion. Queste informazioni provengono dalla base di conoscenza del motore di ricerca e dall'auto-apprendimento passato.

esempio di autocompilazione

Aggiungendo una parola inusuale, la coppia di keyword confonde il search engine. L'autocompilazione della query cambia radicalmente. In questi casi entra in gioco l'algoritmo RankBrain.

L'algoritmo comincia con l'escludere alcune entità, quelle in cui la coppia di termini è poco probabile, per concentrarsi sulle altre entità rimanenti ed espande il loro campo semantico.

esempio di risposta

Nei risultati sono mostrate risorse provenienti da pertinenze differenti. Questo però è utile al search engine per capire qual è il risultato rilevante per l'utente, il suo reale intento e inserire questo dato nella sua memoria.

Nota. Non avendo informazioni dalla knowledge base, l'algoritmo RankBrain dovrebbe prendere in considerazione soprattutto la risposta degli utenti, analizza le loro scelte e impara dall'esperienza.

Nel corso del tempo il search engine impara a rispondere alle query ( auto-apprendimento ) anche se inizialmente non conosce nulla o quasi sulla relazione tra le cose ( entità ) e sull'intenzione dell'utente.

Nell'esempio precedente il primo risultato mostra l'associazione della keyword "imbuto" con l'energia chimica delle proteine. Si tratta però di una metafora. E' invece molto probabile che nel corso del tempo si rafforzi la relazione con l'energia eolica.

esempio di apprendimento

Da un lato questi risultati saranno più cliccati dagli utenti che cercano "imbuto+energia". Dall'altro, trattandosi di una nuova tecnologia, aumenteranno i documenti che contengono i due termini dentro lo stesso campo semantico ( eolico ).

Una soluzione alle query complesse. Questo algoritmo dovrebbe risolvere il problema della query complesse dell'algoritmo Hummingbird. RankBrain dovrebbe perfezionare i risultati nelle Serp.


 
Segnalami un errore, un refuso o un suggerimento per migliorare gli appunti

Bibliografia e link utili

  1. Word2Vec: Tool di Google sull'elaborazione, la rappresentazione e la distribuzione delle parole
    https://code.google.com/p/word2vec/
  2. Distributed Representations of Words and Phrases and their Compositionality
    http://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf
FacebookTwitterLinkedinLinkedin
knowledge base

Libri di approfondimento
  1. Gli algoritmi di Google
  2. Google Penguin
  3. RankBrain