Come funzionano i motori di ricerca? Guida alla comprensione degli algoritmi dei motori di ricerca

Condividi questo articolo:


I motori di ricerca sono il vostro portale per internet. Prendono una massa di informazioni su un sito web, le analizzano e decidono come rispondere a una specifica domanda. Ma con così tanti dati da vagliare, come funzionano effettivamente i motori di ricerca?

Per scoprire, classificare e classificare i miliardi di siti web che compongono internet, i motori di ricerca utilizzano sofisticati algoritmi che prendono decisioni sulla qualità e la rilevanza di qualsiasi pagina. Si tratta di un processo complesso che coinvolge quantità significative di dati, che devono essere presentati in un modo che sia facile da digerire per gli utenti finali.

I motori di ricerca analizzano tutte queste informazioni esaminando numerosi fattori di ranking diversi in base alla domanda di un utente. Ciò include la rilevanza della domanda che l’utente ha digitato, la qualità del contenuto, la velocità del sito, i metadati e altro ancora. Ogni punto di dati viene combinato per aiutare i motori di ricerca a calcolare la qualità complessiva di qualsiasi pagina. Il sito web viene quindi classificato in base ai loro calcoli e presentato all’utente.

La comprensione dei processi dietro le quinte che si svolgono per le decisioni dei motori di ricerca non solo aiuta a capire perché alcuni contenuti si classificano bene, ma aiuta anche a creare nuovi contenuti con il potenziale di classificarsi più in alto.

Diamo un’occhiata alle procedure generali su cui è costruito ogni algoritmo dei motori di ricerca, e poi analizziamo le quattro piattaforme principali per vedere come lo fanno.

Come funzionano i motori di ricerca?

Per essere efficaci, i motori di ricerca devono capire esattamente che tipo di informazioni sono disponibili e presentarle agli utenti in modo logico. Il modo in cui lo fanno è attraverso tre azioni fondamentali: il crawling, l’indicizzazione e il ranking.

Attraverso queste azioni, scoprono i contenuti appena pubblicati, memorizzano le informazioni sui loro server e le organizzano per il vostro consumo. Analizziamo cosa succede durante ognuna di queste azioni:

  • Crawl: I motori di ricerca inviano dei web crawler, noti anche come bot o spider, per rivedere i contenuti del sito web. Prestando molta attenzione ai nuovi siti web e ai contenuti esistenti che sono stati modificati di recente, i web crawler esaminano dati come URL, sitemaps e codice per scoprire i tipi di contenuti visualizzati.
  • Indice: Una volta che un sito web è stato sottoposto a scansione, i motori di ricerca devono decidere come organizzare le informazioni. Il processo di indicizzazione avviene quando esaminano i dati del sito web alla ricerca di segnali di posizionamento positivi o negativi e li memorizzano nella posizione corretta sui loro server.
  • Classifica: Durante il processo di indicizzazione, i motori di ricerca iniziano a decidere dove visualizzare contenuti specifici sulla pagina dei risultati dei motori di ricerca (SERP). La classificazione viene effettuata valutando una serie di fattori diversi in base alla richiesta di qualità e rilevanza da parte dell’utente finale.

Durante questo processo vengono prese decisioni per determinare il valore che qualsiasi sito web può potenzialmente fornire all’utente finale. Queste decisioni sono guidate da un algoritmo. Capire come funziona un algoritmo aiuta a creare contenuti che si classificano meglio per ogni piattaforma.

Che si tratti di RankBrain per Google e YouTube, Space Partition Tree And Graph (SPTAG) per Bing, o di un codice proprietario per DuckDuckGo, ogni piattaforma utilizza una serie unica di fattori di ranking per determinare dove i siti web rientrano nei risultati di ricerca. Se si tiene conto di questi fattori mentre si creano i contenuti per il proprio sito web, è più facile adattare le pagine specifiche per ottenere un buon posizionamento.

Algoritmi dei motori di ricerca per piattaforma

Ogni motore di ricerca fa emergere i risultati della ricerca in modo diverso. Daremo un’occhiata alle quattro principali piattaforme del mercato odierno e analizzeremo il modo in cui prendono le decisioni sulla qualità e la rilevanza dei contenuti.

Algoritmo di ricerca Google

Google è il motore di ricerca più popolare del pianeta. Il loro motore di ricerca possiede abitualmente oltre il 90% del mercato, con il risultato di circa 3,5 miliardi e mezzo di ricerche individuali sulla loro piattaforma ogni giorno. Pur essendo notoriamente a conoscenza del funzionamento del loro algoritmo, Googles fornisce un contesto di alto livello sul modo in cui danno priorità ai siti web nella pagina dei risultati.

Ogni giorno vengono creati nuovi siti web. Google può trovare queste pagine seguendo i link dei contenuti già esistenti che hanno cercato in precedenza, oppure quando il proprietario di un sito web invia direttamente la propria mappa del sito. Anche gli aggiornamenti dei contenuti esistenti possono essere inviati a Google chiedendo loro di eseguire nuovamente la scansione di un URL specifico. Ciò avviene tramite la console di ricerca di Google.

Sebbene Google non indichi la frequenza di scansione dei siti, qualsiasi nuovo contenuto collegato a contenuti esistenti verrà trovato alla fine.

Una volta che i web crawler raccolgono abbastanza informazioni, le riportano a Google per l’indicizzazione.

L’indicizzazione inizia con l’analisi dei dati del sito web, compresi i contenuti scritti, le immagini, i video e la struttura tecnica del sito. Google è alla ricerca di segnali di posizionamento positivi e negativi, come parole chiave e freschezza del sito web, per cercare di capire in cosa consiste ogni pagina che hanno cercato.

L’indice del sito web di Google contiene miliardi di pagine e 100.000.000.000 di gigabyte di dati. Per organizzare queste informazioni, Google utilizza un algoritmo di apprendimento automatico chiamato RankBrain e una base di conoscenza chiamata Knowledge Graph. Tutto ciò contribuisce ad aiutare Google a fornire agli utenti contenuti il più possibile rilevanti. Una volta completata l’indicizzazione, si passa all’azione di posizionamento.

Tutto ciò che avviene fino a questo punto viene fatto in background, prima che un utente interagisca con le funzionalità di ricerca di Google. Il ranking è l’azione che avviene in base a ciò che un utente sta cercando. Google considera cinque fattori principali quando qualcuno effettua una ricerca:

  • Query: Questo determina l’intento di qualsiasi domanda dell’utente finale. Google usa questo per determinare esattamente ciò che qualcuno sta cercando quando esegue una ricerca. Analizzano ogni domanda utilizzando modelli linguistici complessi, basati su ricerche e comportamenti d’uso precedenti.
  • Rilevanza della pagina web: Una volta che Google ha determinato l’intento della query di ricerca di un utente, esamina il contenuto delle pagine web di posizionamento per capire quale sia la più rilevante. Il driver principale per questo è l’analisi delle parole chiave. Le parole chiave di un sito web devono corrispondere alla comprensione di Google della domanda posta da un utente.
  • Qualità del contenuto: Con l’abbinamento delle parole chiave, Google fa un passo avanti e verifica la qualità dei contenuti delle pagine web richieste. Questo li aiuta a dare la priorità a quali risultati vengono prima di tutto esaminando l’autorevolezza di un determinato sito web, nonché il suo page rank e la sua freschezza.
  • Usabilità delle pagine web: Google dà priorità al ranking dei siti web facili da usare. L’usabilità copre tutto, dalla velocità del sito alla reattività.
  • Contesto e impostazioni aggiuntive: Questa fase consente di personalizzare la ricerca in base all’impegno degli utenti e alle impostazioni specifiche all’interno della piattaforma di Google.

Una volta che tutte queste informazioni sono state elaborate, Google fornirà risultati che assomigliano a questo:

Analizziamo questi risultati:

  • Interrogazione dell’utente: La domanda che un utente ha posto a Google.
  • Google shopping: Google considera l’intento di questa query come una persona alla ricerca di prodotti da acquistare. Di conseguenza, estraggono dal loro indice i prodotti che corrispondono a questo intento e li visualizzano per primi nei risultati.
  • Caratteristica snippet: Un risultato di Knowledge Graph. Google presenta informazioni specifiche da un risultato SERP per rendere più facile agli utenti la revisione senza lasciare la pagina dei risultati.
  • Risultati al primo posto: Il primo sito elencato nei risultati è quello che Google ritiene corrispondere meglio all’intento della query di un utente. Il risultato top-ranking è quello che funziona meglio, sulla base dei cinque fattori di ranking di cui abbiamo discusso in precedenza.
  • Correlate: Questo riquadro è un altro risultato del Knowledge Graph. Dà agli utenti un modo veloce per passare a un’altra ricerca che potrebbe corrispondere ancora meglio al loro intento.
    Questi risultati sono possibili solo perché Google ha le informazioni memorizzate su ciascuna di queste pagine nel suo indice. Prima che un utente effettui una ricerca, Google ha esaminato i siti web per capire per quali parole chiave e per quali intenti corrispondono. Questo processo consente di popolare rapidamente la pagina dei risultati quando viene effettuata una ricerca e aiuta Google a fornire i contenuti più rilevanti possibili.

Essendo il motore di ricerca più popolare in circolazione, Google ha più o meno costruito il quadro di riferimento per il modo in cui i motori di ricerca guardano ai contenuti. La maggior parte dei marketer adatta i propri contenuti in modo specifico al posizionamento su Google, il che significa che potenzialmente non sono presenti su altre piattaforme.

Algoritmo di ricerca Bing

Bing, il motore di ricerca proprietario di Microsoft, utilizza un algoritmo di ricerca vettoriale open-source chiamato Space Partition Tree And Graph (SPTAG) per far emergere i risultati. Questo significa che stanno andando in una direzione completamente diversa dalla ricerca basata sulle parole chiave di Google.

Essere open source significa che chiunque può guardare il codice dado e bullone di ciò che compone i risultati della ricerca di Bing e fare commenti. Questo modello aperto è antitetico allo stretto controllo di Google sui loro algoritmi. Il codice stesso è separato in due moduli separati: il costruttore dell’indice e il ricercatore:

  • Costruttore di indici: Il codice che funziona per categorizzare le informazioni del sito web in vettori
  • Cercatore: Il modo in cui Bing crea connessioni tra le query di ricerca e i vettori nel loro indice

 

La seconda grande differenza tra Bing e Google è al centro del modo in cui le informazioni vengono memorizzate e indicizzate. Invece di un modello a parole chiave, come Google, Bing scompone le informazioni in singoli punti di dati chiamati vettori. Un vettore è una rappresentazione numerica del concetto; questo concetto è la base della struttura di ricerca di Bing.

Le query di ricerca per Bing si basano su un principio algoritmico chiamato Approximate Nearest Neighbor, che utilizza modelli di apprendimento profondo e modelli in linguaggio naturale per fornire risultati più rapidi basati sulla vicinanza di determinati vettori tra loro.

Se consideriamo il punto giallo come una richiesta dell’utente, i punti verdi sono i primi vicini di chiusura, seguiti dai punti blu. Seguendo la freccia arancione, possiamo vedere come l’algoritmo di Bing decide quali informazioni sono più rilevanti per la ricerca dell’utente.

Mentre i principi alla base della struttura di ricerca di Bing sono fondamentalmente diversi, il processo di costruzione del loro database segue ancora le azioni di crawl, indice, rango.

Bing esegue il crawl dei siti web per trovare nuovi contenuti o aggiornamenti di quelli esistenti. Poi crea vettori per queste informazioni da memorizzare nel loro indice. Da lì, guardano a specifici fattori di ranking. La differenza maggiore rispetto a Google è che Bing non include pagine senza autorità di ranking, il che significa che le nuove pagine hanno un ranking più difficile se non hanno backlink a una pagina esistente con più autorità.

Per maggiori informazioni su come avviene il crawling e l’indicizzazione, consultate le linee guida per i webmaster di Bing. Questa pagina fornisce una panoramica sul tipo di informazioni che è più importante se si vuole stilare un ranking sulla loro piattaforma.

Se guardiamo alla stessa ricerca effettuata su Bing, i risultati sono diversi:

Mentre i risultati sembrano simili nella loro struttura, Bing sta attingendo da diversi siti web sia per i loro acquisti che per le loro selezioni di articoli. Anche il risultato al top della classifica è diverso dalla nostra ricerca su Google, anche se entrambi corrispondono abbastanza bene al nostro intento.

Se state pensando di creare contenuti su misura per Bing, dovreste iniziare a guardare le differenze tra i siti in cima alla classifica e i frammenti di funzionalità. La loro piattaforma dà priorità ai contenuti in modo diverso da Google, e queste distinzioni vi aiuteranno a capire il perché.

Algoritmo di ricerca DuckDuckGo

DuckDuckGo è un po’ anticonformista nel mercato dei motori di ricerca, ma sta guadagnando terreno come motore di ricerca per chiunque si preoccupi della privacy dei propri dati. Mentre hanno un web crawler proprietario chiamato DuckDuckBot per setacciare i contenuti delle pagine web, molte delle informazioni che DuckDuckGo mostra sulla loro pagina dei risultati sono compilate da più di 400 fonti di terze parti, tra cui Bing, Yahoo e Wikipedia.

A differenza di Google e Bing, DuckDuckGo non acquisisce informazioni personali sui propri utenti, compresa la cronologia delle ricerche passate e l’indirizzo IP. Questa dedizione alla privacy rende in qualche modo più difficile il lavoro del loro algoritmo per fornire risultati personalizzati.

Per una privacy ancora maggiore, DuckDuckGo può anche essere utilizzato per una navigazione completamente anonima utilizzando la rete Tor o un servizio onion.

Come risultato di questa attenzione alla privacy, DuckDuckGo ha la pagina dei risultati più semplificata finora.

Sia Bing che DuckDuckGo hanno lo stesso primo e secondo risultato, il che ha senso, considerando che Bing è incluso negli algoritmi di ricerca di DuckDuckGo.

Le 400 fonti aggiuntive di DuckDuckGo includono anche database computazionali come WolframAlpha, una piattaforma costruita principalmente per rispondere a complesse equazioni matematiche e fornire strumenti per l’analisi dei dati. Altre fonti sono disponibili sotto forma di Instant Answers, che estraggono contenuti da siti web rilevanti nel tentativo di fornire risposte on-page, come i frammenti di funzionalità che abbiamo visto da Google e Bing.

Algoritmo di ricerca di YouTube

YouTube è il sito di hosting video più popolare. Il loro motore di ricerca è efficacemente gestito da regole simili a quelle di Google, che possiede la piattaforma, e si concentra sulle parole chiave e sulla rilevanza. L’algoritmo è suddiviso in due funzioni distinte: la classificazione dei video nella ricerca e la pubblicazione di raccomandazioni pertinenti.

I motivi specifici per cui alcuni video hanno un ranking più alto di altri non sono, come tutte le proprietà di Google, definiti esternamente. Detto questo, la maggior parte delle interpretazioni tende a privilegiare la novità dei video e la frequenza di caricamento dei canali.

In termini di raccomandazioni, questo documento di ricerca del 2016 elenca le principali priorità per YouTube come scala, freschezza e rumore:

  • Scala: Ci sono 300 ore di video caricati su YouTube ogni minuto e la piattaforma ha circa 1,3 miliardi di utenti. Questo rende l’analisi delle informazioni molto più difficile, quindi l’obiettivo principale dell’algoritmo è quello di trovare il modo di vagliare questa quantità di dati utente per utente.
  • Freschezza: YouTube bilancia il modo in cui raccomandare i video in base a come è stato caricato recentemente un video e al comportamento passato del singolo utente.
  • Rumore: A causa della quantità variabile di contenuti che la maggior parte degli utenti guarda su YT, è difficile per qualsiasi IA analizzare ciò che è più rilevante in qualsiasi momento.
    Questi fattori danno luogo a una pagina di raccomandazioni personalizzata per ogni singolo account utente.

Questo mostra anche come l’abbonamento influisce sul modo in cui YouTube presenta i risultati. Quando un utente si iscrive a un particolare canale, questo aumenta il suo ranking nei risultati di ricerca, nelle raccomandazioni e in cosa guardare dopo.

Altri fattori di ranking includono ciò che un utente guarda, per quanto tempo si impegna con diversi video e qual è la popolarità complessiva di un video su YouTube.

Date un’occhiata alla pagina dei risultati per le “migliori cuffie wireless 2019”.

Il risultato principale è il video più visto del gruppo. Segue un upload più recente con meno visualizzazioni ma una corrispondenza esatta delle parole chiave. Il terzo video ha più visualizzazioni rispetto al secondo, ma nessuna corrispondenza esatta delle parole chiave – è anche un upload leggermente più vecchio.

Da questi risultati, comprendiamo che la popolarità è probabilmente uno dei maggiori fattori di ranking per YouTube, collocandosi anche al di sopra di un video più recente con una corrispondenza esatta delle parole chiave.

Per ottenere un buon posizionamento su YouTube, avrete bisogno di un profilo solido e di una cadenza di caricamento costante. La loro attenzione alla popolarità e alla forza del profilo richiede maggiori investimenti da parte dei marketer, ma ripaga i marchi che concentrano i loro sforzi sulla piattaforma.

Comprendere come funzionano i motori di ricerca aiuta a creare contenuti migliori

Quando si sa come le diverse piattaforme visualizzano i loro risultati, è più facile creare contenuti con il potenziale per classificarsi bene. Questa comprensione aiuta anche a diagnosticare perché altri tipi di contenuti si classificano meglio o peggio del proprio.

Ho messo insieme cinque suggerimenti basati su queste informazioni che possono aiutarvi a creare contenuti migliori su ogni piattaforma:

  • Comprendere l’intento dell’utente è importante. Ogni piattaforma che abbiamo esaminato oggi dà priorità ai contenuti in base alla loro rilevanza per la ricerca di un utente.
  • Le parole chiave corrispondenti vi porteranno solo fino ad un certo punto. Includere parole chiave pertinenti nei vostri contenuti aiuterà i motori di ricerca a scoprire e indicizzare i vostri contenuti più facilmente, ma un buon posizionamento è più importante per fornire valore agli utenti.
  • Conoscete il modo in cui i vostri clienti target cercano. L’abbinamento delle parole chiave e dell’intento richiede una comprensione approfondita dei vostri clienti e di come pensano al vostro prodotto e al vostro mercato.
  • I nuovi contenuti aiutano a migliorare il posizionamento. Creare nuovi contenuti o aggiornare i contenuti esistenti aiuta a migliorare il posizionamento e aumenta la vostra credibilità come marchio.
    Ottenere link autorevoli è utile. Più persone si collegano alla tua pagina, meglio apparirà ai motori di ricerca. Ciò indica che è prezioso e rilevante per il contenuto di ogni pagina a cui si collega.
  • Alla fine, tutto si riduce alla comprensione del cliente. Non puoi creare contenuti che si classificano bene se non sai cosa cercano le persone quando cercano il tuo prodotto.

Per ulteriori informazioni visita il sito: immagi.net

Condividi questo articolo: