In una sessione dell'orario d'ufficio SEO di Google, Duy Nguyen del team di qualità della ricerca di Google ha risposto a una domanda sui collegamenti nei siti di spam e su come la fiducia abbia qualcosa a che fare con ciò.
È stato interessante il modo in cui il Googler ha affermato di proteggere il segnale del testo di ancoraggio. Non è qualcosa di cui si discute comunemente.
Costruire la fiducia con Google è una considerazione importante per molti editori e SEO.
C'è un'idea che la "fiducia" aiuterà a ottenere un sito indicizzato e correttamente classificato.
È anche noto che non esiste una metrica di "fiducia", che a volte confonde alcuni nella comunità di ricerca.
Come può l'algoritmo fidarsi se non sta misurando qualcosa?
I googler in realtà non rispondono a questa domanda, ma ci sono brevetti e documenti di ricerca che danno un'idea.
Google non si fida dei link da siti di spam
La persona che ha presentato una domanda all'orario di ufficio SEO ha chiesto:
"Se un dominio viene penalizzato, ciò influisce sui collegamenti in uscita da esso?"
Il Googler, Duy Nguyen, ha risposto:
“Suppongo che con 'penalizzare' intendi che il dominio è stato degradato dai nostri algoritmi antispam o da azioni manuali.
In generale, sì, non ci fidiamo dei link di siti che sappiamo essere spam.
Questo ci aiuta a mantenere la qualità dei nostri segnali di ancoraggio”.
Fiducia e link
I googler parlano di fiducia ed è chiaro che stanno parlando dei loro algoritmi che si fidano di qualcosa o non si fidano di qualcosa.
In questo caso non si tratta di non contare i link che si trovano su siti di spam, in particolare si tratta di non contare il segnale del testo di ancoraggio.
La comunità SEO parla di "costruire fiducia", ma in questo caso si tratta davvero di non creare spam.
In che modo Google determina che un sito è spam?
Non tutti i siti sono penalizzati o ricevono un'azione manuale. Alcuni siti non sono nemmeno indicizzati e questo è il compito di Spam Brain di Google, una piattaforma AI che analizza le pagine web in diversi punti, a partire dal tempo di scansione.
La piattaforma spam brain funziona come:
- Guardiano dell'indicizzazione
Spam Brain blocca i siti durante la scansione, inclusi i contenuti scoperti tramite la console di ricerca e le mappe dei siti. - Dà la caccia allo spam indicizzato
Spam Brain rileva anche lo spam che è stato indicizzato nel momento in cui i siti vengono presi in considerazione per il ranking.
Il modo in cui funziona la piattaforma Spam Brain è che addestra un'intelligenza artificiale sulla conoscenza che Google ha dello spam.
Google ha commentato come funziona lo spam brain:
"Combinando la nostra profonda conoscenza dello spam con l'intelligenza artificiale, l'anno scorso siamo stati in grado di creare la nostra IA antispam che è incredibilmente efficace nel rilevare le tendenze dello spam sia note che nuove".
Non sappiamo di quale “conoscenza dello spam” parli Google, ma ci sono vari brevetti e documenti di ricerca a riguardo.
Coloro che vogliono approfondire questo argomento possono prendere in considerazione la lettura di un articolo che ho scritto sul concetto di algoritmi di classificazione della distanza dei collegamenti, un metodo per classificare i collegamenti.
Ho anche pubblicato un articolo completo su più documenti di ricerca che descrivono algoritmi relativi ai collegamenti che potrebbero descrivere cos'è l'algoritmo Penguin.
Sebbene molti dei brevetti e dei documenti di ricerca risalgano agli ultimi dieci anni circa, da allora non è stato pubblicato nient'altro da motori di ricerca e ricercatori universitari.
L'importanza di quei brevetti e documenti di ricerca è che è possibile che possano entrare nell'algoritmo di Google in una forma diversa, ad esempio per la formazione e l'intelligenza artificiale come Spam Brain.
Il brevetto discusso nell'articolo sulla classificazione della distanza dei collegamenti descrive come il metodo assegna punteggi di classificazione per le pagine in base alle distanze tra un insieme di "siti iniziali" affidabili e le pagine a cui si collegano. I seed site sono come punti di partenza per calcolare quali siti sono normali e quali no (ad es. spam).
L'intuizione è che più un sito è lontano da un sito seed, più è probabile che il sito possa essere considerato spam. Questa parte, sulla determinazione dello spam attraverso la distanza del collegamento, è discussa nei documenti di ricerca citati nell'articolo di Penguin a cui ho fatto riferimento in precedenza.
Il brevetto, (Producing a Ranking for Pages Using Distances in a Web-link Graph), spiega:
“Il sistema quindi assegna le lunghezze ai collegamenti in base alle proprietà dei collegamenti e alle proprietà delle pagine allegate ai collegamenti.
Il sistema calcola quindi le distanze più brevi dall'insieme di pagine iniziali a ciascuna pagina dell'insieme di pagine in base alla lunghezza dei collegamenti tra le pagine.
Successivamente, il sistema determina un punteggio di classificazione per ogni pagina nell'insieme di pagine in base alle distanze più brevi calcolate.
Grafico di collegamento ridotto
Lo stesso brevetto menziona anche quello che è noto come un grafico di collegamento ridotto.
Ma non è solo un brevetto che parla di grafici di collegamento ridotti. Anche i grafici dei collegamenti ridotti sono stati ricercati al di fuori di Google.
Un grafico di collegamento è come una mappa di Internet che viene creata mappando con i collegamenti.
In un grafico di collegamento ridotto vengono rimossi i collegamenti di bassa qualità e i siti associati.
Ciò che resta è quello che viene chiamato un grafico di collegamento ridotto.
Ecco una citazione dal brevetto di Google sopra citato:
“Un grafico di collegamento ridotto
Si noti che i collegamenti che partecipano ai k percorsi più brevi dai semi alle pagine costituiscono un sottografo che include tutti i collegamenti che sono classificati "a flusso" dai semi.
Sebbene questo sottografico includa molti meno link rispetto al link-graph originale, i k percorsi più brevi dai semi a ciascuna pagina in questo sottografico hanno le stesse lunghezze dei percorsi nel grafico originale.
…Inoltre, il flusso di rango verso ciascuna pagina può essere ricondotto ai k semi più vicini attraverso i percorsi in questo sottografico.”
Google non si fida dei link dei siti penalizzati
È una specie di cosa ovvia che Google non si fida dei link da siti web penalizzati.
Ma a volte non si sa se un sito è penalizzato o contrassegnato come spam da Spam Brain.
La ricerca per vedere se un sito potrebbe non essere attendibile è una buona idea prima di tentare di ottenere un collegamento da un sito.
A mio parere, le metriche di terze parti non dovrebbero essere utilizzate per prendere decisioni aziendali come questa perché i calcoli utilizzati per produrre un punteggio sono nascosti.
Se un sito è già collegato a siti potenzialmente spam che a loro volta hanno collegamenti in entrata da possibili collegamenti a pagamento come PBN (reti di blog privati), allora è probabilmente un sito spam.
Immagine in primo piano di Shutterstock/Krakenimages.com
Guarda l'orario d'ufficio SEO: