PageRank e TrustRank

Nel capitolo 1 abbiamo sottolineato come il primo strumento di web marketing della storia (nonché elemento cardine del web stesso) sia stato il link ipertestuale fra un sito e l’altro. Non è un caso dunque se la link popularity, termine con il quale si indica l’insieme della quantità e della qualità dei link in ingresso a un sito, sia uno dei fattori determinanti per il posizionamento naturale nei motori di ricerca, ed elemento decisivo nel algoritmo di Google; si calcola che conti per circa il 25% (vedi fig. 11). Questa importanza deriva dal fatto che si tratta di un attributo molto importante per valutare se una pagina web può essere veramente significativa, perché è un indice del suo valore; la logica sottostante è che se una pagina riceve molti link da siti con una certa importanza, significa verosimilmente che essa contiene qualcosa che ha meritato quei link. Anche gli altri motori di ricerca si sono lentamente adeguati a questo metodo e da anni hanno adottato algoritmi di ranking che tengono conto della link popularity, anche se ad essa viene dato un peso meno rilevante. Essendo Google il motore di ricerca leader, il suo sistema riamane però quello di riferimento, ed ogni innovazione nel calcolo del PR da parte di Google finisce per essere uno standard adottato successivamente dagli altri.

Va detto che l’importanza della link popularity nell’algoritmo di ranking è stata probabilmente la principale ragione del successo di Google. Prima del suo impiego gli algoritmi erano basati esclusivamente su fattori on-page, vale a dire sul contenuto testuale delle pagine web e sugli elementi del codice html in cui erano scritte; i risultati però non erano soddisfacenti, perché in questo modo potevano comparire ai primi posti link di nessun interesse particolare a discapito di altri molto più rilevanti. Chi ha usato i motori di ricerca sino alla fine degli anni ’90 si ricorderà anche che cercando nomi o marchi famosi in più di un caso si trovavano pagine non ufficiali, che a vario titolo si riferivano a questa o quella persona o azienda. Per esempio, se in un sito qualunque il webmaster descriveva in modo dettagliato la sua collezione di dischi, ciò poteva essere sufficiente per figurare al primo posto assoluto cercando i nomi delle canzoni, davanti ai siti ufficiali di cantanti, gruppi ed etichette discografiche. Questa situazione aveva motivazioni puramente matematiche, in quanto gli algoritmi per stabilire il ranking calcolavano solo la frequenza delle parole chiave ricorrenti nelle pagine dei siti indicizzati. L’intuizione dei creatori di Google, Brin e Page, fu quella di inserire nell’algoritmo una variabile che tenesse conto di quanto credito ha nel web ciascuna pagina, tramite il calcolo della sua popolarità. Per misurare questo credito l’algoritmo di Google prende in considerazione i link in ingresso a ogni pagina indicizzata (detti backlink); ogni backlink ricevuto da una pagina web fa aumentare il suo credito, ma a contare sono soprattutto i link provenienti da pagine che a loro volta hanno grande popolarità. Per il computo contano dunque sia la quantità, sia la qualità dei backlink: un link proveniente da un sito con poca popolarità pesa meno nell’algoritmo rispetto a un link proveniente da un sito con molta popolarità. La link popularity viene riassunta da Google in un numero che varia da zero a dieci, chiamato PageRank (PR), calcolato con una complessa formula, qui rappresentata nel dettaglio:

PR[A] = valore di PageRank attribuito alla pagina A
T1…Tn = pagine che contengono almeno un link verso A
PR[T1] … PR[Tn] = valori di PageRank delle pagine T1 … Tn
C[T1] … C[Tn] = numero di link contenuti nelle pagine T1 … Tn
d = fattore di damping che dipende da parametri non divulgati da Google

Si noti che esiste un fattore (d) che dipende da parametri che non sono stati resi noti da Google, ed è questa la componente segreta dell’algoritmo. La maggior parte delle pagine web indicizzate da Google ha un valore di PR fra il 3 e il 5; al di sotto di questa soglia si trovano pagine che hanno problemi di link popularity e in ottica di web marketing hanno sicuramente bisogno di aumentarla. Al contrario un PR fra il 6 e il 7 è sopra la media e può considerarsi ottimo, mentre l’élite si trova dall’8 al 10. Attualmente fra i siti con PR10 ci sono, oltre ovviamente a Google, i siti dei governi di Stati Uniti, Cina e India, la CNN, il W3C, e la pagina di download di Adobe Flash player. La scala non è lineare, bensì esponenziale, per cui il lavoro necessario per passare da PR5 a PR6 sarà maggiore di quello richiesto per passare da PR4 a PR5, e così via. Conoscere il reale PageRank di una determinata pagina web non è facile, perché il valore fornito da Google non è quello reale che viene calcolato nell’algoritmo, ma si riferisce piuttosto a un valore passato e non aggiornato. Si può comunque avere un’approssimazione del PR installando nel browser la Google toolbar (una barra degli strumenti aggiuntiva) che contiene un indicatore del valore del PR di ciascuna pagina visualizzata. In alternativa si può inserire l’URL della pagina in uno dei molti siti che offrono il calcolo del PageRank, facilmente reperibili nel web. Google non fornisce il valore reale del PR per disincentivare la compravendita di link fra i proprietari di siti con PR alto e webmaster in cerca di aumentare un PR deficitario. Ciò che Google stigmatizza non è la monetizzazione del PageRank acquisito, bensì la sua acquisizione da parte di chi non se l’è guadagnato per meriti sul campo ma se lo compra “già fatto e finito”. La compravendita di link è esplicitamente vietata da Google, pena l’esclusione dal suo indice, poiché essa rischia di alterare la significatività della link popularity e in ultima analisi la bontà dei risultati che verrebbero influenzati dalla disponibilità economica dei webmaster. Dopotutto, chi ha un budget da spendere per aumentare la visibilità in Google può sempre rivolgersi al servizio Adwords e comparire con un link sponsorizzato, come vedremo nel prossimo capitolo.
Nel corso degli anni gli esperti di SEO hanno sviluppato altre tecniche, anche sofisticate, per creare backlink. Molti hanno sviluppato reti di link fra siti web con l’unico scopo di distribuire la popularity fra di loro. I più abili sono riusciti a far salire il PR dei loro siti, a tal punto che Google ha dovuto rendere ancora più complesso l’algoritmo, riducendo l’importanza della link popularity e introducendo altri fattori ancora più difficilmente alterabili dai webmaster. In particolare, hanno perso peso i backlink provenienti da pagine web che non sono correlate. A partire dal 2005 il peso del PageRank nell’algoritmo di Google ha cominciato a calare, a beneficio di un altro fattore, detto TrustRank (TR), che lo incorpora in parte ma è influenzato da fattori di altro tipo. Ovviamente, anche del TrustRank non sono stati divulgati ufficialmente i dettagli, ma il nome stesso indica che esso attribuisce valore alla “credibilità” di un sito: il nuovo algoritmo tende a privilegiare quei siti di cui ci si può fidare perché non utilizzano spam o altre tecniche proibite da Google. Gli esperti sono concordi nel ritenere che con il TrustRank sia stata introdotta una sensibilità maggiore verso i seguenti fattori:

• Anzianità del dominio
• Originalità e aggiornamento dei contenuti
• Attinenza del tema fra sito che mette il link e sito che lo riceve

L’anzianità del dominio è un indice immediato di affidabilità, perché Google nel corso del tempo ha archiviato informazioni relative a tutti i domini che ha indicizzato, registrando lo storico delle infrazioni alle proprie linee guida. L’anzianità indica inoltre che l’attività collegata a un sito è un’attività prolungata e continuativa, e anche questo costituisce un fattore di credibilità. Un dominio nuovo di zecca avrà invariabilmente TR=zero, e dovrà cominciare a “guadagnarsi” la fiducia di Google inizialmente attraverso la link popularity. La crescita dei link dovrà essere graduale, con un tasso di crescita che Google ritiene naturale e non artificioso a seguito di compravendita di link o altri sistemi proibiti. Peraltro, neppure un dominio utilizzato regolarmente da molti anni è garanzia di TrustRank elevato, se mancano gli altri fattori principali. Originalità e aggiornamento dei contenuti sono considerati importanti da Google perché indicano un’utilità di un sito web. Questi parametri però vanno interpretati nel modo corretto. Aggiornamento non significa pubblicazione continua di notizie aggiornate, bensì arricchimento progressivo dei contenuti di un sito. In questo senso, anche un sito di storia antica può essere aggiornato, se ad esempio vengono pubblicati nuovi studi e contributi dei visitatori. Per quanto riguarda l’originalità, essa non risponde a fattori semantici, non essendo possibile per un software l’interpretazione del significati dei testi contenuti nelle pagine web; questa eventualità, alla base del cosiddetto web semantico, è al momento solo futuribile e sarà la base di quello che viene chiamato web 3.0, che forse potrà essere utilizzato dai nostri nipoti. Per originalità Google intende piuttosto la pubblicazione di contenuti inediti per il web, non aggiunti con un copia/incolla di testi che circolano nel web. Questo fattore è direttamente collegato al terzo, l’attinenza dei backlink; se essi provengono da pagine web che trattano a grandi linee dello stesso tema della pagina che lo riceve, il PR trasmesso sarà maggiore rispetto al caso in cui non vi sia corrispondenza tematica. Se nel backlink sono contenute delle parole chiave (il cosiddetto anchor text), e queste si trovano anche nella pagina che riceve il link, queste parole chiave verranno considerate come caratterizzanti il tema di questa pagina. Come si è detto, l’innovazione rispetto al PageRank va verso la disincentivazione della creazione di link artificiali fra siti che non hanno molto da spartire; il principio è quello di privilegiare link utili per gli utenti, fra siti che si citano creando un ipertesto logico e coerente. Il classico esempio è quello di un blog, in cui l’autore parla di un determinato argomento mostrandosi d’accordo o meno con l’opinione espressa da un altro blogger. Google tende insomma ad incentivare forme di relazione fra siti web che migliorano l’user experience, visto che la citazione mediante link è consuetudine che rende ricca ed esauriente la lettura da parte dei navigatori che possono seguire i link ipertestuali per approfondire il tema trattato. Come si vede, se il PageRank esprimeva esclusivamente la popolarità il TrustRank contempla anche fattori legati ai contenuti dei siti indicizzati.

Molti esperti di SEO hanno quasi totalmente abbandonato il PR come metro di valutazione del posizionamento dei siti, mentre altri lo ritengono ancora un indice importante. Visto che comunque anche il TrustRank tiene conto della link popularity, consigliamo di puntare alla massimizzazione di entrambi, cosa che va di pari passo purché si eviti di fare attività di PR “vecchio stile” comprando o scambiando link e cercando di ottenere backlink da chiunque. Ciò si riflette nella strategia da adottare per ottenere un buon posizionamento; se fino a qualche anno fa poteva bastare qualche scambio di link e l’inserimento nella Open Directory (DMOZ), adesso non è più sufficiente. Si deve fare in modo che un sito diventi realmente popolare in rete e che guadagni credito ricevendo spontaneamente link da altri siti. La via maestra verso il miglioramento del posizionamento naturale è dunque quella che passa attraverso la pubblicazione di contenuti e risorse originali, aggiornate e utili per i navigatori. Chiaramente si tratta di una strada percorribile con facilità solo da determinati tipi di sito web, in particolare i siti di informazione, i portali orizzontali e verticali, i social network più frequentati, i blog più influenti e tutti quei siti di interesse generale o particolare che per loro natura sono ricchi di contenuti e al tempo stesso attirano backlink. Del novero fanno parte anche i siti web delle grandi aziende che operano nel settore del largo consumo, che vedono riflessa in rete la popolarità consolidata nel mondo off-line; la cosa non vale purtroppo per molti dei siti delle aziende medio-piccole allorquando non sono popolari e conosciute dal grande pubblico, non sviluppano grandi quantità di materiale informativo e non possiedono un dominio da molti anni. Vi sono comunque delle liete eccezioni, frutto di un buon lavoro oppure di cause accidentali. Talvolta si riscontra un discreto valore di TrustRank che deriva da una certa anzianità del sito, registrato in modo lungimirante in tempi in cui la cosa veniva ritenuta inutile da molti imprenditori, anche illustri. Altre volte il TR è buono grazie a un certo dinamismo nel cogliere le opportunità del web, come la segnalazione del sito aziendale in directory di settore, portali verticali, siti di camere di commercio o associazioni di categoria. In taluni casi si hanno buoni valori di TR semplicemente grazie alla solerzia di qualche dipendente che ha provveduto in passato alla segnalazione del sito aziendale a molti siti con buona link popularity. Rari, ma significativi, i casi di piccoli imprenditori che si sono cimentati direttamente nella scrittura di un blog o hanno affidato la cosa a collaboratori. Queste eccezioni confermano però la regola fatta di siti web aziendali che totalizzano valori di TrustRank sotto la media, specchio di una presenza in Internet non pianificata secondi i dettami della SEO. Come rimediare? L’incremento del TrustRank di un sito web può avvenire innanzitutto tramite la crescita dei backlink possibilmente da siti tematici, e ciò si ottenere nei seguenti modi:

1. Spontaneamente, quando un sito è talmente interessante o utile agli occhi di altri webmaster che perciò inseriscono un link ad esso nel loro sito web.

2. Spontaneamente o su segnalazione del webmaster, quando il link è inserito in un sito che ha una relazione funzionale con un altro; p. es. un sito di un campeggio linkato da un sito della locale azienda di promozione turistica.

3. Su segnalazione del webmaster a portali verticali di settore.

4. Su segnalazione del webmaster che cerca di destare interesse in altri webmaster verso il proprio sito e ottenere così un link.

5. Su segnalazione del webmaster a directory e altri elenchi di siti

6. Su segnalazione del webmaster che contatta un altro webmaster per effettuare uno scambio di link

Lo scambio di link ha perso di efficacia rispetto al passato, essendo basato su accordi bilaterali fra webmaster a caccia di link, e non sulla reale utilità per il visitatore delle pagine linkate. Abbiamo incluso ugualmente questo punto 6 perché ha una certa utilità quando si parte da zero. Anche le directory e gli altri tipi di elenchi di siti sono considerati poco influenti nel calcolo del TrustRank; questo a causa della loro progressiva perdita di importanza come strumenti di orientamento dei navigatori, con un conseguente calo di visitatori. I primi quattro metodi sono invece quelli più premianti, perché producono link a tema, frutto di una reale relazione fra i due siti coinvolti. Dal momento che il primo caso non implica generalmente l’intervento del webmaster, sono i metodi 2. 3. e 4. che devono costituire il fulcro dell’attività della costruzione del TrustRank. Suggeriamo di cominciare a verificare quali sono tutti i possibili link ottenibili col metodo 2, contattando se necessario fornitori, partner, sponsor, consorzi, istituzioni, enti, associazioni di categoria in modo da assicurarsi che essi inseriscano nei loro siti un link al nostro; è importante controllare che le pagina di questi siti che pubblicano il link siano effettivamente raggiungibili dagli spider di Google e degli altri motori di ricerca, e correttamente indicizzate, altrimenti non si avrà alcun beneficio. Lo stesso vale per i portali verticali del settore in cui si opera, con la differenza che spesso essi prevedono un canone per l’inserimento del link; a maggior ragione quindi, essendo questo backlink un costo, andrà verificato che la pagina che lo ospita sia a sua volta indicizzata da Google e quindi il backlink venga effettivamente rilevato. Questo tipo di link a pagamento non va confuso con quello offerto dai siti che offrono link con PR elevato esclusivamente in funzione del posizionamento; la richiesta di canone o pagamento una tantum fatta da un sito che offre valore in sé, come appunto sono i portali verticali, è invece una forma perfettamente accettata da Google. Una volta esaurite le possibilità di ottenere link da queste due vie, è il momento di agire con il metodo 3, cominciare a rimboccarsi le maniche e intraprendere il lungo lavoro di individuazione prima, e segnalazione poi, di tutti quei siti che a qualsiasi titolo potrebbero inserire un link al nostro. Va da sé che se il nostro sito non ha contenuti interessanti, non fornisce servizi utili, non è insomma in grado di fornire qualcosa di valido, difficilmente l’intenso lavoro necessario per procurarsi link non spontanei verrà premiato.
Una soluzione interessante per abbinare la crescita dei backlink a quella dei contenuti indicizzabili, altro fattore decisivo per il TrustRank, può essere quella del blog aziendale. Come vedremo nel capitolo 7 il blog, se ben fatto e gestito, può essere un formidabile strumento di marketing di per sé; esso però è secondariamente anche uno strumento di search marketing perché è per sua natura strutturato in modo ideale per l’indicizzazione, specialmente se realizzato su piattaforme adeguate e seguendo alcuni accorgimenti in fase di progettazione. Diversamente dal mini-sito menzionato prima, il corporate blog deve avere contenuti originali ed essere aggiornato con frequenza, e proprio per queste sue caratteristiche è uno strumento che richiede un impiego di risorse molto ingente. Favorite in tal senso sono quelle aziende e organizzazioni che possiedono un ufficio stampa e/o marketing che può produrre contenuti a getto continuo. In special modo nel mercato degli Stati Uniti esistono siti specializzati che offrono un servizio di diffusione degli articoli in una moltitudine di siti che pubblicano questo tipo di materiale, come vedremo nel capitolo 7 a proposito delle PR online. La produzione di comunicati stampa destinati alla diffusione in rete, definita article marketing, è però uno strumento a doppio taglio, perché se si pubblicano nel sito o nel blog aziendale comunicati stampa che vengono anche diffusi in rete, vi è la possibilità che questi vengano ripubblicati in siti con TrustRank più elevato, posizionandosi al posto del nostro sito. I motori di ricerca sono infatti dotati di un filtro che individua quando un identico testo è pubblicato in vari siti, e premiano quello pubblicato nella pagina con TrustRank migliore. Inoltre, se il comunicato contiene un link alla fonte (quindi al nostro sito), anche se avrà molta diffusione in rete verrà conteggiato da Google un solo backlink. Peraltro, può essere sufficiente modificare leggermente il testo dell’articolo per aggirare l’ostacolo del filtro anti-duplicazione. Va inoltre prestata attenzione a quali siti si scelgono come destinazione dei nostri articoli, perché in taluni casi si tratta di veri e propri siti di spam di nessun valore e i link può divenire controproducente. Questa situazione si verifica spesso nel mercato italiano, in la maggior parte dei siti che ripubblica gli articoli lo fa a titolo gratuito; non stupisce quindi che molti immettano articoli privi di interesse nella speranza di ottenere backlink con poca fatica, e così facendo il sito che ripubblica gli articoli perde di valore. L’article marketing può risultare utile per l’indicizzazione in Google News, il motore di ricerca che indicizza le notizie pubblicate in rete. Siccome da quando è stata introdotta l’universal search alcuni dei risultati di Google News vengono inclusi nelle pagine dei risultati principali di Google, può essere utile segnalare i nostri articoli ai siti di informazione indicizzati da Google News. L’universal search, consiste nell’integrazione dei risultati naturali di Google con link a news, video, immagini, e altre risorse ritenute interessanti a seconda delle parole chiave immesse dagli utenti. Questa evoluzione segnala l’importanza di presidiare la visibilità in rete non solo tramite il proprio sito web, ma anche attraverso la produzione di notizie, materiale multimediale, e tutto quanto rientra nell’universal search; da questo punto di vista è bene stabilire una presenza aziendale in un sito come YouTube, che essendo di proprietà di Google è la sorgente principale dei video inseriti nei risultati naturali; vedremo fra l’altro nel capitolo 7, dedicato al web 2.0, che i video possono essere uno strumento di relazioni pubbliche molto potente. L’aspetto più importante dell’universal search per quanto riguarda le piccole e medie imprese è però senza dubbio Google Local Business. Quando viene effettuata una ricerca che riguarda un business a carattere locale viene visualizzata la voce “Risultati di esercizi commerciali locali” che contiene un elenco di link ad aziende, negozi, artigiani, professionisti presenti nella zona specificata dall’utente; gli stessi sono segnalati anche all’interno della Google Map corrispondente alla località indicata (vedi fig 12).

Fig. 12 – I risultati di Google Maps associati a ricerche localizzate

Questo tipo di link precede i risultati naturali ed è distinto da essi, perchè deriva da un database separato che contiene le attività commerciali che sono state segnalate a Google tramite il Business Center di Google Maps (attualmente reperibile all’indirizzo google.it/local/add). Si noti che è possibile iscriversi anche se non si possiede un sito web, utilizzando una pagina web apposita fornita gratuitamente da Google. Limitatamente all’Italia, questo database oltre alle attività commerciali segnalate contiene anche quelle presenti nelle Pagine Gialle online (grazie a un accordo fra Google e Seat). Com’è intuibile, i criteri di ranking di questo sottoinsieme di link non sono stati resi noti da Google, ma sicuramente dipendono da fattori come la vicinanza alla località specificata e la presenza di parole chiave nella descrizione che si inserisce all’atto dell’iscrizione. È evidente che la visibilità tramite Google Maps è particolarmente indicata per quelle piccole imprese che hanno un bacino d’utenza locale, oppure che vengono associate a una località, come le aziende del settore turistico.
In conclusione, riepiloghiamo i concetti fondamentali della SEO. I fattori decisivi per migliorare il posizionamento naturale sono un misto di criteri interni ed esterni al sito, e per ottenere una buona visibilità i fattori principali da considerare sono:

• Indicizzazione: Struttura del sito web semplice e codice leggibile dai motori di ricerca

• Ottimizzazione: Opportuno bilanciamento delle parole chiave in testi, dominio, url, codice

• Contenuti: Originalità, aggiornamento, quantità e qualità

• PageRank: Quantità, qualità e tematizzazione dei link in ingresso

• TrustRank: Combinazione dei fattori precedenti unita all’anzianità del dominio

Un sito che non beneficia di una progettazione adeguata, o quantomeno di un intervento SEO successivo può rimanere sepolto nei risultati anche per parole chiave importanti. Eseguire un buon lavoro SEO non è facile e richiede competenze specifiche, impegno costante e un lavoro lungo e impegnativo; se viene affidata in outsourcing ad agenzie di search marketing, può costare anche cifre importanti, sia pure non paragonabili a quelle del marketing offline. Se fatta a regola d’arte, una volta implementata può però garantire un flusso di traffico notevole. Si deve pertanto entrare nell’ordine di idee che il posizionamento naturale nei motori di ricerca non è più uno strumento per ottenere visibilità a basso costo approfittando del vantaggio competitivo rispetto a chi queste tecniche non le conosceva. La SEO è ora un attività di web marketing molto complessa e sicuramente premiante a patto che la visibilità acquisita venga adeguatamente sfruttata a livello di sito web. Prima di intraprendere un investimento in SEO ci si deve insomma assicurare che il suo ritorno sia tale da giustificarlo. Essendo l’indicizzazione uno strumento di search marketing, va sempre tenuto presente che come ogni forma di marketing di tipo pull essa trova il campo d’impiego migliore in tutti quei settori e quelle situazioni di mercato dove c’è una forte domanda, che si esprime nelle numerose ricerche eseguite nei motori. Più difficile è stimolare una domanda latente, cosa più indicata per gli strumenti push come e-mail e display marketing.

Condividi:
  • Facebook
  • LinkedIn
  • Twitter
  • Google Bookmarks
  • Technorati
  • Digg
  • Segnalo
  • RSS
  • Print

Lascia un Commento