mercoledì 2 dicembre 2009

Google: qual è il suo segreto?


Io credo che tutti ci siamo chiesti almeno una volta nella vita qual è il criterio con cui Google decide di stilare le pagine dei risultati di una ricerca. Alcuni penseranno che dietro al motore di ricerca di Mountain View ci siano delle persone che decidono se un sito è più importante di un altro e merita più attenzioni (metodo usato dalla maggior parte dei "motori di ricerca",uno su tutti Yahoo): tutto falso. Alla base di Google c'è "solo" un algoritmo (ovviamente a noi sconosciuto) che calcola l'importanza di un sito in base a circa 200 variabili. Ecco oggi ve ne voglio proporre alcune (tratte da geekissimo.com):

Dominio

  • Età del dominio (da quanti anni è online)
  • Storia del dominio
  • Keyword nel nome del dominio (quante parole chiave ci sono)

Architettura

  • Struttura HTML
  • Uso dei tag header (quelli dei titoli, ossia ‘h1′, ‘h2′, ‘h3′, ecc.)
  • Path dell’URL
  • Utilizzo di CSS / JS esterni (stili di visualizzazione e script)

Contenuti

  • Densità di keyword in una pagina
  • Keyword nel titolo
  • Keyword nella meta-descrizione (ma non le meta keyword)
  • Keyword nei tag header
  • Keyword nel corpo del sito
  • Freschezza dei contenuti

BackLink (link ricevuti da altri siti)

  • Qualità dei siti che linkano
  • Qualità delle pagine Web linkate
  • Età del sito
  • Età delle pagine Web
  • Rilevanza del contento della pagina
  • Collocazione del link (se nel footer,nel corpo del testo o altro)
  • Anchor testo (il testo contenente il link)
  • Attributi del link
  • Tag alt delle immagini contenenti link (quello che specifica le proprietà dell’immagine, comprese le descrizioni aggiuntive)
  • Specifiche del Paese a cui appartiene il dominio di primo livello
  • Autorevolezza del dominio di primo livello (.edu, .gov, ecc.)
  • Posizione geografica del server
  • Autorevolezza del sito che linka

Link Interni (al sito stesso)

  • Numero di link interni ad una pagina
  • Posizione dei link interni nelle pagine
  • Anchor text del primo link

Penalizzazioni nel posizionamento

  • Troppa ottimizzazione per i motori di ricerca
  • Compravendita di link
  • Spam nei commenti
  • Cloaking (l’utilizzo di script per far leggere a Google cose diverse da quelle realmente presenti nel sito)
  • Testi nascosti
  • Contenuti copiati
  • Keyword stuffing (l’utilizzo smodato di keyword)
  • Sandbox effect (che Google applica ai nuovi domini per evitare ‘giochetti’ fatti tramite back link con siti pre-esistenti)

Varie

  • Link nei JavaScript
  • Link con attributo No Follow (che non fa seguire i siti linkati dagli spider dei motori di ricerca)
  • Velocità di caricamento di un sito Web
  • Velocità Javascript
  • Sitemap in XML (non aiuta il ranking)
  • PageRank
Insomma dietro al dominio di Google si cela (ovviamente oltre alla bravura dei suoi ingegneri) un'algoritmo, della matematica, non un esercito di redattori che non riuscirebbero a stare dietro all'esponenziale crescita del Web: il segreto sta quindi nella scalabilità del sistema,nella capacità di Google di avere capito che solo una "macchina" poteva raggiungere ogni minima informazione presente nel Web e renderla disponibile come risultato ai propri utenti.

Nessun commento:

Posta un commento