Articoli
Posizionamento nei motori di ricerca - La base
Ecco le più diffuse tecniche di base per posizionare il proprio sito nei motori di ricerca:
I meta tag
Description
Il metadato description è destinato a contenere una breve descrizione dei contenuti della pagina, che può essere utile sia all'indicizzazione della pagina, oggi sempre meno nei motori di ricerca maggiori, che ai potenziali visitatori in quanto sono riportati da molti motori nella visualizzazione della ricerca al posto del testo della pagina in cui sono state rintracciate le parole.

Keywords
Il metadato keywords contiene di solito una serie di parole chiave, rappresentative del contenuto della pagina, che sarebbero indirizzati ai motori di ricerca non per il posizionamento del sito ma per l'individuazione dell'argomento trattato nella pagina. L'uso scriteriato di tali metatag decretò la fine del loro uso, quale aiuto alla indicizzazione dai siti per mezzo degli spider; a tutt'oggi però i motori, anche se ormai definitivamente orientato sui contenuti delle pagine, fanno ancora uso di tale metatag anche se solo in maniera accessoria e subordinata, per questo fatto alcuni esperti del posizionamento all'interno dei motori sconsigliano di inserire parole fuorvianti, al solo scopo di tentare di avere un più vasto numero di risultati durante la ricerca, o non richiamate all'interno della pagina, poiché i motori di ricerca penalizzerebbero tali comportamenti scorretti peggiorandone il posizionamento a scopo punitivo e persino cancellando il sito dalle liste di indicizzazione.
Il contenuto dell'attributo content è quindi una lista di parole, su come tali termini vadano inserite, cioè se separate da virgole o da spazi, non esistono pareri unanimi fra gli esperti, certo è che non tutti i motori considerano le virgole come dei separatori; per questo motivo, si adotta spesso la soluzione di usare entrambi, separando ogni parola con una virgola ed uno spazio consecutivi.

Robots
Il metatag robots è indirizzato esclusivamente agli spider fornendo due tipologie distinte di direttive: se indicizzare o meno la pagina, o se seguire o meno i collegamenti da questa ad altre pagine per indicizzarle; l'attributo content quindi può contenere solo determinate variabili che sono:
* all : per indicare che tutte le pagine possono essere indicizzate.
* index : per indicare che la pagina può essere indicizzata.
* noindex : per indicare invece di non indicizzare la pagina.
* follow : per indicare di seguire i link a altre pagine collegate
* nofollow : per indicare di non seguire le pagine linkate

Link: Generatore Meta Tag
Il file robots.txt
Il file robots.txt contiene delle regole utilizzate dai crawler (detti anche spider) per applicare restrizioni di analisi sulle pagine di un sito internet.
I web crawler sono dei software automatici programmati per effettuare ricerche ed indicizzazioni periodiche. Nella prima fase di analisi di un sito web controllano l'esistenza del file robots.txt per applicare eventuali restrizioni richieste dal webmaster del sito.
Il file robots.txt è stato creato nel giugno 1994 con il consenso dei membri della robots mailing list (robots-request@nexor.co.uk).
In questo momento non esiste un vero e proprio standard per il protocollo robots.
* abilitare tutto il sito
User-agent: *
Disallow:
* disabilitare una pagina
User-agent: *
Disallow: /pagina.html
* caricare una sitemap
User-agent: *
Sitemap: www.nomesito.it/sitemap.xml
Sitemap
Una sitemap, o site map, o semplicemente mappa, è una pagina Web che elenca gerarchicamente tutte le pagine di un sito Web. Nata per facilitare la navigazione dell’utente all’interno del sito, ha poi avuto una notevole importanza nell’attività di scansione della Rete da parte dei crawler dei motori di ricerca.
Così come la semplice sitemap anche la Sitemap XML è una lista di link. Introdotta da Google con il servizio Google Sitemaps, e poi utilizzata anche da Yahoo! e MSN, permette ai webmaster di menzionare all’interno di un file XML, e non solo, tutti gli URL delle pagine di un determinato sito Web che si desidera sottoporre al motore di ricerca. In questo modo anche i siti dinamici possono fornire URL corretti permettendo una indicizzazione più intelligente. Il protocollo è regolamentato dalla Attribution-ShareAlike Creative Commons License che ne ha reso possibile l’uso anche ad altri motori di ricerca.
Link:Generatore Sitemap