Prima di avventurarsi nella configurazione di un account Google Analytics è necessario comprendere almeno in parte il funzionamento dei sistemi di web analytics. Sostanzialmente esistono due tipi di metodi differenti per tracciare le visite di un sito Web e sono diametralmente opposti, sebbene presentino dati in uscita simili o quantomeno omogenei:
I due sistemi sono opposti nel senso che i log del Web Server vengono prodotti dall’interazione degli utenti con la macchina che ospita il sito e vengono analizzati successivamente, ma trattandosi di elementi “lato server” mancano di alcune informazioni in possesso dei browser degli utenti; in compenso raccolgono alcune informazioni che invece sono prerogativa del server.
Il sistema a javascript invece raccoglie tutti i dati sul pc dell’utente e successivamente li invia a un server raccoglitore, che procederà all’analisi e alla produzione della reportistica: in questo caso valgono le considerazioni opposte, ovvero possono essere raccolti dati in possesso del pc dell’utente (come ad esempio la risoluzione dello schermo) ma si perdono dettagli che conosce solo il server (come il numero degli hits, o i singoli elementi che compongono la pagina).
Google Analytics rientra nella seconda tipologia, è infatti un sistema di tracciamento delle visite lato client. Per funzionare ha bisogno che si includa un determinato codice javascript su tutte le pagine che si desidera tracciare, codice che verrà poi eseguito dal motore javascript dei browser che effettuano la visita.
In conseguenza di ciò il sistema non è in grado di tracciare spider o agenti automatici e, più in generale, neppure tutte le visite effettuate con javascript assente o disabilitato per scelta.
Il codice di tracciamento di Analytics, quando viene eseguito, opera in maniera totalmente invisibile per l'utente del sito e, oltre ad inviare ai server di Google tutte le informazioni del caso, provvede anche a scrivere alcuni cookie sul computer di chi effettua la visita. Questi cookie contengono informazioni totalmente anonime e servono a determinare, ad esempio, se l'utente è già stato sul nostro sito (quindi se è un nuovo visitatore o un visitatore di ritorno), quanto tempo fa, se proveniva da una campagna piuttosto che da un motore di ricerca, e altre informazioni che possono poi essere consultate all’interno dei vari report.
ATTENZIONE!! L’ avvento di Universal Analytics ha modificato il sistema di raccolta dati adottato da Google.
In precedenza infatti i dati raccolti venivano inviati ad Analytics assieme ad un’apposita richiesta, effettuata dal nostro sito ai server di Google, di un immagine denominata __utm.gif trasparente di 1x1 pixel. In sostanza il codice di monitoraggio dopo aver raccolto tutti i dati provvedeva ad inviarli ad Analytics richiamando dai server di Google questa specifica immagine e aggiungendo alla richiesta di download tutte le informazioni di tracciamento che venivano così memorizzate nei server di Analytics. Ovviamente essendo l’immagine utilizzata di dimensioni 1x1 pixel e trasparente, il processo era del tutto invisibile all’utente.
L’avvento di Universal Analytics, tra le tante novità, ha modificato anche questo sistema di raccolta dati. Ora infatti le informazioni raccolte sulle visite al sito non vengono più inviate ad Analytics associandole alla richiesta di download di un immagine ma vengono inviate direttamente mediante un’apposita chiamata a google-analytics.com/collect … seguita da un’ apposita query string.
In ogni caso, indipendentemente dal sistema di raccolta dati adottato, l'ultimo tratto del percorso che i dati effettuano, è quello in cui vengono richiamati dai Web server Google sparsi per il mondo, analizzati e utilizzati per popolare il database che successivamente ci fornisce i report all’interno dell’interfaccia grafica. Inoltre, poiché il richiamo dei vari file di log che contengono questi dati non è sempre garantito da tutti i Web server, una volta al giorno Google Analytics provvede a rielaborare le 24 ore precedenti e a consolidare definitivamente il dato; questo spiega da un lato le possibili fluttuazioni del dato odierno, se interrogato a distanza di due o più giorni, e dall'altro il perché Analytics ci mostri, per impostazione predefinita, gli ultimi trenta giorni di storia escludendo il giorno corrente.