Blog-  

Strumenti di web analytics: quanto fidarsi dei dati?

Ti sei mai chiesto quanto affidabili siano i dati che leggi in un account di Google Analytics piuttosto che su una piattaforma di advertising come Facebook?
Ti fidi al 100% delle sessioni, dei clic o dei tassi di conversione riportati?

Beh, pensare che i sistemi di web analytics siano impeccabili è utopistico, ma come si può stare tranquilli e prendere decisioni serene sulla base di dati attendibili?
In questo articolo proverò a condividere con te le ragioni per cui chi ha un approccio data driven dovrebbe avere entrambi gli occhi ben aperti e attivare tutti i suoi ricettori per individuare ed evitare le insidie che il mondo digital - della web analytics - al giorno d'oggi nasconde.

Google Analytics: gratuito ma con i suoi limiti

Partiamo con lo strumento di web analytics più diffuso e conosciuto, specie grazie alla sua accessibilità e facilità di installazione ed utilizzo.

I server di Google saranno tanti e potenti ma non illimitati! :)
Lo strumento infatti fa ampiamente uso del campionamento, ovvero della "selezione di un sottoinsieme di dati relativi al traffico e alla generazione di rapporti sulle tendenze disponibili in tale insieme campione". Ciò permette di fornire comunque delle stime e allo stesso tempo di velocizzare l'elaborazione di un rapporto quando il volume di dati di partenza è molto elevato.

Nella versione free di Google Analytics esiste inoltre un limite di hit (ovvero iterazioni che vengono tracciate dallo strumento) oltre il quale i dati vengono campionati.
Questa soglia è, a dir la verità, molto alta (max 500 hit per sessione e 10 milioni di hit al mese per proprietà) e il consumo lo puoi controllare dal pannello di amministrazione dell'account.

Il tuo sito fa molto traffico? Occhio al grado di campionamento dei dati di Google Analytics

Il campionamento entra in gioco anche quando si effettuano delle particolari interrogazioni (query) nei rapporti in cui il numero di sessioni nell'arco temporale analizzato supera la soglia di 500mila.
Ad esempio, i dati potrebbero essere campionati (e quindi non esatti all'unità) quando applichi un segmento, aggiungi una dimensione secondaria oppure analizzi un rapporto personalizzato. Tutte funzioni di uso quotidiano per un web analyst.
In questi casi, comunque, lo strumento ti notifica il livello di accuratezza del dato, riportando un messaggio del tipo: "Questo rapporto si basa sul XX% delle sessioni."

Cosa può fare chi ha la fortuna di avere un sito che genera più traffico di quello che Google consente di tracciare correttamente per avere dati più attendibili? Pagare, passando alla versione premium dello strumento (Analytics 360), che prevede delle soglie di campionamento molto più alte.
Oppure, prendere consapevolezza di questo limite. :)

Utenti o bot? Il problema dello spam

Come già raccontato diverso tempo fa in questo altro mio post, l'affidabilità dei dati di Google Analytics è stata "colpita" da varie forme di spam molto subdole.
Lo spam referral, le "visite fantasma” o l'ultimo arrivato “language spam” (quello con il messaggio "Vote for Trump!” che compare nel report sulle lingue), sono gli esempi più noti di come non è tutto oro quel che luccica.
In questo caso, però, in attesa che gli ingegneri di Google pongano definitivamente un rimedio, le soluzioni per rendere i dati del sito più attendibili e ripulirli dallo spam ci sono.
È compito di chi analizza le statistiche assicurarsi che vengano adottate le giuste contromisure.

Quale strumento dice la verità?

Mi capita spesso inoltre di imbattermi in dati sulla stessa azione registrata da due piattaforme diverse che forniscono numeri molto divergenti tra loro.
Ti faccio un esempio, magari è capitato anche a te.
Campagna di advertising su Facebook: banner con link che punta ad una landing page del sito in cui sono stati usati gli UTM.
Google Analytics riporta X accessi alla landing page provenienti da quel banner, Facebook dice che ci sono stati Y clic sull'annuncio. Con X molto distante da Y. Per non parlare delle eventuali conversioni.
Chi ha più ragione? Chi è attendibile?
Domande a cui è difficile, se non impossibile, dare una risposta che metta tutti d'accordo. Bisogna conoscere prima di tutto come le diverse piattaforme registrano e riportano il dato, o quale modello di attribuzione viene usato, o ancora la durata di permanenza del cookie.
Insomma, anche in questo caso, le conoscenze e le competenze del web analyst fanno la differenza.

Le conoscenze e le competenze del web analyst fanno la differenza!

AdBlocker, questi (s)conosciuti

Una ricerca di maggio 2016 ha portato a galla alcuni risultati molto interessanti sull'utilizzo di sistemi di AdBlocker in Italia.
Si tratta di applicazioni che bloccano dal browser gli annunci pubblicitari di un sito o di un motore di ricerca e che sembrano essere usati dal 13% degli utenti che navigano da desktop e 7,6% di quelli che navigano da mobile.
Penserai: sì, ma cosa c'entra con i dati?
Bene, ci sono degli AdBlocker evoluti che bloccano perfino il tracciamento del sito web che l'utente sta navigando.
Perciò puoi immaginare anche tu che, trattandosi di un fenomeno non ancora diffusissimo in Italia (molto di più all'estero), ma in evoluzione, può davvero minare la consistenza dei dati che vengono raccolti e analizzati negli strumenti di web analytics.
In altre parole, il rischio è di perdere il dato su alcuni visitatori e fare le valutazioni su dati sottostimati.

Purtroppo, i rimedi in questo caso sono molto complessi e tecnologicamente difficili da attuare.
Possiamo però monitorare più o meno facilmente quanti utenti navigano il sito con questo sistema attivato e prenderne atto.

Transazioni e-commerce: quando i numeri non tornano

Infine, un ultimo caso molto frequente quando si parla di e-commerce (sia shop online, ma anche booking), riguarda il tema sui numeri delle transazioni e delle entrate che non tornano mai con quello che l'azienda registra nel proprio gestionale.
Capita frequentemente infatti che lo strumento di web analytics adottato registri meno transazioni di quelle reali, con una conseguenza diretta sull'attendibilità di metriche di performance quali il tasso di conversione ed il ROI di una campagna.

Se si scopre ad esempio che solo la metà degli acquisti di uno shop online vengono correttamente rilevati da Google Analytics, come si possono fare valutazioni sensate sul rendimento delle campagne piuttosto che sulla capacità del sito di convertire?

Per questo tipo di problematica la causa è quasi sempre imputabile al modo in cui i sistemi di pagamento sono integrati nel sito web: quando infatti l'utente esce dal sito per andare su PayPal.com o il sito del gateway bancario per terminare l'acquisto, può essere che non faccia ritorno sulla pagina del sito dove viene mostrata la conferma finale dell'ordine e vengono registrati i dati su Google Analytics.
Soprattutto per i pagamenti da PayPal fatti dagli utenti "più navigati", la cosa è molto frequente.

Anche in questo caso, sta al buon analista di dati digitali essere al corrente di questa problematica, valutare l'entità del problema con dei controlli incrociati e suggerire opportuni rimedi.

Insomma, come puoi immaginare, spesso non ci sono soluzioni per le possibili insidie di consistenza e attendibilità dei dati digitali. Ma già prenderne consapevolezza e apportare tutti gli accorgimenti possibili agli strumenti che usiamo per le analisi può fare la differenza.

Adesso che sei arrivato a leggere fin qua, ti rifaccio la domanda iniziale: quanto ti fidi dei tuoi dati? :)

Commenti

  1. Marco Cilia scrive:
    La frase "In altre parole, per i siti che generano molto traffico è probabile che i numeri riportati non siano precisi, ma delle stime statistiche." è completamente sbagliata e ritengo andrebbe corretta, come quasi tutto il paragrafo. I numeri son precisi fino all'unità, a meno che non inizi a fare interrogazioni particolari o deep dive.
    1. Giovanni Favero scrive:
      Ciao Marco, grazie per la segnalazione. Ho rivisto la frase imprecisa aggiungendo anche delle ulteriori puntualizzazioni.
  2. Marco Cilia scrive:
    grazie, ora lo trovo completamente aderente al vero e molto più corretto e preciso :)
    1. Marco Ziero scrive:
      Grazie ancora a te per il contributo, Marco

Lascia un tuo commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Ti possono interessare anche

Spesso in MOCA ci capitano progetti web, in particolare e-commerce, che hanno un catalogo prodotti molto ampio ed un elenco di categorie altrettanto numeroso. In questi casi diventa difficile concentrare tutte le risorse in egual misura su ogni singola pagina facente parte dell'alberatura del sito, per motivi di budget, di tempo o di dispersione eccessiva […]

Se hai avuto l'occasione di rivolgere qualche domanda a me o i miei colleghi, ti sarà capitato di sentirti rispondere "dipende, bisogna testare".   Non è un mantra che adottiamo per sviare le domande scomode, è qualcosa in cui crediamo davvero. Ci crediamo perché, al contrario, dare una risposta frettolosa e senza cognizione di causa […]

I dati ufficiali di Google dicono che il 51% delle ricerche nel 2016 sono avvenute da mobile. Con l'esplosione degli smartphone, anche il nostro comportamento è cambiato considerevolmente. Sempre di più, quando ci rivolgiamo al nostro dispositivo mobile, lo facciamo per soddisfare un bisogno immediato (qui, ora, adesso), che Google definisce come un micro-momento. Nello […]

[CRO]
[CRO]
[Servizi]
[Servizi]
[ADV]
[ADV]
[CRO]
[CRO]
[SEO]
[SEO]
[Analytics]
[Analytics]
[SERVIZI]
[SERVIZI]
[Analytics]
[Analytics]
[ADV]
[ADV]
[SEO]
[SEO]