Datavask, viktig for alle!

Vaske opp data parametere fra gulvet

24 sep 2015 Datavask, viktig for alle!

Datavask er noe som utføres for å sikre at datagrunnlaget i statistikken er av god kvalitet.

Det skjer altfor mange ganger at bedrifter legger inn Google Analytics, og tror at nå trenger de ikke gjøre mer. Nå vil de automatisk få gode tall og innsikt tilbake fra nettstedet.

Dessverre så er det ikke slik det fungerer.  

Det er en del ting som må gjøres etter at et sporingsscript fra Google Analytics er implementert på nettstedet. Dette er nødvendige tiltak, ettersom verktøyet skal kunne brukes på mange forskjellige nettsteder med forskjellig behov og struktur.

Her er en 3-punkts liste som raskt vil sikre deg bedre datakvalitet fra Google Analytics:

 

1. Parametere på URLene

parametere

Parametere er deler av en URL. Vi kan for eksempel se i en URL at følgende tegn blir satt etter domenet:

http://domene.no/?søk=datavask.

Et parameter danner det vi kaller for en «spørring», en funksjon fra databasens verden. Vi bruker «spørringer» for å hente opp informasjon fra databaser. På samme måte, finnes det spørringer i URLer, og parameterne danner grunnlaget for hva vi spør etter.

Eksempelet viser at et parameter, som heter søk, er lik (=) en verdi, her kalt datavask.

Det produseres ofte en del parametere i URLene, som kanskje ikke er betydningsfulle for innholdet på siden. Med det mener vi at hvis du endrer verdien av en parameter, så vil ikke innholdet på siden endre seg. Slike parametere blir ofte mer støy enn det gjør godt, og kan dermed også fjernes.

Dette gjøres ved å legge til navnet på parameteren inn i «Exclude URL query parameters» («Utelat parametere for nettadressesøk») som ligger under View Settings («Innstillinger for visning/datautvalg»).

exclude

Hvis nettsidesystemet benytter seg av «session ID» i URLen, trenger vi å bruke denne metoden. En session ID er en identifikator for det besøket som brukeren begynte da han besøkte nettstedet. Det som skjer av sidevisninger eller handlinger tilknyttet dette besøket, danner grunnlaget for det vi kaller en «økt» eller «session» på engelsk. «Session ID» er informasjon vi ikke trenger i URLene, og vil bety at hver eneste bruker som besøker nettstedet vil generere unike URLer for hvert eneste besøk på hver eneste side. Dette kommer til å fylle opp databasen ganske fort og vil forkludre all statistikk. Derfor er det viktig å ekskludere «session ID».

 

2. Spam i Google Analyticsspam

Dessverre så har noen funnet ut at det er lukrativt å sende spam til Google Analytics kontoer. Dette er dessverre et økende problem, og det krever at du er litt mer offensiv når det gjelder datavask, enn det som tidligere var nødvendig.

Spam har kommet for fullt nå i 2014-2015, og det har til og med vært et stort tema på Google Analytics Certified Partner Summit. Dette er en samling som avholdes hvert år i San Francisco-/Mountain View-området i California, for samtlige Google Analytics partnere verden over.

Forhåpentligvis vil det etter hvert komme løsninger som hindrer spam i Google Analytics. Enn så lenge kan du filtrere vekk trafikk fra de URLene som ser ut til å være spam.

Hvis du benytter kun ett eneste domene, kan du legge til et filter i Google Analytics-profilen (view), som kun inkluderer trafikk til ditt domene, som vist i bildet under.

Inkluderingsfilter for synlighet.no

Du kan implementere et «Spam Crawler Filter» for å fjerne en del av spammen. Dette gjøres ved å opprette to filter med følgende uttrykk:

anticrawler|best-seo-offer|best-seo-solution|buttons-for-website|buttons-for-your-website|7makemoneyonline|-musicas*-gratis|kambasoft|savetubevideo|ranksonic|medispainstitute|offers.bycontext|100dollars-seo|sitevaluation|dailyrank

og

videos-for-your-business|success-seo|rankscanner|doktoronline.no|adviceforum.info|video–production|sharemyfile.ru|seo-platform|justprofit.xyz

Grunnen til at vi deler opp i to, er fordi ett filter kan ikke inneholde mer enn 255 karakterer i input feltet. Dermed må vi lage to stk.

Følg denne oppskriften for spamfilter:

Spamfilter i Google Analytics

Ettersom spam allerede er registrert i statistikken din, kan du ved bruk av et segment som fjerne det fra rapportene du ønsker å se uten spam. Dette fjerner riktignok ikke spam fra historisk data på permanent basis, men gir deg muligheten til å filtrere bort dataen som spam har generert når du analyserer en rapport.

Følg denne oppskriften for å lage et segment som filtrerer bort spam:

nospam segment i Google Analytics

Gå gjennom data minst én gang i måneden

Det er lurt å gjennomgå datamaterialet jevnlig, minimum én gang i måneden. Dette er for å sikre deg at datamaterialet som lagres er av god kvalitet og ikke lager støy i statistikken din.

Har du en god profilstrategi i Google Analytics? Det vil si har du delt opp profiler slik:

  • Bruttoprofil
  • Hovedprofil
  • Testprofil

Da kan du teste ut filter og konfigurasjoner gjennom Testprofilen for å filtrere vekk det du ønsker å ekskludere fra statistikken. Kontrollér resultatene fra Testprofilen opp mot Bruttoprofilen for å se om tiltakene dine fungerer. Hvis det du har gjort fungerer, legger du det over på hovedprofilen.

Følg jevnlig med på hovedprofilen for å se om det dukker opp mer spam eller støy i statistikken din.

 

Ta kontakt med Synlighet om du trenger hjelp til å kvalitetssikre datamaterialet i Google Analytics!

Avatar
Krister Melandsø Ross