Audit für Google Analytics 4
Hinweise zu den Checks

Folgende Checks werden derzeit vom Google Analytics 4 Audit durchgeführt:

Allgemein

Sind Sitzungen im Auswertungszeitraum vorhanden?

Dieser Check ist offensichtlich: Es wird geprüft, ob Sitzungen gemessen wurden oder nicht. Im Fall von fehlenden Sitzungen ist die Messung entweder nicht aktiv - oder es sind ausschließlich Events über das GA4 Measurement Protocol erfasst worden, die unabhägig von aktiven Sitzungen erfasst wurden. Anders als Universal Analytics ist GA4 nicht dazu gedacht, über das Measurement Protocol auf alternativen Wegen mit Daten beschickt zu werden.

Weitere Informationen

Werden Conversions gemessen und erreicht?

Die Einrichtung von Conversions in Analytics ist ein wesentlicher Punkt, um mit den Daten wirklich etwas anfangen zu können. In GA4 werden daher einige Ereignisse wie Käufe und andere (z. B. im App-Kontext) als Conversions eingestuft. Es ist aber sinnvoll und erforderlich, eigene Ereignisse als Ziel zu definieren, so dass die Messung auf die eigenen Anforderungen abgestillt ist.

Das prüft der Check

Der Check prüft lediglich, ob Conversions gemessen wurden - unabhängig von deren Art (Kauf oder andere automatische oder selbst eingerichtete Conversions). Sind Daten zu finden, liefert der Test ein "OK" Es erfolgt keine Bewertung der Conversionrate o. Ä. Werden aber im Untersuchungszeitraum keine Daten ermittelt, stimmt entweder etwas nicht oder es fehlen noch Conversions - dann bitte unbedingt welche einrichten bzw. die Messung vorhandener Events checken.

Weitere Informationen

Werden User und zugehörige Sitzungen erfasst?

Selbst wenn der Check nach Sitzungen Ergebnisse liefert, muss das nicht bedeuten, dass mit der Messung alles in Ordnung ist. Daher prüft dieser Check zusätzlich, ob auch eine Besuchermessung stattfindet und überhapt User gefunden wurden.

Das prüft der Check

Werden User gefunden und ist die Anzahl der zugehörigen Sitzungen stimmig, ist der Check "OK". Anderenfalls erscheint eine Warnung, wenn die Anzahl der User höher ist als die der Sitzungen (dann ist ganz offensichtlich etwas nicht in Ordnung) oder ein Fehler, wenn keine User gemessen werden.

Weitere Informationen

Gibt es Seiten mit mehr Usern als Sitzungen?

Normalerweise ist zu erwarten, dass man eine Seite nicht "messen" kann, ohne diese als Nutzer aufzurufen und dabei auch eine Sitzung zu erzeugen. Da in GA4 aber alle Ereignisse "auf eine Seite einzahlen", wenn diese Dimension beim Tracking belegt ist, aber nicht bei allen Ereignissen eine (neue) Sitzung beginnt, kann es mehr User auf einer Seite geben, als es dazu passende Sizungen gibt. Dies ist vergleichbar mit einer Absprungrate von mehr als 100% in Universal Analytics und liegt auch hier vermutlich an Events, die entweder nach abgelaufenen Sitzungen gesendet werden (das wäre "normal") oder es fehlt das für GA4 wesentliche Event zum Start einer Sitzung. Das kann passieren, wenn z. B. nicht mit dem Standard-Tagging via GTM / gtag.js verwendet wird und wäre in diesem Fall ein Grund, sich mit der Generierung der Daten im Browser noch einmal auseinander zu setzen.

Das prüft der Check

Es wird die Gesamtzahl aller Seiten mit einer Rate von Sitzungen / User kleiner 1 abgerufen. Gibt es Fundstellen, meldet der Check dies als Hinweis (aus o. g. Gründen kann es sein, dass diese Anomalie erklärbar ist), sonst ist das Ergebnis "OK".

Wie viele Events werden insgesamt erfasst?

In GA4 ist alles ein Ereugnis - die alte Trennung von Seitenaufrufen, Events, Transaktionen und anderen Hit-Typen aus Universal Analytics existiert nicht mehr. Und auch die bisherigen Probleme mit Sampling in den Berichten ist in GA4 zumindest deutlich unaufdringlicher, wenn überhaupt existent. Dennoch ist es gut zu wissen, welches Gesamtvolumen in einer Property zusammenkommt und wie sich dies auf die typischen Ereignisse und alles andere wie automatische Events etc. verteilt.

Das prüft der Check

Es wird die Gesamtzahl aller Ereignisse abgerufen und sowohl als Summe als auch als Teilmenge aller Seiten- bzw. Screenaufrufe zurückgemeldet.

Werden automatische Web-Events vermessen?

In den Einstellungen des (Web-) Datenstreams für GA4 sind i. d. R. mehr als nur Seitenaufrufe aktiviert, so dass z. B. auch Downloads, externe Links u. a. vermessen werden. Diese Ereignisse werden im Check anhand der Daten (nicht der Einstellungen) geprüft.

Das prüft der Check

Alle gefundenen Events aus dieser Kategorie werden in einem Hinweis aufgelistet. Auch wenn keine gefunden wurden, bleibt es bei einem Hinweis, denn es ist absolut kein "Fehler", sich dazu zu entscheiden, diese Events nicht automatisch vermessen zu lassen, wenn diese keinen Wert für die eigenen Auswertungsanforderungen haben.

Weitere Informationen

Werden App-Events vermessen?

Da GA4 nicht nur Websites, sondern auch Apps vermessen soll, gibt es speziell für Apps eine ganze Menge an speziellen Events, die dazu dienen, das Verhalten von Appnutzern besonders gut zu vermessen - genauso, wie es für E-Commerce und andere Bereiche spezielle Events im Modell von GA4 gibt.

Das prüft der Check

Alle gefundenen Events, die Google in GA4 für Apps vorgesehen hat, werden in einem Hinweis aufgelistet.

Werden erweiterte, empfohlene oder eigene Events vermessen?

Screen- oder Seitenaufrufe, E-Commerce, automatische oder weitere Events - es gibt eine Menge Optionen, um Daten an GA4 zu senden und diese anhand des Event-Namens und der Parameter für das System erkennbar zu gestalten. Das ist aber nicht alles; es gibt sowohl weitere empfohlene Ereignisse für einzelne Branchen als auch den unendlichen Pool selbstdefinierter Ereignisse. Um diese gent es in diesem Check.

Das prüft der Check

Alle gefundenen Events, die in keine der sonstigen Kategorien fallen, zeigt dieser Check als Hinweis-Ergebnis. Wie bei den anderen Checkpunkten ist eine Liste der Ereignisnamen dabei.

Stimmen Währungseinstellungen und Zeitzone?

Nicht nur, aber auch für E-Commerce-Tracking ist eine korrekte Währung in den Einstellungen wesentlich. Ebenso wird die eingestellt Zeitzone (wesentlich für die korrekte Zuordnung von Sessions zu Tagen)geprüft.

Das prüft der Check

Davon ausgehend, dass die meisten hier untersuchten Konten zu Websites gehören, deren Zielmarkt in Deutschland oder Nachbarländern liegt, wird geprüft, ob "EUR" als Währung und "Berlin" als Zeitzone gewählt wurde. Ist dies der Fall, ist der Check "OK", anderenfalls wird ein Hinweis ausgegeben, denn abweichende Währungen oder Zeitzonen sind je nach Website sinnvoll und absichtlich gewählt.

Checkpunkte zu E-Commerce-Tracking

Werden E-Commerce Events vermessen?

E-Commerce besteht auch bei GA4 aus mehr als nur dem Kauf. Verschiedene Ereignisse transportieren Produktinformationen und Daten darüber, was mit dem Produkt passiert ist. Der Check rüft, ob diese Events genutzt werden.

Das prüft der Check

Alle Standard-E-Commerce-Events aus dem GA4 Event-Modell werden mit der Anzahl der Ereigisse aufgelistet, wenn welche gefunden wurden und der Check gilt als "OK", sonst erscheint ein Hinweis (kein Fehler, denn E-Commerce ist schlussendlich keine Pflicht für alle Website-Typen oder Apps).

Weitere Informationen

Wird Umsatz erfasst?

E-Commerce und Conversions können aktiv und vermessen sein, aber dennoch fehlt der Umsatz in GA4 - daher prüft dieser Check unabhängig von Vorhandensein von E-Commerce-Events oder Conversions, ob auch eine Umsatzmessung stattfindet.

Das prüft der Check

Für den Fall, dass der vorherige Check aktiviertes E-Commerce-Tracking findet, wird in diesem anschließenden Check in den Berichten nach Umsätzen gesucht. Dabei findet keine Bewertung statt - Umsatz da = "OK", sonst wird ein Fehler ausgegeben, denn wenn das Tracking eingeschaltet ist, sollten sich auch Umsätze messen lassen.

Gibt es Transaktions-Ids mit mehrfachen Transaktionen?

Die doppelte / mehrfache Messung von Transaktionen kann uch in GA4 zu Problemen führen. Wird z. B. durch Neuladen von Bestätigungsseiten im Shop ein purchase Event mehrfach gesendet, führt dies in GA4 ggf. zu Verzerrungen (wenn es GA4 nicht gelingt, die Transaktionen zu deduplizieren).

Das prüft der Check

Der Check sucht nach Transaktions-Ids mit mehr als einer Transaktion. Werden dabei keine Daten zurückgeliefert, gilt der Check als "OK", sonst werden ein Fehler, die Anzahl der betroffenen Ids und eine beispielhafte Transaktions-Id zur weiteren Analyse in GA4 ausgegeben.

Werden Conversions mit Zahlungsanbietern als Quelle gefunden?

Wenngleich in GA4 eine Sitzung mehrere Quellen haben kann, ist es i. d. R. unerwünscht, wenn externe Zahlungsanbieter wie PayPal und andere in den Berichten auftauchen, wenn es um die Attribution geht. Daher kann auch in GA4 in den Einstellungen der Datenstreams definiert werden, welche Verweisquellen hier nicht berücksichtigt werden sollen.

Das prüft der Check

Der Check sucht nach Conversions, deren Sitzungsquelle typische Zahlungsanbieter oder Teile von typischen Zahlungsportal-Domains enthalten. Dies sind die folgenden Zeichenketten: paypal, sofort.com|securecode, securepay., payments.amazon, payments-, trustedshops.com, 3d-secure., 3dsecure.. Werden dabei keine Daten zurückgeliefert, gilt der Check als "OK", sonst erscheint ein Fehler und es wird eine Liste der Quellen und der Anzahl der Conversions ausgegeben.

Sind Zuordnungen von SKU zu Produktnamen eindeutig?

Transaktionen enthalten i. d. R. nicht nur die ID eines Produkts, die normalerweise der Artikelnummer / SKU des Produkts entspricht, sondern auch einen Produktnamen. Gibt es eine eindeutige Zuordnung von Namen und Produkten, sollten hier keine Doubletten oder "Löcher" bei den Namen zu finden sein. Das ist aber nur in der idealen Welt der Fall: Oft ändern sich Artikelbezeichnungen, ohne dass sich die Nummer ändert. Oder umgekehrt. Oder Artikelbezeichnungen werden im Browser in eine andere Sprache übersetzt und daher anders übertragen, als man es erwartet hat - oder der Shop ist mehrsprachig und übergibt die Namen selbständig in verschiedenen Varianten unter der gleichen Id.

Das prüft der Check

Es werden maximal 50.000 unterschiedliche im Untersuchungszeitraum verkaufte Kombinationen von Produktnamen und SKU abgerufen. Der Check sucht danach nach doppelt vorhandenen SKUs oder Namen sowie nach leeren Namen. Werden dabei keine Doubletten oder fehlende Namen gefunden, gilt der Check als "OK", sonst wird eine Information ausgegeben.

Klickt man auf die mit Punktlinien versehenen Links bei der Anzahl der doppelten SKUs ode Namen, werden Beispiele eingeblendet, die beim Check gefunden wurden, um die Suche nach Ursachen bzw. Einschägzung des Problems zu vereinfachen.

Eine Einstufung als Fehler wäre ganz sicher falsch, weil es - wie oben beschrieben - valide Gründe für Abweichungen gibt. Dennoch sollte das Verhältnis von ingesamt untersuchten Positionen zu uneindeutigen Positionen erwartungsgemäß in den meisten Fällen gering ausfallen. Sind hier größere Abweichungen zu finden, ist zumindest zu bedenken, nach welcher Dimension man Produktumsätze betrachtet und ggf. in Reports mit anderen Daten (z. B. über die SKU als Schlüssel) zusammenführt.

Checkpunkte zu Kampagnen

Wird Kampagnen-Tagging (utm-Parameter) genutzt?

Kampagnen-Tagging gehört zu den wesentlichen Werkzeugen, mit denen ein Websitebetreiber den Erfolg von Marketingmaßnahmen nachvollziehen kann. Je detaillierter und vollständiger hier vorgegangen wird, desto mehr Insights warten i. d. R. in den Daten. Wenngleich daher die reine Existenz von Kampagneninformationen allein kein Qualitätsmerkmal darstellt, spricht ein Fehlen solcher Daten auf jeden Fall dafür, dass Nachholbedarf besteht.

Das prüft der Check

Der Check ruft die Gesamtsumme der Nutzer nach Kampagnen ab. Finden sich hier Einträge, ist der Check "OK".

Weitere Informationen

Wird E-Mail als Medium ausgewertet?

Ob Links regelmäßig per Newsletter, in der Signatur von E-Mails oder im Rahmen einer Info- oder Transaktionsmail versendet werden - diese sollten auf jeden Fall auch mit Kampagnenparametern versehen und so dem Medium "email" zugeordnet werden, um dbzgl. Auswertungen zu ermöglichen. In GA4 landen diese Daten im Kanal "Email" in der Standard-Kanalgruppierung.

Das prüft der Check

Die Gesamtanzahl an Nutzern für Sitzungen mit "Spuren" dem Medium "email" werden als Indikator abgerufen. Es wird also nicht nur geürft, ob es Sitzungen gibt, die über diesen Kanal zustande gekommen sind, sondern auch, ob Nutzer innerhalb aktiver Sitzungen über entsprechend getaggte Links wieder eingestiegen sind. Ist dies der Fall, ist der Check "OK"; anderenfalls erscheint ein Hinweis (kein Fehler).

Ist ein aktives Google Ads Konto verbunden?

Wenn ein aktives Google Ads Konto Besucher auf die Website bringt, sollten sich in Analytics bei einem verbundenen Konto auch Informationen zu den trafficbringenden Kampagnen wieder finden.

Das prüft der Check

Der Check sicht nach Daten von Nutzern, die eine Anzeigengruppen-ID beinhalten und so darauf hinweisen, dass es eine Verknüpfung gibt. Finden sich Nutzer, ist der Check "OK". Da nicht für jede Website Marketing via Google Ads betrieben wird, ist ein Fehlen solcher Sitzungen kein "Fehler", sondern lediglich ein Hinweis.

Weitere Informationen

Führen Google Ads Klicks zu messbaren Sitzungen?

Sollte ein verbundenes Google Ads Konto vorhanden sein, wird in einem weiteren Check überprüft, ob auch Sitzungen entstehen, die der Quelle "google" und dem Medium "cpc" zugeordnet sind. Da (derzeit) keine Daten aus dem Ads Konto per GA4 Analytics API abgerufen werden können, ist in diesem Audit (anders als bei UA) kein Vergleich der Klicks mit den Sitzungen möglich.

Das prüft der Check

Es Sitzungen für das Quellmedium "google / cpc" angerufen. Fehlen entsprechende Sitzungen, aber es ist ein Ads Konto verbunden, wird ein Fehler ausgewiesen, sonst ist der Check ungeachtet der Anzahl der Sitzungen als "OK" abgeschlossen.

Checkpunkte zur Datenqualität

Sind E-Mail-Adressen, Namen oder Anschriften in Seiten-URLs (als Parameter) enthalten?

Mailadressen und andere persönliche Daten in der Webanalyse sind ein Problem. Nicht nur für die Nutzungsbedingungen von GA, sondern eben vor allem deshalb, weil man sich ggf. je nach Consentlage viel Mühe macht, Identifizierbarkeit / Adressierbarkeit zu vermeiden und genau dann sollte sich nichts dergleichen in den Daten finden.

Eine wirklich zuverlässige Prüfung anhand einfacher Abfragen ist freilich nicht umsetzbar. Daher ist ein "OK" in diesem Check kein Garant dafür, dass ich nichts Problematisches in den Daten findet. Umgekeht ist eine Fundstelle aber ziemlich sicher ein Problem.

Das prüft der Check

Die Prüfung betrifft die page_location aller Ereignisse, in der sich i. d. R. probematische Parameter wiederfinden, die in URLs auf der Website im Einsatz sind. Andere Felder wären theoretisch denkbar, aber sind erstens über die API nicht erreichbar und außerdem ist deren Anzahl und Verwendung unklar, so dass nicht wie bei Universal Analytics auch sinnvoll in anderen Feldern gesucht werden kann (für UA gibt es deshalb hier auch einen separaten Datenschutz-Check).

Im Rahmen des GA4-Audits wird nach einem "@" Zeichen (Klartext oder codiert) sowie typischen Parametern gesucht. Dies sind: street, strasse, plz, ort, city, vorname, lastname und firstname.

Finden sich Seiten-URLs mit solchen Fundstellen, wird ein Fehler ausgegeben, in dem auch ein Beispiel der ersten Fundstelle angegeben wird. Es empfiehlt sich bei Funden also eine weitere Analyse direkt in den Daten von GA4. Ist nichts zu finden, ergibt der Check ein "OK" - das mit den o. a. Einschränkungen einzuschätzen ist.

Gibt es anhand der Auflösung erkennbare Sitzungen von Bots?

An den Daten der Webanalyse sind leider - ohne entsprechende Maßnahmen und Ergänzungen des Trackings - nur sehr wenige Merkmale zu untersuchen, um zu bestimmen, ob und wie hoch der Anteil von Sitzungen ist, die nicht von realen Besuchern stammen, sondern von rendernden Crawlern von Suchmaschinen, Tools, Preisvergleichs-Bots etc. Dennoch sind in diesem Audit zwei Checks vorhanden, die relativ sichere Merkmale testen.

Das prüft der Check

Um Sitzungen von solchen Bots und "Headless Browsern" zu identifizieren, kann in GA4 leider nur ein Check stattfinden, der die Größe des Browsers prüft. Dabei gilt als Merkmal für einen Bot eine Bildschirmauflösung von unter 200x200. Fundstellen werden durch eine Meldung im Check protokolliert, sind aber kein sicheres Zeichen bei Vorhandensein oder Fehlen solcher Sitzungen.

Ist ein hoher Anteil 'Uassigned' in der Standard Channelgruppierung?

Wie auch Universal Analytics kennt GA4 ein "Default Channel Grouping". Im Gegensatz zu UA ist dieses aber (derzeit) unveränderlich in der Zuordnung von Traffic zu den Kanälen und es ist auch nicht möglich, weitere Kanalgruppierungen selbst anzulegen.

Daher ist es recht wahrscheinlich, dass auch bei "sauberem" Tagging mit UTM-Parametern einiges, was in UA in die gewünschten Kanäle eingeflossen ist, hier im ungewünschten Sammelbecken "Unassigned" landet.

Solange in GA4 keine Anpassungen an der Zuordnung möglich ist, sollte bei größeren Anteilen daher das Tagging von Links mit UTM-Parametern angepasst werden. Sonst besteht die Gefahr, dass Traffic in einem Kanal ungesteuert bleibt, für den sich niemand zuständig fühlt... und diese Daten in den anderen Kanälen fehlen, in denen man sie (ggf. aus der Gewohnheit mit UA) erwartet.

Das prüft der Check

Es werden alle User des Auswertungszeitraums nach Kanälen abgerufen und die Gesamtzahl mit den Antei "Unassigned" (wenn vorhanden) verglichen. Alles unter 5% gilt als "OK", bis 20% erscheint ein Hinweis und darüber gilt der Check als nicht bestanden.

Weitere Informationen

Stammen Events hauptsächlich vom gleichen Host?

Kaum eine Property erhält Evetns ausschließlich vom Hostnamen der eigenen Website. Fast jede Website wird auch über andere Hosts und Server ausgeliefert: Testserver, der Google Cache oder zahlreiche Scrapersites sowie Spammer liefern weitere Treffer an, die zusammen mit den Daten von "echten" Besuchen der eigenen Website vermischt werden, wenn keine entsprechenden Filter im GTM eingesetzt werden, die Traffic je nach Hostnamen in passende Properties leiten oder per blockierendem Trigger verwerfen.

Das prüft der Check

Der Check ruft alle Eventzahlen nach Hostnamen ab. Alle Events (von maximal 50 Hosts) werden addiert und mit den Treffern des Hauptlieferanten für Daten (dem Spitzenreiter der absteigend nach Sitzungen sortierten Hostnamen-Liste) verglichen. Ist der Anteil aller anderen Hosts größer als 5%, wird ein Fehler ausgegeben. Ist dies der Fall, ist es Zeit, sich mit Filtern bzw. blockierenden Triggern im GTM auseinanderzusetzen (siehe oben).

Gibt es auffällige Absprungraten?

Ja, auch in GA4 gibt es die aus anderen Webanalyse-Systemen bekannte Absprungrate (die sich aus der Engagement-Rate ergibt). Diese "allgemein" auszuwerten, ist aufgrund der sehr unterschiedlichen Rahmenbedingungen eigentlich unsinnig. Dennoch können Extremwerte zumindest auf Probleme und Fehler bei der Implementierung hindeuten. So bedeutet eine Absprungrate von unter 5% normalerweise nicht, dass die gemessene Website "besonders gut" ist, sondern ist eher ein Zeichen dafür, dass der Trackingcode z. B. mehrfach in die Seiten eingebaut wurde und so jeder Aufruf zu zwei Messungen führt (Absprungrate daher nahe Null). Auch besonders hohe Absprungraten müssen nicht unbedingt bedeuten, dass die Website "schlecht" ist, aber dennoch wird sie vielleicht nicht korrekt gemessen.

Das prüft der Check

Um Probleme zu identifizieren, werden die Werte nach Sitzungs-Quellmedium unterteilt für alle Segmente abgerufen, die mindestens 100 Sitzungen im Untersuchungszeitraum aufweisen. Finden sich hier Werte unter 5% (0.05) oder über 95% (0.95), wird ein Fehler für den Check protokolliert.