Google BigQuery Dataform im GA4-Rohdaten-Reporting nutzen

GA4-Rohdaten-Reporting mit Dataform

GA4-Rohdaten ermöglichen genauere Analysen, insbesondere wenn man die Daten mit anderen Quellen wie CRM oder Sales verknüpft. Wir zeigen alle Vorteile und einen Geheimtipp zur schnellen Einrichtung in 30 Minuten. 

Vorteile von Rohdaten für Analytics: Eigene Datenhoheit, bessere Analysen und mehr

Rohdaten sind unverarbeitete Analytics-Daten, die viel genauer sind als die in GA4 vorliegenden Daten und viele Vorteile für das professionelle Analytics-Setup bieten. In GA4 kann man die Daten einfach “per Klick” täglich in eine BigQuery-Datenbank in der Google Cloud Platform spiegeln lassen.

Die Vorteile von Rohdaten im Digital Marketing: 

  • Eigene Datenhoheit: Volle Kontrolle über die GA4-Daten, unabhängig von Google.

  • Datenverknüpfung: Einfache Kombination mit anderen Systemen, z. B. Salesforce, HubSpot. So findet man passende Marketing-Cluster und verbessert den Kampagnen-ROI

  • Individuelle KPIs: Eigene Metriken und Dimensionen definieren.

  • Nachträgliche Anpassungen: Daten können per SQL korrigiert oder ergänzt werden, z.B. bei Trackingfehlern

  • Keine Quota-Probleme: Google erlaubt nur wenige Abrufe der GA4-Daten. Mit Rohdaten umgeht man diese API-Limits und vermeidet zudem das Sampling, dass die Daten vergröbert. 

  • KI-Integration: Nutzung von Tools wie Google Vertex AI für Prognosen und Analysen.

Rohdaten-Reporting mit BigQuery Dataform und Looker Studio

Beispiel: Einfaches GA4-Rohdaten-Reporting in Looker Studio

Herausforderung: Daten richtig aufbereiten

Die standardmäßig in BigQuery exportierten GA4-Daten sind komplex und enthalten viele verschachtelte Felder (“nested fields”). Für aussagekräftige Reports müssen diese Daten zunächst aufbereitet werden. Das kostet normalerweise viel Erfahrung und einige Tage Zeit, da diese Daten täglich automatisiert umgeformt werden müssen.

GA4-Daten in BigQuery im Rohformat

Komplexe GA4-Datenstruktur mit “Nested Fields”

 

Die Lösung: Dataform in BigQuery

Dataform ist ein Tool innerhalb von Google Cloud, das die Transformation von Rohdaten in strukturierte Tabellen erleichtert. Dataform selbst ist kostenlos und ermöglicht:

  • Strukturierte Datenmodellierung durch wiederverwendbare SQL-Code-Module

  • Automatisierung von Datenpipelines durch Abläufe

  • Kosteneinsparungen, indem nur neue Daten eingefügt werden (inkrementelle Updates)

BigQuery Dataform-SQL-Code für GA4-Event-Daten

 

So richtet man Dataform in kürzester Zeit ein

Die kostenlose OpenSource-Lösung GA4Dataform macht es möglich, in nur wenigen Klicks ein vollständiges Rohdaten-Setup in BigQuery zu erstellen. Dies kann man direkt für das Reporting nutzen, da nach der Installation die meistgenutzten Reporting-Daten in BigQuery-Tabellen vorliegen. Aufwand: Statt Tagen braucht man nur noch wenige Stunden (oder sogar Minuten).

Was liefert GA4Dataform?

  • Fertig automatisierte Data-Pipeline, täglich aktualisiert, kostenschonend eingerichtet (inkrementelle Updates). 
  • Gute Dokumentation aller GA4-Datenfelder, incl. zahlreicher IDs, Channel-Definitionen und mehr
  • Fertige Reporting-Tabellen, zum sofortigen Reporting nutzbar:
    • Session-Tabelle
    • Event-Tabelle
    • Transactions-Tabelle
  • Channel-Tabelle, in der man Kanäle frei definieren kann, incl. AI-Traffic via ChatGPT und co.

Fertige Data-Pipeline mit GA4Dataform

Die Daten werden nun täglich durch SQL-Transformationen für das Reporting aufbereitet und in BigQuery bereitgestellt. Der Graph zeigt übersichtlich an, wie die Daten modular aus mehreren SQL-Blöcken zusammengesetzt werden. Dafür wird das SQLX-Format genutzt, in dem Datenbank-Abfragen, Metadaten und Include-Blöcke genutzt werden können.

Die Dataform-Transformationen können als Graph angezeigt werden 

Fazit: GA4-Rohdaten verbessern das Marketing-Reporting

Der Zugriff auf GA4-Rohdaten in BigQuery bietet Unternehmen enorme Vorteile: mehr Datenhoheit, flexibel anpassbare KPIs und die Möglichkeit, GA4-Daten mit anderen Systemen zu verknüpfen.

Durch den Einsatz von Google BigQuery Dataform lassen sich diese Daten effizient aufbereiten – automatisiert, nachvollziehbar und kostensparend. Insbesondere durch inkrementelle Datenverarbeitung und den Verzicht auf teure ETL-Tools reduzieren sich sowohl Zeitaufwand als auch Cloud-Kosten deutlich.

Wer GA4-Daten strategisch nutzt, spart bares Geld und gewinnt gleichzeitig deutlich an Analysequalität.

Ralf Schukay

Ralf Schukay ist Team-Lead Analytics und Conversion-Optimierung bei der mediaworx berlin GmbH. Zusammen mit seinem Team realisiert er zahlreiche Analytics-Projekte und Performance-Verbesserungen für namhafte Unternehmen und Brands.

E-Mail
Artikel teilen

Kontakt