Voltar para a lista de artigos Artigos
7 minutos de leitura

Aprenda SQL com dados reais do GA4: Um guia prático para iniciantes

Está curioso para saber como ficam os dados reais de comércio eletrônico em SQL? Neste artigo, você analisará os eventos do Google Analytics 4 (GA4) da Google Merchandise Store usando o BigQuery - e aprenderá habilidades práticas de SQL ao longo do processo.

Deseja aprimorar suas habilidades em SQL com dados reais de comércio eletrônico? Neste artigo, você explorará os dados do Google Analytics 4(GA4) usando SQL no BigQuery - o data warehouse baseado em nuvem do Google. O GA4 é a plataforma de análise da Web do Google usada por milhões de sites e aplicativos para rastrear como os usuários interagem com seu conteúdo. Ela é amplamente adotada na análise digital, o que torna as habilidades em GA4 altamente valiosas no mercado de trabalho e em muitas empresas. Se você conectar sua propriedade do GA4 ao BigQuery, poderá armazenar esses dados brutos de eventos e consultá-los usando SQL. Isso permite ir além dos relatórios integrados do GA4 e analisar o comportamento do usuário com muito mais detalhes.

O Google oferece um conjunto de dados GA4 gratuito no BigQuery: ga4_obfuscated_sample_ecommerce.events_20210113. Ele contém dados de eventos reais da Google Merchandise Store - a loja on-line oficial do Google para produtos de marca, como camisetas, canecas e acessórios - capturados em 13 de janeiro de 2021. Você encontrará visualizações de produtos, adições ao carrinho, compras e informações do usuário, como localização ou tipo de dispositivo. Trata-se de um conjunto de dados leve e real, perfeito para aprender SQL.

Precisa de uma rápida atualização em SQL? Experimente nosso curso interativo de SQL para análise de dados. É a maneira mais rápida de aprender os conceitos básicos que você usará ao longo deste guia.

Conheça o conjunto de dados

Neste guia, usaremos um conjunto de dados público gratuito no BigQuery:
bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113 .

O GA4 usa um modelo baseado em eventos, em que cada interação do usuário - como visualizar um produto, adicioná-lo ao carrinho ou concluir uma compra - é rastreada como um evento separado. Cada linha do conjunto de dados representa uma dessas interações e contém campos padrão (como nome do evento e registro de data e hora) e estruturas aninhadas (como detalhes do produto ou parâmetros do evento).

Aqui estão algumas colunas-chave com as quais você trabalhará:

  • event_name: o tipo de ação do usuário, como page_view, view_item, add_to_cart, begin_checkout, ou purchase
  • user_pseudo_ididentificador anônimo do usuário
  • event_timestampQuando o evento ocorreu
  • event_params: detalhes relacionados ao evento (armazenados como pares de valores-chave)
  • items: dados de produtos aninhados para eventos como view_item ou compra

Quais eventos são mais comuns?

Vamos começar vendo o que os usuários estão fazendo no site. Essa consulta mostra os tipos de eventos mais comuns e quantos usuários os acionaram:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS unique_users,
  COUNT(*) AS total_events
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
GROUP BY event_name
ORDER BY total_events DESC;

Essa consulta mostra as ações mais comuns dos usuários. Como esperado, o site page_view lidera com mais de 15.000 eventos. Apenas 34 usuários concluíram uma compra, enquanto muitos outros visualizaram produtos ou os adicionaram ao carrinho - uma clara queda típica dos funis de comércio eletrônico.

event_nameunique_userstotal_events
page_view403415653
user_engagement32669698
scroll19445091
session_start40434478
first_visit34393440
view_item7312990
view_promotion14632127
add_to_cart168665
begin_checkout79398
purchase3436

Rastrear o funil de compras

Em seguida, vamos criar um funil básico para entender quantos usuários passam da navegação para a compra. Contaremos quantos usuários únicos acionaram cada um dos principais eventos de comércio eletrônico:

SELECT
  event_name,
  COUNT(DISTINCT user_pseudo_id) AS users
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name IN ('view_item', 'add_to_cart', 'begin_checkout', 'purchase')
GROUP BY event_name
ORDER BY users DESC;

Isso mostra como os usuários abandonam cada estágio da jornada de compras. É provável que você observe mais usuários visualizando itens do que realmente concluindo compras, como na maioria das lojas on-line.

event_nameusers
view_item731
add_to_cart168
begin_checkout79
purchase34

Analisar o que as pessoas compraram

Quer saber quais produtos os usuários estão comprando mais? Muitos eventos de comércio eletrônico incluem detalhes do produto em um campo aninhado chamado itens. Para acessá-lo, usaremos a função UNNEST().

Veja como encontrar os 10 produtos mais comprados:

SELECT
  item.item_name,
  COUNT(*) AS purchases
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY purchases DESC
LIMIT 10;

E aqui está o resultado:

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

Você também pode analisar os preços dos produtos e calcular a receita total ou média.

Por exemplo, essa consulta retorna a receita total por produto:

SELECT
  item.item_name,
  ROUND(SUM(item.price * item.quantity), 2) AS total_revenue
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`,
  UNNEST(items) AS item
WHERE event_name = 'purchase'
GROUP BY item.item_name
ORDER BY total_revenue DESC
LIMIT 10;

É uma ótima maneira de encontrar os produtos mais vendidos de sua loja.

item_namepurchases
Google Pride Sticker4
Google Sherpa Zip Hoodie Navy4
Google Light Pen Red3
Google Black Cloud Zip Hoodie3
Google Crewneck Sweatshirt Green3
Google Metallic Notebook Set2
Unisex Google Pocket Tee Grey2
Google Large Standard Journal Grey2
Google Sherpa Zip Hoodie Charcoal2
Google Soft Modal Scarf2

Segmentar usuários por país

Os dados do GA4 também incluem informações sobre a localização e o dispositivo de cada usuário. Você pode segmentar o tráfego por geo.country.

Aqui está uma consulta que mostra de onde os usuários estão comprando:

SELECT
  geo.country,
  COUNT(DISTINCT user_pseudo_id) AS unique_buyers
FROM
  `bigquery-public-data.ga4_obfuscated_sample_ecommerce.events_20210113`
WHERE event_name = 'purchase'
GROUP BY geo.country
ORDER BY unique_buyers DESC;
countryunique_buyers
United States19
Canada4
Italy2
United Kingdom1
Germany1
Japan1
Singapore1
Netherlands1
Taiwan1
Malaysia1
Poland1
Hong Kong1

Pratique mais por conta própria

Agora que você já trabalhou com os exemplos guiados, é hora de praticar por conta própria. A melhor maneira de desenvolver suas habilidades em SQL - e pensar como um analista de dados - é explorar os dados com suas próprias perguntas em mente.

  • Divida as compras por fonte de tráfego (traffic_source.source)
  • Compare o tamanho médio do carrinho entre usuários de dispositivos móveis e de desktop
  • Analisar as visualizações de produtos que não levaram a uma compra
  • Criar um caminho no nível da sessão para um único usuário

Aqui estão alguns desafios práticos que você pode tentar em seguida:

  • Analisar as compras por fonte de tráfego. Veja quais fontes (como Google, direta ou de referência) estão gerando o maior número de compras usando traffic_source.source.
  • Compare o tamanho médio do carrinho entre usuários de dispositivos móveis e de desktop. Use os dados do dispositivo para descobrir se o comportamento do usuário muda de acordo com a plataforma.
  • Analise as visualizações de produtos que não levaram a uma compra. Identifique os pontos de interrupção no funil comparando os eventos view_item e purchase.
  • Crie um caminho no nível da sessão para um único usuário. Escolha um user_pseudo_id e reconstrua sua jornada passo a passo usando event_timestamp.

Quanto mais você experimentar consultas como essas, melhor entenderá os dados e mais confiante se tornará na aplicação do SQL a problemas comerciais do mundo real.

Considerações finais

Aprender SQL é muito mais envolvente - e prático - quando se trabalha com dados reais. Especialmente quando esses dados refletem o comportamento real do usuário em uma loja on-line real, como a Google Merchandise Store. Não se trata apenas de teoria; é assim que os analistas de dados, profissionais de marketing e equipes de produtos trabalham todos os dias.

Neste artigo, você aprendeu a:

  • Escrever consultas usando dados reais de comércio eletrônico do GA4
  • Trabalhar com campos aninhados usando UNNEST()
  • Explorar eventos, produtos, segmentos de usuários e funis

Ao trabalhar diretamente com dados do GA4 no BigQuery, você deu um grande passo para pensar como um analista de dados - fazendo perguntas, escrevendo consultas significativas e encontrando insights importantes.

Quer ir mais longe? Confira nosso curso SQL de A a Z para construir uma base sólida ou mergulhe em tópicos mais avançados com nossos cursos interativos de SQL.

Continue praticando, mantenha a curiosidade - e boas consultas!