Voltar para a lista de artigos Artigos
10 minutos de leitura

Como criar um painel de dados (mesmo que você tenha acabado de começar a aprender SQL)

Mergulhe na criação de seu próprio painel de dados com este guia fácil para iniciantes - mesmo que esteja apenas começando com SQL. Usando o BigQuery, conjuntos de dados públicos e o Looker Studio, você aprenderá a criar facilmente um painel impressionante.

Se você é um analista de dados - ou pretende se tornar um -, aprender SQL é essencial. SQL, ou Structured Query Language (Linguagem de Consulta Estruturada), é a linguagem usada para extrair e analisar dados de bancos de dados, ajudando você a transformar números brutos em insights reais. Mas se você está apenas começando, ter ideias de projetos pode ser a parte mais difícil. É aí que entra este guia. Você criará um painel de dados usando as ferramentas gratuitas BigQuery e Looker Studio do Google, que permitem analisar dados reais sobre crimes da cidade americana de Chicago.

Quer você seja iniciante em SQL ou esteja procurando aprimorar suas habilidades, o guia SQL para análise de dados em LearnSQL.com.br é o lugar perfeito para começar. É um caminho de aprendizado completo projetado para futuros analistas, que abrange tudo, desde consultas básicas até tópicos mais avançados, como a criação de relatórios complexos e o uso de funções de janela. Cada um dos quatro cursos incluídos no curso é interativo e prático, ajudando você a aprender com exemplos do mundo real que o preparam para o trabalho com dados reais. Ao final do curso, você terá confiança para escrever suas próprias consultas, analisar conjuntos de dados reais e criar projetos como o painel que criaremos neste tutorial.

Ferramentas que usaremos para criar o painel

Usaremos duas ferramentas para criar nosso painel: BigQuery e Looker Studio.

BigQuery

O BigQuery é um data warehouse oferecido pelo Google. Um data warehouse é um tipo de banco de dados projetado para lidar com grandes quantidades de dados e responder a perguntas analíticas.

O BigQuery é especialmente útil para iniciantes porque você não precisa instalar nada; basta abrir o navegador e começar a escrever SQL. Você pode usar o BigQuery gratuitamente enquanto estiver aprendendo.

O Google oferece um nível gratuito com um limite mensal generoso. Se você estiver apenas executando consultas simples e explorando dados, é muito improvável que exceda esse limite. O BigQuery também lhe dá acesso a conjuntos de dados públicos gratuitos, incluindo dados reais sobre tópicos como crime, saúde e transporte.

Looker Studio

O Looker Studio é uma plataforma de Business Intelligence oferecida pelo Google. Ele permite que você transforme dados em painéis interativos e compartilháveis e relatórios fáceis de ler. É uma ótima ferramenta para iniciantes porque é visual, intuitiva e funciona em seu navegador. Você pode criar relatórios de aparência profissional com gráficos e filtros do tipo arrastar e soltar. E você pode atualizar seu trabalho automaticamente à medida que os dados mudam.

Como criar um painel de dados

Exemplo de painel de controle no Looker Studio

O Looker Studio é de uso gratuito (com alguns limites). Ele funciona com uma ampla variedade de fontes de dados, incluindo o Google Sheets, o Google Analytics e (o que é mais importante para nós) o BigQuery.

Neste artigo, conectaremos o Looker Studio ao BigQuery para criar um painel usando um dos conjuntos de dados publicamente disponíveis do BigQuery.

O conjunto de dados de crimes de Chicago

Para este tutorial, usaremos o conjunto de dados Chicago Crimes, que está disponível publicamente por meio do programa de conjuntos de dados públicos gratuitos do Google BigQuery. Ele é publicado pela cidade de Chicago e se baseia em informações coletadas pelo Departamento de Polícia de Chicago. Ele é atualizado semanalmente com dados da semana anterior.

O conjunto de dados é ideal para praticar SQL e criar seu primeiro painel de dados. Ele inclui vários tipos de crimes que você pode agrupar e filtrar, bem como campos de data e hora para experimentar consultas baseadas em tempo. Como ele é atualizado regularmente, você trabalhará com dados novos e reais.

Esse conjunto de dados contém milhares de linhas, cada uma representando um crime relatado na cidade de Chicago. Há apenas uma tabela no conjunto de dados, chamada bigquery-public-data.chicago_crime.crime. Algumas das colunas mais importantes da tabela são:

  • date - A data e a hora em que o crime ocorreu (armazenada como DATETIME).
  • block - O endereço aproximado onde o incidente ocorreu.
  • primary_type - A categoria de crime de alto nível (por exemplo, THEFT, BATTERY, ROBBERY).
  • description - Descrição mais específica do crime (por exemplo, SIMPLE, STRONG ARM – NO WEAPON).
  • location_description - O tipo de local onde o crime ocorreu (por exemplo, STREET, PARKING LOT, CHA HALLWAY).
  • arrest - Um valor booleano (TRUE/FALSE) indicando se alguém foi preso.
  • domestic - Um valor booleano (TRUE/FALSE) que indica se foi um incidente doméstico.
  • beat, district, ward - Identificadores numéricos para batidas de polícia, distritos e alas da cidade.
  • latitude, longitude - As coordenadas do local onde o crime foi cometido (pode ser usado para mapeamento).
  • year - O ano em que o crime ocorreu.

Perguntas a serem feitas sobre o conjunto de dados

Para criar um painel significativo, você precisa começar com as perguntas certas. Você pode fazer suas próprias perguntas para criar seu painel. Vou compartilhar com você as perguntas e consultas que usei para criar um painel de dados simples para visualizar crimes em um determinado período de tempo.

As perguntas que usei para orientar meu painel foram:

  • Quantos crimes foram registrados em um determinado período?
  • Quantas prisões foram feitas em um determinado período?
  • Quais são os 5 tipos de crimes mais comuns relatados?
  • Quais são os 5 principais tipos de crime que levaram a prisões?

Antes de começarmos a escrever as consultas para responder a essas perguntas, vamos explorar o conjunto de dados.

Explorar um conjunto de dados no BigQuery

A primeira etapa para criar seu painel é saber mais sobre seu conjunto de dados.

  1. Abra o console do BigQuery em console.cloud.google.com/bigquery.
  2. No painel à esquerda, procure por bigquery-public-data. Expanda-a para encontrar chicago_crime e clique na tabela crime para visualizar sua estrutura.
  3. Clique no botão de consulta SQL na parte superior.
  4. No editor de consultas, você pode começar a escrever o SQL:
    SELECT *
    FROM `bigquery-public-data.chicago_crime.crime`
    LIMIT 10;
    

    Isso retornará as primeiras 10 linhas do conjunto de dados.
Como criar um painel de dados

A partir daí, você pode começar a explorar seus dados. Execute algumas consultas para se familiarizar com o conjunto de dados. Você pode filtrar por data, agrupar por tipo de crime ou analisar prisões. Essas são as mesmas técnicas que você usaria em qualquer banco de dados baseado em SQL.

Lembre-se de sempre colocar o nome completo da tabela entre aspas: `bigquery-public-data.dataset_name.table_name`.

Criar consultas que executam seu painel

Agora vamos escrever as consultas para o nosso painel. Para manter a simplicidade, vou me concentrar nos dados do ano de 2024, mas você pode alterar facilmente os filtros para abranger qualquer período de tempo que desejar.

Essas consultas são apenas um ponto de partida. Sinta-se à vontade para ajustá-las ou usar suas próprias ideias. Os painéis são sempre criados passo a passo: você começa com uma versão básica e depois a aprimora à medida que avança.

Total de crimes relatados

Nossa primeira consulta é:

SELECT COUNT(*)
FROM `bigquery-public-data.chicago_crime.crime`
WHERE year = 2024;

Essa consulta conta o número total de crimes registrados no conjunto de dados Chicago Crime para o ano de 2024. Usamos a função COUNT(*) para retornar o número de linhas e a coluna year para filtrar os crimes cometidos no ano de 2024.

Total de prisões

SELECT COUNT(*)
FROM `bigquery-public-data.chicago_crime.crime`
WHERE year = 2024
  AND arrest IS TRUE;

Essa consulta é semelhante à anterior, exceto pelo fato de estarmos filtrando (e contando apenas) as linhas em que a coluna de prisão está definida como TRUE.

Os 5 principais tipos de crime

SELECT
  primary_type,
  COUNT(*)
FROM `bigquery-public-data.chicago_crime.crime`
WHERE year = 2024
GROUP BY primary_type
ORDER BY COUNT(*) DESC
LIMIT 5;

Essa consulta mostra os 5 principais tipos de crime mais comuns em 2024. Ela filtra os dados para esse ano, agrupa os registros por tipo de crime (primary_type), conta quantas vezes cada tipo ocorreu e, em seguida, classifica-os do mais frequente para o menos frequente. Por fim, ele limita o resultado aos 5 principais.

Os 5 principais tipos de prisão

SELECT
  primary_type,
  COUNT(*)
FROM `bigquery-public-data.chicago_crime.crime`
WHERE year = 2024
AND arrest IS TRUE
GROUP BY primary_type
ORDER BY COUNT(*) DESC
LIMIT 5;

Essa consulta encontra os 5 principais tipos de crime em 2024 que mais frequentemente levaram a uma prisão. Ela filtra os dados para incluir apenas crimes de 2024 em que houve prisão, agrupa-os por primary_type, conta quantas prisões ocorreram para cada tipo, classifica os resultados por contagem em ordem decrescente e retorna os 5 principais.

Conectar o Looker Studio ao BigQuery

Usaremos o Looker Studio para criar nosso painel. Ele pode se conectar a muitas fontes de dados, mas funciona especialmente bem com aquelas do ecossistema do Google (como o BigQuery).

Para manter as coisas limpas e eficientes, usaremos a opção Custom Query (Consulta personalizada ). Isso nos permite filtrar, organizar e moldar os dados com SQL antes que eles cheguem ao painel.

Comece abrindo o Looker Studio e criando um novo relatório em branco. No painel Adicionar dados ao relatório, escolha BigQuery como sua fonte de dados. Em seguida, selecione Custom Query (Consulta personalizada). Escolha seu projeto de faturamento. (Esse é o projeto que será cobrado pelo uso do BigQuery; se você estiver usando o BigQuery Sandbox, não será cobrado). Cole sua consulta SQL no campo Enter Custom Query (Inserir consulta personalizada ) e clique em Add (Adicionar).

Como criar um painel de dados

É interessante notar que você não pode renomear a fonte de dados nesse estágio; o Looker Studio a nomeará automaticamente. Depois de adicionar a fonte de dados ao seu relatório, você pode renomeá-la acessando Resource > Manage added data sources (Recurso > Gerenciar fontes de dados adicionadas), onde também pode atualizar a consulta ou renomear quaisquer campos.

Você pode adicionar outras consultas SQL ao seu painel, conforme necessário.

Criar um painel no Looker Studio

Em seguida, você precisa criar suas visualizações. Primeiro, clique no botão Add a chart (Adicionar um gráfico ). Você pode escolher entre uma seleção de diferentes tipos de gráficos, como gráfico de barras ou gráfico de linhas.

Como criar um painel de dados

Para configurar um gráfico, você precisa selecionar a fonte de dados correta e definir quais colunas serão exibidas. O editor de gráficos do Looker Studio tem duas guias principais para ajudá-lo a fazer isso. A guia SETUP é onde você escolhe a fonte de dados, as dimensões e as métricas; é aqui que você decide o que o gráfico mostrará. A guia STYLE permite personalizar a aparência do gráfico, ou seja, escolher fontes, cores, bordas e títulos.

Por exemplo, ao criar um gráfico de barras, você usará a guia SETUP (Configuração) para mostrar tipos de crime e contagens e a guia STYLE (Estilo ) para ajustar a aparência do gráfico.

Como criar um painel de dados

Você pode adicionar outros gráficos ao seu painel, como scorecards que exibem um único número, gráficos de linhas para mostrar tendências ao longo do tempo ou mapas geográficos para visualizar os dados por local. Cada gráfico pode ser estilizado separadamente, o que lhe dá controle total sobre o layout e o design para atender às suas preferências ou destacar os principais insights.

Este é o aspecto do meu painel final:

Como criar um painel de dados

Leve suas habilidades em SQL mais longe

Se você gostou de criar este painel, não pare por aqui! Tente explorar outros conjuntos de dados e criar seus próprios painéis. Quanto mais você praticar, melhor será sua capacidade de fazer as perguntas certas e encontrar respostas nos dados.

Quer levar suas habilidades para o próximo nível? Mais uma vez, recomendo nosso curso SQL for Data Analysis. É um caminho de aprendizado prático criado para ajudá-lo a ir além do básico e começar a pensar como um analista de dados. Você aprenderá a escrever consultas mais avançadas, trabalhar com conjuntos de dados do mundo real, identificar tendências, comparar períodos de tempo, segmentar seus dados e preparar dados para painéis e relatórios. Cada curso inclui exercícios interativos, feedback instantâneo e prática real de SQL. Com esse curso interativo, você aprende fazendo, e não apenas lendo.

Ao final do curso, você será capaz de explorar conjuntos de dados com confiança e criar painéis que realmente respondem a perguntas importantes. Confira hoje mesmo!