9th Oct 2025 13 minutos de leitura Conjuntos de dados de cultura pop do SQL: Prática com filmes, músicas e esportes LearnSQL.com.br Team práticas sql Índice Filmes: Consulte seus filmes favoritos Música: Analisar os gráficos 🏀 Esportes: Estatísticas que contam uma história Arte: Formas de expressão Videogames: Brinque com os dados 🗂️ Como carregar um conjunto de dados CSV em um banco de dados Da diversão ao profissional Por que se contentar com faturas e tabelas de pedidos quando você poderia consultar o Oscar, os hits do Spotify ou as estatísticas da NBA? Os conjuntos de dados da cultura pop tornam a prática de SQL divertida, envolvente e surpreendentemente eficaz. Você já quis usar o SQL para descobrir qual ator tem mais vitórias no Oscar, qual artista dominou as paradas no ano em que você se formou ou qual país está no topo da tabela de medalhas olímpicas? Boas notícias: você pode. A maioria dos iniciantes aprende SQL analisando clientes, pedidos e faturas. Isso é útil, mas sejamos honestos: nem sempre é empolgante. Se quiser se manter motivado enquanto aprende, você precisa de conjuntos de dados que sejam divertidos e relacionáveis. É aí que entra a cultura pop. Filmes, música e esportes estão repletos de dados, e consultá-los é uma maneira perfeita de desenvolver habilidades reais de SQL e, ao mesmo tempo, manter as coisas interessantes. Se você está apenas começando - ou se precisa de uma atualização - comece com o curso SQL para Iniciantes em LearnSQL.com.br. Nossos cursos de SQL são totalmente interativos: você escreve consultas, executa-as em bancos de dados reais e recebe feedback instantâneo. Oferecemos cursos para iniciantes e desafios avançados, portanto, mesmo que você seja um analista de dados experiente, encontrará algo para aprimorar suas habilidades. Neste artigo, exploraremos como você pode praticar SQL usando conjuntos de dados da cultura pop. Examinaremos exemplos de filmes, músicas e esportes e mostraremos como eles se conectam aos conceitos que você aprenderá em nossos cursos. Filmes: Consulte seus filmes favoritos Os filmes não são apenas entretenimento - eles são minas de ouro de dados. Listas de elenco, datas de lançamento, orçamentos, ganhos de bilheteria, gêneros, classificações... tudo isso se encaixa perfeitamente em um banco de dados. Ideias de conjuntos de dados Conjunto de dados IMDB - Mantido pelo IMDb, esse enorme conjunto de dados inclui títulos, elenco, equipe, anos de lançamento, classificações e muito mais. É uma das fontes mais amplamente usadas para dados relacionados a filmes. The Movie Database (TMDb) - Um banco de dados aberto e voltado para a comunidade com metadados detalhados sobre filmes e programas de TV. Popular por sua API e conteúdo atualizado. Kaggle Top 500 Popular Movies - Conjuntos de dados de filmes selecionados no Kaggle, como Top 500 Popular Movies, fornecem subconjuntos limpos e prontos para uso de filmes populares. Programas da Netflix (Kaggle) - Conjuntos de dados compilados a partir de catálogos da Netflix, geralmente extraídos ou compartilhados por pesquisadores, abrangendo títulos, gêneros, anos de lançamento e regiões. Seu próprio Netflix Wrapped- Exporte seu histórico pessoal de visualizações da Netflix para analisar seus hábitos de exibição. Ótimo para praticar SQL personalizado. Oscars (Kaggle) - Dados históricos sobre os prêmios da Academia, incluindo vencedores, indicados, categorias e anos. Útil para consultas sobre conquistas e tendências no cinema. Ideias para praticar Qual ator participou do maior número de filmes vencedores do Oscar? Qual foi o filme de maior bilheteria em 2010? Qual diretor tem a maior classificação média do IMDB? Quantos filmes nos últimos 20 anos tiveram orçamentos superiores a US$ 100 milhões, mas não conseguiram atingir o ponto de equilíbrio? Conceitos de SQL que você praticará JOINs (por exemplo, vincular atores a filmes) Classificação com ORDER BY (por exemplo, listar os filmes mais bem avaliados ou os maiores sucessos de bilheteria) Agregados como COUNT, AVG, MAX, SUM (por exemplo, contar filmes por diretor, encontrar a classificação média por década ou calcular a bilheteria total por estúdio) Esse é exatamente o tipo de prática que você terá em nosso curso SQL para Iniciantes . Em vez de estrelas de cinema, você consultará dados comerciais estruturados, mas as habilidades serão transferidas diretamente. Música: Analisar os gráficos Os dados de música estão em toda parte: gráficos, listas de reprodução, estatísticas de streaming e até mesmo letras de música. Se você tem curiosidade sobre tendências, o SQL pode revelar insights fascinantes. Ideias de conjuntos de dados Billboard Hot 100 e mais - Os dados das paradas de sucesso capturam as classificações semanais das principais músicas, com artistas, anos de lançamento e desempenho nas paradas. Perfeito para explorar tendências de popularidade ao longo do tempo. Conjunto de dados de faixas do Spotify (Kaggle) - Um grande conjunto de dados com recursos de áudio (andamento, dançabilidade, energia, valência), detalhes de faixas, artistas e pontuações de popularidade. Compilado por colaboradores do Kaggle a partir da API do Spotify, ele é amplamente usado para analisar tendências de escuta e atributos musicais. Crie seu próprio Spotify embrulhado com SQL - Um guia prático que mostra como exportar seu histórico pessoal do Spotify e consultá-lo com SQL. Ideal para criar seus próprios insights no estilo "Wrapped". Prêmios Grammy (Kaggle) - Abrange os indicados e vencedores de 1965 a 2024, incluindo categorias, artistas, músicas e álbuns. Criado pela comunidade do Kaggle, esse conjunto de dados é popular para estudar o histórico de prêmios e o sucesso de artistas ao longo de décadas. Principais compositores clássicos (Kaggle) - Um conjunto de dados com curadoria de compositores clássicos com metadados como nomes, épocas e países. Um recurso simples, mas eficaz, para analisar a história da música por meio de SQL. MusicNet (Kaggle) - Contém 330 gravações clássicas com mais de um milhão de rótulos marcando cada nota e instrumento. Originalmente lançado para pesquisa, é um dos conjuntos de dados clássicos mais ricos, possibilitando analisar a estrutura musical e comparar compositores em detalhes. Ideias práticas Quem foi o artista mais transmitido em 2020? Como a duração das músicas mudou ao longo das décadas? Qual década produziu a maioria dos sucessos nº 1 da Billboard? Quais artistas aparecem consistentemente no Top 10 ano após ano? Quem detém o recorde de maior número de indicações ao Grammy sem ganhar? Quais compositores clássicos viveram por mais tempo e quantas obras são atribuídas a eles? Conceitos de SQL que você praticará Funções GROUP BY e agregadas (por exemplo, contar as entradas nas paradas por artista ou encontrar a duração média das músicas por década) Filtragem com WHERE (por exemplo, restringir os resultados a músicas da década de 1990 ou apenas aos vencedores do Grammy) Trabalhar com datas (por exemplo, comparar o desempenho nas paradas por década ou rastrear picos de streaming por ano) Se você achar GROUP BY confuso, nosso SQL GROUP BY Practice oferece vários exercícios práticos para aumentar sua confiança. Com uma variedade de conjuntos de dados do mundo real, você praticará o agrupamento e a agregação de dados até que isso se torne algo natural. 🏀 Esportes: Estatísticas que contam uma história Os fãs de esportes sabem que as estatísticas fazem parte da diversão. Pontos, gols, medalhas, vitórias, derrotas - todos eles vivem em bancos de dados estruturados. Isso os torna perfeitos para a prática de SQL. Ideias de conjuntos de dados 120 anos de história olímpica (Kaggle) - Abrange atletas olímpicos e resultados de 1896 a 2016. Inclui dados demográficos dos atletas, eventos, medalhas e estatísticas do país. Amplamente usado para análise histórica e de tendências. Copa do Mundo da FIFA (GitHub) - Um conjunto de dados estruturado de partidas, equipes, torneios, gols e resultados da Copa do Mundo. Criado pelo pesquisador esportivo Jeffrey Fjelstul, popular para analisar o histórico do futebol. Conjunto de dados da NBA (Kaggle) - Dados abrangentes da NBA com jogos, equipes, jogadores e resultados de caixa ao longo de décadas. Excelente para comparar carreiras de jogadores, sucesso de equipes e desempenho temporada a temporada. NFL - nflfastR - Dados públicos da NFL, jogo a jogo, de 1999 em diante. Inclui estatísticas avançadas, como pontos esperados e probabilidade de vitória. Dados disponíveis em CSV/Parquet, amplamente usados em análises esportivas. Beisebol - pybaseball (GitHub) - Uma biblioteca Python que extrai dados da MLB de fontes oficiais e semi-oficiais, como Baseball Savant e FanGraphs. Fornece estatísticas em nível de jogo, temporada e arremesso. Ideias para praticar Qual jogador da NBA marcou mais pontos na década de 1990? Quem detém o recorde de mais gols na Copa do Mundo? Qual país é consistentemente o mais bem classificado em medalhas de ouro olímpicas? Como o número médio de gols por partida mudou entre os torneios? Conceitos de SQL que você praticará Consultas de classificação (por exemplo, encontrar os maiores artilheiros ou líderes em medalhas) Filtragem com várias condições (por exemplo, foco em temporadas ou torneios específicos) Agregados com condições (por exemplo, calcular a média de gols por partida ou pontos por jogo) Os dados esportivos têm tudo a ver com classificações, médias e comparações entre temporadas. É exatamente isso que você aprenderá em nosso Como Criar Relatórios Básicos em SQL curso - transformar estatísticas brutas em relatórios claros e estruturados. Arte: Formas de expressão A arte não se trata apenas de galerias e exposições - ela também contém dados que estão esperando para serem explorados. Museus e pesquisadores de todo o mundo publicam coleções estruturadas com informações sobre artistas, obras de arte, estilos e movimentos. Com o SQL, você pode revelar padrões de criatividade, comparar épocas e até mesmo acompanhar a evolução de determinadas tendências artísticas ao longo do tempo. Ideias de conjuntos de dados Coleção MoMA (GitHub) - O conjunto de dados abertos do Museu de Arte Moderna, que contém metadados sobre mais de 130.000 obras de arte: artistas, títulos, mídias, datas e classificações. Perfeito para explorar a arte moderna e contemporânea. Imagens de arte (Kaggle) - Um conjunto de dados com cerca de 9.000 imagens de obras de arte em categorias como desenhos, pinturas, esculturas e gravuras. Inclui rótulos para o tipo de trabalho, úteis para classificação e exploração. Acesso aberto ao Whitney Museum - Metadados sobre artistas, obras de arte e exposições do Whitney Museum of American Art. Atualizado regularmente, o que o torna uma fonte confiável para analisar a história da arte americana. Melhores obras de arte de todos os tempos (Kaggle) - Um conjunto de dados com curadoria de obras de 50 pintores famosos, incluindo nomes de artistas, estilos e detalhes de pintura. Excelente para comparar artistas individuais ou estudar movimentos ao longo dos séculos. Ideias práticas Qual artista tem o maior número de obras na coleção do MoMA? Como as mídias (óleo, acrílico, escultura, etc.) variam entre as décadas? Quais movimentos artísticos estão mais representados no conjunto de dados do Whitney? Quais dos pintores das "melhores obras de arte de todos os tempos" aparecem com mais frequência e em quais categorias de estilo? Compare a sobreposição entre o MoMA e o Whitney - determinados artistas são apresentados em ambos? Conceitos de SQL que você praticará Filtragem e agrupamento (por exemplo, obras por artista, mídia ou década) JOINs (por exemplo, vinculação de obras de arte a exposições ou artistas) Agregados como COUNT e DISTINCT (por exemplo, número de obras por estilo ou movimento) Ordenação e classificação (por exemplo, os 10 pintores mais prolíficos em uma coleção) Deseja praticar com dados reais? Experimente nossos Trilha de Práticas em SQL Bancos de dados. Você encontrará conjuntos de dados como MoMA e Athletics Finals projetados para exploração livre, para que você possa escrever suas próprias consultas e descobrir insights sem ficar preso a exercícios predefinidos. Videogames: Brinque com os dados Os videogames não são apenas divertidos de jogar - eles também geram grandes quantidades de dados estruturados. De números de vendas e análises a torneios de e-sports e classificações de jogos de tabuleiro, esses conjuntos de dados permitem explorar tendências em entretenimento, competição e cultura. Com o SQL, você pode descobrir o que faz um jogo de sucesso, como os gêneros evoluem ou quais jogadores e equipes dominam o cenário dos esportes eletrônicos. Ideias de conjuntos de dados Vendas de videogames (Kaggle) - Contém dados de vendas de mais de 16.000 jogos de vídeo. As colunas incluem nome, plataforma, ano, gênero, editora e vendas globais/regionais. Perfeito para praticar as funções GROUP BY, JOIN e aggregate. Conjunto de dados de jogos do Steam (Kaggle) - Abrange o vasto catálogo de jogos do Steam. Inclui título, data de lançamento, desenvolvedor, gênero, tags, preço e avaliações. Ótimo para filtragem, pesquisa de texto e análise de tendências. Ganhos de esportes (Kaggle) - Dados em nível de torneio com prêmios, jogadores e equipes. Útil para consultas hierárquicas, classificação e exploração de tendências de desempenho em jogos competitivos. Jogos de tabuleiro (Kaggle) - Dados do BoardGameGeek com resenhas, classificações e categorias. Excelente para praticar junções entre avaliações, categorias e classificações. Ideias para praticar Qual plataforma de videogame teve as maiores vendas globais nos anos 2000? Quais desenvolvedores do Steam lançaram o maior número de jogos e como se comparam suas classificações médias? Quem são os 10 maiores jogadores de e-sports em termos de ganhos totais e quais jogos dominam os prêmios? Quais categorias de jogos de tabuleiro têm as classificações médias mais altas e elas diferem das mais revisadas? Como os gêneros de jogos mudaram em termos de popularidade nas últimas três décadas? Conceitos de SQL que você praticará Agrupamento e agregação (por exemplo, vendas por plataforma ou gênero) JOINs (por exemplo, vinculação de análises a categorias de jogos de tabuleiro) Classificação com ORDER BY (por exemplo, jogos mais vendidos ou jogadores de esportes eletrônicos mais bem pagos) Filtragem e pesquisa de texto (por exemplo, jogos com "Adventure" em seu título ou tags) Os jogos têm tudo a ver com classificações e tabelas de classificação - e é exatamente aí que as funções de janela se destacam. Em nosso Funções de Janela (Window Functions) em SQL curso, você aprenderá a classificar, comparar e analisar dados ao longo do tempo, assim como rastrear os melhores jogadores ou os títulos mais vendidos. 🗂️ Como carregar um conjunto de dados CSV em um banco de dados A maioria dos conjuntos de dados que examinamos está no formato CSV. Para praticar o SQL, geralmente é necessário carregá-los em um sistema de banco de dados como PostgreSQL, MySQL ou SQLite. Este é o processo geral: Escolha seu banco de dados SQLite - opção mais simples; armazena tudo em um único arquivo. PostgreSQL / MySQL - mais avançado, bom se você quiser trabalhar com conjuntos de dados maiores ou várias tabelas. Crie uma tabela Crie uma tabela que corresponda à estrutura do seu arquivo CSV. Por exemplo, se seu CSV tiver colunas: Name, Platform, Year, Genre, Sales, sua tabela poderá ter a seguinte aparência no PostgreSQL: CREATE TABLE videogames ( name TEXT, platform TEXT, year INT, genre TEXT, sales NUMERIC ); Importar o CSV No PostgreSQL: COPY videogames(name, platform, year, genre, sales) FROM '/path/to/videogames.csv' DELIMITER ',' CSV HEADER; No MySQL: LOAD DATA INFILE '/path/to/videogames.csv' INTO TABLE videogames FIELDS TERMINATED BY ',' IGNORE 1 ROWS; No SQLite (usando a linha de comando): sqlite3 mydatabase.db .mode csv .import videogames.csv videogames Comece a consultar Depois de carregada, você pode executar suas consultas SQL como de costume: SELECT genre, AVG(sales) FROM videogames GROUP BY genre ORDER BY AVG(sales) DESC; Se não quiser lidar com a configuração do banco de dados, você também pode usar o SQL Practice Databases do LearnSQL.com.bros bancos de dados de prática de SQL da Microsoft. Eles estão prontos para consulta em seu navegador, sem necessidade de instalação. Da diversão ao profissional Praticar SQL em filmes, músicas, esportes ou jogos é uma ótima maneira de se manter motivado. Mas o benefício real vem quando você transfere essas habilidades para sua carreira. Depois de dominar a filtragem, JOINs e agregados em conjuntos de dados divertidos, você estará pronto para analisar dados de clientes, relatórios de vendas ou análises de marketing no trabalho. Se você quiser uma maneira estruturada de desenvolver essas habilidades, sem perder tempo procurando conjuntos de dados, o Ilimitado Vitalício pacote SQL é a melhor opção. Ele lhe dá acesso vitalício a todos os cursos do site LearnSQL.com.br , desde o básico até tópicos avançados como funções de janela, relatórios e subconsultas. Você praticará o SQL de forma interativa com dados reais, obterá feedback instantâneo e ganhará confiança para consultar qualquer conjunto de dados - sejam eles sucessos de bilheteria, gráficos do Spotify ou o banco de dados da sua empresa. Pronto para dar o salto da cultura pop para a análise profissional? O pacote Ilimitado Vitalício pacote SQL tem tudo o que você precisa para se tornar fluente em SQL de uma vez por todas. Tags: práticas sql