Context
Estes dados contém estatísticas e eventos dos jogos do Campeonato Paulista da Série A1 (Brasil) dos anos de 2019 a 2022 e foram utilizados para ilustrar como estruturar dados de futebol neste vídeo (https://youtu.be/5AwqRsMtkCo)
Content
Os dados estão estruturados da seguinte forma:
**Tabela de Jogos
-
1 jogo por linha
-
Dados como o estádio, juiz, resultado, id do jogo, nome dos times, etc.
-
Base para a união dos dados para as demais tabelas
**Tabela Estatísticas
- Pode variar, neste caso são 2 linhas por jogo (1 para o time da casa e 1 para o visitante)
- Trazem os dados como posse de bola, chutes a gol, escanteios, cartões, etc.
- Com os tratamentos, transformando 1 linha por jogo, geralmente é o input para análises e modelos estatísticos
**Tabela Eventos
- 1 linha por tipo de evento/time/jogador/tempo
- Geralmente traz os principais eventos do jogos: Substituições, cartões, gols
- Interessante para montar uma linha do tempo do jogo e entender o efeito destes eventos no resultado. Será que um cartão vermelho acima dos 30 minutos garante que o time com 1 a mais será vencedor? Fica a questão para análises...hehe
Acknowledgements
Estes dados foram extraídos por meio da minha assinatura no serviço api-football.
Inspiration
Destes dados podemos tirar diversos insights interessantes e a idéia é estimular a comunidade a explorá-los.
- Como torcedor, quando o time adversário perde um jogador logo nos animamos, o grito no estádio aumenta e a esperança de uma goleada logo se acende. Mas, nos números, será que isto é realmente verdade ou estamos sendo enganados pelo nosso senso comum?
- Qual a probabilidade de sair o segundo gol, do mesmo time, após a marcação do primeiro?
- Os gols aos últimos minutos são eventos extremamente raros?
- Um time que ganhou um jogo de virada aumenta a probabilidade de ganhar o próximo jogo? (mudança na motivação)
...