Analitical Base Table to data scientist's studies.

[pt-br]

Contexto

Como jogador, estudante de Estatística e curioso, sempre que posso busco maneiras de aplicar meus conhecimentos em projetos práticos. Mais do que isso, tenho muita paixão em compartilhar minhas descobertas e aprendizados com a comunidade por meio de minhas lives na Twitch e vídeos no YouTube.

Tendo em vista recapitular um projeto que desenvolvi durante minha graduação, resolvemos fazer em live a obtenção dos dados de Partidas profissionais de Dota 2 a partir da API Open Dota. Os dados foram salvos em bancos de dados NoSQL (MongoDB) e também processados em diversas camadas de dados usando o conceito de Data Lake com a engine de processamento Apache Spark.

Você pode conferir nosso projeto em seu repositório no GitHub.

Conteúdo

Este dataset está longe de ser um dado crú, uma vez que passou por diversas etapas de transformações, cruzamentos e agregações. As informações presentes são estatísticas de cada time um dia antes da partida em questão ter início. Tais estatísticas são calculadas a partir das informações das partidas de cada jogador no 6 meses anteriores à partida em questão.

Assim, cada linha deste dataset possui a informação de qual time ganhou a partida, bem como estatísticas sumarizadas e 'não normalizadas' de cada time.

Agradecimentos

Muito obrigado a todos que acompanharam o desenvolvimento deste projeto em nossas lives e nos apoiaram com as inscrições na Twitch. O apoio de voc6es possibilita que levemos Data Science adiante, como por exemplo, compartilhando este dataset com mais pessoas que têm interesse em se desenvolver na área.

Inspiração

Nosso desejo enquanto comunidade é fazer com que o ensino chegue cada dia mais próximo das pessoas. E entendo que isso começa no Brasil. Por isso a descrição em pt-br, dando maior foco ao nosso público nacional.

Se tiver interesse em conhecer mais sobre nosso trabalho, nos acompanhe na Twitch: Téo Me Why .

[en - Google Translate]

Context

As a player, Statistics student and a curious person, I am always looking for ways to apply my skills in real time problems. I also am passionate about sharing my findings and learnings with others through my streaming sessions on Twitch or my Youtube channel.

With the goal of reusing a project that I worked on during my undergrad, we decided to stream the data acquisition of professional matches of Dota 2 through the Open Dota API. The dataset has been stored in a NoSQL (MongoDB) and it has been processed in several data layers using the Data Lake concept with the Apache Spark processing engine.

You can check out the project in this repository on GitHub.

Content

This dataset is far from being raw data, since it went through several stages of transformations, crossings and aggregations. The information present is each team's statistics one day before the match in question starts. Such statistics are calculated from each player's match information in the 6 months preceding the match in question.

Thus, each row of this dataset contains information on which team won the match, as well as summarized and 'non-normalized' statistics for each team.

Acknowledge

Many thanks to everyone who followed the development of this project in our lives and supported us with registration at Twitch. Your support enables us to take Data Science forward, such as sharing this dataset with more people who are interested in developing in the area.

Inspiration

Our desire as a community is to bring teaching closer to people every day. And I understand that this starts in Brazil. That's why the description in pt-br, giving greater focus to our national audience.

If you are interested in learning more about our work, follow us on Twitch: Téo Me Why .

Related Datasets

Ultimate Soccer Dataset

@blt
League Of Legends Esports

@blt
Ultimate Basketball Dataset

@blt
CS:GO Player Ranking Dataset

@kaggle
SFC2014 - REACT EU Overview Allocation Vs Decided

@esifunds
Praticantes Inscritos (N.º) Em Federações Desportivas Por Sexo E Modalidades Desportivas

@ine

Ultimate Soccer Dataset

League Of Legends Esports

Ultimate Basketball Dataset

CS:GO Player Ranking Dataset

SFC2014 - REACT EU Overview Allocation Vs Decided

Praticantes Inscritos (N.º) Em Federações Desportivas Por Sexo E Modalidades Desportivas