Baselight

State Of Data Brazil 2024-2025

O maior mapeamento do mercado brasileiro de dados e AI [Data Hackers + Bain]

@kaggle.datahackers_state_of_data_brazil_20242025

Loading...
Loading...

About this Dataset

State Of Data Brazil 2024-2025

1 Sobre a Pesquisa

Entre novembro e dezembro de 2024, mais de 5,2 mil profissionais responderam o State of Data Brazil -a pesquisa anual, do maior panorama do mercado de trabalho em dados no Brasil -, feito pela comunidade Data Hackers em parceria com a Bain & Company, esta é a 5ª edição desta pesquisa que teve início em 2019.

Veja mais detalhes no site da pesquisa: stateofdata.datahackers.com.br - No site da pesquisa você também pode fazer o download gratuito de um relatório completo desenvolvido pela Bain & Company com conclusões interessantes sobre o mercado de trabalho brasileiro na área de dados.

A presente pesquisa é o resultado de um esforço conjunto da Data Hackers, a maior comunidade de dados do Brasil, e da Bain & Company, consultoria global que ajuda empresas e organizações a promover mudanças que definam o futuro dos negócios, para mapear o mercado de trabalho de dados no Brasil.

A pesquisa foi conduzida entre 14 de outubro de 2024 e 18 de dezembro de 2024 e contou com 5.217
respondentes brasileiros. A amostra reflete a visão de variados papéis de atuação em empresas, como os de
analista de dados, cientista de dados e engenheiro de dados, bem como diferentes perfis de experiência
profissional, incluindo analistas júnior, pleno, sênior e gestores.

Gostaríamos de agradecer a toda a comunidade Data Hackers e a todos os parceiros que nos apoiaram durante a pesquisa, incluindo André Sionek, Karine Lago, Canal Let's Data, Canal Programação Dinâmica, Canal do Mario Filho, Alura, Canal Estatidados, Comunidade Mulheres em Dados, Teo Calvo, Flai, QuantitativaMente, Preditiva e professora Fernanda Maciel, sem o apoio de vocês nunca teríamos chegado a uma pesquisa tão completa e abrangente.

2 Sobre o processamento e anonimização dos dados

O dataset foi anonimizado com o objetivo de garantir a privacidade dos respondentes, para isso foi necessário em alguns casos remover outliers que poderiam identificar o entrevistado e, portanto, nem todos os dados coletados na pesquisa estarão disponíveis aqui. Estados com menor incidência de resposta, como alguns da região Norte por exemplo, terão apenas sua região indicada no dataset, também como consequência do processo de anonimização, o mesmo aconteceu em algumas outras perguntas.

As perguntas cujas respostas são multi-valoradas ocupam mais de uma coluna no dataset. Portanto, para diferenciar quais colunas pertencem a quais perguntas, cada coluna é identificada com uma tupla. Sendo o primeiro identificador o da pergunta, e, no caso de várias respostas, o segundo identificador referencia a alternativa escolhida. As perguntas mapeadas são mostradas abaixo (lembrando que algumas foram removidas e outras tiveram alguns outliers transformados/apagados no processo de anonimização)

3 Sobre os dados da Pesquisa

O questionário foi dividido em 8 partes, e dentro de cada uma das partes temos as perguntas e opções de escolha.

  • Parte 1 - Dados demográficos
  • Parte 2 - Dados sobre carreira
  • Parte 3 - Desafios dos gestores de times de dados
  • Parte 4 - Conhecimentos na área de dados
  • Parte 5 - Objetivos na área de dados
  • Parte 6 - Conhecimentos em Engenharia de Dados/DE
  • Parte 7 - Conhecimentos em Análise de Dados/DA
  • Parte 8 - Conhecimentos em Ciências de Dados/DS

Cada pergunta é dividida em Parte, Letra da Pergunta, Número da Opção escolhida
Exemplo: P3a_1 = Parte 3, pergunta (a), opção (1)

4 Saiba Mais

Para acompanhar as evoluções da pesquisa e demais iniciativas da comunidade cadastre-se no site datahackers.news

Em caso de qualquer dúvida entre em contato no email: falecom@datahackers.com.br

Tables

Final Dataset State Of Data 2024 Kaggle Df Survey 2024

@kaggle.datahackers_state_of_data_brazil_20242025.final_dataset_state_of_data_2024_kaggle_df_survey_2024
  • 1.4 MB
  • 5,217 rows
  • 403 columns
Loading...
CREATE TABLE final_dataset_state_of_data_2024_kaggle_df_survey_2024 (
  "n_0_a_token" VARCHAR  -- 0.a Token,
  "n_0_d_data_hora_envio" VARCHAR  -- 0.d Data/hora Envio,
  "n_1_a_idade" BIGINT  -- 1.a Idade,
  "n_1_a_1_faixa_idade" VARCHAR  -- 1.a.1 Faixa Idade,
  "n_1_b_genero" VARCHAR  -- 1.b Genero,
  "n_1_c_cor_raca_etnia" VARCHAR  -- 1.c Cor/raca/etnia,
  "n_1_d_pcd" VARCHAR  -- 1.d Pcd,
  "n_1_e_experiencia_profissional_prejudicada" VARCHAR  -- 1.e Experiencia Profissional Prejudicada,
  "n_1_e_1_n_o_acredito_que_minha_experi_ncia_profissiona_b395c565" DOUBLE  -- 1.e.1 Não Acredito Que Minha Experiência Profissional Seja Afetada,
  "n_1_e_2_sim_devido_a_minha_cor_ra_a_etnia" DOUBLE  -- 1.e.2 Sim, Devido A Minha Cor/Raça/Etnia,
  "n_1_e_3_sim_devido_a_minha_identidade_de_g_nero" DOUBLE  -- 1.e.3 Sim, Devido A Minha Identidade De Gênero,
  "n_1_e_4_sim_devido_ao_fato_de_ser_pcd" DOUBLE  -- 1.e.4 Sim, Devido Ao Fato De Ser PCD,
  "n_1_i_1_uf_onde_mora" VARCHAR  -- 1.i.1 Uf Onde Mora,
  "n_1_f_1_quantidade_de_oportunidades_de_emprego_vagas_recebidas" DOUBLE  -- 1.f.1 Quantidade De Oportunidades De Emprego/vagas Recebidas,
  "n_1_f_2_senioridade_das_vagas_recebidas_em_rela_o_sua__a94f3f8e" DOUBLE  -- 1.f.2 Senioridade Das Vagas Recebidas Em Relação À Sua Experiência,
  "n_1_f_3_aprova_o_em_processos_seletivos_entrevistas" DOUBLE  -- 1.f.3 Aprovação Em Processos Seletivos/entrevistas,
  "n_1_f_4_oportunidades_de_progress_o_de_carreira" DOUBLE  -- 1.f.4 Oportunidades De Progressão De Carreira,
  "n_1_f_5_velocidade_de_progress_o_de_carreira" DOUBLE  -- 1.f.5 Velocidade De Progressão De Carreira,
  "n_1_f_6_n_vel_de_cobran_a_no_trabalho_stress_no_trabalho" DOUBLE  -- 1.f.6 Nível De Cobrança No Trabalho/Stress No Trabalho,
  "n_1_f_7_aten_o_dada_pelas_pessoas_diante_das_minhas_op_ca91bae9" DOUBLE  -- 1.f.7 Atenção Dada Pelas Pessoas Diante Das Minhas Opiniões E Ideias,
  "n_1_f_8_rela_o_com_outras_pessoas_da_empresa_em_moment_b9033247" DOUBLE  -- 1.f.8 Relação Com Outras Pessoas Da Empresa, Em Momentos De Trabalho,
  "n_1_f_9_rela_o_com_outras_pessoas_da_empresa_em_moment_af186993" DOUBLE  -- 1.f.9 Relação Com Outras Pessoas Da Empresa, Em Momentos De Integração E Outros Momentos Fora Do Trabalho,
  "n_1_i_2_regiao_onde_mora" VARCHAR  -- 1.i.2 Regiao Onde Mora,
  "n_1_f_aspectos_prejudicados" VARCHAR  -- 1.f Aspectos Prejudicados,
  "n_1_k_1_uf_de_origem" VARCHAR  -- 1.k.1 Uf De Origem,
  "n_1_k_2_regiao_de_origem" VARCHAR  -- 1.k.2 Regiao De Origem,
  "n_1_g_vive_no_brasil" BOOLEAN  -- 1.g Vive No Brasil,
  "n_1_h_pais_onde_mora" VARCHAR  -- 1.h Pais Onde Mora,
  "n_1_i_estado_onde_mora" VARCHAR  -- 1.i Estado Onde Mora,
  "n_1_j_vive_no_estado_de_formacao" VARCHAR  -- 1.j Vive No Estado De Formacao,
  "n_1_k_estado_de_origem" VARCHAR  -- 1.k Estado De Origem,
  "n_1_l_nivel_de_ensino" VARCHAR  -- 1.l Nivel De Ensino,
  "n_1_m_rea_de_forma_o" VARCHAR  -- 1.m Área De Formação,
  "n_2_a_situa_o_de_trabalho" VARCHAR  -- 2.a Situação De Trabalho,
  "n_2_b_setor" VARCHAR  -- 2.b Setor,
  "n_2_c_numero_de_funcionarios" VARCHAR  -- 2.c Numero De Funcionarios,
  "n_2_d_atua_como_gestor" VARCHAR  -- 2.d Atua Como Gestor,
  "n_2_e_cargo_como_gestor" VARCHAR  -- 2.e Cargo Como Gestor,
  "n_2_f_cargo_atual" VARCHAR  -- 2.f Cargo Atual,
  "n_2_g_nivel" VARCHAR  -- 2.g Nivel,
  "n_2_h_faixa_salarial" VARCHAR  -- 2.h Faixa Salarial,
  "n_2_i_tempo_de_experiencia_em_dados" VARCHAR  -- 2.i Tempo De Experiencia Em Dados,
  "n_2_j_tempo_de_experiencia_em_ti" VARCHAR  -- 2.j Tempo De Experiencia Em Ti,
  "n_2_k_satisfeito_atualmente" VARCHAR  -- 2.k Satisfeito Atualmente,
  "n_2_l_1_remunera_o_sal_rio" DOUBLE  -- 2.l.1 Remuneração/Salário,
  "n_2_l_2_benef_cios" DOUBLE  -- 2.l.2 Benefícios,
  "n_2_l_3_prop_sito_do_trabalho_e_da_empresa" DOUBLE  -- 2.l.3 Propósito Do Trabalho E Da Empresa,
  "n_2_l_4_flexibilidade_de_trabalho_remoto" DOUBLE  -- 2.l.4 Flexibilidade De Trabalho Remoto,
  "n_2_l_5_ambiente_e_clima_de_trabalho" DOUBLE  -- 2.l.5 Ambiente E Clima De Trabalho,
  "n_2_l_6_oportunidade_de_aprendizado_e_trabalhar_com_refer_ncias" DOUBLE  -- 2.l.6 Oportunidade De Aprendizado E Trabalhar Com Referências,
  "n_2_l_7_oportunidades_de_crescimento" DOUBLE  -- 2.l.7 Oportunidades De Crescimento,
  "n_2_l_8_maturidade_da_empresa_em_termos_de_tecnologia_e_dados" DOUBLE  -- 2.l.8 Maturidade Da Empresa Em Termos De Tecnologia E Dados,
  "n_2_l_9_rela_o_com_os_gestores_e_l_deres" DOUBLE  -- 2.l.9 Relação Com Os Gestores E Líderes,
  "n_2_l_10_reputa_o_que_a_empresa_tem_no_mercado" DOUBLE  -- 2.l.10 Reputação Que A Empresa Tem No Mercado,
  "n_2_l_11_gostaria_de_trabalhar_em_outra_rea" DOUBLE  -- 2.l.11 Gostaria De Trabalhar Em Outra Área,
  "n_2_l_motivo_insatisfacao" VARCHAR  -- 2.l Motivo Insatisfacao,
  "n_2_m_participou_de_entrevistas_ultimos_6m" VARCHAR  -- 2.m Participou De Entrevistas Ultimos 6m,
  "n_2_n_planos_de_mudar_de_emprego_6m" VARCHAR  -- 2.n Planos De Mudar De Emprego 6m,
  "n_2_o_criterios_para_escolha_de_emprego" VARCHAR  -- 2.o Criterios Para Escolha De Emprego,
  "n_2_o_1_remunera_o_sal_rio" DOUBLE  -- 2.o.1 Remuneração/Salário,
  "n_2_o_2_benef_cios" DOUBLE  -- 2.o.2 Benefícios,
  "n_2_o_3_prop_sito_do_trabalho_e_da_empresa" DOUBLE  -- 2.o.3 Propósito Do Trabalho E Da Empresa,
  "n_2_o_4_flexibilidade_de_trabalho_remoto" DOUBLE  -- 2.o.4 Flexibilidade De Trabalho Remoto,
  "n_2_o_5_ambiente_e_clima_de_trabalho" DOUBLE  -- 2.o.5 Ambiente E Clima De Trabalho,
  "n_2_o_6_oportunidade_de_aprendizado_e_trabalhar_com_refer_ncias" DOUBLE  -- 2.o.6 Oportunidade De Aprendizado E Trabalhar Com Referências,
  "n_2_o_7_plano_de_carreira_e_oportunidades_de_crescimento" DOUBLE  -- 2.o.7 Plano De Carreira E Oportunidades De Crescimento,
  "n_2_o_8_maturidade_da_empresa_em_termos_de_tecnologia_e_dados" DOUBLE  -- 2.o.8 Maturidade Da Empresa Em Termos De Tecnologia E Dados,
  "n_2_o_9_qualidade_dos_gestores_e_l_deres" DOUBLE  -- 2.o.9 Qualidade Dos Gestores E Líderes,
  "n_2_o_10_reputa_o_que_a_empresa_tem_no_mercado" DOUBLE  -- 2.o.10 Reputação Que A Empresa Tem No Mercado,
  "n_2_q_empresa_passou_por_layoff_em_2024" VARCHAR  -- 2.q Empresa Passou Por Layoff Em 2024,
  "n_2_r_modelo_de_trabalho_atual" VARCHAR  -- 2.r Modelo De Trabalho Atual,
  "n_2_s_modelo_de_trabalho_ideal" VARCHAR  -- 2.s Modelo De Trabalho Ideal,
  "n_2_t_atitude_em_caso_de_retorno_presencial" VARCHAR  -- 2.t Atitude Em Caso De Retorno Presencial,
  "n_3_a_numero_de_pessoas_em_dados" VARCHAR  -- 3.a Numero De Pessoas Em Dados,
  "n_3_b_cargos_no_time_de_dados_da_empresa" VARCHAR  -- 3.b Cargos No Time De Dados Da Empresa,
  "n_3_b_1_analytics_engineer" DOUBLE  -- 3.b.1 Analytics Engineer,
  "n_3_b_2_engenharia_de_dados_data_engineer" DOUBLE  -- 3.b.2 Engenharia De Dados/Data Engineer,
  "n_3_b_3_analista_de_dados_data_analyst" DOUBLE  -- 3.b.3 Analista De Dados/Data Analyst,
  "n_3_b_4_cientista_de_dados_data_scientist" DOUBLE  -- 3.b.4 Cientista De Dados/Data Scientist,
  "n_3_b_5_database_administrator_dba" DOUBLE  -- 3.b.5 Database Administrator/DBA,
  "n_3_b_6_analista_de_business_intelligence_bi" DOUBLE  -- 3.b.6 Analista De Business Intelligence/BI,
  "n_3_b_7_arquiteto_de_dados_data_architect" DOUBLE  -- 3.b.7 Arquiteto De Dados/Data Architect,
  "n_3_b_8_data_product_manager_dpm" DOUBLE  -- 3.b.8 Data Product Manager/DPM,
  "n_3_b_9_business_analyst" DOUBLE  -- 3.b.9 Business Analyst,
  "n_3_b_10_ml_engineer_ai_engineer" DOUBLE  -- 3.b.10 ML Engineer/AI Engineer,
  "n_3_c_responsabilidades_como_gestor" VARCHAR  -- 3.c Responsabilidades Como Gestor,
  "n_3_c_1_pensar_na_vis_o_de_longo_prazo_de_dados" DOUBLE  -- 3.c.1 Pensar Na Visão De Longo Prazo De Dados,
  "n_3_c_2_organiza_o_de_treinamentos_e_iniciativas" DOUBLE  -- 3.c.2 Organização De Treinamentos E Iniciativas,
  "n_3_c_3_atra_o_sele_o_e_contrata_o" DOUBLE  -- 3.c.3 Atração, Seleção E Contratação,
  "n_3_c_4_decis_o_sobre_contrata_o_de_ferramentas" DOUBLE  -- 3.c.4 Decisão Sobre Contratação De Ferramentas,
  "n_3_c_5_gestor_da_equipe_de_engenharia_de_dados" DOUBLE  -- 3.c.5 Gestor Da Equipe De Engenharia De Dados,
  "n_3_c_6_gestor_da_equipe_de_estudos_relat_rios" DOUBLE  -- 3.c.6 Gestor Da Equipe De Estudos, Relatórios,
  "n_3_c_7_gestor_da_equipe_de_intelig_ncia_artificial_e__55b63e37" DOUBLE  -- 3.c.7 Gestor Da Equipe De Inteligência Artificial E Machine Learning,
  "n_3_c_8_apesar_de_ser_gestor_ainda_atuo_na_parte_t_cnica" DOUBLE  -- 3.c.8 Apesar De Ser Gestor Ainda Atuo Na Parte Técnica,
  "n_3_c_9_gest_o_de_projetos_de_dados" DOUBLE  -- 3.c.9 Gestão De Projetos De Dados,
  "n_3_c_10_gest_o_de_produtos_de_dados" DOUBLE  -- 3.c.10 Gestão De Produtos De Dados,
  "n_3_c_11_gest_o_de_pessoas" DOUBLE  -- 3.c.11 Gestão De Pessoas,
  "n_3_d_desafios_como_gestor" VARCHAR  -- 3.d Desafios Como Gestor,
  "n_3_d_1_contratar_talentos" DOUBLE  -- 3.d.1 Contratar Talentos,
  "n_3_d_2_reter_talentos" DOUBLE  -- 3.d.2 Reter Talentos
);

Share link

Anyone who has the link will be able to view this.