Baselight

State Of Data Brazil 2024-2025

O maior mapeamento do mercado brasileiro de dados e AI [Data Hackers + Bain]

@kaggle.datahackers_state_of_data_brazil_20242025

Loading...
Loading...

About this Dataset

State Of Data Brazil 2024-2025

1 Sobre a Pesquisa

Entre novembro e dezembro de 2024, mais de 5,2 mil profissionais responderam o State of Data Brazil -a pesquisa anual, do maior panorama do mercado de trabalho em dados no Brasil -, feito pela comunidade Data Hackers em parceria com a Bain & Company, esta é a 5ª edição desta pesquisa que teve início em 2019.

Veja mais detalhes no site da pesquisa: stateofdata.datahackers.com.br - No site da pesquisa você também pode fazer o download gratuito de um relatório completo desenvolvido pela Bain & Company com conclusões interessantes sobre o mercado de trabalho brasileiro na área de dados.

A presente pesquisa é o resultado de um esforço conjunto da Data Hackers, a maior comunidade de dados do Brasil, e da Bain & Company, consultoria global que ajuda empresas e organizações a promover mudanças que definam o futuro dos negócios, para mapear o mercado de trabalho de dados no Brasil.

A pesquisa foi conduzida entre 14 de outubro de 2024 e 18 de dezembro de 2024 e contou com 5.217
respondentes brasileiros. A amostra reflete a visão de variados papéis de atuação em empresas, como os de
analista de dados, cientista de dados e engenheiro de dados, bem como diferentes perfis de experiência
profissional, incluindo analistas júnior, pleno, sênior e gestores.

Gostaríamos de agradecer a toda a comunidade Data Hackers e a todos os parceiros que nos apoiaram durante a pesquisa, incluindo André Sionek, Karine Lago, Canal Let's Data, Canal Programação Dinâmica, Canal do Mario Filho, Alura, Canal Estatidados, Comunidade Mulheres em Dados, Teo Calvo, Flai, QuantitativaMente, Preditiva e professora Fernanda Maciel, sem o apoio de vocês nunca teríamos chegado a uma pesquisa tão completa e abrangente.

2 Sobre o processamento e anonimização dos dados

O dataset foi anonimizado com o objetivo de garantir a privacidade dos respondentes, para isso foi necessário em alguns casos remover outliers que poderiam identificar o entrevistado e, portanto, nem todos os dados coletados na pesquisa estarão disponíveis aqui. Estados com menor incidência de resposta, como alguns da região Norte por exemplo, terão apenas sua região indicada no dataset, também como consequência do processo de anonimização, o mesmo aconteceu em algumas outras perguntas.

As perguntas cujas respostas são multi-valoradas ocupam mais de uma coluna no dataset. Portanto, para diferenciar quais colunas pertencem a quais perguntas, cada coluna é identificada com uma tupla. Sendo o primeiro identificador o da pergunta, e, no caso de várias respostas, o segundo identificador referencia a alternativa escolhida. As perguntas mapeadas são mostradas abaixo (lembrando que algumas foram removidas e outras tiveram alguns outliers transformados/apagados no processo de anonimização)

3 Sobre os dados da Pesquisa

O questionário foi dividido em 8 partes, e dentro de cada uma das partes temos as perguntas e opções de escolha.

  • Parte 1 - Dados demográficos
  • Parte 2 - Dados sobre carreira
  • Parte 3 - Desafios dos gestores de times de dados
  • Parte 4 - Conhecimentos na área de dados
  • Parte 5 - Objetivos na área de dados
  • Parte 6 - Conhecimentos em Engenharia de Dados/DE
  • Parte 7 - Conhecimentos em Análise de Dados/DA
  • Parte 8 - Conhecimentos em Ciências de Dados/DS

Cada pergunta é dividida em Parte, Letra da Pergunta, Número da Opção escolhida
Exemplo: P3a_1 = Parte 3, pergunta (a), opção (1)

4 Saiba Mais

Para acompanhar as evoluções da pesquisa e demais iniciativas da comunidade cadastre-se no site datahackers.news

Em caso de qualquer dúvida entre em contato no email: falecom@datahackers.com.br

Tables

Final Dataset State Of Data 2024 Kaggle Df Survey 2024

@kaggle.datahackers_state_of_data_brazil_20242025.final_dataset_state_of_data_2024_kaggle_df_survey_2024
  • 1.33 MB
  • 5217 rows
  • 403 columns
Loading...

CREATE TABLE final_dataset_state_of_data_2024_kaggle_df_survey_2024 (
  "n_0_a_token" VARCHAR,
  "n_0_d_data_hora_envio" VARCHAR,
  "n_1_a_idade" BIGINT,
  "n_1_a_1_faixa_idade" VARCHAR,
  "n_1_b_genero" VARCHAR,
  "n_1_c_cor_raca_etnia" VARCHAR,
  "n_1_d_pcd" VARCHAR,
  "n_1_e_experiencia_profissional_prejudicada" VARCHAR,
  "n_1_e_1_n_o_acredito_que_minha_experi_ncia_profissiona_b395c565" DOUBLE,
  "n_1_e_2_sim_devido_a_minha_cor_ra_a_etnia" DOUBLE,
  "n_1_e_3_sim_devido_a_minha_identidade_de_g_nero" DOUBLE,
  "n_1_e_4_sim_devido_ao_fato_de_ser_pcd" DOUBLE,
  "n_1_i_1_uf_onde_mora" VARCHAR,
  "n_1_f_1_quantidade_de_oportunidades_de_emprego_vagas_recebidas" DOUBLE,
  "n_1_f_2_senioridade_das_vagas_recebidas_em_rela_o_sua__a94f3f8e" DOUBLE,
  "n_1_f_3_aprova_o_em_processos_seletivos_entrevistas" DOUBLE,
  "n_1_f_4_oportunidades_de_progress_o_de_carreira" DOUBLE,
  "n_1_f_5_velocidade_de_progress_o_de_carreira" DOUBLE,
  "n_1_f_6_n_vel_de_cobran_a_no_trabalho_stress_no_trabalho" DOUBLE,
  "n_1_f_7_aten_o_dada_pelas_pessoas_diante_das_minhas_op_ca91bae9" DOUBLE,
  "n_1_f_8_rela_o_com_outras_pessoas_da_empresa_em_moment_b9033247" DOUBLE,
  "n_1_f_9_rela_o_com_outras_pessoas_da_empresa_em_moment_af186993" DOUBLE,
  "n_1_i_2_regiao_onde_mora" VARCHAR,
  "n_1_f_aspectos_prejudicados" VARCHAR,
  "n_1_k_1_uf_de_origem" VARCHAR,
  "n_1_k_2_regiao_de_origem" VARCHAR,
  "n_1_g_vive_no_brasil" BOOLEAN,
  "n_1_h_pais_onde_mora" VARCHAR,
  "n_1_i_estado_onde_mora" VARCHAR,
  "n_1_j_vive_no_estado_de_formacao" VARCHAR,
  "n_1_k_estado_de_origem" VARCHAR,
  "n_1_l_nivel_de_ensino" VARCHAR,
  "n_1_m_rea_de_forma_o" VARCHAR,
  "n_2_a_situa_o_de_trabalho" VARCHAR,
  "n_2_b_setor" VARCHAR,
  "n_2_c_numero_de_funcionarios" VARCHAR,
  "n_2_d_atua_como_gestor" VARCHAR,
  "n_2_e_cargo_como_gestor" VARCHAR,
  "n_2_f_cargo_atual" VARCHAR,
  "n_2_g_nivel" VARCHAR,
  "n_2_h_faixa_salarial" VARCHAR,
  "n_2_i_tempo_de_experiencia_em_dados" VARCHAR,
  "n_2_j_tempo_de_experiencia_em_ti" VARCHAR,
  "n_2_k_satisfeito_atualmente" VARCHAR,
  "n_2_l_1_remunera_o_sal_rio" DOUBLE,
  "n_2_l_2_benef_cios" DOUBLE,
  "n_2_l_3_prop_sito_do_trabalho_e_da_empresa" DOUBLE,
  "n_2_l_4_flexibilidade_de_trabalho_remoto" DOUBLE,
  "n_2_l_5_ambiente_e_clima_de_trabalho" DOUBLE,
  "n_2_l_6_oportunidade_de_aprendizado_e_trabalhar_com_refer_ncias" DOUBLE,
  "n_2_l_7_oportunidades_de_crescimento" DOUBLE,
  "n_2_l_8_maturidade_da_empresa_em_termos_de_tecnologia_e_dados" DOUBLE,
  "n_2_l_9_rela_o_com_os_gestores_e_l_deres" DOUBLE,
  "n_2_l_10_reputa_o_que_a_empresa_tem_no_mercado" DOUBLE,
  "n_2_l_11_gostaria_de_trabalhar_em_outra_rea" DOUBLE,
  "n_2_l_motivo_insatisfacao" VARCHAR,
  "n_2_m_participou_de_entrevistas_ultimos_6m" VARCHAR,
  "n_2_n_planos_de_mudar_de_emprego_6m" VARCHAR,
  "n_2_o_criterios_para_escolha_de_emprego" VARCHAR,
  "n_2_o_1_remunera_o_sal_rio" DOUBLE,
  "n_2_o_2_benef_cios" DOUBLE,
  "n_2_o_3_prop_sito_do_trabalho_e_da_empresa" DOUBLE,
  "n_2_o_4_flexibilidade_de_trabalho_remoto" DOUBLE,
  "n_2_o_5_ambiente_e_clima_de_trabalho" DOUBLE,
  "n_2_o_6_oportunidade_de_aprendizado_e_trabalhar_com_refer_ncias" DOUBLE,
  "n_2_o_7_plano_de_carreira_e_oportunidades_de_crescimento" DOUBLE,
  "n_2_o_8_maturidade_da_empresa_em_termos_de_tecnologia_e_dados" DOUBLE,
  "n_2_o_9_qualidade_dos_gestores_e_l_deres" DOUBLE,
  "n_2_o_10_reputa_o_que_a_empresa_tem_no_mercado" DOUBLE,
  "n_2_q_empresa_passou_por_layoff_em_2024" VARCHAR,
  "n_2_r_modelo_de_trabalho_atual" VARCHAR,
  "n_2_s_modelo_de_trabalho_ideal" VARCHAR,
  "n_2_t_atitude_em_caso_de_retorno_presencial" VARCHAR,
  "n_3_a_numero_de_pessoas_em_dados" VARCHAR,
  "n_3_b_cargos_no_time_de_dados_da_empresa" VARCHAR,
  "n_3_b_1_analytics_engineer" DOUBLE,
  "n_3_b_2_engenharia_de_dados_data_engineer" DOUBLE,
  "n_3_b_3_analista_de_dados_data_analyst" DOUBLE,
  "n_3_b_4_cientista_de_dados_data_scientist" DOUBLE,
  "n_3_b_5_database_administrator_dba" DOUBLE,
  "n_3_b_6_analista_de_business_intelligence_bi" DOUBLE,
  "n_3_b_7_arquiteto_de_dados_data_architect" DOUBLE,
  "n_3_b_8_data_product_manager_dpm" DOUBLE,
  "n_3_b_9_business_analyst" DOUBLE,
  "n_3_b_10_ml_engineer_ai_engineer" DOUBLE,
  "n_3_c_responsabilidades_como_gestor" VARCHAR,
  "n_3_c_1_pensar_na_vis_o_de_longo_prazo_de_dados" DOUBLE,
  "n_3_c_2_organiza_o_de_treinamentos_e_iniciativas" DOUBLE,
  "n_3_c_3_atra_o_sele_o_e_contrata_o" DOUBLE,
  "n_3_c_4_decis_o_sobre_contrata_o_de_ferramentas" DOUBLE,
  "n_3_c_5_gestor_da_equipe_de_engenharia_de_dados" DOUBLE,
  "n_3_c_6_gestor_da_equipe_de_estudos_relat_rios" DOUBLE,
  "n_3_c_7_gestor_da_equipe_de_intelig_ncia_artificial_e__55b63e37" DOUBLE,
  "n_3_c_8_apesar_de_ser_gestor_ainda_atuo_na_parte_t_cnica" DOUBLE,
  "n_3_c_9_gest_o_de_projetos_de_dados" DOUBLE,
  "n_3_c_10_gest_o_de_produtos_de_dados" DOUBLE,
  "n_3_c_11_gest_o_de_pessoas" DOUBLE,
  "n_3_d_desafios_como_gestor" VARCHAR,
  "n_3_d_1_contratar_talentos" DOUBLE,
  "n_3_d_2_reter_talentos" DOUBLE
);

Share link

Anyone who has the link will be able to view this.