Um guia de carreira e salários em dados em 2022 😎

Conheça o AudioLM, a AI da Google que pode ouvir um pequeno trecho de uma conversa e continuar o papo com a voz da pessoa

Fala Data Hackers, chegamos a mais uma semana com novidades quentes no mundo dos dados e AI!A primeira novidade é que a Pesquisa State of Data Brazil 2022 acabou de ser lançada! Se você ainda não conhece essa iniciativa ela funciona assim:Todos os anos a comunidade Data Hackers com o apoio da consultoria global Bain & Company, faz um mapeamento completo do mercado de trabalho na área de dados no Brasil, coletando informações a respeito dos maiores desafios dos profissionais, senioridade, salário, tendências de tecnologias e ferramentas, perrengues na carreira e muito mais.Depois que a pesquisa é realizada, construimos um relatório com um panorama da área de dados no Brasil, abrimos os dados anonimizados para toda a comunidade poder explorar e ainda lançamos uma competição onde as melhores análises com os dados da pesquisa ganham prêmios incríveis (esse ano rolou até um PS5)... Lembre-se que tudo isso só é possível com a colaboração de todos da comunidade.Mas, antes de começamos, posso te fazer um pedido?Poderia participar da nossa pesquisa preenchendo esse questionário e apoiando a comunidade Data Hackers a mapear os desafios do mercado brasileiro de dados? Esse é o link direto para o questionário.Muito obrigado pela contribuição, essa pesquisa é muito importante para toda a comunidade.Mas agora vamos ao que interessa, temos vários assuntos interessantes para começar a semana:

Participe da pesquisa State of Data Brazil 2022 e ajude toda a comunide a entender os desafios do mercado de trabalho brasileiro em dados

A pesquisa State of Data Brazil é uma das maiores entregas do ano da comunidade Data Hackers, afinal com a força da comunidade conseguimos mapear informações importantes sobre carreiras, salários, desafios, tendências de tecnologias e muito mais!

A melhor parte é que ao final da pesquisa todos os participantes da comunidade tem acesso a um dataset super completo para utilizar como preferir.

Já vimos pessoas que usam o dataset da pesquisa para criar conteúdos, para estudar, para dar aulas, para testar novas técnicas e modelos, para incrementar o portfólio e até mesmo para pedir um aumento pro chefe! (mas dessa vez embasado nos dados, certo?)

Sendo assim, não precisamos nem mesmo explicar sobre a importância que todos respondam a pesquisa, uma vez que sem uma boa amostra de respostas a pesquisa perde muita qualidade. A pesquisa é bem objetiva e foi planejada com muito critério, o tempo para responder é estimado em 10 minutos.

E aí o que está esperando? Acesse

e participe!

Os participantes da pesquisa State of Data Brazil 2022 vão ganhar acesso a um material exclusivo que acabou de sair do forno, o Guia Data Hackers: Carreira + Salários em dados em 2022.

O guia é um ebook com diversas informações importantes sobre as carreiras em dados, como por exemplo:

  • Quais os salários de profissionais Júnior x Pleno x Sênior;

  • Como estão os comportamentos de mudança de emprego em dados;

  • Um Raio-X das profissões de Cientista de Dados, Engenheiro de Dados e Analista de Dados, contemplando as tecnologias e ferramentas mais utilizadas, níveis de senioriedade e empresas que mais contratam esses profissionais;

  • E muito, muito mais!

Essa é mais uma forma que a comunidade Data Hackers criou para agradecer a participação de todos na pesquisa, mas podem aguardar que ainda teremos mais novidades! (em Português)

O mercado de novas tecnologias em AI está mais quente do que nunca!

Dessa vez a novidade vem direto da Google que acabou de apresentar o AudioLM, uma AI que promete conseguir pegar pequenos trechos de audio e criar toda uma sequência, com a mesma voz e falando sobre um assunto totalmente contextualizado com o trecho de exemplo.

O processo é bem parecido com algumas formas de uso do GPT-3 que pegam trechos de um livro e continuam a história, com a diferença que agora a continuação é toda na mesma voz passada pelo exemplo.

Certamente essa é mais uma daquelas inovações que no início nem conseguimos imaginar as inúmeras possibilidades de uso em nosso dia a dia, mas que podem trazer evoluções incríveis em muito pouco tempo. (em Inglês)

 

Desenvolver um produto de dados é uma aventura muito desafiadora pois envolve toda a complexidade de gestão de um produto em um ambiente ainda mais complexo, cercado por grandes volumes de dados.

Mas será que existe uma forma de fazer com que esse produto não se torne um pesadelo? Essa é exatamente a proposta desse artigo.

No texto a autora apresenta as principais fazes que precisamos acompanhar com atenção durante a construção de um produto de dados e os quarto critérios indispensáveis para o sucesso desse tipo de produto.

O artigo é bem completo e inclui um checklist de perguntas importantes que precisam ser respondidas durante o processo de desenvolvimento de um produto de dados.  (em Inglês)

Na última semana divulgamos aqui

o lançamento do Optimus Bot, um robô humanoide que promete executar tarefas comuns em nosso dia a dia. Mas agora após todo o hype do lançamento, pessoas da área de AI chegaram a um consentimento que o robô aparenta ser muito mais avançado que se esperava, desenvolvendo com muita destreza diversas tarefas do dia a dia como carregar caixas, manusear ferramentas e regar plantas. Agora a dúvida fica em prever quanto tempo vai levar até esse tipo de robô se tornar presente em nosso dia a dia. (em Inglês)

O Datas Hacker Gustavo Santos fez um artigo muito interessante contando em detalhes como funcionam os pipelines do Scikit Learn e como essa funcionalidade pode te ajudar a ser mais produtivo nas rotinas de Data Science. (em Português)

Modelos de regressão são uma base muito importante para o entendimento de como funcionam os modelos preditivos, porém como se tratam de conceitos de matemática e estatística, nem sempre são fáceis de serem compreendidos. A ideia por trás desse site veio para ajudar exatamente nisso, explicando regressão linear passo a passo, através de animações, explicações e fórmulas. (em Inglês)

Apesar de tratar de um tema complexo, esse artigo é bem interessante e demostra de forma prática como detectar observações atípicas (outliers) em conjuntos de textos. O autor discute as principais abordagens a respeito do tema e apresenta um canivete suíço de ferramentas open-source em Python para encarar esse desafio. (em Inglês)

Cientistas de Dados precisam se preocupar com documentação?Já sabemos que a maioria dos brasileiros não é muito fã de ler documentações, muitas vezes preferem aprender através do processo de tentativa e erro (por mais que não faça sentido em termos de eficiência), mas e na área de dados? Quão importante é a documentação e como cada tipo de profissional da área deveria se preocupar com ela? Esse vídeo da Cassie Kozyrkov (Chief Decision Scientist na Google) fala justamente desse tema tão importante para garantir mais eficiência em projetos de dados e tecnologia. Já adianto que a resposta a essa pergunta muda muito dependendo do cargo da pessoa, vale a pena conferir as conclusões da Cassie no vídeo. (em Inglês)

VAGAS DA SEMANA

  • Inglês avançado para leitura (artigos técnicos) e escrita (documentação de modelos e APIs);

  • Experiência com técnicas de modelagem descritiva e preditiva;

  • Experiência na construção de ETL usando SQL;

  • Experiência com Python e/ou R para construção de modelos;

  • Formação ciências exatas (preferencialmente Matemática, Computação ou Engenharia);

  • SQL;

  • Programação em Python e/ou R;

  • Domínio em estatística e Machine Learning (regressão, classificação, clusterização e séries temporais);

  • Experiência com exploração e visualização de dados (preferencialmente Power BI);

Ouvi dizer por aí que a vida do Engenheiro de Dados está cada vez mais fácil...

Na legislatura que vai tomar posse em 2023, as mulheres serão 17,7% da bancada federal. O número ainda é pequeno, mas já é um novo recorde, ultrapassando o número de 15% em 2018. Nessa visualização de dados disponibilizada pela equipe do Nexo Jornalé possível entender melhor como tem sido essa evolução ao longo do tempo. (em português)

AWSOME DAY20 de Outubro - Evento Gratuito e 100% OnlineCoalesce: The Analytics Engineer Conference17 a 21 de Outubro - Parte Online gratuitaImpact: The Data Observability Summit25 e 26 de Outubro - Parte Online gratuitaAquece TDC: Feature Stores como aceleradores das plataformas modernas de dados27 de Outubro - Evento Gratuito e 100% OnlineFloripa dbt Meetup (in-person)27 de Outubro - Evento Gratuito e presencialAWS Re:Invent28 de Novembro a 02 de Dezembro - Parte Online gratuita

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.