Data Hackers Newsletter
Posts
A dica matadora para se destacar na busca por emprego em dados

A dica matadora para se destacar na busca por emprego em dados

E mais: como o DuckDB pode deixar o PySpark mais rápido; a relação entre a fórmula de Bhaskara e a estatística.

Data Hackers & Paulo Vasconcellos
13 de novembro de 2023 • Tempo de leitura estimado: 5 minutos

Fala, Data Hackers! Que tal abrir a semana lendo as notícias e artigos mais quentes do mundo dos dados?

Nesta edição trazemos um artigo sobre como contribuir para projetos open-source pode ajudar na busca de um emprego no mercado de dados, uma análise do potencial do DuckDB para deixar o PySpark mais rápido e um artigo que traz a fórmula de Bhaskara, nossa velha conhecida da escola, em um contexto estatístico.

Confira ainda alguns outros destaques dessa edição:

Live do Data Hackers: Estratégias de estudo para migração de carreira em dados

Na próxima terça vamos explorar práticas essenciais do que estudar, que ferramentas usar e quais são os desafios comuns que as pessoas enfrentam na jornada de fazer uma migração de carreira para a área de dados. Como convidada especial, teremos Carla Vieira, Mestra em Inteligência Artificial pela USP e Engenheira de Dados na QuantumBlack, reconhecida como Google Developer Expert em Machine learning e como uma das 100 mulheres mais brilhantes na área de IA Ética.

Não esqueça de clicar em “Receber notificações" para saber quando a live começa. Nos vemos lá!

A dica matadora para se destacar na busca por emprego em dados

Calma, não vou tentar te vender um curso, eu juro!

O mercado de dados tem se mostrado cruel para quem está iniciando: são poucas vagas juniores para muitos profissionais tentando um primeiro emprego, muitos deles migrando de carreira e vindo de outras áreas. Como se destacar, afinal?

Neste artigo, falo um pouco sobre como contribuir para projetos open-source pode te ajudar a ser enxergado e valorizado pelo mercado: em um contexto onde muitos profissionais têm portfólios com projetos genéricos copiados de tutoriais ou cursos, você mostra seu real nível de entendimento e resolução de problemas, e ninguém pode copiar isso de você. (em Português)

O que a Fórmula de Bhaskara tem a ver com Estatística?

Fórmula de Bhaskara é algo que você aprende na escola pra resolver equações do segundo grau e depois nunca mais vê na vida, certo?

E se eu te falar que não necessariamente?

Neste artigo, o Data Hacker Antonio Carlos mostra a fórmula de Bhaskara de um ponto de vista estatístico e mostra algumas situações reais em que pode ser possível aplicá-la. (em Português)

Como o DuckDB pode deixar o PySpark mais rápido

Desde seu lançamento em 2014 o Apache Spark se tornou uma referência para o processamento de dados. A questão é que para muitos pipelines, principalmente aqueles de incremento diário, não são necessários tantos recursos e principalmente tantos nós, e mesmo rodando com configuração mínima o Spark ainda gera muita sobrecarga.

Desde sua última versão, a equipe do gerenciador DuckDB vem trabalhando para oferecer um API de compatibilidade com o Spark: o usuário pode utilizar a base de código do Spark, mas trabalhando com o DuckDB. Este artigo detalha o potencial de um API assim, além de comentar possíveis contextos de uso. (em Inglês)

OUTROS TÓPICOS

X (antigo Twitter) anuncia Grok, sua IA sarcástica
Modelo apresentado pela empresa de Elon Musk é inspirado em “O Guia do Mochileiro das Galáxias”: com certa “tendência rebelde”, ele dá tiradas de humor cortantes e responde perguntas picantes que outros modelos provavelmente evitariam, além de usar informações em tempo real através da plataforma X. (em Inglês)

OpenAI DevDay apresenta diminuição de custo para IA e novidades
Em seu evento voltado para desenvolvedores, a gigante OpenAI, criadora do ChatGPT, anunciou a redução do custo de seus modelos em até 3 vezes, atualizações dos modelos GPT, novos APIs desenvolvidos pela empresa e a criação de GPTs personalizados pelo próprio usuário, entre outras novidades. (em Inglês)

O que fazer quando se sentir travado em um projeto de dados
Você já esteve construindo um pipeline de dados ou um modelo preditivo e, quando se sentia próximo de terminar, o código executado não gerou os resultados que você esperava? E o pior: sem nenhuma mensagem de erro ou indicação clara do que está causando o problema? Este valioso artigo sugere estratégias para usar nessas situações que podem acontecer com todos nós. (em Inglês)

Como a Figma usa data scientists e UX researchers para gerar melhores insights
Este artigo relata como uma equipe multifuncional que reunia cientistas de dados e pesquisadores UX acumulou aprendizados quantitativos e qualitativos e assim ajudou a Figma a oferecer aos usuários insights e notificações melhores. (em Inglês)

Ainda dá tempo de participar do State of Data Brazil!

A pesquisa State of Data Brazil segue a todo vapor! Já foram mais de 3800 respostas que recebemos de profissionais de dados que estão nos ajudando a mapear o mercado brasileiro de dados! Mas, ainda dá tempo de você participar do State of Data Brazil! Clique aqui para participar da pesquisa (se você já havia começado ela mas não terminou, pode voltar de onde parou!).

A edição desse ano está ainda melhor, onde adicionamos perguntas relacionadas ao trabalho remoto e uso de inteligência artificial generativa. Além disso, ao finalizar a pesquisa, você terá acesso ao Guia de Carreira em Dados: um relatório detalhado com informações sobre carreiras, salários, formações e tudo mais que você precisa para montar seu plano para crescer na área de dados!

O State of Data Brazil é uma iniciativa da comunidade Data Hackers com a Bain & Company. Como nos anos passados, ao final vamos disponibilizar os dados da pesquisa (sem informações pessoais, é claro) além de um relatório detalhado com as maiores descobertas que tivemos esse ano. Já preencheu a pesquisa? Que tal nos ajudar compartilhando ela com seus colegas e grupos que participar?

E aí, podemos contar com seu apoio? Acesse www.stateofdata.com.br/newsletter e participe!

DICA DE VÍDEO

Ensinando uma IA a jogar Pokémon

E se uma IA jogasse Pokémon? O YouTuber Peter Whidden fez um experimento onde colocou uma IA para jogar o clássico Pokémon Red por 50 mil horas sem saber que a IA soubesse nada do jogo inicialmente, mas tivesse objetivos como visualizar coisas novas, capturar Pokémons, aumentar o nível geral da equipe, vencer batalhas e vencer ginásios. Nesse vídeo, o YouTuber detalha o processo, os sucessos e principalmente as falhas que a IA teve, que podem trazer insights preciosos sobre o funcionamento dos algoritmos e mesmo a maneira como aprendemos coisas novas. No final, ele ainda se aprofunda em detalhes técnicos e oferece o programa para quem quiser baixá-lo e testá-lo. (em Inglês)

VAGAS DA SEMANA

Estatístico(a) Pleno - Allianz

São Paulo - SP - Híbrido

Formação superior em Estatística, Ciências Atuariais, Engenharia e/ou áreas correlatas;
Inglês Avançado;
Atuação anterior em Pricing;
Power BI;
SAS;
Phyton.

Data Scientist Senior - OLX

Rio de Janeiro - RJ - Híbrido

Experiência com análise e modelagem numérica;
Conhecimentos em modelos preditivos de Machine Learning de classificação de preferência focado em Texto, Imagem e/ou Dados estruturados;
Habilidade de conduzir análises quantitativas consistentes e claras;
Habilidade para documentar e comunicar insights orientados a dados para públicos diversos;
Escrita de código em nível de criação de protótipos sem depender de engenheiros de software.

MEME DA SEMANA

É, Google, não vai ser fácil bater a OpenAI não, hein?

DATA VISUALIZATION DA SEMANA

Collins elege "AI" como a Palavra do Ano de 2023

O Collins é um dos mais tradicionais dicionários da língua inglesa: teve sua primeira edição publicada na Escócia em 1819 e desde então tem novas edições todos os anos, hoje sob responsabilidade do grupo editorial HarperCollins, um dos 5 maiores da língua inglesa no mundo.

Desde 2013, o dicionário passou a eleger uma “Palavra do Ano” todos os anos, com as candidatas (que podem ser novas ou não) selecionadas pela equipe que do dicionário com base em dados de usuários e referências cruzadas com o corpus do Collins, o que ajuda a entender como a linguagem mudou no último ano. Em 2023, a bola da vez foi “AI”, desbancando concorrentes como “ultraprocessed” e “deinfluencing”.

Vale acessar, entender o processo que elege a palavra do ano e constatar como a tecnologia não muda só nossos hábitos, mas até mesmo nossa linguagem. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

apply(ops) 23
14 de novembro - Online

Observability and Platform Mindset: Fostering Developer Autonomy
21 de novembro - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

1 - Fraca | 2 - Razoável | 3 - Média | 4 - Boa | 5 - Excelente

Faça Login ou Inscrever-se para participar de pesquisas.