Data Hackers Newsletter
Posts
O guia completo para quem quer se tornar um Cientista de Dados em 2024

O guia completo para quem quer se tornar um Cientista de Dados em 2024

E mais: Lendo 1TB de dados no seu laptop utilizando Python; Como gerenciar pessoas que não estão performando bem

Paulo Vasconcellos
5 de agosto de 2024 • Tempo de leitura estimado: 5 minutos

Se inscrever | Parcerias | Podcast | Blog

Fala aí galera! Bora começar agosto se informando sobre o que tem rolado no universo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

Podcast da Semana

🎙️Ouvir em outras plataformas de podcast

Nos últimos anos, a pesquisa State of Data Brazil destacou as barreiras enfrentadas por pessoas com deficiência para se tornarem profissionais da área de dados e conseguirem progredir na carreira.

Nesse podcast, discutimos como empresas e líderes podem criar ambientes de trabalho que valorizem habilidades, adaptando processos seletivos e práticas para acolher profissionais com deficiência. Também exploramos o papel das ferramentas de IA Generativa na melhoria da acessibilidade e como tem sido sua adoção.

Para isso, contamos com um time especial de convidadas: Géssica Pereira, deficiente visual total e Data Science Specialist; Maristela Salle — Gerente Sr. de Dados e AI; e Luíza Tocchetto — Especialista Diversidade Inclusão; todas atuantes no Grupo Boticário.

No fim, além de oferecer conselhos para quem deseja ser parte dessa transformação inclusiva nossa convidada Géssica compartilha uma mensagem inspiradora para outros profissionais com deficiência que buscam construir uma carreira na área de dados. Vale ouvir!

O guia completo para quem quer se tornar um cientista de dados em 2024

Com o boom dos dados na última década e o número de pessoas interessadas em migrar de carreira, há inúmeros guias e roadmaps internet afora voltados para quem quer se tornar um cientista de dados. Mas paradoxalmente, o alto número de opções pode até jogar contra, no sentido que fica difícil saber quais conteúdos são de fato relevantes e merecem ser seguidos. Este repositório se mostra bem completo e didático: contém recursos que vão desde blog posts até como se preparar para entrevistas. Puro ouro! (em Inglês)

Um workshop gratuito onde você vai aprender a utilizar na prática 20 ferramentas de AI

Em uma parceria com a GrowthSchool estamos divulgando esse workshop, quando você clicar no link eles vão te oferecer materiais extras por US$ 19, mas não é necessário comprar, o workshop é gratuito e o link será encaminhado pelo Whatsapp. (O workshop é totalmente em inglês)

AI & ChatGPT Mini Crash Course - Eliminate workplace burnout & save 16+ hours every week. Learn 20+ AI tools, prompting techniques & hacks for free.

Save your seat here (first 100 people only) ⏰

Obs: Os links acima são patrocinados, ao clicar você apoia a comunidade Data Hackers, escolha a opção "Skip Forever” para ter acesso ao conteúdo gratuito.

Lendo 1TB de dados no seu laptop utilizando Python

Ao trabalhar com datasets muito grandes, é comum incorrer em erros de falta de memória, os chamados “out-of-memory (OOM) errors”. E isso acontece por um motivo simples: quando boa parte dos dataframes foram criados, não era imaginável ter que analisar 100 GB ou 1 TB de dados como se faz hoje.

É possível, no entanto, analisar grandes quantidades de dados sem possuir tanta memória RAM: este artigo traz um tutorial de como analisar 1 TB de dados em um laptop usando o dataframe Ibis. (em Inglês)

Como gerenciar pessoas que não estão performando bem

O baixo rendimento é algo comum no mundo corporativo, e todo gerente vai precisar lidar com isso em algum momento. Performances aquém do esperado podem ter basicamente dois motivos (sem qualquer relação entre eles): problemas no alinhamento e falhas na execução.

Este artigo traz um guia prático de como investigar os motivos que levam a uma baixa performance e como agir em cada caso, passando por aspectos técnicos, relacionais e pessoais. (em Inglês)

OUTROS TÓPICOS

Governo anuncia Plano Nacional da Inteligência Artificial

O Ministério da Ciência e Tecnologia divulgou na última semana o Plano Nacional de Inteligência Artificial. Ainda dependendo de validação pelo Palácio do Planalto para entrar em vigor, o Plano prevê o investimento de R$ 23 bilhões até 2028, entre incentivos para a indústria brasileira de IA, repasses para a construção de infraestruturas locais e até o desenvolvimento de um “supercomputador” para ser usado em parcerias com empresas. (em Português)

O X (antigo Twitter) vai usar seus dados para treinamento de IA, a não ser que você o impeça

O X (antigo Twitter) inseriu em suas configurações um termo sobre o uso de dados de usuários para treinamento de IA, e esse termo já vem marcado automaticamente como se o usuário tivesse consentido. Mas calma: ainda é possível desautorizar esse uso por parte de Elon Musk e sua turma. Leia esse artigo para aprender como. (em Inglês)

OpenAI anuncia nova ferramenta de buscas com IA

A OpenAI não para: depois de lançar o modelo de IA de baixo custo GPT-4o mini e a resposta por voz no GPT-4o, que gerou polêmica com a atriz Scarlet Johansson acusando a empresa de clonar sua voz, a big tech anunciou o lançamento de um sistema de busca próprio para concorrer com o Google. Chamado de SearchGPT, o novo sistema está sendo testado por um grupo limitado de usuários, será em breve disponibilizado como um protótipo em um navegador da web e poderá ser adicionado ao ChatGPT. (em Português)

Alexa está em milhões de lares (e a Amazon está perdendo bilhões de dólares)

Pode parecer inacreditável, mas a Alexa, provavelmente a assistente virtual mais conhecida do mercado, tem grande chance de ser descontinuada. Desde que foi lançada há 8 anos, a Alexa jamais deu lucro: era vendida quase a preço de custo buscando invadir os lares e monopolizar o mercado da automação residencial. Havia a expectativa de que as equipes de IA e engenharia conseguissem monetizar a assistente, mas isso nunca se concretizou, e só nesse ano, o setor da Amazon responsável pela Alexa gerou US$ 10 bilhões de prejuízo. (em Inglês)

DICA DE VIDEO

O novo Llama é um verdadeiro monstro

A nova versão do Llama foi lançada semana passada, impressionando a todos pelos resultados em matéria de benchmarking. Mas é aquela história… Benchmarkings podem mentir, né? A melhor forma de constatar as reais capacidades de um modelo é testando ele. Nesse vídeo, os caras do Fireship põem a mão na massa e testam um pouco das capacidades reais desse gigante. Bem interessante de assistir. (em Inglês)

VAGAS DA SEMANA

Cientista de Dados Pleno - UOL

Remoto - Todo o Brasil

Data Product Manager Especialista - Grupo Boticário

Remoto - Todo o Brasil

MEME DA SEMANA

Acesse nosso canal do slack para mais memes como esse!

DATA VISUALIZATION DA SEMANA

Pedimos a uma IA para criar um storytelling. Será que ela foi capaz?

O The Pudding é um portal muito conhecido aqui na comunidade por seus storytellings incríveis. Mas será que, com a equipe do próprio site orientando um modelo de IA generativa, esse modelo conseguiria criar um storytelling tão bom quanto os usados no site? A turma do The Pudding topou o desafio, até como forma de avaliar a capacidade de uma IA de substituir o trabalho humano, e tentou orientar o Claude, da Anthropic, para criar um sotytelling. Vale conferir o resultado. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

AWS Cloud Sessions - IA Generativa na AWS

6 de agosto - Online

AWS Summit São Paulo

15 de agosto - São Paulo-SP

The Developer’s Conference 2024 SP

18 a 20 de setembro - São Paulo-SP

Python Brasil 2024

16 a 21 de outubro (Submissão de Atividades até 10 de agosto) - Rio de Janeiro-RJ

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

1 - Fraca 🤬 | 2 - Razoável 🤨 | 3 - Média 🙂 | 4 - Boa 😀 | 5 - Excelente 😁

Faça Login ou Inscrever-se para participar de pesquisas.