Ela ganhou o prêmio de melhor análise de dados do Brasil em 2025 🏆

E mais: Uso do ChatGPT despenca no verão, quando estudantes não estão colando; Como o Nubank processa dados em streaming em tempo real

Fala Data Hackers! E aí, bora abrir essa última semana de agosto com as notícias mais quentes do universo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

Como é manter a operação de um dos maiores ecossistemas de mídia da América Latina com uma estratégia de cultura de dados que gera valor de forma responsável?

Neste episódio, conversamos com Leonardo Blunk, Felipe Alvarenga e Vicente Cosel Fiebig, da Globo, sobre os aprendizados e reflexões que marcaram a Semana do Uso Consciente de Dados e IA.

O evento reuniu as áreas de Governança de Dados e IA, Segurança da Informação, Privacidade e Proteção de Dados em torno de um propósito comum: refletir, aprender e evoluir juntos.

Durante a conversa, os convidados falaram sobre o papel das áreas na construção de uma abordagem mais responsável e colaborativa para o uso de dados e inteligência artificial, além dos desafios que surgem com o avanço da IA generativa.

Uma jornada que tem, no centro de tudo, as pessoas.

Lembrando que você pode encontrar todos os podcasts da comunidade Data Hackers no Spotify, iTunes, Google Podcast, Castbox e muitas outras plataformas.

No Data Hackers Challenge 2025, só os melhores levam o prêmio! De 400 inscrições, três análises se destacaram. O primeiro lugar foi para “Boomers à Gen Z: Desafios na área de Dados” de Isabela Souza, que se destacou pela originalidade e relevância. Rafael Figueiredo chegou em segundo com “IA Generativa: Fato, Moda ou Pressão Corporativa?”, uma análise afiada sobre o hype da IA. E Pedro Andrade ficou com o terceiro lugar, abordando a radiografia dos gestores de dados. Veja as análises e entenda como a equipe de jurados escolheu os vencedores nesta edição histórica! (em Português)

Dica de Newsletter

Conta a real: seu feed de notícias te dá vontade de ler?

Conheça a “1440”, uma newsletter cuja ideia é fugir dos algoritmos: é feita de humanos pra humanos. Parceira da comunidade Data Hackers, é pensada para pessoas curiosas e pode reunir assuntos tão diversos que vão de IA a vinhos: o importante é ser interessante.

Acesse o link abaixo, faça o cadastro (é grátis!) e passe a receber o feed diariamente:

Daily News for Curious Minds

Be the smartest person in the room by reading 1440! Dive into 1440, where 4 million Americans find their daily, fact-based news fix. We navigate through 100+ sources to deliver a comprehensive roundup from every corner of the internet – politics, global events, business, and culture, all in a quick, 5-minute newsletter. It's completely free and devoid of bias or political influence, ensuring you get the facts straight. Subscribe to 1440 today.

Obs: Essa é uma parceria, para cada pessoa que clicar no link ou na imagem (o acesso ao conteúdo é gratuito) eles fazem uma doação para a comunidade Data Hackers (se quiser clicar vai ajudar a gente e ainda ter acesso a um conteúdo bem relevante 🥸).

Durante as férias de verão, o uso do ChatGPT apresenta uma queda expressiva, o que leva a crer que os estudantes são uma grande parte da base de usuários desse popular modelo de IA.

Com a chegada das férias, a geração de tokens despenca, o que evidencia a atual dependência acadêmica das ferramentas de IA, o que gera ainda reflexões sobre o equilíbrio financeiro das empresas de IA sem os estudantes. (em Inglês)

Em um recente Meetup promovido pelo Nubank, André Midea, gerente de engenharia da empresa, deu uma verdadeira aula sobre a atual infraestrutura de dados de streaming que o Nubank utiliza.

Dentre outros tópicos, Midea falou das jornadas de evolução em sistemas distribuídos e como elas levaram à criação da plataforma Avalanche, que permite o processamento em tempo real com baixa latência. (em Português)

OUTROS TÓPICOS

Quem trabalha com dados desestruturados sabe a dor de cabeça que é quando não existe uma chave única perfeita. Neste artigo, a Data Hacker Laura Mattos fala das dificuldades do matching de dados e como a biblioteca TheFuzz pode acabar salvando o dia. Com algoritmos práticos, como o token_set_ratio, TheFuzz ajuda a normalizar listas e encontrar similaridades entre registros, e um exemplo prático em Python já demonstra como é possível fazer tudo isso com poucas linhas de código. Para qualquer um que já sofreu com deduplicações e unificação de cadastros, vale a leitura. (em Português)

Neste artigo, o perfil Analyst Uttam compartilha seu “kit de ferramentas” de funções SQL que ajudam a resolver a maioria dos problemas de dados que encontramos no dia a dia. Desde funções como COALESCE, que salva campanhas inteiras com dados incompletos, até a DATE_TRUNC, que torna a organização de datas mais simples, o texto é uma verdadeira aula de praticidade. Se você já se perdeu em funções de data e outros contextos complicados, esse é o guia que pode transformar sua rotina de trabalho com SQL. (em Inglês)

A Meta lançou uma ferramenta de tradução por IA que, segundo a empresa, é capaz de dublar seus vídeos no Instagram e Facebook em outros idiomas, como inglês e espanhol. E o mais impressionante: a Meta atesta que o modelo tem capacidade da IA de sincronizar a dublagem com o movimento dos lábios e a voz original. Essa novidade está disponível para criadores com mais de mil seguidores e contas públicas, e uma etiqueta vai indicar quando um vídeo for traduzido usando a IA da Meta. (em Inglês)

Modelos de IA não precisam custar tanto quanto você imagina. Sasha Luccioni, da Hugging Face, compartilha neste artigo cinco estratégias para otimizar o uso de IA nas empresas sem abrir mão da performance. Desde ajustar o modelo certo para a tarefa até reavaliar a necessidade de enormes clusters de GPUs e promover a eficiência energética, essas dicas são essenciais para qualquer empresa que busca ser mais inteligente na computação. Talvez seja hora de revisar a ideia de que “mais computação é sempre melhor”. (em Inglês)

Aqui, a cientista de dados Mariana Avelino mergulha fundo no funcionamento do GraphRAG da Microsoft, uma abordagem inovadora que associa geração de texto com gráficos de conhecimento. Este artigo oferece um guia completo para entender cada etapa, da criação do gráfico às funcionalidades de busca — incluindo um método de busca local que não está na documentação oficial. Se você quer saber como essa tecnologia é aplicada com exemplos reais, tá aí um excelente ponto de partida. (em Inglês)

O iFood, gigante do delivery, encontrou uma solução inteligente para lidar com tabelas duplicadas no Data Lake. Assinado em parceria com um egenheiro de dados do iFood, este artigo mostra como a empresa adaptou o poderoso algoritmo R2D2 para suas necessidades, reduzindo a redundância de dados e otimizando custos e performance. A abordagem incluiu etapas sofisticadas como Schema Graph Builder, DLP e LTP, garantindo eficiência no monitoramento das tabelas. Uma leitura intrigante para quem quer entender como a combinação de algoritmos de ponta e adaptação às necessidades específicas pode gerar resultados surpreendentes! (em Português)

DICA DE VÍDEO

Conheça a história inspiradora de Gabriel Almeida, que saiu das vendas de cimento para se tornar uma referência no cenário brasileiro de Inteligência Artificial. Neste corte do podcast Data Hackers, ele compartilha sua jornada até a criação do Langflow, um projeto Open Source que revolucionou a área de AI Agents. Uma trajetória cheia de reviravoltas e lições de muito aprendizado! (em Inglês)

VAGAS DA SEMANA

Presencial - Belo Horizonte-MG

Híbrido - São Paulo-SP

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Quer ver um panorama completo do mercado de dados e IA brasileiro? Nossos parceiros do Zoho Analytics fizeram um dashboard com os dados da pesquisa State of Data Brazil 2025, trazendo diversas possibilidades muito interessantes de visualizações. Vale conferir! (em Português)

PRÓXIMOS EVENTOS E MEETUPS

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo