Nova epidemia de IA transforma personagens bíblicos em influenciadores 🤯

E mais: Novo paper da Apple encontra limitações em modelos de raciocínio; Como determinar o tamanho ideal da amostra em cada situação

Sponsored by

Fala Data Hackers! Seguindo no mês das quadrilhas, bora abrir mais uma semana com as novidades mais quentes do mundo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

E se Noé tivesse um canal no TikTok? Com a ajuda de IA generativa, agora ele tem! O “Vlog Bíblico” transforma histórias antigas em conteúdo digital, trazendo personagens bíblicos como Noé, Moisés e Daniel para o mundo dos influencers. A página já conta com mais de 340 mil seguidores e levanta discussões sobre os impactos da IA nos conteúdos digitais. (em Português)

Dica de Newsletter

Que tal ter acesso diário a um feed de notícias interessantes, sem bobagens ou clickbaits?

A “1440” é uma newsletter cuja ideia é fugir dos algoritmos: é feita de humanos pra humanos, e agora se tornou parceira da comunidade Data Hackers. Criada para pessoas curiosas, ela entrega assuntos que podem ir de IA a vinhos: a questão é ser interessante.

Cadastre-se no link abaixo (é grátis!) e passe a receber a curadoria de notícias todos os dias.

Looking for unbiased, fact-based news? Join 1440 today.

Join over 4 million Americans who start their day with 1440 – your daily digest for unbiased, fact-centric news. From politics to sports, we cover it all by analyzing over 100 sources. Our concise, 5-minute read lands in your inbox each morning at no cost. Experience news without the noise; let 1440 help you make up your own mind. Sign up now and invite your friends and family to be part of the informed.

Obs: Essa é uma parceria que ajuda muito a comunidade Data Hackers! Para cada pessoa que clicar no link (o acesso ao conteúdo é gratuito) eles fazem uma doação para a comunidade Data Hackers (se quiser clicar vai ajudar a gente e ainda ter acesso a um conteúdo bem relevante 🥸).

O último paper da Apple explora as limitações de Modelos de Raciocínio Avançados (LRMs) e mostra que, apesar de sua evolução em benchmarks, lidar com complexidades elevadas os leva a um colapso total de precisão.

Usando ambientes controláveis de quebra-cabeças, a pesquisa mostra que o esforço de raciocínio dos LRMs aumenta até um ponto e depois diminui, o que revela os limites do seu poder de processamento. (em Inglês)

Encontrar o tamanho certo da amostra pode ser um desafio em ciência de dados. Este post da Vicki Boykis ajuda nessa definição, e mostra como, muitas vezes, problemas de big data se transformam em problemas de small data.

Além de dar dicas práticas, ela aborda a importância do nível de confiança e a margem de erro nesse processo. E tudo isso é trazido à vida com exemplos curiosos envolvendo fazendas de cabras narcolépticas. (em Inglês)

OUTROS TÓPICOS

A Reddit entrou com uma ação judicial contra a Anthropic, acusando a empresa de acessar seu site mais de 100 mil vezes desde julho de 2024. A Anthropic, vista como uma das rivais da OpenAI, teria afirmado ter interrompido o uso de bots em maio de 2024, mas a Reddit discorda e acusa a empresa de uso comercial indevido. E esse não é o primeiro processo envolvendo questões de direitos autorais enfrentado pela startup de IA… (em Inglês)

A ElevenLabs revelou sua nova IA Eleven v3 (alpha), considerada o modelo de Texto para Fala mais expressivo até agora. Ela traz controle inédito e realismo na geração de fala, com disponibilidade de mais de 70 idiomas. Entre as novidades estão os diálogos multivocais e tags de áudio que permitem ajustes de tom e emoção, com opões como “empolgação”, “sussurros” e “suspiros”. Embora exija mais engenharia de prompt, suas capacidades são impressionantes, especialmente para vídeos e audiolivros. (em Inglês)

Quantas vezes você já ouviu algo como “só preciso de um número rápido” ou “pode adicionar essa coluna?” em um dia comum de trabalho? Se as demandas contínuas estão transformando sua equipe de dados em uma “pastelaria”, esse papo no Reddit pode ser uma mina de ouro para você. Nele, profissionais de data engineering discutem maneiras eficientes de resistir a pedidos urgentes que interrompem o fluxo do trabalho. Um debate essencial para manter a sanidade e a produtividade no dia a dia do escritório. (em Inglês)

A versão 1.0 do Cursor chegou com tudo, trazendo várias novidades! O editor de código com inteligência artificial agora conta com o BugBot para revisão automática de códigos, suporte a Jupyter Notebooks, instalação de servidores MCP com um clique e muito mais. A funcionalidade Memories armazena informações de conversas, e o Background Agent está disponível para todos. Sem falar do chat e do dashboard, que foram melhorados. Bora explorar o que essa nova versão tem a oferecer! (em Inglês)

DICA DE PODCAST

Sundar Pichai, CEO do Google e Alphabet, troca uma ideia com Lex Fridman sobre diversos assuntos, indo desde sua infância na Índia até os desafios das decisões de liderança. O papo aborda também o impacto da IA na história humana, o futuro dos vídeos, e inclui até demos do Google Beam e Google XR Glasses. Excelentes insights sobre o futuro da tecnologia e da humanidade! (em Inglês)

VAGAS DA SEMANA

Remoto

Remoto

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

O setor de IA está em ebulição e as startups estão mostrando todo seu potencial criativo. Nesse Dataviz feito pelo pessoal do Visual Capitalist, conheça 25 empresas que estão se destacando na corrida da inteligência artificial, recebendo investimentos de peso e desenvolvendo ferramentas de produtividade, criatividade e muito mais. Apesar do domínio das gigantes como Google e OpenAI, essas pequenas notáveis estão conquistando espaço e trazendo inovações extraordinárias para o mercado. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo