IA, faz um solo de Jazz no piano para mim 🎹

Snowflake compra dbt (???); Competições no Hugging Face Spaces; 7 exercícios para você iniciar como Data Engineer;

Fala, Data Hackers! Sejam bem-vindos a mais uma newsletter!

Eu sei... eu sei... tá todo mundo cansado de modelos generativos, de Chat GPT e o caramba. Mas essa, eu não podia deixar de fora.Logo alguns dias depois do nosso amigo Paulo prever que iremos ver mais mais IAs generativas, mas agora focadas em audio e video, a Google Research manda essa: o MusicLM, modelo que gera músicas de alta-fidelidade a partir de um input textual.Os resultados parecem ser promissores!

O modelo consegue gerar músicas bem convincentes a partir de comandos como "discoteca dos anos 80" ou "música calma para meditação". Nessa news, você ainda vai ver:

Já tivemos o primeiro acerto das previsões 🔮 do nosso podcast Tendencias para Dados e AI em 2023: Uma IA que gera músicas! Palpite do Paulo no episódio, falando que iríamos ver mais IAs que trabalhem audios e sons, diferente das que trabalham texto e imagens que bombaram em 2022.A Google Research lançou o MusicLM: modelo generativo que cria músicas de alta-fidelidade a partir de descrições textuais. O resultado é impressionante! Dá para ouvir alguns exemplos na página que realmente impressionam: Desde músicas calmas e relaxantes ao som de violão, até Bella Ciao, misturada com Jingle Bells em assovio! (em Inglês)

O Data Hacker Sávio Teles, Head de Produto na Jusbrasil e Doutor em Big Data e Machine Learning pela UFG, em mais uma bela contribuição para nosso blog, compilou 5 principais tendências em Engenharia de Dados para 2023.

Além do DataOps, Teles trás 4 assuntos que estão dominando as rodas de discussões de Engenheiros de Dados, que vão desde novas tecnologias, muito promissoras, até uma mudança de paradigma - você até já sabe qual... - que está dando o que falar. (em Português)

 

Hora que eu recebi esse link num grupo de WhatsApp, eu quase cai da cadeira! kkkk Com um título muito clickbait, mas um argumento que faz muito sentido, Robert Yi, CPO do HyperQuery, escreveu como que Snowflake + dbt faz frente com a GCP para entregar um baita produto de dados ponta-a-ponta.

Como comentamos no podcast de tendências, é um caminho cada vez mais discutido no mercado: se ter uma All-in-one Data Platform. Eu diria que é só uma questão de tempo. (em Inglês)

A pioneira em construção de Plataforma de Data & AI no mundo publicou, finalmente, sua plataforma, chamada Foundry, num marketplace de nuvem pública: A Azure. Com isso, Palantir começa aos poucos oferecer sua plataforma que era restrita a quem tinha muuuita grana, e normalmente ambientes on-premises, para um mercado bem maior. Será que agora vamos ver mais empresas conseguindo pagar o preço de uma das Data Platforms mais evoluídas e inteligentes do mundo? (em Inglês)

Sabia que o algoritmo que avalia seu crédito, provavelmente usa Machine Learning por trás? Pois é! Nesse post, o Data Hacker João Gustavo mostra como você pode criar um modelo de classificador que libera ou não o crédito, usando Regressão Logística, XGBoost ou Random Forest. (em Português)

O Kaggle Grandmaster Abhishek Thakur criou um projeto onde qualquer pessoa pode criar competições públicas ou privadas no Hugging Face Spaces. Nesse tuíte, ele explica como pode ser utilizado o projeto. Muito bacana! (em Inglês)

DICA DE DESAFIO

7 Desafios para iniciar com Engenharia de DadosUma coisa que sempre me perguntam é: como posso me treinar para processos seletivos pra ser um Eng. de Dados? O Daniel Beach disponibilizou um repositório com 7 desafios para quem está iniciando como Data Engineering. De crawling até o processamento de dados com PySpark, você vai fazer seguindo o guia dele. Taí uma dica boa! (em Inglês)

VAGAS DA SEMANA

  • Exp. Java, Scala e Clean Architecture

  • Experiência com Cloud (AWS, GCP ou Azure);

  • Infraestrutura como código (Terraform, Ansible, puppet);

  • Docker e Spark

  • Sólida experiência atuando em Data Analytics;

  • SQL Avançado;

  • Domínio sobre DataViz e data storytelling;

  • Noções de LookML e modelagem de dados.

"Engenheiros de Dados implementando Boas-Práticas""Qual é o ROI?!"

O chart.guide está distribuindo um poster em altíssima qualidade que é quase que um guia completo de Data Viz. Na imagem, dividida em várias seções, você consegue achar a visualização perfeita para cada dado: categórico, crescente, séries temporais, e tudo mais! (em Inglês)

07 de fevereiro de 2023 18:00 as 20:00 - 100% online e gratuito

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.