Por que todo mundo quer virar Analytics Engineer?¬†ūüď£

R + Spotify = amor Quanto valeriam as unicórnios nessa crise?

Fala,¬†Data Hackers! Bem-vindos a mais uma news do DH!Pra quem t√° ligado, ja sabe que Analytics Engineer¬†√© um cargo que faz - ou vai fazer - parte dos nossos times de Dados. Mas, por que que esse termo para uma posi√ß√£o t√£o imatura e recente tem sido t√£o disputado por empresas? Por que ser√° que tem tanta gente migrando para esse cargo?No highlight dessa newsletter, trouxemos um texto de um dos maiores influencers do mundo de Dados atualmente botando v√°rias doses de fatos e "futurologia" sobre Analytics Engineering.Mas essa edi√ß√£o tem muuuito conte√ļdo ainda. Hoje voc√™ vai ver sobre:

Não perca o prazo para concorrer ao prêmio mais importante de Data Storytelling do país!Se você é daqueles que gosta de uma emoção no envio do trabalho de faculdade? Se liga que o prazo para submissão ja é essa semana! Quer concorrer a um PS5, um Meta Quest 2 e um monitor portátil ASUS? Então agiliza aí!Dia 12 de Julho (Terça-Feira) as 23:59 BRT (Horário de Brasília)Não deixe de conferir as Regras da competição e fazer o upload do seu Notebook no Kaggle! (em Português)

Se voc√™ ainda n√£o ouviu falar nesse novo cargo, voc√™ precisa voltar algumas casas nas nossas newsletters. A posi√ß√£o de Analytics Engineer surgiu nos √ļltimos 3 anos e j√° corresponde a uma porcentagem relevante dos times de dados modernos por a√≠.Nesse artigo top do¬†Benn Stancil, CAO e Co-Founder da Mode, um dos maiores influenciadores da nossa √°rea,¬†voc√™ vai entender os principais motivos do "hype" (?) desta nova profiss√£o e como os ventos das mudan√ßas nas Data Platforms e da Modern Data Stack est√£o influenciando no nosso dia-a-dia como Data Pros. Imperd√≠vel!¬†(em Ingl√™s)

Com a crescente de novos conceitos surgindo, como Lakehouse, Data Lakes e Data Mesh, fica cada vez mais complicado escolher uma técnica de modelagem para um Data Lake/DW/Lakehouse. Este post da galera do Databricks, traz as principais referências de modelagem, do Star Schema até o Bronze/Silver/Gold do Delta Lake, passando pelo, ás vezes esquecido, Data Vault. Imperdível! (em Inglês)

 

Existe uma m√°xima de que na linguagem R "existe um pacote para tudo"! Seguindo nesse mantra, a galera do Curso R postou um guia sobre um dos pacotes mais legais pra quem gosta de explorar dados musicais: o RSpotify. Com este pacote, √© poss√≠vel, em poucos passos, usar capturar dados sobre Artistas, Playlists e M√ļsicas muito facilmente. Bem completo e simples de seguir, d√° uma lida!

(em Português)

Se voc√™ n√£o conhece o Pydantic, a hora √© agora! √Č uma

que agiliza demais o data validation, garantindo que os formados dos campos de uma classe obede√ßa certos padr√Ķes. Agora, com a v2.0, o Pydantic est√° 17x mais r√°pido, pois seu core foi refeito em Rust, uma das linguagens mais perform√°ticas da nova gera√ß√£o. (em Ingl√™s)

TF-IDF (Term Frequence - Inverse Document Frequency) é uma forma algébrica de representar um texto dentro de um Corpus (uma série de textos). Essa forma é uma das mais utilizadas do mundo para implementação de buscas de texto e comparar similaridade entre eles. Nesse artigo, o Data Hacker Arthur Vaz explica como que funciona e quais formulas são usadas para esse método.

Em NLP, um dos grandes desafios é fazer Reconhecer e Definir Entidades. Nesse post incrível, a Data Hacker Beatriz Albuquerque fala de Named Entity Recognition, que é uma máquina entender Nomes - como Bia, São Paulo e Amazon - dentro de texto.

Live Data Hackers: Dicas de Data Storytelling e Visualização de DadosSe você ainda quer umas dicas para dar um tapa na sua submissão pro Challenge State of Data Brazil 2021, ainda há tempo! Chamamos 3 FERAS em Data Storytelling & Visualization para contarem quais são as formas e técnicas mais relevantes para se passar uma história ou uma conclusão através dos dados. Mesmo se você não vai participar do Challenge, as dicas do pessoal são infalíveis para quem quer entregar resultado de maneira efetiva para os seus usuários e clientes.(em Português)

VAGAS DA SEMANA

  • Forte conhecimento em SQL e Excel; NoSQL desej√°vel.¬†

  • Exp. com ferramentas de Viz, como¬†Tableau, Metabase;

  • Programa√ß√£o em Python, R, Scala, Etc;

  • Conhecimentos intermedi√°rios em Matem√°tica | Estat√≠stica;

  • An√°lise descritiva, l√≥gica e infer√™ncia;

  • Forma√ß√£o: gradua√ß√£o exatas;

  • Profici√™ncia em Estat√≠stica e Machine Learning;

  • Conhecimento avan√ßado em Python, R, SQL, etc;

  • Experi√™ncia com plataforma de Big Data (Hadoop, Spark, etc);

  • Ingl√™s intermedi√°rio;

  • Cloud AWS √© Diferencial.

Pra quem n√£o t√° no

: Voc√™ e o trabalho final do semestre que voc√™ j√° comemorou as 3 vezes que o professor adiou. Estamos de olho!¬†ūüĎĀÔłŹūüĎĀÔłŹ

Quem acompanhou nossa Live sobre os Layoffs e deu uma estudada no assunto, t√° ligado na situa√ß√£o. Nesse post do excelente Snaq, eles mostram como cairam os valuations de 6 unic√≥rnios desde seus √ļltimos investimentos. Impressionante, n√£o √© mesmo?¬†(em Ingl√™s)

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.