AI invadiu o mundo dos podcasts (e at√© ressuscitou o Metaverso) ūü§ď

Roadmap para projetos em DE; Demanda por GPUs est√° sobrecarregada; 17 metricas para profissionais de dados;

Como estão, Data Hackers? Vamos começar mais uma semana com as notícias mais interessantes que movimentaram o universo dos dados?

Pra começar, a volta dos que não foram: dado como morto por muitos, o Metaverso voltou a ser comentado depois da Meta apresentar a nova versão de um recurso para criar avatares fotorrealistas - e que impressionou até os críticos da empresa, que certamente não são poucos.

Além dessa demonstração, que aconteceu no podcast do Lex Fridman e fez barulho, trazemos ainda um guia com dicas práticas para quem pensa em migrar para a área de dados (dicas tanto para perceber se há afinidade quanto sobre o percurso de aprendizado) e a forma como tecnologias deepfake estão sendo usadas para vender produtos na China.

Veja alguns dos principais conte√ļdos da news de hoje:

Legenda: Construção do avatar do Zuckerberg no Metaverso

Muita gente j√° havia se antecipado em cantar o fim do Metaverso, o mundo paralelo pelo qual a empresa de Mark Zuckerberg foi criticada em diversas ocasi√Ķes. Mas uma recente tecnologia para cria√ß√£o de avatares surpreendeu a internet: uma entrevista dada por Zuckerberg ao podcast do Lex Fridman na verdade n√£o foi presencial, mas possibilitada pelo uso de avatares fotorrealistas, o que impressionou os usu√°rios das redes sociais.

Se quiser ver exatamente o momento dos dois dentro do Metaverso veja esse video do Lex Fridman. (Ser√° que o Mark Zuckerberg enfim deu a volta por cima e vai calar os cr√≠ticos do Metaverso, como "esse que vos fala‚ÄĚ? ūüė¨)

A tecnologia utilizada foi o Codec Avatars, que tem como objetivo criar avatares totalmente fotorrealistas e em tempo real que funcionam por meio de headsets com sensores de rastreamento facial. A apresentação ocorreu apenas um dia depois da Meta apresentar sua resposta ao ChatGPT.

Al√©m disso outra not√≠cia relacionada a intelig√™ncia artificial que agitou o mundo dos podcasts veio do Spotify. A nova tecnologia lan√ßada vai permitir que os podcasts sejam dublados em diferentes l√≠nguas mantendo a voz original dos criadores do conte√ļdo. Bom se quiser conferir na pr√°tica como funciona esse link explica melhor o que tem por tr√°s dessa nova tecnologia, e o exemplo √© justamente com o podcast do Lex Fridman.

J√° imaginou quando todas essas novidades se juntarem? Avatares realistas dublados em m√ļltiplas l√≠nguas dentro do Metaverso? Ser√° esse o futuro das novelas mexicanas? (em Portugu√™s)

O crescimento vertiginoso em investimento, import√Ęncia e prest√≠gio que a √°rea de dados teve nas √ļltimas d√©cadas, e que colocou seus profissionais entre os mais bem pagos do mercado, fez com que muita gente pensasse em migrar para a √°rea. Como saber, no entanto, quando algu√©m apresenta de fato afinidade com a √°rea?

Neste artigo, o Data Hacker João Pedro Reis Silva - que fez, ele próprio, uma transição de carreira - apresenta dicas práticas para constatar quando há gosto pela área ou não. Além disso, o percurso para se tornar um analista de dados é apresentado dividido em etapas, mostrando os passos e o que se deve buscar em cada fase de forma clara e objetiva. (em Português)

Desde que a exist√™ncia das tecnologias deepfake foi divulgada, houve discuss√Ķes em v√°rias esferas da sociedade e qualquer possibilidade do uso comercial foi descartada. Mas, na China, isso est√° mudando.

No pa√≠s asi√°tico, o uso de lives de influencers para vender produtos √© algo disseminado h√° anos, com alguns apresentadores vendendo mais de um bilh√£o de d√≥lares em uma √ļnica noite. O custo de treinar influencers e cuidar de detalhes t√©cnicos, no entanto, inviabilizava o recurso para algumas empresas.

Agora, milhares de empresas oferecem a criação de avatares deepfakes para vender produtos a custos extremamente atrativos: apenas alguns minutos de vídeo (para referência) e cerca de mil dólares podem garantir um apresentador que trabalha 24/7. (em Inglês)

OUTROS T√ďPICOS

Este tutorial apresenta de maneira pr√°tica como utilizar Previs√Ķes Conformes em modelos de Regress√£o, abordando quest√Ķes como o que √© a Regress√£o M√©dia Conformalizada e qual √© a diferen√ßa entre Intervalo de Confian√ßa e Intervalo de Previs√£o. (em Portugu√™s)

Este artigo apresenta um roadmap criar projetos de engenharia de dados de forma incremental, passando por aspectos como a criação de pipelines diferentes com base nos mesmos princípios, a qualidade dos dados, escabilidade e otimização. (em Inglês)

Artigo que começa apresentando o conceito do que são métricas e em seguida introduz um total de 17 tipos de métricas que todos os profissionais de dados devem conhecer para desenvolver um trabalho mais embasado e consistente. Veja bem: não são 17 métricas específicas e sim 17 tipos de métricas, como as medidas, as calculadas, as modeladas, as intensivas e as extensivas. Fundamental para classificar e diferenciar os dados que usamos no dia a dia. (em Inglês)

H√° poucos dias, Mark Zuckerberg anunciou que, seguindo a corrida que tantos gigantes da tecnologia fazem atualmente para inserir recursos de IA generativa em seus produtos, a Meta vai em breve disponibilizar IA no WhatsApp, no Instagram e no Facebook. Al√©m disso, uma nova linha de √≥culos Ray-Ban vai contar com IA da Meta para controlar a luminosidade e oferecer informa√ß√Ķes a que os usa, por exemplo. (em Ingl√™s)

Análise de curto e médio prazo sobre o grande aumento de demanda por GPUs. O artigo levanta questionamentos sobre quanto valor está sendo efetivamente gerado por todas essas GPUs demandadas. (em Inglês)

A startup de IA Anthropic (que é criadora do Claude, o principal concorrente do ChatGPT) vai receber da Amazon um investimento que pode chegar aos US$ 4bi. O deal torna a AWS a principal provedora de nuvem da Anthropic, com a plataforma sendo usada inclusive para o treinamento de modelos, e o Claude será integrado ao Bedrock da AWS, com os usuários da plataforma tendo acesso antecipado a novas tecnologias desenvolvidas. (em Inglês)

De acordo com o jornal Wall Street Journal, a OpenAI estaria considerando a possibilidade de suas a√ß√Ķes. Essa venda teria como objetivo elevar o valuation da companhia de US$ 29 bilh√Ķes para algo entre US$ 80 e 90 bilh√Ķes. A OpenAI, que tem a Microsoft como dona de 90% de suas a√ß√Ķes, reportou que planeja fazer US$ 1 bi em faturamento esse ano. (em Ingl√™s)

DICA DE V√ćDEO

Neste v√≠deo Jeremy Howard, cofundador da fast.ai e criador da abordagem ULMFiT (na qual todos os modelos de linguagem modernos, chamados de LMs, se baseiam), explica de forma did√°tica os LMs. Come√ßando com os conceitos b√°sicos, Jeremy apresenta a arquitetura e a mec√Ęnica que faz com que esses sistemas de IA funcionem. Em seguida, ele se aprofunda nas avalia√ß√Ķes cr√≠ticas do GPT-4 apresentando casos de usos pr√°ticos e dando dicas pr√°ticas para trabalhar com a API OpenAI. O v√≠deo aborda ainda t√≥picos t√©cnicos, como fine tuning, decoding tokens e como utilizar inst√Ęncias privadas para treinar modelos GPT. (em Ingl√™s)

VAGAS DA SEMANA

Remoto

  • Forma√ß√£o superior completa em Exatas ou TI;

  • Python (dom√≠nio);

  • Experi√™ncia comprovada de 4 anos ou mais em Engenharia de Dados e disciplinas correlatas;

  • Conhecimento de Ferramentas de Orquestra√ß√£o de Pipeline (Airflow, NiFi ou outras);

  • Conhecimento de clouds p√ļblicas (AWS, Azure, GCP);

  • Viv√™ncia com prioriza√ß√£o de demandas de neg√≥cio.

São Paulo - SP - Híbrido

  • Forma√ß√£o em Ci√™ncia da Computa√ß√£o, Engenharia de Software ou √°reas correlatas (mestrado √© um diferencial);

  • Ingl√™s avan√ßado;

  • Experi√™ncia com solu√ß√Ķes de dados em nuvem (AWS, Azure, Google Cloud);

  • Bancos de dados de big data (Hadoop, Spark ou equivalentes);

  • Redes neurais recorrentes;

  • Frameworks de machine learning;

  • Configura√ß√£o e manuten√ß√£o de ambientes de programa√ß√£o estilo Jupyter;

  • Habilidades de programa√ß√£o (Python, R ou outras linguagens relevantes para dados).

MEME DA SEMANA

Você também esté fazendo de tudo… pode falar a verdade…

mais memes como esse no nosso canal do slack

DATA VISUALIZATION DA SEMANA

O treinamento de IAs generativas fez a demanda por GPUs disparar, mas qual seria o impacto dessa demanda nas a√ß√Ķes das fabricantes dessa tecnologia?

Neste Dataviz √© poss√≠vel ver detalhes sobre o desempenho acion√°rio da NVIDIA - gigante da tecnologia e uma das maiores fabricantes de GPUs do mundo - nos √ļltimos anos. Dados como a receita trimestral, o lucro l√≠quido e a forma como a empresa ganha dinheiro s√£o apresentados em detalhes, e permitem dimensionar melhor o efeito do ‚Äúboom‚ÄĚ recente da IA.

(em Português)

  • 21 de outubro - Belo Horizonte - MG

  • 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link (vagas esgotadas!)

  • 26 de outubro - 18:30h - Presencial (S√£o Paulo - SP) e Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opini√£o sincera...

Login or Subscribe to participate in polls.

Logo