• Data Hackers Newsletter
  • Posts
  • Deep Fake mostra pesquisa falsa na voz de Apresentadora do Jornal Nacional¬†ūüöó

Deep Fake mostra pesquisa falsa na voz de Apresentadora do Jornal Nacional¬†ūüöó

Tchau, Airflow?

Fala Data Hackers! Sejam bem-vindos a mais uma news! Dessa vez eu vou tomar o papel do Lages pra falar de Poleeeee√™mica! KKKKMal come√ßaram as elei√ß√Ķes e a galera das Fake News j√° est√° usando o que h√° de mais avan√ßado em IA para espalhar informa√ß√Ķes falsas. Num video editado com trechos reais e trechos fabricados, vemos que √© quase imposs√≠vel diferenciar a voz real da apresentadora Renata Vasconcellos e a voz criada artificialmente por um deep fake. Mais uma aplica√ß√£o escusa da intelig√™ncia criada por n√≥s, profissionais de dados.√Č esse destaque da news de hoje! Mas tem mais:

Data Mesh √© uma abordagem s√≥cio-t√©cnica para descentralizarmos a responsabilidade sobre os dados nas organiza√ß√Ķes; envolvendo pr√°ticas, ferramentas e uma forte cultura orientada √† dados. Nessa live, convidamos dois estrategistas em dados da Thoughtworks para bater um papo sobre os desafios e caminhos que podemos seguir ao adotar esse paradigma, trazendo nossa vis√£o e experi√™ncia com os cen√°rios que comumente acontecem nessa jornada.

Convidados:

  • Magna Fernandes - Estrategista de Data & AI, Thoughtworks Brasil

  • Ricardo Wendell - Estrategista de Data & AI, Thoughtworks Brasil

Clique aí e já ative o sininho para não perder esse evento tão bacana! (em Português)

Aproveitando o papo dessa semana, o time da Thoughtworks vai trazer o Data & AI Summit Brasil 2022, logo no fim do mes, dia 31 de Agosto. Com uma série de especialistas em MLOps, Data Mesh, Analytics e outros temas muito relevantes para nós, profissionais de dados.

Quer saber mais ainda sobre Data Mesh e Cultura Data-Driven?Se inscreve aí neste link! (em Português)

O tempo de propaganda eleitoral mal começou e já tem gente mal-intencionada usando todo o poder de IA para criar desinformação. Essa matéria do UOL mostra um Deep Fake criado para espalhar resultados falsos de uma pesquisa, na voz da apresentadora Renata Vasconcellos, do Jornal Nacional, um dos mais assistidos do país. No vídeo, é quase impossível diferenciar o que é a voz verdadeira e a criada por IA.

O uso de

e nem vai ser o √ļnico. √Č important√≠ssimo que n√≥s, profissionais de dados, trabalhemos para conscientizar as pessoas, independentemente do lado pol√≠tico que esteja utilizando desses meios escusos, precisamos ficar atentos! (em Ingl√™s)

 

J√° parou para imaginar a imensid√£o de dados s√£o coletados e processados pela Tesla para que ela consiga tanta compet√™ncia no Autopilot de seus carros? √Č isso que esse artigo da IEEE discorre sobre. Cada ve√≠culo tem 4-GB SD e 8-GB microSD card na sua unidade de controle, que nada mais √© que um micro-pc Linux s√≥ para captura de dados b√°sicos.

Numa análise muito mais detalhada, o time da IEEE avalia os documentos técnicos para chegar numa estimativa do quanto de dado cada Tesla gera e processa. Bem interessante esse artigo e suas referências. Não perca! (em Inglês)

 

Voc√™ j√° ouviu falar em Data Fabric? O conceito √© um dos que vem guiando a constru√ß√£o de arquiteturas e plataformas cada vez mais democr√°ticas dentro das empresas. A Gartner, uma das principais influenciadoras do mercado de Analytics, fez esse artigo compilado de outras refer√™ncias para mostrar como essa arquitetura - inclusive, muito pr√≥xima do que o Data Mesh traz - remove os gargalos e incentiva a entrega de Analytics e Data Science em larga-escala nas organiza√ß√Ķes.

(em Inglês)

O Apache Airflow é uma das ferramentas mais usadas por times de Eng. de Dados pelo mundo. Mas ele reina sem alternativas? Não! Nesse post direto ao ponto, o Data Hacker Lucas Gabriel dá uma introdução ao Dagster: framework Python ultra-rápido para fazer ETL, fácil de usar e simples de subir. Imperdível! (em Português)

Tá querendo tirar aquele commit errado do meio da branch e não sabe qual o comando? No gitexplorer você vai aprender esse e muito mais! Do git blame ao cherry-pick, olha aí! (em Inglês)

Até pouco tempo atrás, na GCP, para tirar dados do BigTable, transformar e escrever de volta, só usando DataFlow ou outras ferramentas externas de ETL. Nesse post breve, o Jan Wiggers trás a nova funcionalidade do BigQuery, só criar uma tabela externa apontando pro BigTable e tcharam! Muito easy, olha aí. (em Inglês)

Implementa√ß√£o do PyTorch para Recupera√ß√£o de imagensA MEG Vii, empresa chinesa que √© uma das maiores refer√™ncias mundiais em IA e Vis√£o Computacional, lan√ßou a √ļltima vers√£o do NAFNet, algoritmo de recupera√ß√£o de imagens usando PyTorch como framework base. Os resultados s√£o impressionantes, quanto para tirar Blur de imagens, quanto de adi√ß√£o de Super Resolu√ß√£o.D√° uma explorada no repo deles no Github! (em Portugu√™s)

VAGAS DA SEMANA

  • Dom√≠nio em Python e SQL;

  • Conhecimento da t√©cnica de desenvolvimento √°gil TDD;

  • Conhecimentos s√≥lidos em Github;

  • Conhecimentos em APIs;

  • Conhecimento em Plataformas de Visualiza√ß√£o de Dados (ou BI) (ex: Metabase, Tableau, PowerBI, Google DataStudio ou similares);

  • Conhecimento em Airflow;

  • Conhecimento em GCP (Google Cloud Platform);

  • Experi√™ncia pr√©via com grandes volumes de dados (Big Data);

  • Experi√™ncia pr√©via com empresas de varejo/ecommerce,

  • Exp. em projetos de machine learning e ci√™ncia de dados.

Mestre Marlesson t√° de saco cheio, vamos escrever sobre Random Forest! kkkkk

Vi no

Em mais uma visualização ultra-bacana, o time do Information Is Beautiful traz os principais Data Breaches do mundo, classificados por gravidade e volume de dados vazados. Dá uma explorada aí! (em Inglês)

Coalesce: The Analytics Engineer Conference17 a 21 de Outubro - Evento Gratuito e 100% OnlineData & AI Summit Brasil 2022 - Thoughtworks31 de agosto | 8h45 às 12h30 - Evento Gratuito e 100% Online

Live sobre Data Mesh - DH e TW 25 de Agosto - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.