Deep Fake mostra pesquisa falsa na voz de Apresentadora do Jornal Nacional 🚗

Tchau, Airflow?

Fala Data Hackers! Sejam bem-vindos a mais uma news! Dessa vez eu vou tomar o papel do Lages pra falar de Poleeeeeêmica! KKKKMal começaram as eleições e a galera das Fake News já está usando o que há de mais avançado em IA para espalhar informações falsas. Num video editado com trechos reais e trechos fabricados, vemos que é quase impossível diferenciar a voz real da apresentadora Renata Vasconcellos e a voz criada artificialmente por um deep fake. Mais uma aplicação escusa da inteligência criada por nós, profissionais de dados.É esse destaque da news de hoje! Mas tem mais:

Data Mesh é uma abordagem sócio-técnica para descentralizarmos a responsabilidade sobre os dados nas organizações; envolvendo práticas, ferramentas e uma forte cultura orientada à dados. Nessa live, convidamos dois estrategistas em dados da Thoughtworks para bater um papo sobre os desafios e caminhos que podemos seguir ao adotar esse paradigma, trazendo nossa visão e experiência com os cenários que comumente acontecem nessa jornada.

Convidados:

  • Magna Fernandes - Estrategista de Data & AI, Thoughtworks Brasil

  • Ricardo Wendell - Estrategista de Data & AI, Thoughtworks Brasil

Clique aí e já ative o sininho para não perder esse evento tão bacana! (em Português)

Aproveitando o papo dessa semana, o time da Thoughtworks vai trazer o Data & AI Summit Brasil 2022, logo no fim do mes, dia 31 de Agosto. Com uma série de especialistas em MLOps, Data Mesh, Analytics e outros temas muito relevantes para nós, profissionais de dados.

Quer saber mais ainda sobre Data Mesh e Cultura Data-Driven?Se inscreve aí neste link! (em Português)

O tempo de propaganda eleitoral mal começou e já tem gente mal-intencionada usando todo o poder de IA para criar desinformação. Essa matéria do UOL mostra um Deep Fake criado para espalhar resultados falsos de uma pesquisa, na voz da apresentadora Renata Vasconcellos, do Jornal Nacional, um dos mais assistidos do país. No vídeo, é quase impossível diferenciar o que é a voz verdadeira e a criada por IA.

O uso de

e nem vai ser o único. É importantíssimo que nós, profissionais de dados, trabalhemos para conscientizar as pessoas, independentemente do lado político que esteja utilizando desses meios escusos, precisamos ficar atentos! (em Inglês)

 

Já parou para imaginar a imensidão de dados são coletados e processados pela Tesla para que ela consiga tanta competência no Autopilot de seus carros? É isso que esse artigo da IEEE discorre sobre. Cada veículo tem 4-GB SD e 8-GB microSD card na sua unidade de controle, que nada mais é que um micro-pc Linux só para captura de dados básicos.

Numa análise muito mais detalhada, o time da IEEE avalia os documentos técnicos para chegar numa estimativa do quanto de dado cada Tesla gera e processa. Bem interessante esse artigo e suas referências. Não perca! (em Inglês)

 

Você já ouviu falar em Data Fabric? O conceito é um dos que vem guiando a construção de arquiteturas e plataformas cada vez mais democráticas dentro das empresas. A Gartner, uma das principais influenciadoras do mercado de Analytics, fez esse artigo compilado de outras referências para mostrar como essa arquitetura - inclusive, muito próxima do que o Data Mesh traz - remove os gargalos e incentiva a entrega de Analytics e Data Science em larga-escala nas organizações.

(em Inglês)

O Apache Airflow é uma das ferramentas mais usadas por times de Eng. de Dados pelo mundo. Mas ele reina sem alternativas? Não! Nesse post direto ao ponto, o Data Hacker Lucas Gabriel dá uma introdução ao Dagster: framework Python ultra-rápido para fazer ETL, fácil de usar e simples de subir. Imperdível! (em Português)

Tá querendo tirar aquele commit errado do meio da branch e não sabe qual o comando? No gitexplorer você vai aprender esse e muito mais! Do git blame ao cherry-pick, olha aí! (em Inglês)

Até pouco tempo atrás, na GCP, para tirar dados do BigTable, transformar e escrever de volta, só usando DataFlow ou outras ferramentas externas de ETL. Nesse post breve, o Jan Wiggers trás a nova funcionalidade do BigQuery, só criar uma tabela externa apontando pro BigTable e tcharam! Muito easy, olha aí. (em Inglês)

Implementação do PyTorch para Recuperação de imagensA MEG Vii, empresa chinesa que é uma das maiores referências mundiais em IA e Visão Computacional, lançou a última versão do NAFNet, algoritmo de recuperação de imagens usando PyTorch como framework base. Os resultados são impressionantes, quanto para tirar Blur de imagens, quanto de adição de Super Resolução.Dá uma explorada no repo deles no Github! (em Português)

VAGAS DA SEMANA

  • Domínio em Python e SQL;

  • Conhecimento da técnica de desenvolvimento ágil TDD;

  • Conhecimentos sólidos em Github;

  • Conhecimentos em APIs;

  • Conhecimento em Plataformas de Visualização de Dados (ou BI) (ex: Metabase, Tableau, PowerBI, Google DataStudio ou similares);

  • Conhecimento em Airflow;

  • Conhecimento em GCP (Google Cloud Platform);

  • Experiência prévia com grandes volumes de dados (Big Data);

  • Experiência prévia com empresas de varejo/ecommerce,

  • Exp. em projetos de machine learning e ciência de dados.

Mestre Marlesson tá de saco cheio, vamos escrever sobre Random Forest! kkkkk

Vi no

Em mais uma visualização ultra-bacana, o time do Information Is Beautiful traz os principais Data Breaches do mundo, classificados por gravidade e volume de dados vazados. Dá uma explorada aí! (em Inglês)

Coalesce: The Analytics Engineer Conference17 a 21 de Outubro - Evento Gratuito e 100% OnlineData & AI Summit Brasil 2022 - Thoughtworks31 de agosto | 8h45 às 12h30 - Evento Gratuito e 100% Online

Live sobre Data Mesh - DH e TW 25 de Agosto - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.