• Data Hackers Newsletter
  • Posts
  • Perigos do deepfake: IA cria mentiras sobre vida de repórter, incluindo caso com Mark Zuckerberg

Perigos do deepfake: IA cria mentiras sobre vida de repórter, incluindo caso com Mark Zuckerberg

E mais: Como a Uber consegue escalar sua plataforma de AI e ML usando soluções open-source; Após revelação sobre uso de milhares de indianos em tecnologia, Amazon remove IA de suas lojas

Fala, Data Hackers! Preparados para começar mais uma semana imersos no mundo dos dados?

Hoje vamos começar com um conteúdo polêmico, em um evento ao vivo que rolou esse mês uma repórter foi convidada para participar de um painel para discutir os perigos do uso de inteligência artificial. O que ela não imaginava é que que os convidados mostrariam em tempo real o poder que as IAs, que estão disponíveis hoje, já tem para criar conteúdos falsos com poucos comandos… Em alguns minutos eles conseguiram criar uma série de conteúdos "provando" que a repórter teve um caso com Mark Zuckerberg incluindo notícias falsas, posts de redes sociais, imagens e muito mais. Uma situação aterrorizante que serve de alerta para todos nós sobre os riscos que já estão por aí…

Além disso vamos falar de diferentes tópicos, como a construção de estratégias de AI nas empresas, soluções que acabaram de ser lançadas no mercado, ideias de projetos de análise de dados para o seu portfólio e muito mais!

Confira outros destaques:

Estamos felizes em anunciar que a Thoughtworks, consultoria global de tecnologia que integra estratégia, design e engenharia de software para habilitar empresas e organizações disruptivas em todo o mundo a prosperar como negócios digitais modernos, agora é parceira da comunidade Data Hackers!

Nesta parceria, nos unimos à comunidade de especialistas em Dados da Thoughtworks (pessoas Engenheiras, Analistas, Arquitetas, Cientistas de Dados e profissionais Machine Learning) para juntos criarmos oportunidades de impacto real no mercado de dados.

E enquanto a gente não anuncia as próximas ações, aproveite o poder transformador dos Dados e da Inteligência Artificial (IA), na página de carreiras da Thoughtworks.

É apenas o início do que está por vir!

A repórter especializada em tecnologia Laurie Segall viu sua carreira e reputação ruírem: num espaço curto de tempo, teve fotos escandalosas divulgadas, sofreu com rumores de um relacionamento comprometedor e foi alvo de vários tuítes acusatórios. Só tem um detalhe: nada disso era de fato real, e foi tudo parte de um experimento no qual ela concordou em participar, e que dá dimensão do estrago que deepfakes podem fazer na vida de uma pessoa. Nessa publicação, ela conta como foi essa experiência. (em Inglês)

Desde que começou a usar modelos de Machine Learning para precificar corridas e conectar motoristas e passageiros em 2016, a Uber percorreu um longo caminho, a ponto de hoje haver emprego de deep learning e exploração de IA generativa nas aplicações críticas para negócios da plataforma. Mas isso, obviamente, passou por questões de infraestrutura.

Neste artigo, o próprio time da Uber relata como foi o processo de escalar sua plataforma de IA e ML, o que passou por desafios como melhorar bibliotecas de software e integrar diversos frameworks de treinamento. (em Inglês)

A Amazon está desistindo do “Just walk out”, recurso que permitia que a compra de clientes fosse fechada de forma automática, bastando para isso scanear um QR code ao entrar na loja. Tudo parecia automatizado, mas como o portal The Information revelou essa semana, o sistema dependia de mil pessoas na Índia assistindo e rotulando vídeos enquanto as pessoas compravam.

A Amazon pretende agora investir no Dash Carts, sistema que, através de uma tela e um scanner no carrinho de compras, permite aos clientes finalizar a compra diretamente. (em Inglês)

Microsoft atualiza o Copilot 365 com GPT-4 Turbo, mensagens ilimitadas e mais
Jordi Ribas, vice-presidente corporativo da Microsoft, anunciou um pacote de atualizações para o Copilot para Microsoft 365: agora, o assistente já inicia tendo o GPT-4 Turbo como modelo no backend, e não há mais limitação no número de mensagens e na duração das conversas. Além disso, o Copilot terá recursos expandidos para geração de imagens, e o GPT-4 Turbo no backend permitirá que o usuário entre com prompts de texto bem mais longos, oferecendo melhor contexto. (em Inglês)

5 ideias de projetos de análise de dados para enriquecer seu portfólio e te ajudar na busca por uma vaga na área de dados em 2024
Para quem está em busca de uma primeira oportunidade, ou deseja migrar de carreira na área de dados, um portfólio pode ser muito útil tanto para você entender melhor o dia a dia de quem analisa dados quanto para convencer o recrutador que você já possui certa familiaridade com a área de dados e que está preparado para o desafio. Esse artigo mostra um caminho prático com 5 exemplos passo a passo de análises que podem te ajudar nisso. (em Inglês)

Nova tecnologia da Stability AI usa IA para criar músicas do zero
Na última semana, Stability.ai anunciou a nova versão do Stable Audio, que permite criar músicas de até 3 minutos a partir de um prompt de texto usando IA generativa. O usuário pode descrever coisas como “clima” que quer que a música tenha, o número de BPMs e os instrumentos que devem ser usados. Ainda que já houvesse alguns modelos de IA voltados para a produção de músicas, nenhum deles até agora permitia criar músicas tão longas. (em Inglês)

Construindo estratégias efetivas envolvendo IA e compliance
Neste artigo, o pessoal da CastorDoc traz os principais insights que eles tiraram do Gartner Summit 2024: ideias práticas para a construção de estratégias efetivas envolvendo IA e compliance, direto do evento onde a Gartner, uma das maiores consultorias do mundo, reuniu 5 mil dos maiores líderes, profissionais e prestadores de serviço de todo o globo. (em Inglês)

DICA DE VÍDEO

Os sistemas de recomendação têm sido utilizados para personalizar a experiência dos usuários em redes sociais, plataformas de streaming, portais de notícia e outros, os LLMs têm causado grande impacto por sua capacidade de compreender e gerar texto, e as técnicas de Retrieval Augmented Generation (RAG) têm sido aplicadas com sucesso para fornecer conteúdo específico ou recente como contexto para melhorar as respostas das LLMs. Neste meetup promovido pelo Nubank!, o engenheiro de dados Leonardo Raggio explica o que essas tecnologias têm em comum e dá exemplos práticos de como elas trabalham conjuntamente. (em Português)

VAGAS DA SEMANA

São Paulo-SP - Presencial

  • Formação superior, ou pelo menos 7 anos de experiência profissional ou militar;

  • 5 ou mais anos de experiência como profissional ou executivo de Machine Learning;

  • Experiência em participar de ciclos de venda (direta ou indiretamente);

  • Experiência em consultoria de gestão ou trabalhos relacionados;

  • Experiência no lançamento de programas ou projetos tecnicamente complexos que incluam Big Data, Analytics, Inteligência Artificial e Machine Learning.

Remoto

  • Experiência comprovada em MLOps e deploy de modelos de Machine Learning no Kubernetes;

  • Proficiência em plataformas de computação em nuvem (AWS, GCP, Azure);

  • Experiência com ferramentas de orquestração de dados (ex. Apache Airflow);

  • Familiaridade com Terraform para CI/CD e infraestrutura enquanto código;

  • Forte capacidade de programação para desenvolvimento de software;

  • Mindset agnóstico em relação a sistemas em nuvem (experiência em Kubeflow é um diferencial).

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Agora que faz pouco mais de 2 anos que o conflito entre Rússia e Ucrânia começou, o pessoal do Information is Beautiful levantou os principais números sobre a guerra até o momento (dentro do possível, já que o contexto de guerra sempre torna os dados imprecisos) e sintetizou nesse Dataviz. Número de mortos e feridos (militares e civis), investimento militar e outras cifras que ajudam a dar a dimensão da enorme tragédia humanitária que infelizmente vem se desenrolando e que infelizmente ainda não dá sinais de acabar. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

Dremio Surface
2 e 3 de maio - Nova York, EUA e Online

Rockset Index
26 e 27 de março - São Paulo-SP (ou online)

Data + AI Summit
10 e 13 de junho - San Francisco, Califórnia, EUA

HackTown 2024 (Data Hackers têm 15% de desconto!)
01 de agosto - Santa Rita do Sapucaí-MG

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

AWS Innovate
On-demand - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo