Meta abre segredos de TODAS suas IAs ūüėĮ

Meta abre segredos de TODAS suas IAs!

Fala Data Hackers! Seja bem-vindo a mais uma news!

Sabe aquele destaque da news do brasileiro que fez um dos modelos mais baixados do mundo no Hugging Face? Então, ele topou conversar com a gente e gravou um podcast exclusivíssimo contando toda sua história, desde o início de sua pesquisa, até a publicação do modelo que BOMBOU na comunidade mundial!

Outro ponto bem bacana dessa news foi a liberação da Meta sobre seus sistemas de recomendação. Eles contam quais características são as mais relevantes para cada um de seus sistemas, do Reels até os Grupos do Facebook. Imperdível, hein?!

Mas não é só isso! Tem mais:

Se você está ligado no assunto de IA/ML nas redes sociais LinkedIn e Twitter, provavelmente você deve ter ouvido falar desse caso.

O renomado cientista brasileiro Jonatas Grosman tem feito um sucesso estrondoso no #HuggingFace, chegando a ultrapassar o renomado BERT da #Google em termos de downloads de modelos. O seu modelo de destaque é uma afinação refinada do Wav2Vec2-XLSR-53 do Facebook, especializado em reconhecimento de fala.

A pedido da comunidade Data Hackers - a mais expressiva em IA e Data Science do Brasil - tivemos a oportunidade de bater um papo esclarecedor e bem-humorado com Jonatas Grosman. Com um doutorado em Ciência da Computação e atuando como pesquisador na PUC-Rio, Jonatas compartilhou sobre sua jornada, a criação do seu modelo e ainda levantou uma questão crucial sobre a necessidade de uma maior integração entre universidades, pesquisa e mercado.

Nesse episódio, Jonatas conta sua história de superação, e como que Data Science o ajudou a superar um dos momentos mais difíceis da sua vida. Esse episódio é realmente imperdível!

Vale lembrar que todos os episódios do podcast Data Hackers podem ser encontrados no Spotify, iTunes, Google Podcast, Castbox entre outras plataformas. (em Português)

Sabe aqueles an√ļncios que aparecem assim que voc√™ abre o app? Ent√£o, aqui nesse post o Spotify conta como que eles conseguem segmentar os an√ļncios e usar a sua intera√ß√£o com eles para te mandar os conte√ļdos mais relevantes.

O Spotify reconhece que as mensagens no aplicativo t√™m efeitos variados em diferentes usu√°rios, um fen√īmeno conhecido como efeito heterog√™neo do tratamento. Para otimizar o uso das mensagens, eles se prop√Ķem a prever o efeito das mensagens nos usu√°rios, usando a modelagem de uplift. Essa t√©cnica visa modelar diretamente o impacto das mensagens no comportamento do usu√°rio.

Para medir a efic√°cia das mensagens no aplicativo, o Spotify criou grupos de controle ou "holdouts", que s√£o grupos de usu√°rios que n√£o recebem mensagens no aplicativo. Isso permite √† empresa comparar o comportamento desses usu√°rios com o daqueles que recebem as mensagens e medir o efeito m√©dio do tratamento (m√©dia do impacto das mensagens em todo o p√ļblico). (em Ingl√™s)

Que o Facebook tem um dos sistemas de recomenda√ß√Ķes mais inteligentes e complexos do mundo voc√™ j√° sabe. Mas imagina ter acesso a como cada recsys deles funcionam: dos Stories at√© as Buscas.

Nesta p√°gina, a Meta fornece "AI system cards", ferramentas para explicar como os sistemas de IA em seus produtos funcionam e que podem ser entendidas por especialistas e n√£o especialistas.

O ranking dos posts √© afetado por previs√Ķes sobre o post, caracter√≠sticas do conte√ļdo e intera√ß√Ķes dos indiv√≠duos com os produtos da Meta, determinando assim a coloca√ß√£o mais alta ou mais baixa do conte√ļdo no feed.

No Reels, por exemplo, a IA est√° de olho na dura√ß√£o dos Reels que voc√™ assiste e quantos deles voc√™ assiste duas vezes. Ela olha para quantos Reels voc√™ assistiu, e quantos voc√™ compartilhou, e com quais criadores de conte√ļdo voc√™ interagiu.

E a lista continua, pessoal! Ela tá ligada até na probabilidade de você assistir a menos de três segundos de um Reel.

Muito bacana essa iniciativa da Meta! (em Inglês)

OUTROS T√ďPICOS

O Data Hacker Danilo Steckelberg escreveu sobre o famoso Viés de Sobrevivência, que nos leva a um erro muito constante de olhar só para os casos que se mantêm vivos ou vitoriosos. Com um discurso bem diferente e descontraído, Danilo mostra como podemos evitar de cair nessa pegadinha. (em Português)

A Data Hacker Giuliana de Jong destaca, nesse post, a import√Ęncia da estrutura√ß√£o e da governan√ßa dos dados no ambiente de neg√≥cios atual, com √™nfase na cria√ß√£o de dashboards. O processo, embora flex√≠vel, √© rigoroso, come√ßando com a identifica√ß√£o da necessidade de um dashboard, seguido por entrevistas com stakeholders para entender suas necessidades. O texto tamb√©m destaca a import√Ęncia do teste e da valida√ß√£o antes da implementa√ß√£o final, bem como a possibilidade de treinamento para os usu√°rios finais.

(em Português)

Mage AI surgiu recentemente como uma plataforma inovadora para a orquestração pipelines de dados. O Data Hacker Denis Oliveira conta como o Mage tem uma interface de usuário intuitiva, implementação simplificada e suporte à integração com diversas fontes de dados. Com capacidade para criar pipelines de dados personalizados em tempo real e em lote, e monitoramento eficiente, torna-se uma ferramenta robusta para o manejo de dados. Vale destacar sua missão de valorizar os dados como "first class citizens", proporcionando a criação de pipelines de dados limpos, consistentes e bem testados. (em Português)

DICA DE CURSO

Um dos desafios atualmente, com ChatGPT ou outros LLMs é você resumir os textos para caber em uma “Completion" ou “Predição". O Andrew Ng, Founder do deeplearning.ai chamou ninguem menos que Harrison Chase, o Criador do LangChain para dar um curso gratuito! Imperdível! (em Inglês)

VAGAS DA SEMANA

  • Experi√™ncia com an√°lise de dados;

  • Conhecimento em plataformas de web analytics (Google Analytics, Adobe Analytics, etc.) e teste e personaliza√ß√£o de conte√ļdo (Adobe Target, Google Optimizer, etc.);

  • Habilidade para criar relat√≥rios/dashboards e extrair insights relevantes para o neg√≥cio;

  • Habilidade para propor e documentar solu√ß√Ķes de neg√≥cio relacionadas √† coleta de dados;

  • Capacidade de organizar e eleger demandas para melhorias de web analytics;

S√£o Paulo - SP (Remoto)

  • Experi√™ncia em implementa√ß√£o e condu√ß√£o de programas de Governan√ßa de Dados, especificamente nos aspectos de metadados e qualidade de dados;

  • Experi√™ncia com ferramentas de qualidade de dados;

  • Experi√™ncia em implementa√ß√£o de controles de qualidade de dados, definindo padr√Ķes, estrat√©gias e m√©tricas dos ativos de dados para garantir a precis√£o e a confiabilidade dos dados;

  • Experi√™ncia em Data Profiling e Data Quality Assessment como insumos;

  • Experi√™ncia com constru√ß√£o de relat√≥rios de Qualidade de Dados.

MEME DA SEMANA

“Product Manager: Por que você não pode só “deployar" o modelo?

Cientista de Dados: AAAAHH"

kkkkk esse trem n√£o converge nem ferrando!

DATA VISUALIZATION DA SEMANA

A galera do Datamade são uma das maiores referências em consultoria de Dados do mundo. Nesse trabalho para a prefeitura de Chicago, eles levantaram todos os pontos onde tem programas e atividades para a recuperação da cidade em vários mapas interativos. (em Inglês)

PROXIMOS EVENTOS E MEETUPS

Data Mesh na Prática com Dadosfera17/07/2023 a 21/07/2023, das 19:00 às 22:00 - Online

Desconto de 50% Cupom DATAHACKERS50

Supletivo DH - Tableau25/07 às 19:00 - Online e Gratuito

Data Makers Fest (Porto - Portugal)23 e 24 de Outubro de 2023

29 de junho de 2023 - 09h00 às 10h30 (BRT) - Gratuito

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.

Twitter icon
Website icon
LinkedIn icon
Medium icon