Meta abre segredos de TODAS suas IAs 😯

Meta abre segredos de TODAS suas IAs!

Fala Data Hackers! Seja bem-vindo a mais uma news!

Sabe aquele destaque da news do brasileiro que fez um dos modelos mais baixados do mundo no Hugging Face? Então, ele topou conversar com a gente e gravou um podcast exclusivíssimo contando toda sua história, desde o início de sua pesquisa, até a publicação do modelo que BOMBOU na comunidade mundial!

Outro ponto bem bacana dessa news foi a liberação da Meta sobre seus sistemas de recomendação. Eles contam quais características são as mais relevantes para cada um de seus sistemas, do Reels até os Grupos do Facebook. Imperdível, hein?!

Mas não é só isso! Tem mais:

Se você está ligado no assunto de IA/ML nas redes sociais LinkedIn e Twitter, provavelmente você deve ter ouvido falar desse caso.

O renomado cientista brasileiro Jonatas Grosman tem feito um sucesso estrondoso no #HuggingFace, chegando a ultrapassar o renomado BERT da #Google em termos de downloads de modelos. O seu modelo de destaque é uma afinação refinada do Wav2Vec2-XLSR-53 do Facebook, especializado em reconhecimento de fala.

A pedido da comunidade Data Hackers - a mais expressiva em IA e Data Science do Brasil - tivemos a oportunidade de bater um papo esclarecedor e bem-humorado com Jonatas Grosman. Com um doutorado em Ciência da Computação e atuando como pesquisador na PUC-Rio, Jonatas compartilhou sobre sua jornada, a criação do seu modelo e ainda levantou uma questão crucial sobre a necessidade de uma maior integração entre universidades, pesquisa e mercado.

Nesse episódio, Jonatas conta sua história de superação, e como que Data Science o ajudou a superar um dos momentos mais difíceis da sua vida. Esse episódio é realmente imperdível!

Vale lembrar que todos os episódios do podcast Data Hackers podem ser encontrados no Spotify, iTunes, Google Podcast, Castbox entre outras plataformas. (em Português)

Sabe aqueles anúncios que aparecem assim que você abre o app? Então, aqui nesse post o Spotify conta como que eles conseguem segmentar os anúncios e usar a sua interação com eles para te mandar os conteúdos mais relevantes.

O Spotify reconhece que as mensagens no aplicativo têm efeitos variados em diferentes usuários, um fenômeno conhecido como efeito heterogêneo do tratamento. Para otimizar o uso das mensagens, eles se propõem a prever o efeito das mensagens nos usuários, usando a modelagem de uplift. Essa técnica visa modelar diretamente o impacto das mensagens no comportamento do usuário.

Para medir a eficácia das mensagens no aplicativo, o Spotify criou grupos de controle ou "holdouts", que são grupos de usuários que não recebem mensagens no aplicativo. Isso permite à empresa comparar o comportamento desses usuários com o daqueles que recebem as mensagens e medir o efeito médio do tratamento (média do impacto das mensagens em todo o público). (em Inglês)

Que o Facebook tem um dos sistemas de recomendações mais inteligentes e complexos do mundo você já sabe. Mas imagina ter acesso a como cada recsys deles funcionam: dos Stories até as Buscas.

Nesta página, a Meta fornece "AI system cards", ferramentas para explicar como os sistemas de IA em seus produtos funcionam e que podem ser entendidas por especialistas e não especialistas.

O ranking dos posts é afetado por previsões sobre o post, características do conteúdo e interações dos indivíduos com os produtos da Meta, determinando assim a colocação mais alta ou mais baixa do conteúdo no feed.

No Reels, por exemplo, a IA está de olho na duração dos Reels que você assiste e quantos deles você assiste duas vezes. Ela olha para quantos Reels você assistiu, e quantos você compartilhou, e com quais criadores de conteúdo você interagiu.

E a lista continua, pessoal! Ela tá ligada até na probabilidade de você assistir a menos de três segundos de um Reel.

Muito bacana essa iniciativa da Meta! (em Inglês)

OUTROS TÓPICOS

O Data Hacker Danilo Steckelberg escreveu sobre o famoso Viés de Sobrevivência, que nos leva a um erro muito constante de olhar só para os casos que se mantêm vivos ou vitoriosos. Com um discurso bem diferente e descontraído, Danilo mostra como podemos evitar de cair nessa pegadinha. (em Português)

A Data Hacker Giuliana de Jong destaca, nesse post, a importância da estruturação e da governança dos dados no ambiente de negócios atual, com ênfase na criação de dashboards. O processo, embora flexível, é rigoroso, começando com a identificação da necessidade de um dashboard, seguido por entrevistas com stakeholders para entender suas necessidades. O texto também destaca a importância do teste e da validação antes da implementação final, bem como a possibilidade de treinamento para os usuários finais.

(em Português)

Mage AI surgiu recentemente como uma plataforma inovadora para a orquestração pipelines de dados. O Data Hacker Denis Oliveira conta como o Mage tem uma interface de usuário intuitiva, implementação simplificada e suporte à integração com diversas fontes de dados. Com capacidade para criar pipelines de dados personalizados em tempo real e em lote, e monitoramento eficiente, torna-se uma ferramenta robusta para o manejo de dados. Vale destacar sua missão de valorizar os dados como "first class citizens", proporcionando a criação de pipelines de dados limpos, consistentes e bem testados. (em Português)

DICA DE CURSO

Um dos desafios atualmente, com ChatGPT ou outros LLMs é você resumir os textos para caber em uma “Completion" ou “Predição". O Andrew Ng, Founder do deeplearning.ai chamou ninguem menos que Harrison Chase, o Criador do LangChain para dar um curso gratuito! Imperdível! (em Inglês)

VAGAS DA SEMANA

  • Experiência com análise de dados;

  • Conhecimento em plataformas de web analytics (Google Analytics, Adobe Analytics, etc.) e teste e personalização de conteúdo (Adobe Target, Google Optimizer, etc.);

  • Habilidade para criar relatórios/dashboards e extrair insights relevantes para o negócio;

  • Habilidade para propor e documentar soluções de negócio relacionadas à coleta de dados;

  • Capacidade de organizar e eleger demandas para melhorias de web analytics;

São Paulo - SP (Remoto)

  • Experiência em implementação e condução de programas de Governança de Dados, especificamente nos aspectos de metadados e qualidade de dados;

  • Experiência com ferramentas de qualidade de dados;

  • Experiência em implementação de controles de qualidade de dados, definindo padrões, estratégias e métricas dos ativos de dados para garantir a precisão e a confiabilidade dos dados;

  • Experiência em Data Profiling e Data Quality Assessment como insumos;

  • Experiência com construção de relatórios de Qualidade de Dados.

MEME DA SEMANA

“Product Manager: Por que você não pode só “deployar" o modelo?

Cientista de Dados: AAAAHH"

kkkkk esse trem não converge nem ferrando!

DATA VISUALIZATION DA SEMANA

A galera do Datamade são uma das maiores referências em consultoria de Dados do mundo. Nesse trabalho para a prefeitura de Chicago, eles levantaram todos os pontos onde tem programas e atividades para a recuperação da cidade em vários mapas interativos. (em Inglês)

PROXIMOS EVENTOS E MEETUPS

Data Mesh na Prática com Dadosfera17/07/2023 a 21/07/2023, das 19:00 às 22:00 - Online

Desconto de 50% Cupom DATAHACKERS50

Supletivo DH - Tableau25/07 às 19:00 - Online e Gratuito

Data Makers Fest (Porto - Portugal)23 e 24 de Outubro de 2023

29 de junho de 2023 - 09h00 às 10h30 (BRT) - Gratuito

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.

Twitter icon
Website icon
LinkedIn icon
Medium icon