Como o modelo viciante do TikTok funciona?¬†ūüďĪ

O modelo da Meta que n√£o durou 3 dias

Fala, Data Hackers! Estamos de volta para mais uma news! Dia de jogo ou n√£o, estamos sempre na sua caixa de entrada pra dar um SHOW DE BOLA nas not√≠cias e novidades do mundo de dados! kkkkEssa news est√° recheada de novidades bem bacanas! Uma das principais delas √© que o TikTok, a rede social que mais cresce no mundo, liberou um artigo explicando como funciona seu Sistema de Recomenda√ß√£o de Conte√ļdo. Para quem nunca usou a rede, deixe-me explicar (do alto do meu desconhecimento millenial sobre a ferramenta kkk): no TikTok voc√™ simplesmente vai rolando para cima e o algoritmo trata de entender os conte√ļdos que prendem sua aten√ß√£o por mais segundos que outros. √Č realmente inacredit√°vel: voc√™ mal mal preenche seu perfil ou conecta-se com amigos ou segue pessoas: o TikTok vai te colocar num buraco negro dif√≠cil de sair de conte√ļdos que voc√™ gosta! N√£o deixe de ler o artigo!Mas tem muito mais:

TikTok, a rede social que mais cresce no mundo, liberou um artigo mostrando como funciona seu Sistema de Recomenda√ß√£o, respons√°vel por manter o maior "tempo de tela" de todos os apps do mundo. E o mais incr√≠vel, √© que o modelo pouco se basea no perfil do usu√°rio ou nos perfis que ele segue. Ele √© fortemente orientado pelo comportamento do usu√°rio ao assistir os conte√ļdos r√°pidos da plataforma e utiliza t√©cnicas avan√ßadas para filtrar "bolhas" ou conte√ļdos muito repetitivos.Eu entendo bulhufas de Sistemas de Recomenda√ß√£o, achei interessante que a arquitetura precisa de realtime fino com Apache Kafka, para conseguir fazer treinamento online em alta-performance.Para quem √© apaixonado por RecSys ou por Machine Learning em geral, √© um must ler e entender esse artigo. Imperd√≠vel!Link para o artigo aqui. (em Ingl√™s)

HOJE √© o √ļltimo dia para compartilhar mais infos da sua carreira conosco!

A Meta tinha lançado recentemente o seu grande modelo de IA que conversa e aprende em conversas com seres humanos, o Galactica. Mas, em menos de 3 dias, já tirou a demo que tanto fez buzz para galera usar do ar, frente a um rampante de críticas de grandes experts no assunto. Modelos desse tipo já deram bem ruim no passado, principalmente por reproduzir viéses e se tornarem máquinas de ódio e absurdos.

Mesmo assim, a Meta colocou o seu modelo no ar que foi testado por vários cientistas. Um dos principais problemas identificados era que Galactica não conseguia separar uma fake news da realidade kkkk Quem diria né?! Muito interessante o artigo do MIT Review sobre o caso, não deixe de ler! (em Inglês)

 

Já podemos dizer que Jupyter é a IDE de Cientistas de Dados. Um dos ambientes mais diversos e produtivos atualmente para desenvolvimento, é nosso queridinho. Mas existem muitos segredos e boas-práticas que devem ser seguidas para tirar todo o poder dessa ferramenta.

Quer ficar por dentro de como a plataforma de desenvolvimento web Jupyter Notebook pode te ajudar nas prototipagens rápidas de experimentação em ciência de dados e análise exploratória?

O Henrique Branco, Engenheiro de Machine Learning do Grupo Boticário, te conta as vantagens e desvantagens nesse artigo. Imperdível! (em Português)

Imagina sua empresa receber investimento da Open AI? Legal demais n√©? √Č o que aconteceu com a Harvey, startup que usa IA para apoiar advogados a entenderem o conte√ļdo de grandes processos. Os fundadores da Harvey trabalharam na Google Brain e tamb√©m na Meta AI, s√£o refer√™ncias no desenvolvimento de modelos NLP, como o GPT-3. (em Ingl√™s)

Um dos modelos que estão impressionando o mundo já lançou sua versão 2.0! O Stable Diffusion 2.0 usa um novo text encoder, que aumentam a qualidade dos resultados do modelo. O Upscaler para gerar imagens em Super-Resolução também teve melhorias. (em Inglês)

Você viu que o próprio TikTok usa o Apache Kafka no centro de sua arquitetura do sistema de recomendação né? Então nem preciso falar o quão importante é para Eng. de Dados ou de Machine Learning entenderem dessa ferramenta incrível. Nesse post, estão compilados os cursos mais atualizados e recomendados para dominar o streaming de dados mais usado no mundo. (em Inglês)

Conferencia de Computational Intelligence da IEEE na LATAMUma das maiores organiza√ß√Ķes refer√™ncia em Engenharia e Ci√™ncia, a IEEE, hosteou uma confer√™ncia na Am√©rica Latina que contou com v√°rias pessoas refer√™ncias brasileiras e latinas em IA, como: Fernando Buarque, da Escola Polit√©cnica da Universidade de Pernambuco e Gerardo Rubino da Inria na Fran√ßa. Esse link √© para a se√ß√£o de quarta, mas o canal tem todos os outros dias. (em Ingl√™s)

VAGAS DA SEMANA

  • Conhecimentos s√≥lidos em Estat√≠stica, Machine Learning, modelagem supervisionada e n√£o supervisionada;

  • Conhecimento em Python e/ou R;

  • Conhecimento em SQL;

  • Pensamento anal√≠tico e criativo

  • Interesse por conhecer cada vez mais sobre a √°rea de neg√≥cio

  • Forma√ß√£o superior em Ci√™ncia/Engenharia da Computa√ß√£o ou √°reas similares;

  • 5+ anos de experi√™ncia na fun√ß√£o de Engenheiro de Dados;

  • Conhecimento avan√ßado de SQL;

  • Experi√™ncia na constru√ß√£o e otimiza√ß√£o de pipelines de dados, arquiteturas e fontes de dados;

  • Experi√™ncia com pipeline de dados: Airflow, Step Functions, etc;

  • Experi√™ncia com AWS: S3, Lambda, Glue, EC2, EMR, RDS, MWAA;

  • Experi√™ncia com programa√ß√£o Python (Lambdas);

  • Ingl√™s avan√ßado.

- Uma IA pode escrever consultas SQL eficientes?- Voc√™ pode?CRYYY kkkk ūü•≤Dica do Rodrigo Teoria no nosso Slack

O espa√ßo do dom√≠nio do Mercado Livre como maior e-commerce do Brasil vem diminuindo. Al√©m da gigante Amazon que saltou a frente dos outros players nos √ļltimos meses, o novo entrante Shopee vem numa crescente incr√≠vel desde 2021. Nessa Viz do Snaq no Instagram, voc√™ pode acompanhar essa corrida e, em outros cards, mais detalhes desses n√ļmeros. Olha l√°! (em Portugu√™s)

AWS Re:Invent28 de Novembro a 02 de Dezembro - Parte Online gratuitaPrograma de Verão IME 2023 Janeiro e Fevereiro de 2023 - Diversos cursos a preços acessíveis (R$ 60 a R$ 500)Obs: O programa também conta com alguns cursos gratuitos.

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.