300 casos práticos de uso de Machine Learning e AI em empresas

E mais: Meta lança modelo de geração de imagens treinado com fotos do Instagram e Facebook; Como o AirBnB está medindo e otimizando a qualidade de seus dados

Fala Data Hackers! Antes que o natal chegue e o ano acabe de vez, bora saber o que rolou de mais quente no universo dos dados por esses dias?

Essa semana trazemos um material quentíssimo para quem se interessa por machine learning: um banco com 300 cases em que mais de 80 empresas mostram como usaram machine learning para melhorar seus processos ou produtos. Mas não é só: trazemos também o lançamento do Imagine, modelo de IA gerador de imagens criado pela Meta e treinado com fotos públicas dos usuários do Instagram e do Facebook, e ainda a abordagem inovadora que permitiu ao Airbnb garantir a qualidade de seus dados de forma escalável por todos os setores da empresa.

Confira outros destaques da news de hoje:

Você já teve curiosidade de saber como companhias como Netflix, Airbnb e Doordash usam machine learning para melhorar seus produtos e processos? Este link reúne 300 estudos de caso de mais de 80 empresas que compartilharam cases de uso de machine learning e aprendizados que elas tiveram ao desenhar sistemas usando essa tecnologia. É possível ainda filtrar os cases de acordo com tags ou por um determinado tipo de indústria. Para quem se interessa por machine learning, um verdadeiro tesouro! (em Inglês)

A gigante Meta acaba de entrar de vez no universo modelos de IA geradores de imagem ao lançar seu modelo independente, que foi batizado de Imagine e pode ser acessado pelo site imagine.meta.com.

O Imagine se apresenta como uma opção gratuita para gerar imagens a partir de texto, e enquanto concorrentes enfrentam críticas e até processos por imagens públicas da web terem sido usadas para o treinamento dos modelos, o Imagine tem o diferencial de ter sido treinado com imagens disponibilizadas como públicas pelos usuários do Instagram e do Facebook - embora também enfrente críticas, já que os usuários em questão não consentiram que as imagens fossem usadas dessa forma.

(em Inglês)

Algum tempo atrás, a AirBnB enfrentava um problema: apesar de ter um volume enorme de dados, a falta de qualidade desses dados levava a atrasos na entrega na entrega de reports e dificultava a obtenção de resultados consistentes. Foi aí que a empresa sentiu a necessidade de passar a dar atenção à qualidade dos dados.

Este artigo detalha a adoção de uma escala própria, chamada de Airbnb’s Data Quality Score (“DQ Score”), para medir a qualidade dos dados. A criação dessa escala se mostrou uma abordagem inovadora na busca de garantir a consistência dos números, consistência essa que pode depender de processos longos e trabalhosos, de forma escalável por todos os setores da empresa.

(em Inglês)

OUTROS TÓPICOS

Na busca por bons empregos em dados, sempre é válido fortalecer as competências que os empregadores mais buscam nos profissionais. Confira nesse artigo detalhes sobre 5 das habilidades mais buscadas pelas empresas (fortes habilidades analíticas, proficiência em programação, expertise em machine learning, habilidade em dataviz/comunicação e conhecimento em domínios da internet) e ideias de projetos para desenvolver melhor cada uma delas. (em Inglês)

Foi anunciado nessa semana o primeiro canal de notícias gerado por IA no mundo: o Channel 1, que deve começar a transmitir em março de 2024. O canal, que vai contar com âncoras de personalidades distintas geradas por IA e promete uma experiência de notícias personalizável, lançou um vídeo demonstrativo essa semana e, claro, acendeu discussões sobre o futuro do jornalismo. (em Inglês)

Depois de ter anunciado em junho o Voicebox, que usa IA para recriar as vozes de pessoas, a Meta revelou nos últimos dias o Audiobox, ferramenta que permite criar áudios a partir de textos. O Audiobox permite que o usuário descreva o que quer no áudio e é capaz de distinguir orientações como o ambiente em questão (como uma catedral) e a emoção de quem fala. (em Inglês)

Os modelos geradores de imagens vivem um momento de grande popularidade, ainda mais depois que gigantes como OpenAI, Nvidia e Google conseguiram treinar modelos em larga escala. Mas como funciona, afinal, o princípio por trás de tais modelos? Este artigo apresenta de forma prática o funcionamento da principal arquitetura que permite gerar imagens de alta resolução com base em texto. (em Inglês)

O Midjourney, serviço de IA de geração de imagens que funciona junto ao app de mensagens Discord, começou a testar uma versão “alpha” do seu site, midjourney.com, que permite ao público gerar imagens diretamente, sem precisar usar o Discord. O serviço está entre os mais populares do mundo, com cerca de 17.5 milhões de usuários em seu servidor no Discord. (em Inglês)

DICA DE VÍDEO

Até que ponto o Prompt Engineering, nome dado à capacidade de otimizar comandos e instruções para modelos de linguagem baseado em Inteligência Artificial, é de fato essencial? Neste vídeo, Cassie Kozyrkov, que foi por muitos anos Head de Decision Intelligence no Google, mostra como, quando se busca um resultado específico, aumentar a precisão nos detalhes pode ser fundamental - o que torna a questão muito próxima de programação ou matemática. (em Inglês)

VAGAS DA SEMANA

Remoto

  • Experiência mínima de 3 anos como Cientista de Dados;

  • Tecnologias de Big Data (conjuntos, bancos de dados e armazenamento em nuvem);

  • Experiência em gestão de equipes técnicas de pequeno ou médio porte;

  • Experiência em contratar e gerir uma equipe de tecnólogos de alto nível;

  • Metodologia ágil (Scrum, Kanban, XP ou outros);

  • Métodos de gestão de projetos de ciência de dados (como CRISP-DM, Agile-CRISP-DM, SEMMA);

  • Conhecimentos sobre boas práticas de desenvolvimento de software.

São Paulo-SP - Presencial

  • Mestrado ou especialização em Matemática, Estatística, Ciência da Computação ou correlatas;

  • Mínimo de 7 anos de experiência em Data Science e boa noção de e-commerce;

  • Mínimo de 2 anos de experiência em gestão de pessoas;

  • Proficiência em SQL/Hive/Python ou R;

  • Experiência em manipulação massiva de dados, machine learning e modelagem;

  • Sólido conhecimento de metodologias de testes A/B;

  • Capacidade de proporcionar abordagens sistemáticas para resolver problemas de negócios;

  • Boa comunicação oral e escrita em inglês.

DATA VISUALIZATION DA SEMANA

Você já parou pra se perguntar quais as principais formas como os casais se conhecem, e como isso vem mudando ao longo das décadas? Observar dados sobre isso permite observar como a dinâmica social se transforma ao longo do tempo, e ainda mais em tempos recentes, com a ajuda dos aplicativos de relacionamento. Este gráfico usa os dados de uma pesquisa acadêmica para ilustrar como a forma dos casais hétero se conhecerem mudou dos anos 50 pra cá - e mostra como o as flechas do cupido agora voam mais pela internet do que em qualquer outro lugar. (em Inglês)

  • 31 de janeiro - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo

trução