100 casos práticos de uso de AI Generativa (organizados e em português)🥇

E mais: Llama 3, o mais poderoso modelo LLM open source já lançado, está acessível para o público; 6 dicas práticas para ampliar seus conhecimentos em engenharia de dados

Fala, Data Hackers! E aí, que tal começar essa nova semana se informando do que tem rolado no universo dos dados?

Hoje trazemos como destaque um compilado de nada mais nada menos do que 100 casos práticos de uso de AI Generativa. É uma lista bem organizada e em português, onde foram selecionadas as maneiras mais úteis de tornar esse tipo de tecnologia parte do dia a dia dos profissionais de dados e tecnologia.

E não é só: temos ainda o lançamento do Llama 3, aguardada nova versão do LLM open source da Meta, e dicas para adentrar na Engenharia de Dados muito além de conselhos genéricos como “aprenda Python e SQL”.

Confira outros destaques:

A IA Generativa tem impactado o mercado financeiro, apesar do segmento ter um comportamento mais conservador no apoio às iniciativas de inovação (a prioridade desse mercado são iniciativas com foco em crescimento de receitas e eficiência operacional, mantendo clientes e preservando as margens para mitigar riscos).

Você já se perguntou como a revolução da inteligência artificial está moldando o cenário financeiro atual? E como ela pode ser usada para criar impacto diante de um contexto de insegurança para abraçar plenamente iniciativas inovadoras?

Junte-se com a gente neste Webinar no dia 08/05 às 19h, promovido pela comunidade Data Hackers em parceria com a Thoughtworks, onde exploraremos o impacto da GenAI no mercado financeiro! (em português)

Streamlit é uma ferramenta poderosa para criar aplicativos de dados de forma rápida e eficiente, ela está ganhando cada vez mais adeptos pela simplicidade de colocar um site ou app no ar utilizando vários recursos visuais de dados.

Até mesmo o site da pesquisa State of Data foi desenvolvido com essa ferramenta, acredita?

Nosso convidado especial, Luciano Borba, irá compartilhar insights valiosos, dicas práticas e exemplos de como usar essa ferramenta incrível nessa live gratuita - Inscreva-se nesse link.

Não perca esta oportunidade de aprender e se inspirar! Marque na sua agenda e junte-se a nós para uma conversa fascinante sobre Streamlit.

Contamos com a sua presença!(em português)

O destaque dessa semana veio direto do Linkedin, Gustavo Melles, empreendedor na área de AI, providenciou a tradução para português de um material incrível e resolveu compartilhar na rede. No arquivo PDF são apresentadas 100 aplicações práticas de AI generativa, com exemplos!

A lista está bem interessante, inclui dicas de prompts e contempla exemplos de uso úteis em várias áreas, tanto no lado pessoal quanto no profissional, ou seja, vai sede a geração de códigos, manipulação de dados, criação de formulas do excel até aplicações voltadas para organização pessoal, lazer, soft skills e muito mais. Vale a pena conferir com calma o material! (em Português)

O Llama 3, esperada nova versão do Large Language Model open-source da Meta que é usado por diversos modelos de IA generativa, acaba de chegar. O modelo já está disponível através do Meta AI, que Zuckerberg e cia anunciam como um dos principais assistentes de IA do mundo e que pode ajudar a realizar tarefas, criar conteúdo e mais.

A ideia é que uma diversidade de modelos do Llama 3 esteja em breve disponível em variadas plataformas, assim como novos recursos e ferramentas de segurança. (em Inglês)

Quando se demonstra interesse em trabalhar com Engenharia de Dados, muita gente acha que é "só aprender Python e SQL”. É justo, esse é o início de tudo, mas, passado esse ponto, qual o próximo passo para se virar em um universo que envolve tecnologias Spark, Flink, Iceberg, BigQuery?

A ideia deste guia é revelar de forma direta e didática tudo que você precisa para trabalhar com Engenharia de Dados no ano de 2024. Tem interesse? Vale conferir. (em Inglês)

Dicas para quem quer trabalhar com Ciência de Dados aplicada a Futebol e outros esportes
Os dados hoje fazem parte do contexto do esporte, com times de diversas modalidades usando mapas de calor e outros recursos para analisar adversários e construir estratégias, do físico à tática. Nesse cenário, muitos sonham em trabalhar com dados no contexto esportivo. Mas como se aproximar desse universo, afinal? Este guia, escrito por um profissional que usou dados para trabalhar no contexto do futebol americano, explica de forma direta. (em Inglês)

Microsoft demonstra nova tecnologia de AI que permite dar vida a fotos antigas e obras de arte de maneira muito realista
A Microsoft demonstrou na última semana o VASA-1, modelo de IA que se mostra revolucionário pela capacidade de usar fotos produzir vídeos com cabeças que falam e cantam a partir de pouquíssimos inputs: basta uma foto e um áudio. A gigante da tecnologia chegou inclusive a divulgar um vídeo em que a Monalisa, de Leonardo da Vinci, aparece cantando um rap. Em função do risco de tal tecnologia ser usada para gerar deepfakes, no entanto, a empresa deixou claro que não pretende lançar o modelo comercialmente. (em Inglês)

É possível usar LLMs para Data Labeling (categorizar e rotular dados)?
Dados rotulados com precisão fornecem uma base sólida para o treinamento e a avaliação de modelos de Machine Learning em relação a diversas tarefas. O mais comum para chegar à rotulagem de qualidade, no entanto, é contratar crowdworkers (como através do Amazon Mechanical Turk, por exemplo), ou especialistas de domínio), o que pode custar caro e consumir muito tempo. E esse cenário levou muita gente se perguntar: seria possível usar LLMs para isso? Esse post traz a resposta. (em Inglês)

TRETA: Ferramenta de IA da Adobe usou imagens dos seus rivais (como Midjourney) em seus treinamentos
O Firefly, modelo de de IA da Adobe dedicado à criação de imagens a partir de prompts de texto, era tido como um modelo mais ético que os demais por ter sido treinado com imagens do banco da própria empresa. Na última semana foi revelado, no entanto, que o treinamento incluiu imagens criadas pelo Midjourney, modelo concorrente, e que essas imagens teriam sido agregadas ao banco da Adobe por clientes. A criadora do Firefly afirma, no entanto, que o percentual dessas imagens foi pequeno (em torno de 5%). (em Inglês)

AirBnB acaba de tornar sua plataforma interna de Machine Learning Open Source
O pessoal da AirBnB acaba de anunciar que Chronon, a plataforma de Machine Learning usada pela companhia internamente, agora é open source e está disponível para quem se interessar. O Chronon oferece ferramentas de observabilidade e gerenciamento, permite a profissionais de Machine Learning usar variadas fontes de dados e lidar com a complexidade da engenharia de dados ao mesmo tempo, e ainda oferece streaming de baixa latência. Quer saber mais sobre a plataforma? Confira tudo neste artigo. (em Inglês)

DICA DE LIVRO

Causal Machine Learning Causal é um novo conceito que vem ganhando destaque e se trata de juntar conceitos de inferência causal a técnicas avançadas de ML. Este livro, que você pode baixar gratuitamente, apresenta uma série de conceitos e ideias, indo desde modelos clássicos de equações estruturais (os chamados SEMs) até seus equivalentes modernos em matéria de IA e os modelos causais estruturais. São apresentados métodos de Machine Learning que permitem fazer inferências nos modelos apresentados usando ferramentas modernas e já conhecidas. (em Inglês)

VAGAS DA SEMANA

Remoto

  • Formação em Matemática, Estatística, Ciência de Dados ou correlatas;

  • Experiência e conhecimento em fraudes financeiras e risco de crédito;

  • Experiência em desenvolvimento e teste de modelos de Machine Learning / Estatísticos;

  • Conhecimento em uma linguagem de script (como Python);

  • Entendimento do processo de desenvolvimento de modelos;

  • Conhecimento avançado em SQL;

  • Inglês avançado;

  • Experiência relevante em função de liderança / supervisão.

Osasco-SP - Híbrido

  • Contar com conhecimentos básicos-intermediários sobre Python e SQL;

  • Conhecer as ferramentas e métodos de elaboração de modelos de previsão, incluindo Facebook Prophet, árvores de decisão, regressão linear, e algoritmos para comportamentos não lineares como rede neurais, entre outras;

  • Possuir conhecimento com modelos preditivos, abrangendo a propensão de vendas, as recomendações e as associações;

  • Ter conhecimentos sobre modelos de otimização.

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Todo mundo sabe o quanto uma boa noite de sono é fundamental para começar bem o dia, mas que tal analisar os dados e entender quantas horas de sono são necessárias para isso? Essa série de gráficos busca entender melhor dados referentes ao sono, ficou bem legal e vale a pena conferir. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

Dremio Surface
2 e 3 de maio - Nova York, EUA e Online

Data + AI Summit
10 a 13 de junho - San Francisco, Califórnia, EUA

HackTown 2024 (Data Hackers têm 15% de desconto!)
01 de agosto - Santa Rita do Sapucaí-MG

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

AWS Innovate
On-demand - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo