DALL-E 3: IA de imagem com suporte ao ChatGPT chega balançando o mercado

Databricks capta 500M; Portfólio de dados; Por que o Kafka é tão rápido?

E aí Data Hackers, bora abrir a semana com as notícias mais quentes em matéria de dados?

De cara, uma novidade que promete balançar o universo de IA: a OpenAI acaba lançar a terceira versão da IA de imagem DALL-E, que possui integração nativa com o ChatGPT e promete considerar todo o texto do prompt na criação das imagens. Os olhos do mundo inteiro se voltaram para essa ferramenta, com testes e reviews. Pra quem se interessa pelo tema, certamente vale conferir por si mesmo.

Além desse lançamento de impacto, a edição de hoje traz comparações sobre as diferentes formas de customizar LLMs, detalhes técnicos sobre o funcionamento da solução de big data Kafka e uma introdução ao Python para usuários de R.

Confira alguns dos destaques da news de hoje:

A OpenAI acaba de lançar o DALL-E 3, a nova versão da sua IA de imagem. Além de ser nativamente integrado ao ChatGPT, o novo DALL-E está muito melhor para criar textos e mãos, e promete considerar todo o texto do prompt (quem nunca teve um pedido no prompt negado pelo DALL-E, não é mesmo?). Isso quer dizer que você não precisará mais de prompt engineering para que o DALL-E considere uma certa instrução específica, o que deve impactar todo o universo ligado às IAs de imagem. Vale a pena conferir! (em Inglês)

Nesse episódio, mergulhamos no emocionante mundo da análise de dados na maior cervejaria do Brasil. Em um papo divertido, exploramos como a análise de dados desempenha um papel crucial desde o plantio da cevada até o envase e distribuição dos icônicos produtos da AmBev, garantindo que eles tenham uma qualidade consistente. Confira aqui.

Uma das principais empresas no segmento de IA generativa no momento, a Stability AI, anunciou nesta semana a chegada do Stable Audio, ferramenta que usa inteligência artificial para gerar músicas e outros efeitos sonoros com alta qualidade.

A ferramenta, de uso simples, funciona a partir de comandos em prompts, numa experiência bem similar à da geração de imagens. No seu comando de texto, você pode inserir estilos musicais, instrumentos, batidas por minuto, efeitos sonoros e outros adjetivos para criar a ambientação da música. Feito isso, a ferramenta gera instantaneamente uma música relacionada ao prompt.

Se a geração de imagens por AI já estava gerando incômodos e discussões entre pintores e desenhistas, imagine agora que a polêmica vai chegar ao mundo da música. Só temos uma palavra: TRETA! (em Português)

Frequentemente empresas precisam ir além dos modelos pré-treinados e customizar casos de uso de LLM. Elas têm em geral duas opções: ou fazem um fine tuning de modelos (treinando-os dentro do seu próprio contexto), ou utilizam uma técnica de Retrieval Augmented Generation (RAG), técnica esta que não consiste em re-treinar o LLM mas em fornecer um contexto de dados adicional dentro do prompt: assim o LLM responde a perguntas com informações específicas sobre aquele assunto.

Em relação a aspectos como custo e latência, cada uma dessas estratégias de uso de IA Generativa tem suas vantagens e desvantagens, e ambas podem apresentar resultados distintos para diferentes casos de uso.

Esse artigo explica melhor quais as principais diferenças entre as abordagens e as vantagens de se usar cada uma delas. (em Inglês)

OUTROS TÓPICOS

A Databricks, plataforma de dados e Inteligência Artificial, anunciou que arrecadou mais de US$ 500 milhões na rodada de investimentos de Série I (que ocorre quando startups já têm um modelo de negócio construído, com clientes, receita e potencial de crescimento). Conheça os detalhes desse aporte milionário. (em Português)

Nesse post, Halisson Paz, do canal Programação Dinâmica, lista os principais pontos para ter o que ele considera como um portifólio de dados vencedor. Compartilhando fontes de dados e informações sobre onde encontrar outros projetos para se inspirar, ele mostra ainda como otimizar seu LinkedIn para ganhar destaque com recrutadores. (em Português)

Esse artigo busca explorar de um ponto de vista mais técnico a arquitetura por trás do Kafka (uma das principais soluções para big data) e de seus principais componentes. São abordadas as otimizações que permitem o rendimento impressionante e a baixa latência da solução, assim como sua forma de armazenar e replicar dados. (em Inglês)

As gigantes Salesforce e Databricks anunciaram várias novidades em sua mais nova parceria, com destaque para o Bring Your Own Lake (BYOL), recurso que permite aos clientes acessar dados tanto do Salesforce Data Cloud Lakehouse quanto do Databricks Lakehouse como se tudo estivesse hospedado em um único local (e com ETL zero, o que permite uma experiência de compartilhamento melhor e com menor latência). (em Inglês)

Um dia, Rebecca Barter, estatística e cientista de dados conhecida internacionalmente, se viu numa encruzilhada: depois de anos tendo R como sua linguagem preferida para análise de dados, precisou começar a fazer análises utilizando Python, e mais do que isso, precisou ensinar pessoas a usarem Python também. Por conta disso, resolveu compartilhar seus aprendizados em um guia, com a ideia de ajudar outros apaixonados pela linguagem R a fazerem uma transição mais fácil para o mundo do Python. (em Inglês)

O recente relatório "Future of Work Report: AI at Work", desenvolvido pelo LinkedIn, destaca o impacto que as tecnologias de IA generativa tiveram no mercado de trabalho e o consequente aumento das habilidades de IA nos perfis dos membros da rede social. Ao que tudo indica, as pessoas passaram a adicionar termos relacionados a IA e ChatGPT no currículo na tentativa de atrair mais recrutadores e de parecerem, aos olhos deles, mais preparadas para os novos desafios envolvendo inteligência artificial. (em Inglês)

DICA DE VÍDEO

Nesse vídeo, Karine Lago mostra como o ChatGPT pode ser um grande aliado no dia-a-dia dos profissionais de dados, ajudando no desenvolvimento de soluções e trazendo maior produtividade. Com uma abordagem simples e direta, ela mostra como a integração entre Power BI e ChatGPT funciona e dá dicas de como fazer as perguntas certas para o chatbot da OpenAI. (em Português)

VAGAS DA SEMANA

Remoto

  • 2 anos de experiência ou mais como Software Engineer ou equivalente;

  • Linguagens backend (Kotlin, Python, etc);

  • Construção de soluções customizadas na plataforma MLOps;

  • Integração de soluções MLOps (AWS Sagemaker, Databricks, etc);

  • Tecnologias LLM (LangChain, LLM AIs);

  • Inglês fluente (entrevistas em inglês).

São Paulo - SP - Presencial

  • Formação superior (Sistemas de Informação, Ciência da Computação, Estatística, Finanças ou similares);

  • Linguagens de programação (SQL, Python, etc);

  • Modelos estatísticos e Machine Learning;

  • Data modeling (relacional, dimensional);

  • Ferramentas de visualização (DOMO, Google Data Studio, Power BI);

  • Metodologias BI, Big Data;

    Inglês avançado.

MEME DA SEMANA

E assim vão surgindo as novas gerações…

mais memes como esses no nosso canal do slack.

DATA VISUALIZATION DA SEMANA

Na última semana aconteceu o lançamento do IPhone 15, um evento que "parou a internet" - e ao que tudo indica, parou tudo MESMO. Nesse ótimo exemplo de Dataviz + Data Storytelling, o time de dados do Pornhub, um dos maiores portais de pornografia do mundo, fez algumas análises mostrando o impacto que o lançamento do IPhone 15 teve no volume de acessos do portal, minuto a minuto. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

  • 26 a 29 de setembro - Brasília-DF / Virtual

  • 28 de setembro - São Paulo-SP

  • 21 de outubro - Belo Horizonte - MG

  • 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link (vagas esgotadas!)

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo