A AI só não dominou o mundo ainda por falta de GPUs 😳

Fala Data Hackers, sejam bem-vindos a mais uma newsletter! Nessa edição, trazemos 2 destaques muito importantes para avaliarmos quais são os reais empecilho da AI evoluir atualmente: a Cloud.

Sim, mesmo as gigantes Google Cloud, Oracle, Microsoft Azure e AWS não estão tendo poder de processamento suficiente para atender todas as empresas que precisam treinar e testar seus modelos de IA. O grande boom da IA tem um recurso necessário muito em falta hoje: chips.

Também trouxemos o outro lado da moeda: Stability AI, startup por trás do famoso Stable Diffusion, está sofrendo para pagar as contas de cloud. Até a parceria com a AWS não está resolvendo muito a cobrança dos seus s’ócios por um modelo de negócio sustentável.

Além disso temos alguns outros assuntos quentes hoje:

Sabe essa realidade sua hoje, de pegar uma dica no Tudo Gostoso, ver um video no YouTube como que faz, pedir os ingredientes no Rappi e, depois de tudo pronto, postar no Instagram a foto do seu feito? Só o fogão não vai ser pilotado pelo Chat GPT!

Nesse TED Talk incrível, o Greg Brockman, co-founder da OpenAI mostra o poder dos Plugins: integrações que qualquer App pode fazer com o Chat GPT. Com essas integrações, mesmo sem você especificar exatamente como, o GPT interage com Apps, como o Instacart e Twitter. Greg aposta que toda a forma de interagir com Apps vai mudar. (em Inglês)

Stability AI, criadora do Stable Diffusion e uma das startups mais bombadas do boom de AI, tá passando por apertos para monetizar e dar retorno para seus acionistas.

Esse artigo do Semafor conta que o CEO da companhia, Emad Mostaque, está cogitando trazer uma COO no calibre da mítica Sheryl Sandberg, que transformou o Facebook de uma febre rampante para um negócio ultra-lucrativo.

O texto também adianta que a Stability está com uma conta gigantesca com a AWS e que isso tem incomodado muito sua liderança. Será que vem uma Compra por a’í pra resolver essa d’ívida?! (em Inglês)

Se você acha que o mundo vai acabar com todo mundo sem papel higiênico, que nada! O que já tá faltando nessa corrida de IA é servidores com GPU para treinamento de modelos de Inteligência Artificial!

Nesse artigo exclusivo do The Information, eles trazem os apertos que empresas e desenvolvedores estão tendo para usar servidores reservados com hardware pronto para treinar ML.

A Google Cloud, Azure e AWS estão investindo pesado em compra dos seus fornecedores, como NVIDIA, mas que também têm sofrido para acompanhar essa demanda. Parece que a Skynet ainda vai ter que aguardar a gente produzir chips suficientes para eles dominarem o mundo kkkk (em Inglês)

OUTROS TÓPICOS

Introdução à Previsão ConformeO Data Hacker Gustavo Bruschi fez uma contribuição bem diferente pro nosso blog: ele fala sobre Previsão Conforme. Conformal Prediction - o nome em inglês da técnica - é um método que transforma previsões pontuais em conjuntos de previsões que fornecem um nível de confiança estatística maior, permitindo medir e controlar os riscos de uma previsão estar errada. Gustavo conta da história do conceito e também traz um exemplo prático em Python.(em Português)

Mais um grande post do Max, criador do Airflow e SupersetConhecido por posts muito relevantes na área de Dados, ele está de volta! O mestre Max Beauchimin, apresenta uma nova abordagem de modelagem de dados centrada em entidades, que busca facilitar BI Analytics. Em vez de organizar os dados em tabelas relacionais, como em modelos de dados tradicionais, a abordagem centrada em entidades organiza os dados em torno das entidades de negócios relevantes, como clientes, produtos e transações. Esse modelo, é muito próximo do que já foi proposto pelo Data Mesh, que bebe do DDD - Domain-Driven Design. Vale ler esse post!(em Inglês)

Google Cloud lança CDC para BigQueryUm dos grandes desafios em Engenharia de Dados é conseguir, a partir dos logs de bancos transacionais como MySQL e PostgreSQL, montar uma view legível do CDC deste banco. A GCP lançou recentemente uma API do BigQuery para montar facilmente essas visões (em Inglês)

DICA DE VÍDEO

O Data Hacker Victor Bertoldo, Data Architect no Digio, fez um video avaliando o Nanodegree de Data Architect. Victor conta como foi seu processo de pesquisa, o porquê de ter escolhido um Nanodegree, ao invés, de uma “Formação Tradicional”. Se você quer entender como funciona a formação da Udacity, seus módulos e projetos, não perca esse vídeo!

(em Português)

VAGAS DA SEMANA

Cientista de Dados Sr - DatariskRemoto (Florianópolis - SC)

  • Conhecimento em modelos preditivos e técnicas de Machine Learning;

  • Experiência com linguagens Python e R, além de conhecimento em bibliotecas para ciência e análise de dados;

  • Conhecimento em análise de dados utilizando ferramentas open source;

  • Conhecimento de tecnologias para IA;

  • Experiência com criação de dashboards;

  • Interesse em pesquisa de novos algoritmos e soluções técnicas aplicáveis ao nosso negócio.

São Paulo - SP - Remoto

  • Previsão de formatura entre 06/2024 e 06/2025 (período máximo de estágio: 2 anos)

  • Ter disponibilidade para estagiar 30h semanais (6 horas por dia)

  • Cursando Ciências da Computação, Engenharias, SI, Matemática e correlatas

  • Noção básica em: SQL, Python, Git

  • Diferencial: Airflow

MEME DA SEMANA

“Antes de ter uma IA God-like, precisamos passar por uma Dog-like”

Dica do Rodrigo Teoria lá no nosso Slack. Se o MESTRE LeCun tá despreocupado com a Skynet, quem sou eu para duvidar?!

DATA VISUALIZATION DA SEMANA

The GAFAM Empire: um mapa das aquisições das Big Techs

Pra quem pensa que a inovação nasce em empresas como Google e Apple, não se enganem! As Big Techs estão constantemente comprando empresas inovadoras para incorporar seus produtos dentro do seu portfólio digital já recheado. Esse site traz várias viz muito legais mostrando o “Império GAFAM” de Google, Apple, Facebook (Meta), Amazon e Microsoft crescendo por meio de investimentos de M&A, de IA até Healthcare! (em Inglês)

PROXIMOS EVENTOS E MEETUPS

30 de Maio e 01 de Junho - 9:00 às 12:00

27 de Abril - 1:00 PM - 2:00 PM

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.