A primeira IA desenvolvedora de software foi criada

E mais: ”Como eu economizei 70 mil dólares no Google Big Query”; Uma biblioteca para visualizar árvores de decisão.

Fala, Data Hackers!

Bora abrir mais uma semana sabendo do que tem rolado no mundo dos dados? Hoje, trazemos o lançamento da primeira IA generativa capaz de desenvolver software, que já está dando polêmica, com muita gente duvidando de sua real capacidade.

Trazemos ainda dicas para otimizar o uso do Google BigQuery e garantir uma boa economia na conta final do mês, e uma biblioteca em Python que permite visualizar as árvores de decisão do scikit-learn.

Confira outros destaques dessa edição:

E tem episódio especial do podcast sobre Mulheres na Liderança & Carreira em Dados!

Em parceria com o Itaú, trouxemos como convidadas três lideranças do banco: a Head of Quantum Technologies, Samuraí Brito, a superintendent data governance, Priscila Ferreira e a Lead Data Science, Veronica Neves. Com essas mulheres incríveis, líderes de áreas como Computação Quântica, Ciência de Dados e Governança, exploramos tópicos como transição de carreira em dados, visibilidade das mulheres na liderança e desafios profissionais envolvendo maternidade. Vale muito conferir! (em Português)

A Cognition apresentou recentemente Devin, sua IA Software Engineer. Ela está dando o que falar porque não apenas gera códigos de qualidade que vão de ponta a ponta (ex.: ela consegue fazer de forma autônoma web apps, APIs, fine-tuning de modelos...), mas pela sua capacidade de planejar e debuggar o que está dando errado.

É claro que uma notícia assim causou um alvoroço nas redes, com muitos profissionais duvidando da qualidade de Devin e alegando que a empresa estaria apenas promovendo seu produto em uma jogada de Marketing. Só o tempo dirá se Devin vingará ou não. (em Português)

O BigQuery da Google, se tornou uma ferramenta recorrente para muitos profissionais de dados. Mas como toda ferramenta, o BigQuery exige certa malícia para ser melhor utilizado - e isso pode poupar gastos.

Neste artigo, Junaid Effendi compartilha técnicas simples, mas muito poderosas, para otimizar o uso do BigQuery, e que permitiram a ele economizar cerca de 70 mil dólares em sua conta mensal com o Google. (em Inglês)

Arvores de decisão são algoritmos poderosos e altamente explicativos. Tal capacidade nos permite visualizar como o algoritmo realizou uma tomada de decisão, de forma bem amigável. Com isso em mente, o professor e líder de tecnologia no Google, Terence Parr desenvolveu com um aluno essa biblioteca para Python que permite visualizar as árvores de decisão do scikit-learn. Para quem se interessa peloa algoritmo, esse é um excelente recurso. (em Inglês)

OUTROS TÓPICOS

Anthropic lança biblioteca de prompts otimizados para usar no Claude
A Anthropic, que lançou recentemente sua nova família de modelos de IA generativa Claude 3, disponibilizou uma biblioteca de prompts otimizados para serem usados nos modelos, incluindo funcionalidades como testar bugs em códigos escritos em Python ou escrever funções para Microsoft Excel, entre diversas outras. Vale conferir. (em Inglês)

Elon Musk anuncia que sua IA, Grok, será de código aberto
Elon Musk anunciou essa semana que sua empresa voltada para IA, a xAI, vai abrir o código do seu chatbot Grok. O anúncio aconteceu poucos dias depois do bilionário processar a OpenAI, da qual foi fundador, por ter se tornado lucrativa e fechado o código e, para muita gente, soou como uma indireta para Sam Altman e companhia. (em Português)

Google lança IA capaz de jogar videogames
Os videogames sempre foram um farto campo de testes para sistemas de inteligência artificial (IA), por serem ambientes de aprendizagem ricos, com configurações responsivas em tempo real e objetivos que estão sempre mudando. Na última semana, o Google DeepMind lançou um report sobre o que promete ser um marco nesse contexto: o SIMA, novo modelo que não apenas é capaz de jogar um jogo específico, mas um modelo geral capaz de ser jogar diversos jogos. (em Inglês)

CTO da OpenAI fala mais sobre o modelo de geração de vídeo Sora
Em entrevista ao The Wall Street Journal, a CTO da Open AI Mira Murati falou sobre Sora, recente modelo de geração de vídeos lançado pela companhia. Um dos pontos altos (e polêmicos) da entrevista foi quando a CTO, perguntada sobre que dados foram usados para treinar Sora, falou em dados públicos e proprietários, o que abriu margem para um possível uso de conteúdos de redes sociais e criadores de conteúdo. (em Inglês)

DICA DE VÍDEO

Já ouviu falar no CUDA, da Nvidia? O recurso, cujo nome significa Compute Unified Device Architecture (algo como Arquitetura de dispositivos unificados de computação, em tradução livre) , é uma plataforma gráfica disponível em algumas placas da empresa que permite a desenvolvedores criar sistemas que aproveitem a capacidade de processamento paralelo das GPUs, aproveitando assim todo o potencial da IA. Este vídeo explica em apenas 100 segundos o funcionamento da plataforma e todo o seu potencial. (em Inglês)

VAGAS DA SEMANA

Remoto

  • Proficiência em Python e SQL para análise de dados;

  • Ter trabalhado com computação em nuvem (GCP, AWS, Azure);

  • Experiência com manipulação de grandes volumes de dados;

  • Sólido conhecimento de técnicas estatísticas (distribuições estatísticas, testes de hipótese, estatística multivariada e outros);

  • Experiência em técnicas de Machine Learning (classificação, regressão, séries temporais e outras);

  • Conhecimento em versionamento de código (git);

  • Graduação em Ciência de Dados, Estatística, Matemática, Ciência da Computação ou Engenharias.

Remoto

  • Experiência como Analista de Dados ou de Negócios;

  • Proficiência em ferramentas de análise de dados e linguagens como SQL, Python, R e similares, e experiência com ferramentas como NumPy, Pandas, Matplotlib, Seaborn e TensorFlow;

  • Experiência com ferramentas de visualização de dados (Tableau, Power BI, Metabase) para criar reports e dashboards;

  • Capacidade de resolução de problemas e obtenção de insights a partir de dados;

  • Familiaridade com técnicas de Machine Learning e suas aplicações em negócios;

  • Inglês avançado;

  • Graduação em áreas relacionadas a dados, Estatística, Computação ou experiência relevante em campos similares.

MEME DA SEMANA

E seo Python usasse chaves igual o Javascript, hein? Sonho ou pesadelo?

DATA VISUALIZATION DA SEMANA

Listas com as maiores fortunas do globo sempre atraíram uma curiosidade geral e, mesmo que os bilionários certamente não fiquem pobres de um momento pro outro, a dinâmica desse tipo de lista vai sempre mudando (basta lembrar dos anos 90, quando Bill Gates disputava com o sultão de Brunei - que já sumiu das listas faz uns anos). Nesse dataviz, o pessoal do Visual Capitalist elenca não só as pessoas mais ricas em geral na data de hoje, mas lista também as maiores fortunas entre as mulheres e os mais ricos em certas áreas (como tecnologia, finanças e esportes) e mesmo em certos países, como Índia e China. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

TDC 2024 SUMMIT SÃO PAULO: Inteligência Artificial
26 e 27 de março - São Paulo-SP (ou online)

Tecton Apply
3 de abril - Online

Dremio Surface
2 e 3 de maio - Nova York, EUA e Online

Rockset Index
16 de maio - Mountain View, Califórnia, EUA e Online

HackTown 2024 (Data Hackers têm 15% de desconto!)
01 de agosto - Santa Rita do Sapucaí-MG

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

AWS Innovate
On-demand - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo