60 Prompts de ChatGPT para Data Science (testados, validados e organizados)

60 prompts de ChatGPT para Data Science

(testados, validados e organizados!)

Fala Data Hackers, bora para mais uma semana come癟ando com a sua newsletter preferida?

Hoje o assunto principal 矇 mais que um post Trata-se de um verdadeiro canivete su穩癟o para quem busca mais produtividade no dia a dia de dados. Encontramos uma curadoria de prompts de ChatGPT com o foco no dia a dia dos profissionais de dados. Esse 矇 o tipo de conte繳do que pode te ajudar a reduzir drasticamente o volume de tarefas repetitivas que voc礙 faz no dia a dia.

Mas n瓊o para por a穩, vamos mostrar tudo que rolou na semana passada, marcada por grandes eventos globais de AI, pois simultaneamente rolaram o Data + AI Summit promovido pela Data Bricks e o Snowflake Summit, os eventos trouxeram muitas novidades para a 獺rea de dados como o lan癟amento de novas tecnologias e uma pr矇via do que est獺 por vir para os pr籀ximos meses. Ainda foram divulgadas diversas novas parcerias e aquisi癟瓊o de empresas (o mercado de dados est獺 pegando fogo!).

Al矇m disso temos muitos outros assuntos interessantes:

Quem avisa amigo 矇! Essa ter癟a (04/07 as 20h) teremos uma live sensacional no canal de Youtube do Data Hackers. Convidamos Luiz Sim繭es o Data Hacker que ganhou o Challenge do ano passado e levou um PlayStation 5 para casa. Na Live o Luiz vai contar:

  • Como entrou para 獺rea de dados do zero aprendendo online

  • Dicas de visualiza癟繭es de dados que chamam a aten癟瓊o das pessoas

  • Como organizar um Jupyter Notebook de forma profissional

  • Dicas para cruzar dados e extrair insights valiosos para o neg籀cio

A live vale tanto para quem est獺 come癟ando quanto para quem j獺 矇 experiente na 獺rea mas deseja que seus projetos tenham mais destaque e chamem aten癟瓊o das pessoas.

Acesse o link aqui (em Portugu礙s)

isso mesmo que voc礙 leu. Sem pegadinhas, sem enrola癟瓊o, 60 prompts direto ao ponto!

Travis Tang atua na 獺rea de DS e teve a seguinte ideia: Ser獺 que o ChatGPT pode ajudar um cientista de dados a ser mais produtivo?

Desde ent瓊o ele pegou cada aspecto da rotina de um profissional de dados e tentou encontrar prompts que pudessem ajudar na automa癟瓊o de tarefas, incluindo prompts com o o foco em:

  • Treinamento de modelos

  • Explorar dados

  • Escrever Regex

  • Gerar dados sint矇ticos

  • Interpretar modelos

  • Explicar c籀digos

  • Otimizar c籀digos

  • Simplificar c籀digos

  • Documentar projetos

  • Escrever SQL

  • Formatar tabelas e arquivos

Esses s瓊o s籀 alguns dos exemplos de como o ChatGPT pode ser 繳til para profissionais da 獺rea de dados, no artigo voc礙 encontra 60 prompts organizados acompanhando as principais rotinas de um cientista de dados no dia a dia para ajudar todos da 獺rea a ter mais efici礙ncia no trabalho. (em Ingl礙s)

Na 繳ltima semana ocorreram dois dos maiores eventos de dados do ano, e ambos rolaram ao mesmo tempo, organizados pelas plataformas de dados Snowflake e Databricks (que tamb矇m possuem solu癟繭es concorrentes).

O time da Monte Carlo foi r獺pido, patrocinou ambos eventos, e preparou em primeira m瓊o um resumo com os highlights dos eventos, mostrando as novas tecnologias lan癟adas, novas divulga癟繭es, principais palestras e tudo de interessante que cada um dos eventos apresentou para o p繳blico.

Para voc礙 que n瓊o p繫de participar dos eventos, pelo menos agora pode acompanhar esse resumo e depois procurar pelos conte繳dos que mais te interessarem no Youtube, pois algumas palestras j獺 foram disponibilizadas para o p繳blico gratuitamente. (em Ingl礙s)

Desde o boom do lan癟amento do ChatGPT, as tecnologias com o foco em AI Generativa e LLM's tomaram a aten癟瓊o do mundo dos neg籀cios e as discuss繭es sobre o futuro das empresas mas certamente n瓊o vai parar por a穩.

Nesse primeiro semestre de 2023 j獺 temos visto inclusive algumas mudan癟as radicais na atua癟瓊o de profissionais de dados, 獺reas da ci礙ncia como NLP, Vis瓊o Computacional foram as primeiras que tiveram impacto direto, mas muitas outras est瓊o come癟ando a mudar conforme v瓊o surgindo novidades.

At矇 mesmo a engenharia de dados deve passar por mudan癟as radicais com a busca de dados atrav矇s de linguagem natural e gera癟瓊o de ETLs atrav矇s de AI Generativa.

Diante de tantas mudan癟as n籀s profissionais precisamos nos atualizar para acompanhar as novidades e uma excelente pr獺tica 矇 atualizar nosso portf籀lio a medida que vamos ganhando novos conhecimentos. Pensando nisso separamos esse conte繳do com 10 ideias que projetos de LLM que podem incrementar seu portf籀lio! (em Ingl礙s)

OUTROS TPICOS

A Databricks, uma das maiores e mais relevantes plataformas de dados, formalizou um acordo definitivo para adquirir o MosaicML, uma renomada plataforma GenAI. A inten癟瓊o por tr獺s da aquisi癟瓊o, avaliada em aproximadamente US$ 1,3 bilh瓊o, incluindo pacotes de reten癟瓊o, 矇 democratizar o acesso IA generativa para organiza癟繭es em todo o mundo e integrar cada vez mais esse tipo de tecnologia a sua plataforma. (em Ingl礙s)

A Snowflake, outra gigante dos Dados, e a Nvidia anunciaram na 繳ltima semana que est瓊o formando uma parceria para oferecer a empresas de todos os portes um caminho acelerado para criar aplica癟繭es de IA generativa personalizadas, usando dados propriet獺rios dentro da Snowflake Data Cloud. Com a plataforma Nvidia NeMo para o desenvolvimento de grandes modelos de linguagem (LLMs) e a computa癟瓊o acelerada por GPU da Nvidia, a Snowflake permitir獺 que as empresas usem os Dados em suas contas da Snowflake para criar LLMs personalizados para servi癟os avan癟ados de IA generativa. (em Ingl礙s)

Esse maluco teve uma ideia genial. Utilizou uma famosa plataforma para "freelas" na 獺rea de Tecnologia e Dados para pagar por sess繭es de mentorias com 10 refer礙ncias na 獺rea de dados. Ele pegou tudo que aprendeu nas mentorias e resumiu nesse artigo, com dicas de onde come癟ar, como se especializar, passo a passo para encontrar clientes, como aumentar o valor do servi癟o prestado e at矇 mesmo como viver 100% de projetos freelance. Excelente conte繳do para quem busca mais liberdade de atua癟瓊o na 獺rea de dados. (em Ingl礙s)

O cofundador e CEO da Google Deepmind, divis瓊o de intelig礙ncia artificial da empresa, disse em uma entrevista que eles est瓊o desenvolvendo um sistema para bater de frente com o ChatGPT ou at矇 super獺-lo. De acordo com Demis Hassabis, o Gemini combinar獺 a tecnologia do LLM com as t矇cnicas usadas no AlphaGo, programa de IA da DeepMind baseado na t矇cnica de aprendizado por refor癟o, em que o software 矇 apresentado para problemas complexos e a IA recebe feedbacks sobre suas falhas para melhorar seu desempenho. (em Portugu礙s)Conhe癟a a Solara: A lib que pode substituir o Streamlit na constru癟瓊o de webapps em PythonSolara 矇 uma biblioteca que foi lan癟ada recentemente com o objetivo de ajudar profissionais de dados a criar aplicativos da Web em Python puro. Em sua documenta癟瓊o, ela oferece alguns recursos interessantes, como componentes reutiliz獺veis e uma integra癟瓊o simples com Jupyter Notebooks. Um detalhe que chamou aten癟瓊o 矇 que o pr籀prio site oficial do Solara tamb矇m 矇 constru穩do com o Solara, o que n瓊o acontece no Streamlit . (em Ingl礙s)

"Drifts em modelos de Machine Learning em produ癟瓊o s瓊o bem mais frequente que a maioria das pessoas imaginam, e costumam tirar a paz de quem atua na 獺rea de ML Engineering. Nesse artigo s瓊o apresentados 5 m矇todos para detectar de forma imediata esse tipo de comportamento nos modelos e assim poder atuar para reduzir os problemas consequentes. (em Ingl礙s)

DICA DE VDEO

Data + AI Summit: Novidades no Apache SparkUm dos pontos altos do evento Data + AI Summit que rolou em San Francisco na 繳ltima semana foram as novidades que acabam de ser lan癟adas em rela癟繭es a diferentes tecnologias, como Delta Lake e Spark. Nesse v穩deo voc礙 acompanha em primeira m瓊o tudo de novo que foi lan癟ado no Spark. (em Ingl礙s)

VAGAS DA SEMANA

  • Excel礙ncia em Python e boas pr獺ticas de desenvolvimento (ex: ferramentas de versionamento);

  • S籀lida experi礙ncia pr獺tica e te籀rica em Machine Learning supervisionados e n瓊o supervisionados (RandomForest, XGBM, Neural Nets, controle de overfit, valida癟瓊o de modelos, feature selection e engineering, etc);

  • Paix瓊o por resolver problemas e construir solu癟繭es baseadas em dados, avaliando seu impacto em termos do retorno para o neg籀cio;

Belo Horizonte - MG

  • Conhecimento intermedi獺rio em Machine Learning;

  • Python (scikit-learn, tensorflow, pytorch);

  • SQL e NoSQL;

  • Conhecimentos em Cloud AWS;

  • Conhecimento em implanta癟瓊o com Docker, containers, desenvolvimento e consumo de dados API;

MEME DA SEMANA

Dica do @datascience_memes

DATA VISUALIZATION DA SEMANA

Nessa an獺lise super interessante a equipe do The Pudding resolveu investigar a fundo a hist籀ria das pessoas que aparecem em mais de 200 moedas de diferentes pa穩ses. Com toda essa informa癟瓊o em m瓊os criaram visualiza癟繭es de dados incr穩veis mostrando quais as caracter穩sticas mais comuns das pessoas estampadas em notas e moedas ao redor do mundo. (em Ingl礙s)

PROXIMOS EVENTOS E MEETUPS

Semana de Finan癟as Quantitativas - Prof. Thiago Marques10 a 14 de julho - 100% Online e Gratuito

Acelerando Dashboards com Design System 12 de julho, 18h - 100% Online e Gratuito

Causal Inference symposium12 de Setembro - 100% Online

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright 穢 datahackers.com.br.Gostaria de parar de receber esses emails?Voc礙 pode atualizar suas prefer礙ncias ou remover o cadastro dessa lista de emails.

Twitter icon
Website icon
LinkedIn icon
Medium icon