Mestres Tech falam: Parem o desenvolvimento das IAs!¬†ūüė≥

Fala Data Hackers, sejam bem-vindos a mais uma newsletter!

Hoje trouxemos vários temas polêmicos sobre a revolução que estamos vivendo com a adoção em massa de modelos como o GPT-3 da OpenAI.

Como destaque trouxemos a carta do Instituto Future of Life, assinado por nomes de gigantes da tecnologia, como Elon Musk, Steve Wosniak e Yuval Harari. Na carta, eles alertam para os perigos da falta de regulação nessa área e pedem a suspensão das pesquisas por 6 meses!

Além disso temos alguns outros assuntos quentes hoje:

Uma s√©rie de refer√™ncias do mundo da Tecnologia, incluindo Elon Musk, da Tesla e SpaceX, Steve Wosniak, da Apple, o escritor dos best-sellers Homo Deus e Sapiens, Yuval Harari, entre outros, assinaram uma carta pedindo para que as grandes empresas de tecnologia pausem por 6 meses o desenvolvimento de grandes IAs como o Chat GPT. A carta foi elaborada pelo Instituto Future of Life, que pesquisa sobre as revolu√ß√Ķes tecnol√≥gicas e como elas impactam positivamente/negativamente na preserva√ß√£o da humanidade.Eles defendem a cria√ß√£o de mecanismos de controle e regula√ß√£o para garantir que a tecnologia seja usada de forma √©tica e segura. A carta tamb√©m chama a aten√ß√£o para os riscos de uma eventual superintelig√™ncia artificial, que poderia representar uma amea√ßa √† sobreviv√™ncia da humanidade.

A polêmica tá só come’çando! Quer entrar na discussão sobre isso? Entra no nosso Slack e participe! (em Português)

Databricks lançou um novo open-source, mas agora no hype dos LLMs. O Dolly é um modelo que permite que os usuários treinem e personalizem seus próprios modelos de conversação de chatbot. A plataforma usa o ChatGPT, uma versão do GPT, para fornecer uma API fácil de usar e modelos predefinidos que podem ser personalizados sem a necessidade de codificação adicional.

Segundo o Databricks, o modelo pode ser treinado em 30 minutos, tem somente 6 bilh√Ķes, frente aos 175 bilh√Ķes do GPT-3.

Você pode brincar com ele lendo mais na página do DB no Hugging Face

Com essa iniciativa, a Databricks busca democratizar a constru√ß√£o de chatbots e promover a acessibilidade da tecnologia de linguagem natural para um p√ļblico mais amplo.. (em Ingl√™s)

Num retorno após mais de ano, eu, Allan Sene, Co-Founder e CTO da Dadosfera, resolvi escrever um texto sobre muito do que estou vendo acontecer em empresas de vários portes, de pequenas startups, à grandes empresas tradicionais.

Nesse artigo, eu alerto sobre o dano de BIG PROJECTS de Plataformas de Dados. Eles exigem grandes investimentos em times de Infraestrutura, em Cloud e, talvez o pior, de TEMPO.

O BOOM do Chat GPT mostra o quanto o √© importante as organiza√ß√Ķes focarem na qualidade dos seus dados e modelos, n√£o mais na constru√ß√£o da Plataforma.

Gestores e Líderes em Dados: fiquem de olho! (em Português)

OUTROS T√ďPICOS

Uma das maiores refer√™ncias do mundo em IA e Deep Learning se pronunciou sobre a carta do Instituto Future of Life. O prof. Andrew √© contra a morat√≥ria! Ele argumenta que √© impratic√°vel parar as pesquisas pelo mundo todo. Tamb√©m diz que todos os envolvidos est√£o muito comprometidos com uma IA √©tica e respons√°vel, al√©m de que uma pausa dessas vai atrasar o avan√ßo de pesquisas que trazem grandes benef‚Äô√≠cios para a humanidade (em Ingl√™s)Arquitetura de Lakehouse da UberA Uber fez um artigo sobre sua Arquitetura de Lakehouse. Usando tecnologias como Apache Hudi e Delta Lake, para oferecer uma plataforma escal√°vel e flex√≠vel de armazenamento e processamento de dados em tempo real, al√©m de fornecer uma camada de governan√ßa e qualidade de dados para garantir a confiabilidade das informa√ß√Ķes armazenadas. O artigo destaca como o Lakehouse da Uber tem sido utilizado para impulsionar a tomada de decis√Ķes em tempo real em v√°rias √°reas do neg√≥cio da empresa, como marketing, opera√ß√Ķes e finan√ßas. (em Ingl√™s)

VAGAS DA SEMANA

  • Forma√ß√£o superior completa em Estat√≠stica.

  • Experi√™ncia em projetos de analytics para Marketing

  • Conhecimento em softwares estat√≠sticos (SAS), Excel avan√ßado e programa√ß√£o.

  • Linguagem SQL

  • Perfil anal√≠tico e consultivo

  • Experi√™ncia em desenvolvimento de algoritmos de NLP e DL atuais, como transformers (BERT, entre outros).

  • Experi√™ncia em trabalhar com grandes conjuntos de dados.

  • Conhecimentos em Python(TensorFlow, PyTorch, entre outros.)

  • Familiaridade com ambiente Unix;

  • Ingl√™s t√©cnico: ser capaz de ler e escrever textos/relat√≥rios em Ingl√™s.

MEME DA SEMANA

Ah, meu amigo, sangue chega a ferver!! kkkk

Vi no LinkedIn da Monte Carlo

DATA VISUALIZATION DA SEMANA

A galera que sempre t√° aqui mostrando visualiza√ß√Ķes muito bacanas de como as grandes marcas fazem dinheiro, lan√ßou um canal no YouTube. Nesse canal, eles analisam realidades de mercado - nesse a corrente ‚ÄúAI Wars‚ÄĚ - olhando data viz e dados dos balan√ßos das grandes corpora√ß√Ķes. Imperd√≠vel!(em portugu√™s)

PROXIMOS EVENTOS E MEETUPS

TWDC 202317 a 19 de Abril - 10 às 12h e 14 às 17h- 100% online e gratuito

Semantic Layer Summit 2023 23 de abril - 100% online e gratuitoObs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo