Samsung vaza dados confidenciais ao ChatGPT (sem querer) ⚠️

Fala, Data Hackers. Sejam bem-vindos a mais uma newsletter! Essa semana o mundo de dados foi movimentado com novos modelos sendo lançados e fortes discussões sobre o futuro do desenvolvimento de IA foram discutidos.

Mas, o destaque dessa edição via para a Samsung, onde alguns trabalhadores enviaram dados sensíveis para o ChatGPT, e que provavelmente estão agora nos futuros datasets de treino da IA. Saiba mais ainda nessa edição.

Além disso, se liga no que você vai conferir nessa edição:

O que rolou foi o seguinte: a Samsung permitiu que os seus engenheiros utilizassem a IA da OpenAI para ajudar a melhorar o código de seus programas. Mas, acabaram enviando não apenas o código fonte em si, mas também notas de reuniões confidenciais.

Vale lembrar que apenas recentemente a OpenAI lançou uma pol’ítica informando que não usar’á dados de seus clientes pagos em novos treinamentos da IA. Então, é prov’ável que os dados da Samsung sejam utilizados em treinamentos ainda. (em Inglês)

A Meta lançou um novo modelo chamado SAM (Segment Anything Model) um modelo estado-da-arte que está impressionando por sua capacidade de segmentar imagens em altíssimo detalhe. (em Inglês)

A Itália é o primeiro país a banir o ChatGPT. O país está colocando a IA sob investigação por preocupações com relação a leis de privacidade de usuários. (em Inglês)

OUTROS TÓPICOS

Primeira versão do Open Assistant está no arO Open Assistant é o primeiro modelo open-source colaborativo a ser lançado pela comunidade open-source. Durante meses, voluntários trabalharam na criação de prompts e avaliando resultados para criar essa primeira versão que está muito impressionante. Você pode experimentar a IA, e tanto o modelo quanto o dataset serão liberados na próxima semana. (em Português)

LangChain levanta US$ 10 mi em investimentoLangChain é uma empresa que está fazendo barulho na comunidade ao oferecer um toolkit para paralelizar e melhorar códigos que fazem uso de modelos de linguagem. Recentemente, eles receberam uma rodada de investimento para continuar evoluindo sua ferramenta, disponível gratuitamente para Python. (em Inglês)Microsoft lança Copilot para profissionais de CybersegurançaEssa semana a Microsoft lançou mais uma versão de seu Copilot. Depois de ter lançado para programadores e usuários do Office, agora a vez é dos profissionais de cyber poderem usufruir do poder da ferramenta para automatizar seus trabalhos. (em Inglês)

DICA DE VÍDEO

Na semana passada mostramos aqui na newsletter que Elon Musk e outras pessoas assinaram uma carta para pausar os avanços de IA (em especial GPT-4) por seis meses. Dois titãs da indústria de IA deram suas opiniões sobre isso. (em Inglês)

VAGAS DA SEMANA

  • Banco de dados SQL e NoSQL

  • EXP em Data Lake e data pipelines

  • Databricks

  • Apache Spark

  • CI/CD

Cientista de Dados Sênior - GympassSão Paulo - SP (Remoto)

  • EXP. prévia como Cientista de Ddos

  • Conhecimento em ML

  • Excelente comunicação

MEME DA SEMANA

Isso aí é passível de banimento no planeta inteiro

DATA VISUALIZATION DA SEMANA

Uma pesquisa realizada perguntou a participantes de diferentes países se IA e produtos de IA trazem mais benefícios que malefícios. O resultado você pode verificar acima. (em Inglês)

PRÓXIMOS EVENTOS

LLM in Production Conference13 de Abril - 100% online e gratuito

TWDC 202317 a 19 de Abril - 10 às 12h e 14 às 17h- 100% online e gratuito

Semantic Layer Summit 202323 de abril - 100% online e gratuito