• Data Hackers Newsletter
  • Posts
  • Conheça as 50 empresas que estão dominando a área de AI (e possivelmente o futuro dos mercados) 👀

Conheça as 50 empresas que estão dominando a área de AI (e possivelmente o futuro dos mercados) 👀

Fala Data Hackers, todos prontos para começar mais uma semana lendo sua newsletter preferida?

O assunto principal de hoje é uma curadoria feita em detalhes pela Forbes, Sequoia e Meritech que reune os 50 negócios mais promissores de 2023 quando o assunto é Inteligência Artificial. A lista acabou de sair do forno e apresenta todos os detalhes de cada um desses negócios, que vão desde geradores de imagens e vídeos, passando por chatbots, sistemas de defesa e até mesmo empresas que usam AI para descobrir e criar novos medicamentos… Tem de tudo!

Além disso temos alguns outros assuntos quentes hoje:

Pode falar a verdade, você ficou completamente surpreso quando viu o ChatGPT pela primeira vez e não fazia nem ideia de quem estava por trás daquele projeto…

Pois saiba que além da OpenAI existem milhares de outros projetos, pesquisas e até mesmo negócios inteiros baseados em AI que podem ser tão revolucionários quando o ChatGPT, muitos deles inclusive podem ser muito úteis para impulsionar outras empresas.

Na lista Forbes AI50, são destacados os 50 negócios mais promissores no mercado de inteligência artificial em 2023, e é possível acessar um verdadeiro Raio-X de cada uma dessas empresas, entender mais sobre o produto e os motivos por trás de tanto destaque. Ou seja, esse é mais um daqueles conteúdos essenciais para todos profissionais e entusiastas da área de dados. (em Inglês)

A Databricks acaba de lançar a versão 2.0 do Dolly, o primeiro large language model orientado a prompts, ajustado em um conjunto de dados transparente e disponível gratuitamente que também é de código aberto para uso comercial.

Isso significa que o Dolly 2.0 está disponível para aplicativos comerciais sem a necessidade de pagar por acesso à API ou compartilhar dados com terceiros, dando mais autonomia e segurança para quem for usar e permitindo que se criem negócios inteiros em cima da tecnologia. (em Inglês)

O mais recente artigo do Data Hacker Cícero de Moura tem como objetivo mostrar a importância da qualidade dos dados em projetos de “Big Data” e como garantir essa qualidade utilizando o Great Expectations, uma ferramenta open source de validação de dados, juntamente com o Spark de forma prática.

O artigo é praticamente um tutorial onde você vai aprender como utilizar o Great Expectations com o Spark no EMR, onde os dados são armazenados no S3 da AWS e a orquestração é feita pelo Airflow. Vale a pena conferir. (em Português)

OUTROS TÓPICOS

CDC (Change Data Capture) é um conjunto de padrões ou técnicas para integração de dados onde determinadas alterações realizadas em um banco de dados são capturadas e disponibilizadas de maneira que possam ser integrados aos mais diversos destinos. Nesse artigo o Data Hacker Abdias Montalvão mostra como o uso dessa técnica pode ser aplicado para processos escaláveis de ingestão de dados, apresentando em detalhes toda a arquitetura, ferramentas utilizadas e processos de monitoramento, por fim mostra quando usar e quando não usar essa estratégia. (em Português)A guerra por talentos em IA: Como as empresas estão espionando grandes universidades em busca dos maiores gêniosArtigo interessante mostrando os detalhes obscuros por trás da guerra por talentos em IA e como isso está afetando a rotina dos alunos em grandes universidades. (em Inglês)Cientistas criaram uma cidade virtual e inundaram de personagens 100% baseados em inteligência artificial (e o resultado foi incrível)O que você acha que aconteceria se enchessem uma cidade virtual com robôs programados por AI e os deixasse livres leves e soltos? Guerra das máquinas? Reproduções dos piores comportamentos humanos? Bem… O resultado não foi esse…

Nesse experimento os cientistas viram que os robôs escovam os dentes e são muito legais uns com os outros! O experimento completo ficou bem interessante e foi publicado nesse artigo. (em Inglês)Um dataset BR contendo todos os dados de mais de 14 mil jogos de futebolCom esse dataset você vai poder fazer suas próprias análises sobre o futebol brasileiro e complementar seu portfólio de análises. São mais de 14 mil jogos dos principais campeonatos nacionais incluindo série A, B, C, Copa do Brasil além de vários campeonatos estaduais. Os dados estão abertos e podem ser baixados gratuitamente. (em Português)

OpenxBI: Um projeto open-source de componentes customizáveis para ferramentas de BIA iniciativa está em inglês, mas se trata de um trabalho muito legal liderado por um BR. O Data Hacker Raphael Barros criou um projeto open-source com o objetivo de se tornar uma plataforma de componentes para BI estilizados em HTML e CSS puro, que podem ser personalizados para qualquer necessidade. O uso da plataforma é focado em cientistas e analistas de dados, e usuários de PowerBI, porém nada impede que os componentes sejam aproveitados em outras plataformas como Tableau, Qlik, ou qualquer outra finalidade específica.(em Inglês)

Democratização de dados com o MetabaseA Data Hacker Mariana Caetano fez um post bem interessante mostrando como é possível utilizar o Metabase para acelerar o processo de democratização de dados nas empresas. (em Português)

DICA DE VÍDEO

Nesta aula que vai rolar na próxima quarta-feira 19/04 as 20h, convidamos você a mergulhar no fascinante mundo dos Large Language Models (LLMs) e descobrir como o ChatGPT tem transformado o campo do processamento de linguagem natural. Vamos explorar os conceitos fundamentais por trás do ChatGPT e apresentar algumas alternativas OpenSource bastante promissoras. Além disso, você aprenderá valiosas técnicas e estratégias de engenharia de prompt, que serão essenciais para otimizar suas soluções. Abordaremos o In-Context Learning e a importância dos Embedding Vectors no aprendizado contextual dos modelos. Por fim, demonstraremos como criar aplicações inteligentes baseadas em LLMs com o LangChain, fornecendo exemplos práticos e experimentos interativos que revelam o verdadeiro potencial do ChatGPT quando integrado às suas próprias implementações.

  1. Introdução aos Large Language Models (LLMs)

  2. Conceitos fundamentais do ChatGPT

  3. Alternativas OpenSource

  4. Técnicas e estratégias de engenharia de prompt

  5. In-Context Learning e a importância dos Embedding Vectors no aprendizado contextual

  6. Criação de aplicações inteligentes baseadas em LLMs com LangChain

  7. Exemplos práticos, do básico ao avançado com ChatGPT e LangChain

(em Português)

VAGAS DA SEMANA

  • Estudante de graduação em Computação, Matemática, Estatística ou áreas relacionadas;

  • Proatividade;

  • Boas habilidades de comunicação;

  • Inglês avançado;

São Paulo - SP - Remoto

  • Sólidos conhecimentos em Machine Learning e Deep Learning;

  • Sólidos conhecimentos em algoritmos de processamento de imagens;

  • Python + Tensorflow;

  • Desejável experiência em desenvolvimento Android e sistemas de câmeras;

  • Inglês fluente;

MEME DA SEMANA

*Conteúdo original do @marketoonist.com traduzido pela comunidade Data Hackers.

“Eis que o ChatGPT chega para solucionar os problemas que ele mesmo criou”

DATA VISUALIZATION DA SEMANA

Que tal usar os dados para tentar prever as reais chances de ter sucesso nas buscas por um encontro no seu app de relacionamento preferido? Foi exatamente essa a ideia explorada nesse artigo do The Economist. O foco do estudo não foi somente a probabilidade de “dar match”, mas buscaram entender também o quão “mente aberta” são os usuários de app quando o assunto é um novo relacionamento e fizeram descobertas inesperadas, identificando, por exemplo, que usuários com configurações permissivas nos apps mostram preconceitos semelhantes àqueles com configurações restritivas. Vale a pena conferir!

(em Inglês)

PROXIMOS EVENTOS E MEETUPS

TDWC 202317 a 19 de abril - 100% online e gratuito

Supletivo Data Hackers - ChatGPT19 de abril - 20h - 100% online e gratuito

Latam Early-Talent Forum19 de abril - 100% online e gratuito

Semantic Layer Summit 2023 23 de abril - 100% online e gratuito

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.