9 cursos gratuitos de IA (com ou sem códigos) disponibilizados pela NVIDIA 📖

E mais: Entenda porque Engenharia de Dados e Engenharia de Software são coisas distintas; Análise de sentimentos com um "ChatGPT" de código aberto

Fala, Data Hackers! E aí, antes de começar a semana, partiu se informar do que tem acontecido de mais quente envolvendo dados?

Hoje trazemos 9 cursos gratuitos sobre IA oferecidos pela NVIDIA, conteúdo riquíssimo para quem quer se qualificar nessa área. Além disso, temos também um artigo que explica porque engenharia de dados e engenharia de software são coisas diferentes, apesar de todos os recursos em comum que as áreas tem compartilhado nos últimos anos, e ainda um artigo que ensina a executar localmente o Llama 2 para fazer análise de sentimentos.

Confira outros destaques desta edição:

A IA Generativa tem impactado o mercado financeiro, apesar do segmento ter um comportamento mais conservador no apoio às iniciativas de inovação (a prioridade desse mercado são iniciativas com foco em crescimento de receitas e eficiência operacional, mantendo clientes e preservando as margens para mitigar riscos).

Você já se perguntou como a revolução da inteligência artificial está moldando o cenário financeiro atual? E como ela pode ser usada para criar impacto diante de um contexto de insegurança para abraçar plenamente iniciativas inovadoras?

Junte-se com a gente neste Webinar no dia 08/05 às 19h, promovido pela comunidade Data Hackers em parceria com a Thoughtworks, onde exploraremos o impacto da GenAI no mercado financeiro! (em português)

Em um mundo em que a tecnologia evolui a cada segundo, toda oportunidade de aprender e se qualificar deve ser aproveitada. Imagina se tratando de cursos gratuitos ofertados por uma das maiores empresas de tecnologia do planeta, e a principal fabricante de chips para IA?

Neste post são listados 9 cursos gratuitos sobre IA oferecidos pela gigante estadunidense NVIDIA. Puro ouro! (em Inglês)

A aproximação que se deu nos últimos anos entre engenharia de dados e DevOps, com ambos os campos se valendo de recursos como estrutura em nuvem, containerização, CI/CD, e GitOps, levou muitas pessoas a pensarem que não há diferença significativa entre engenharia de software e engenharia de dados.

Mas, acredite, pensar isso pode ser contraprodutivo para o sucesso dos engenheiros de dados. Entenda o porquê. (em Inglês)

A análise de sentimentos, também chamada de mineração de opinião, é um campo que tem ganhado destaque: permite rapidamente decodificar as emoções que estão por trás de um grande volume de texto, sendo útil para analisar os comentários sobre um produto ou serviço, por exemplo.

Neste post, o Data Hacker Felipe Gomes ensina como executar localmente o Llama 2, LLM pré treinado de código aberto, para realizar uma análise de sentimentos em Python. (em Português)

Novo golpe: Entrevista de emprego falsa com direito a ataque Hacker
Um novo modelo de golpe tem acontecido: um desenvolvedor encontra uma oferta de vaga muito boa para trabalhar remotamente para o exterior, faz um teste de código que parece normal e legítimo, e termina com um hacker tendo acesso remoto ao seu computador. O nome que tem sido atribuído a essa ameaça é DEVPOPPER, e esse post explica basicamente como a coisa acontece. Se cuidem, devs! (em Português)

Tokens e Embedding: Entendendo alguns dos principais conceitos de LLMs
Muito se fala sobre IA generativa e LLMs, mas poucos entendem conceitos básicos dessas tecnologias, como Embeddings e Tokens (que são usados para determinar a capacidade de modelos generativos e até para fazer cobranças quanto ao uso dessas ferramentas). Esse artigo ajuda a entender esses conceitos fundamentais. (em Português)

Github Copilot Workspace: Uma solução de IA que promete transformar ideias em softwares
Depois de anunciar o Copilot Workspace, ferramenta para desenvolvedores que usa IA, em sua conferência para usuários em 2023, a GitHub liberou uma primeira versão da ferramenta para testes, e desenvolvedores interessados podem entrar em uma lista de espera. O Copilot Workspace promete permitir que desenvolvedores possam planejar, escrever e testar códigos mais rápido e com mais facilidade que antes. As expectativas são altas. (em Inglês)

7 perguntas sobre IA utilizadas em entrevistas e como respondê-las
Sendo IA a bola da vez, é natural esperar perguntas sobre esse assunto em qualquer entrevista de emprego cujo cargo envolve tecnologia, certo? Este artigo lista 7 perguntas possíveis / prováveis e dá dicas de como respondê-las. Vale se preparar e estar afiado! (em Inglês)

Seria possível detectar que um texto é feito por IA só olhando para ele?
Não há dúvida de que muitos dos textos que lemos atualmente internet afora são produzidos por IA. Mas haveria como perceber isso rapidamente? Neste artigo, o cientista de dados Farred Khan dá dicas de palavras, expressões e estruturas que podem denunciar que a autoria de um determinado texto não tem nada de humana. (em Inglês)

Um guia para iniciantes em estruturas de dados para IA e ML
Estruturas de dados são, de certa forma, os tijolos de construção dos algoritmos, sendo fundamentais para seu funcionamento. Apesar de muita gente tratar essas estruturas como simples lugares onde dados são inseridos, elas são ferramentas complexas por si só e podem ser determinantes na performance. Este guia apresenta melhor as diferentes estruturas, as diferenças entre elas e o que faz com que se encaixem melhor num determinado caso. (em Inglês)

DICA DE VÍDEO

Streamlit é uma ferramenta poderosa para criar aplicativos de dados de forma rápida e eficiente, e está ganhando cada vez mais adeptos pela simplicidade de colocar um site ou app no ar utilizando vários recursos visuais de dados. Neste vídeo, nosso convidado Luciano Borba compartilha insights valiosos, dicas práticas e exemplos de como usar essa ferramenta incrível. Vale assistir! (em Português)

VAGAS DA SEMANA

Remoto

  • Sólidos conhecimentos em Engenharia de dados (data pipelines, data integration, and API development)

  • Experiência com ETL's e soluções de orquestração (Airflow, Talend ou Apache NiFi)

  • Conhecimentos avançados em SQL

  • Conhecimentos em Data Warehouse

  • Conhecimentos em análise de dados e ferramentas de BI

  • Experiência em programação (Python, Java ou Scala)

Obs: Qualquer dúvida chama o Allan Sene no Linkedin e ele te direciona

Remoto

  • Formação em Estatística, Ciência da Computação, Engenharias, Matemática, Economia ou correlatas;

  • Experiência em design e análise de experimentos online (como testes A/B) como Cientista de Dados em um time de desenvolvimento de produto;

  • Proficiência em SQL;

  • Experiência em modelagem estatística aplicada em pelo menos (usando Python, R, etc.);

  • Boa compreensão dos conceitos básicos de Machine Learning e Estatística;

  • Boa noção de negócios e produto, com capacidade de transformar perguntas vagas em hipóteses e métricas para conduzir negócios.

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Nem tanto tempo atrás, havia mais pessoas no mundo que comiam pouco (chegando até mesmo à insegurança alimentar) do que pessoas que comiam em excesso. Mas as coisas se inverteram: um estudo publicado em fevereiro na revista científica britânica Lancet aponta que mais de 1 bilhão de pessoas no mundo eram consideradas obesas em 2022, ano mais recente com dados disponíveis. Dos anos 90 pra cá, as taxas de obesidade dobraram entre adultos e quadriplicaram entre crianças e adolescentes. Este mapa, produzido pela revista The Economist, mostra quais países possuem os índices mais altos. (em inglês)

PRÓXIMOS EVENTOS E MEETUPS

Rockset Index
16 de maio - Mountain View, Califórnia, EUA e Online

Data + AI Summit
10 a 13 de junho - San Francisco, Califórnia, EUA

HackTown 2024 (Data Hackers têm 15% de desconto!)
1 de agosto - Santa Rita do Sapucaí-MG

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

AWS Innovate
On-demand - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo