• Data Hackers Newsletter
  • Posts
  • AI que ressuscita os mortos, AI que joga Minecraft... Qual será a próxima novidade? 👻

AI que ressuscita os mortos, AI que joga Minecraft... Qual será a próxima novidade? 👻

Data Engineering Wiki: Um repositório que concentra o universo de DE Truques e ferramentas para você ter mais eficiência programando em Python

Fala Data Hackers, prontos para começar mais uma semana se atualizando com as últimas novidades da área de dados?Um dos principais pontos que vamos trazer hoje foram algumas novidades na área de AI que foram divulgadas essa semana como a nova funcionalidade da Alexa que permite com que ela aprenda vozes ouvindo o áudio da fala de pessoas e depois passe a conversar utilizando aquela voz, tornando-a capaz de simular a voz inclusive de pessoas que já faleceram. Outra novidade nesse mundo da inteligência artificial é que agora a OpenAI conseguiu treinar um algoritmo para jogar Minecraft sozinho, aprendendo toda a complexidade envolvida no jogo.Mas não para por aí, além desse tópico temos vários outros assuntos interessantes:

Essa é sua chance de ganhar um PS5 analisando dados, inscreva-se agora! O Challenge State of Data está na reta final, ou seja, você tem 2 semanas para enviar suas análises feitas em cima dos dados da pesquisa State of Data e concorrer a prêmios incríveis incluindo um PS5, um Oculus VR e um monitor portátil! Saiba mais no site stateofdata.com.br/challenge.  (em Português)

Para começar, vamos direto para uma polêmica que dominou a internet nessa última semana. A Amazon Web Services (divisão de cloud e tecnologia da Amazon) fez um evento incrível com o foco em Machine Learning, automação, robôs e vigens ao espaço e aproveitou esse momento para dividir com o público suas principais novidades.Foram apresentados vários lançamentos na área de ML, novas tecnologias de robôs domésticos e para empresas, os próximos passos na corrida espacial e muitas outras inovações, porém o que chamou a atenção mesmo foi uma novidade na Alexa (aquele assistente virtual da Amazon) que permite com que a IA aprenda a repetir vozes e falar como se fosse aquela pessoa.Até aí nada demais, certo? Afinal nós já mostramos aqui mesmo na newsletter vários recursos de Deepfake que permitem clonar vozes, não é uma grande novidade nesse meio. Porém o que chamou a atenção foram os casos de usos desse tipo de recurso, pois quando o  VP e cientista-chefe de IA da Alexa o exemplo dado foi: “pedir para a vovó ler o Mágico de Oz”.Não demorou muito para a internet polemizar essa novidade, mostrando que a "vovó" seria capaz de contar histórias para os netos mesmo após já ter falecido. É bom reforçar que essa funcionalidade ainda não tem data para chegar aos dispositivos, então é provável que até lá muita polêmica ainda vai ser criada em cima desse tema.Outro assunto que está quente na área de AI essa semana é uma novidade da OpenAI que resolveu utilizar um recursos de treinamento de modelos baseado em vídeo (Video PreTraining (VPT)) para fazer seus algoritmos aprenderem a jogar Minecraft sozinhos (será que até os youtubers donos de canais sobre minecraft serão substituidos por robôs no futuro?). Veja os detalhes dessa novidade direto no blog deles. Vale a pena conferir!

Já pensou se tivesse um repositório unificado que reunisse os principais recursos envolvidos no processo de engenharia de dados? Seria incrível, certo? Pois saiba que esse repositório já existe!

Na Data Engineering Wiki você vai encontrar as definições dos principais conceitos da área de DE, incluindo processos, ferramentas, plataformas, linguagens etc. Tudo muito bem estruturado e organizado, escute nossa dica e salve logo o link dessa Wiki nos favoritos! (em Inglês)

 

Um dos maiores desafios dos programadores é manter a eficiência no processo de desenvolvimento de soluções de tecnologia. Não importa se seu foco é desenvolvimento de software, engenharia ou análise de dados, a verdade é que de tempos em tempos é fundamental refletir sobre formas de tornar seu trabalho mais eficiente e justamente por isso esse livro no formato ebook é tão importante.

A autora fala de diversos temas importantes como organização do código, métodos, processos, bibliotecas e ferramentas que vão te ajudar a se tornar um profissional mais eficiente, poupando tempo e economizando recursos. (em Inglês)

O artigo da vez vem do nosso amigo Lucas Silva, ele foi bem direto ao ponto e criou um guia com dicas para quem deseja realizar controle de versão e automatização de changelog em Python. (em Português)

9 entre 10 cientistas de dados gostariam de aprimorar suas habilidades em visualização de dados, pensando justamente nisso trouxemos esse artigo que apresenta 3 diferentes recursos de visualização de dados disponíveis em Python. (em Inglês)

Você já sabe o que é Adversarial Validation? O Data Hacker Alexandre Mundim decidiu falar mais dessa abordagem, explicando os conceitos e mostrando como essa abordagem pode ajudar os profissionais de dados a garantir a qualidade e eficiência de modelos de Machine Learning ao longo do tempo. (em Português)

Já parou para pensar que a Uber processa milhões de documentos diferentes todos os dias? Como isso seria possível de ser feito em tempo real? Nesse artigo é apresentada a arquitetura por trás do processamento e validação de documentos pela Uber, contando os segredos por trás das soluções que eles desenvolveram para superar esses desafios. (em Inglês)

Microsoft disponibiliza curso de ML para iniciantes na áreaA Microsoft disponibilizou um curso completo para quem está iniciando na área de Machine Learning. O curso é bem completo, com 26 aulas gratuitas passando por diversos temas importantes para quem está iniciando na área, vale a pena conferir. (em Inglês)

VAGAS DA SEMANA

  • Experiência em liderança técnica;

  • Ter experiência sólida na área de Ciência de Dados;

  • Experiência na criação e entrega de modelos em produção, com impacto positivo para o Negócio;

  • Ter experiência com ferramentas do ecossistema de Ciência de Dados e Machine Learning;

  • Sólida experiência em Machine Learning;

  • Conhecimento em feature engineering;

  • Python;

  • Experiência com modelos de classificação, regressão, clusterização, time series etc;

Se foi o Andrew NG que disse então é verdade...

Um tweet recente do @Julian essa semana reviveu um estudo ao melhor estilo "OLD BUT GOLD". A simples ideia de tentar quantificar a forma com que as pessoas falam das chances de algo acontecer foi transformada em um estudo e visualização de dados muito interessantes. Esse estudo inclusive já ganhou prêmios de melhor visualização de dados. (em Inglês)

Data + AI Summit27 a 30 de Junho - Evento Gratuito e 100% Online

NVIDIA: Recommender Systems Summit 202228 de Junho - Evento Gratuitoe 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.