O processo da New York Times contra a OpenAI

E mais: Como perdi mil euros apostando com Machine Learning; Como foi organizar um hackathon de IA para mais de 600 pessoas.

Fala, Data Hackers! E aí, bora conferir o que está rolando no universo dos dados com a nossa primeira newsletter do ano?

Nesta edição trazemos o processo que o jornal The New York Times move contra a OpenAI pela utilização do seu conteúdo para treinar o ChatGPT, detalhes sobre a organização de um hackathon de Inteligência Artificial para mais de 600 pessoas e um artigo que explica que erros não cometer ao usar Machine Learning para fazer apostas e investimentos.

Confira outros destaques dessa edição:

Para abrir a sequência de podcasts em 2024, conversamos com dois nomes de peso da área de tecnologia e que são autores livros best-sellers: Sandor Caetano - CDO no Picpay, co-autor do livro “O Cientista e o Executivo”, ex-Nubank e iFood; e Diego Barreto - VP de Finanças e Estratégia do iFood, autor dos best-sellers Nova Economia” e “O Cientista e o Executivo”, mentor da Endeavor e colunista no MIT Tech Review.

Neste episódio falamos sobre a percepção e o aumento de empresas brasileiras que fazem uso de Inteligência Artificial, em uma visão técnica e de negócios.

Vale ir ao Spotify e deixar seu comentário sobre esse episódio, porque sortearemos dois comentários (de pessoas diferentes) para ganhar o livro do Sandor e do Diego, “O Cientista e o Executivo”. Confira aqui

Usar Machine Learning para fazer apostas e investimentos parece uma grande ideia, certo? E até pode ser, mas é preciso conhecimento, critério e planejamento, caso contrário a coisa pode sair muito errada.

Neste artigo, o engenheiro de Machine Learning Pedro Tabacof detalha como perdeu 1000 mil euros usando Machine Learning para apostar em e-sports (mais especificamente em CS:GO) e explica quais foram os erros que ele cometeu - e que devem ser evitados a todo custo. (em Inglês)

Obs: Sabia que o Pedro Tabacof foi um dos primeiros convidados do Podcast Data Hackers? Se quiser voltar no tempo e escutar histórias de quando ele ainda vivia no Brasil, em 2018, clique aqui.

Na contramão de outros grupos de mídia que assinaram acordos de conteúdo com a OpenAI, como o alemão Axel Springer e a agência Associated Press (AP), o jornal americano The New York Times entrou com um processo contra a criadora do ChatGPT no fim de dezembro. O jornal alega violação de direitos autorais por seu conteúdo ter sido usado para treinar modelos de IA, estima em bilhões de dólares os danos sofridos e exige uma indenização.

A postura do jornal americano vai na trilha da polêmica sobre os direitos autorais das obras usadas para treinar modelos de IA, e o resultado do processo pode abrir um precedente para novos casos. (em Português)

Desde 2017 a Hotmart organiza o Hack Week, um hackathon onde seus colaboradores formam times multidisciplinares e competem na criação de soluções de negócio em poucos dias. Depois de uma pausa devido à pandemia, em 2023 o evento voltou com força total, tendo como tema a Inteligência Artificial e incluindo a participação de mais de 600 pessoas.

Quais os desafios de organizar um evento desse porte, tanto do ponto de vista de estrutura como dos desafios a serem resolvidos? Quais foram os resultados, e quais lições os organizadores tiraram do processo? Confira tudo nesse artigo assinado por mim e Valter Pereira, produtores do evento. (em Português)

OUTROS TÓPICOS

Algumas previsões do que vem por ai em 2024
O que o ano que está começando pode nos reservar em matéria de inovação em tecnologia? Fred Wilson, fundador/sócio da empresa de capital de risco Union Square Ventures e respeitado blogueiro, traça um panorama considerando do cenário econômico aos caminhos que a tecnologia percorreu em 2023. (em Inglês)

Os artigos mais populares da Wikipedia em 2023
Você já se perguntou quais os artigos mais visitados da Wikipedia em um determinado ano? A lista abrange esportes, filmes e celebridades, mas não se engane: passa também pela tecnologia, com o ChatGPT no topo da lista. Confira a lista com os 25 artigos mais acessados em 2023, divulgada pela Wikimedia Foundation. (em Inglês)

Você não precisa de um graph database: usando Postgres para gráficos
Existem algumas opções bem conhecidas para quem precisa de um banco de dados de grafos, como o famigerado Neo4j. Mas, você sabia que é possível utilizar o Postgres para esse mesmo propósito? Nesse post, Viktor Qvarfordt dá mais detalhes de como você pode implementar um banco de grafos usando o Postgres. (em Inglês)

DICA DE VÍDEO

Criar grandes estruturas de dados passa por grandes desafios: se não seguirmos certos princípios e boas práticas, as estruturas podem se tornar confusas e pouco funcionais. Neste vídeo, a Dra. Pragyansmita Nayak, Chief Data Scientist na Hitachi Vantara Federal, explica alguns anti-patterns comuns que devem ser evitados para que sua arquitetura tenha o maior valor possível. (em Inglês)

VAGAS DA SEMANA (Especial Itaú)

Estamos buscando pessoas que queiram se desenvolver e aprender constantemente, compartilhando, colaborando, inovando e entregando valor para todos os nossos clientes. Aqui a gente não sabe tudo, a gente vai de turma.

  • 6+ Anos de experiência em arquitetura de soluções;

  • Patterns e Design Principles

  • Decomposição de serviços (DDD)

  • Event-Driven

  • Microservices

  • Arquitetura AWS

  • Arquitetura de dados / Data mesh

  • Experiência com micros serviços e arquitetura de aplicativos distribuídos, como: API Gateway, CloudFront, CloudWatch, S3, DynamoDB, Lambda, Athena, Glue,Fargate, ECS/ECR, EKS (Kubernetes), Kafka, SQS, RabbitMQ, StepFuncions

  • Experiência com integração e comunicação com APIs entre aplicações de diferentes camadas;

  • Conhecimento com ferramentas de DevOps com AWS e GitHub (actions);

  • Conhecimento de modernização e construção de arquiteturas cloud native;

  • Experiência com GIT (GitLab / GitHub);

  • Conhecimento em design de software como: SOLID / Clean Code / Clean Architecture / [etc].

MEME DA SEMANA

Dica do Data Hacker Mario Filho no nosso canal do Slack

DATA VISUALIZATION DA SEMANA

Do seu início humilde no início dos anos 70 até se tornar o setor de mídia que mais fatura atualmente, com uma receita de mais de 180 bilhões de dólares em 2022, a indústria de video games derrubou qualquer dúvida sobre sua força e capacidade de permanência na indústria do entretenimento. Mas como foi sua evolução em termos de receita ao longo desses 50 anos de história, e quais plataformas mais contribuíram para o crescimento dessa receita? Confira nesse dataviz, cujos dados foram levantados pela Pelham Smither, firma inglesa de inteligência de mercado. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

AWS re:Invent Recap
31 de janeiro - Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo