09/05/2026 –, Sala de Exposições (3º piso) Idioma: Português brasileiro
Nessa palestra falaremos um pouco sobre os abusos no uso de dados para treinamento de LLMs por parte de grandes empresas, do processo de treinamento conhecido como “Distilação” e como o mesmo pode ser usado para extrair conhecimento de modelos já treinados para embutir em outros modelos.
Boa parte, se não todas, as empresas norteamericanas que detem modelos de linguagem (LLMs) proprietários conseguiram esses feitos ao custo de trabalho intelectual roubado (na forma de dados de treinamento) e de exploração de mão de obra de paises da periferia do capitalismo de forma excepcionalmente danosa (exposição a conteúdo prejudicial, por exemplo). Uma vez com seus modelos, essas mesmas empresas empurram o uso indiscriminado de suas ferramentas, gerando precarização de trabalho, prejudicando sistemas de ensino e destruindo recursos naturais em larga escala.
Não obstante, essas mesmas empresas opõe-se de forma explícita a iniciativas open-source, atacando constantemente modelos de organizações alinhadas a China e evocando soberania “nacional” (norteamericana) como forma de pressionar a sociedade a defender os direitos (?) das grandes empresas de tecnologia e ferir direitos alheios.
Mas, algo treinado com dados coletivos, muitas vezes voluntários, de forma completamente não-consentida deveria, no mínimo, ser disponibilizado abertamente, em benefício da sociedade que, de outra forma, ficaria lesada.
Nessa palestra falaremos um pouco sobre as temáticas acima, do processo de treinamento conhecido como “Distilação” e como o mesmo pode ser usado para extrair conhecimento de modelos já treinados para embutir em outros modelos. A Open AI e Anthropic tiraram de você, mas você pode - e deveria - pegar um pouco de volta.
Wandemberg Gibaut é pesquisador em Inteligência Artificial, com doutorado na área e atuação na interseção entre IA, tecnologias emergentes e vieses algorítmicos. Seu trabalho combina pesquisa avançada com aplicações práticas, incluindo agentes inteligentes, automação e impacto social da tecnologia. Interessa-se em debater os rumos da IA, privacidade e descentralização no mundo contemporâneo.