Aprendizado de Representações para Learning to Sense usando Modelos de Linguagem

Motivação e Objetivos

Deseja-se explorar técnicas de aprendizado de representação baseadas em Language Models para capturar a semântica dos eventos (especialmente relação de causa e efeito), investigar formas de incorporar restrições espaço-temporais na representação dos eventos e avaliar a construção de mapas de sensores bidimensionais que organizem eventos semelhantes em regiões de alta densidade.

Métodos e Procedimentos

Os procedimentos de pré-processamento sobre um dataset com pares de títulos de notícia envolveram oversampling, criação de pares simétricos, inserção de erros de digitação, extração de informação espaço-temporal com LLM, obtenção de coordenadas geográficas e isolação de eventos. Para classificação da relação causal entre títulos, foram usados o BERT (RoBERTa) e a LLM Qwen3-4B, esta última fine-tunada com diferentes formatos de entrada, incluindo informação espaço-temporal. A visualização utilizou duas abordagens de similaridade (distância de cosseno das embeddings e combinação de pesos com probabilidades da predição) para criar redes de eventos agrupando por conteúdo e localização, além de mapas de ponteiros e mapas de calor que permitem identificar eventos e regiões de maior concentração.

Resultados e Aplicações

Os modelos Qwen3 superam o BERT, especialmente com a inclusão de informações espaço-temporais. A similaridade baseada na classificação de causalidade agrupa melhor eventos relacionados, mesmo com conteúdo diferente, enquanto a restrição geográfica pode limitar esse agrupamento. Mapas de ponteiros e de calor são eficazes para associar eventos a locais e visualizar padrões espaciais rapidamente.

Conclusão

A identificação de relações causais entre eventos é fundamental, mas frequentemente não explícita nos textos, exigindo modelos avançados para inferi-las. LLMs surgem como uma alternativa promissora para enriquecer a representação dos eventos e identificar relações.

Arquivos

Completo com os modelos treinados

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
Images		Images
Material		Material
Notebooks		Notebooks
README.md		README.md
RelatorioFinal.pdf		RelatorioFinal.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Aprendizado de Representações para Learning to Sense usando Modelos de Linguagem

Motivação e Objetivos

Métodos e Procedimentos

Resultados e Aplicações

Conclusão

Arquivos

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Aprendizado de Representações para Learning to Sense usando Modelos de Linguagem

Motivação e Objetivos

Métodos e Procedimentos

Resultados e Aplicações

Conclusão

Arquivos

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages