LICA

Literatura Computacionalmente Anotada

Um sistema piloto para construir grafos de conhecimento sobre literatura brasileira do oitocentos — auditáveis, navegáveis, ancorados em trechos literais do texto-fonte.

O que é o LICA

O LICA é um pipeline reprodutível de extração de informação narrativa: a partir do texto integral de uma obra (em TEI, no padrão do portal UFSC/NUPILL), gera-se um grafo onde cada nó é uma entidade (pessoa, lugar, conceito, evento, doença) e cada aresta é uma relação ancorada em evidência textual literal — um trecho do livro que sustenta aquela ligação.

Sobre esse grafo, montam-se vistas de leitura distante: ego-networks de personagens, linha do tempo narrativa, mapa de itinerário (quando aplicável), confronto de famílias semânticas, comparação entre figuras. Cada métrica do site devolve ao trecho que a sustenta — é a circularidade grafo↔texto que distingue um KG literário sério de uma estatística cega.

O método é calibrado por subgênero: o vocabulário de um memorial militar (Taunay) não é o de um romance romântico abolicionista (Maria Firmina), e nenhum dos dois é o de um romance picaresco urbano de folhetim (Manuel Antônio de Almeida). O sistema declara essas diferenças em arquivos de configuração por obra, e o mesmo template renderiza cada caso com as taxonomias adequadas.

Obras no piloto

Clique numa capa para abrir o explorador interativo da obra.

O que está em jogo

Três obras de gêneros distantes — memorial militar testemunhal, romance abolicionista feminino e romance picaresco urbano de folhetim — passam pelo mesmo método e produzem grafos estruturalmente diferentes. Úrsula concentra densidade em relações afetivas, parentesco, servidão e religião; A Retirada da Laguna distribui sua densidade por topônimos, datas, instituições militares e deslocamentos; Memórias de um Sargento de Milícias espalha-se por uma rede densa de figuras urbanas anônimas, ofícios, casas e ruas do Rio joanino. A diferença não é só literária — é computacionalmente visível, e isso é o ponto: o subgênero deixa marcas no grafo, e essas marcas podem ser estudadas como modos de falha e calibração de pipelines de extração.

O nome LICA é o apelido da minha mãe.

Sobre o piloto