Perguntas Frequentes

 

O Arquivo

Testemunhos

Edições dos Peritos

Codificação XML-TEI

Comparação de Edições

Pesquisa

Leitura

Edição Virtual

O Arquivo

O que é o Arquivo LdoD?

O Arquivo LdoD é um arquivo digital colaborativo do Livro do Desassossego de Fernando Pessoa. Contém imagens dos documentos autógrafos, novas transcrições desses documentos e ainda transcrições de quatro edições da obra. Além da leitura e comparação das transcrições, o Arquivo LdoD permite que os utilizadores colaborem na criação de edições virtuais do Livro do Desassossego. Inclui ainda um módulo de escrita que, futuramente, permitirá aos utilizadores escreverem variações a partir dos fragmentos do Livro. Deste modo, o Arquivo LdoD combina um princípio representacional com um princípio simulatório: o primeiro consiste na representação da história e dos processos de escrita e de edição do Livro; o segundo consiste na possibilidade de os utilizadores assumirem diferentes papéis no processo literário (ler, editar, escrever), usando a flexibilidade do meio digital para experimentarem o Livro do Desassossego como máquina literária.

O que contém o Arquivo LdoD?

O Arquivo LdoD é constituído por um grupo de fragmentos que Fernando Pessoa explicitamente indicou pertencerem ao Livro do Desassossego e um outro grupo, sem a indicação “L. do D.”, que os seus editores escolheram a partir de evidências materiais ou estilísticas dos testemunhos autógrafos. Para cada fragmento o Arquivo LdoD contém o conjunto das interpretações associadas a esse fragmento. Uma interpretação é constituída por uma transcrição do texto e um conjunto de metainformação sobre o mesmo, como seja a atribuição de uma data, ou de um heterónimo, ou a indicação da cota da Biblioteca Nacional de Portugal que identifica o testemunho em causa. Os diferentes editores do Livro produziram interpretações que podem diferir quer na transcrição quer na metainformação. Assim, no Arquivo LdoD, um fragmento possui interpretações dos seus editores (interpretações editoriais), podendo ocorrer que algum dos editores não considere esse fragmento como fazendo parte do Livro, situação em que não haverá interpretação associada a esse perito. Adicionalmente, um fragmento possui uma ou mais interpretações dos testemunhos (interpretações autorais), sendo que pode haver várias interpretações autorais do mesmo fragmento devido, por exemplo, à existência de vários manuscritos e datiloscritos de um mesmo texto. A transcrição e metainformação associada a uma interpretação autoral é da responsabilidade da equipa do Arquivo LdoD.

O que é um fragmento no Arquivo LdoD?

Um fragmento é uma sequência textual modular e constitui a unidade básica de composição do Arquivo LdoD. A maior parte das sequências textuais constituem também unidades materiais delimitadas, uma vez que estão escritas em folhas soltas (ou pequenos grupos de folhas) sem uma ordenação definida entre si. Os fragmentos codificados no Arquivo LdoD correspondem à soma de todos os textos que foram considerados como pertencentes ou como estando associados ao Livro do Desassossego pelas quatro edições críticas, incluindo aqueles textos que são publicados em apêndice ou em anexo.

Qual a relação entre um texto no Livro do Desassossego e um fragmento no Arquivo LdoD?

Todos os fragmentos do Arquivo LdoD são também unidades textuais do Livro do Desassossego segundo pelo menos uma das edições. A estrutura do Arquivo LdoD coloca todos os fragmentos à mesma distância uns dos outros, isto é, com o mesmo índice de modularidade. Todavia, nas edições, nem todas as unidades textuais têm o mesmo grau de independência relativa, uma vez que há grupos de textos que estão mais próximos entre si, quer por serem partes de uma unidade textual maior, quer por proximidade temática ou cronológica. As unidades textuais das edições têm diferentes índices de modularidade, pois há grupos de textos mais próximos entre si. Essa é a diferença principal entre um texto como unidade de uma dada edição e um fragmento como unidade do Arquivo LdoD.

Por que motivo o fragmento é tratado como unidade modular no Arquivo LdoD?

A organização modular dos fragmentos (isto é, à mesma distância relativa uns dos outros) no Arquivo LdoD é uma pré-condição para que a comparação e a virtualização das edições possa ser processada da forma aberta concebida pelo nosso modelo. Esta sobrevalorização da fragmentariedade modular do Livro no Arquivo LdoD constitui um instrumento crítico para abrir o potencial de leitura, edição e escrita da obra a novas intervenções. A distorção introduzida pelo modelo de dados — suporte principal das funcionalidades dinâmicas do Arquivo LdoD — dá expressão técnica a uma rematerialização digital de documentos, textos e obra para além dos modelos bibliográficos. O Livro do Desasssossego não é uma organização inteiramente livre de fragmentos soltos, mas a configuração radial e desierarquizada das suas unidades no Arquivo LdoD permite simular a projetualidade autoral e a projetualidade editorial como processos de imaginação da obra enquanto livro.

O que é uma interpretação no Arquivo LdoD?

Uma interpretação é o conjunto formado por uma transcrição e pela metainformação que lhe está associada. As interpretações das cinco versões (isto é, das quatro edições dos peritos e ainda da representação genética dos testemunhos) não são totalmente coincidentes entre si, quer por variações e diferenças microtextuais (ortografia, pontuação, escolha de variantes, ordenação interna dos parágrafos, por exemplo), quer por variações macrotextuais (isto é, divisão dos fragmentos entre si, ordenação relativa do fragmento na arquitetura do Livro, inclusão ou exclusão de um determinado fragmento do corpus do Livro).

Porque é que alguns fragmentos possuem mais do que uma interpretação editorial para o mesmo editor?

Isso acontece porque os editores dividem, por vezes, um fragmento ou associam vários fragmentos. Por exemplo, um editor pode considerar como sendo um único texto o que outro editor considera serem dois textos distintos, ou seja, para o primeiro editor o arquivo associa uma única interpretação enquanto para o segundo editor associa duas.

O que é a interpretação autoral representativa de um fragmento?

É a interpretação autoral da fonte impressa, caso exista; senão, de uma fonte datiloscrita, e se esta também não existir, de uma fonte manuscrita. É necessário definir uma interpretação autoral representativa para se ter uma transcrição de referência, por exemplo, para calcular a similaridade textual entre dois fragmentos quando se usa o algoritmo de recomendação.

Testemunhos

O que são os testemunhos?

Os testemunhos são as interpretações dos fragmentos constituídas por transcrições genéticas de manuscritos e datiloscritos autógrafos, e ainda impressos publicados por Pessoa, codificadas pela equipa do Arquivo LdoD. Além da transcrição, há um conjunto de metainformação sobre os testemunhos documentais (suporte e meio da inscrição, dimensões do papel, eventuais particularidades do documento, cota da BNP, etc.).

O que é uma transcrição genética?

É uma transcrição que permite observar o processo de escrita e revisão autoral, registando todas as camadas de composição do texto e não apenas a versão final.

O que permite a interface de visualização dos testemunhos?

Permite ver a transcrição de um testemunho autoral que respeita a topografia de quebras de linha e de distribuição de espaços do original. Permite ver também os elementos textuais cancelados, substituídos ou acrescentados por Fernando Pessoa, assim como o fac-símile digital dos documentos originais. São representadas ainda todas as variantes, isto é, aqueles passos textuais para os quais existem duas ou mais alternativas.

O que é o fac-símile?

O fac-símile é uma imagem digital do documento original, que é representado através da unidade página (com exceção das fontes publicadas, nas quais é usada a dupla página). São incluídas imagens de todas as faces escritas de documentos cujo texto foi atribuído ou relacionado com o Livro. Há por isso folhas representadas apenas em recto e outras em recto e verso.

Qual a diferença entre testemunhos e fragmentos codificados?

As designações “testemunhos” e “fragmentos codificados” são perspetivas diferentes sobre os mesmos materiais. “Testemunhos” apresenta uma perspetiva dos materiais a partir das unidades definidas pela Biblioteca Nacional de Portugal, ou seja, a partir das cotas que determinam a unidade material de cada documento autógrafo como objeto referenciável. “Fragmentos codificados”, por seu turno, apresenta uma perspetiva dos materiais a partir das unidades do próprio Arquivo LdoD, ou seja, dos ficheiros XML como unidades que garantem a modularidade dos fragmentos e das interpretações (transcrições) que lhes estão associadas. Se se observarem as respetivas tabelas, torna-se mais clara a respetiva lógica: os 754 “testemunhos” correspondem a documentos autógrafos da BNP que têm uma cota específica (ou, no caso de algumas cartas, cotas de outros arquivos) e ainda a 12 textos publicados; já os 720 “fragmentos codificados” correspondem aos ficheiros XML do Arquivo LdoD, cada um dos quais contém um certo número de interpretações para o mesmo fragmento. Do ponto de vista do nosso modelo de dados no Arquivo LdoD, é como se o fragmento fosse uma entidade abstrata, que depois tem múltiplas instanciações: as transcrições de JPC, TSC, RZ e JP, e ainda as nossas próprias transcrições dos testemunhos. Geralmente surge apenas uma interpretação de cada edição para cada fragmento (ou seja, cinco ao todo), mas este número pode ir até sete quando, além das cinco interpretações editorias há vários autógrafos — por exemplo, dois datiloscritos diferentes e uma versão publicada em revista. Neste caso, o Arquivo LdoD transcreve as três versõs autógrafas. Através da tabela dos “fragmentos codificados” temos uma imagem global do conteúdo do Arquivo LdoD. De um ponto de vista teórico, podemos dizer que os ficheiros XML são documentos do Arquivo LdoD tal como os autógrafos são documentos do espólio de FP na BNP. Estes últimos estão representados no Arquivo LdoD através de uma imagem fac-similada e de uma nova transcrição genética topográfica.

Edições dos Peritos

O que são as edições dos peritos?

As edições dos peritos que constam do Arquivo LdoD são as principais edições críticas publicadas entre 1982 e 2012. Estas quatro edições críticas (preparadas a partir dos testemunhos autógrafos) foram organizadas, respetivamente, por Jacinto do Prado Coelho (1982, reimp. 1997), Teresa Sobral Cunha (2008; 1ª ed. 1990-1991), Richard Zenith (2012; 1ª ed. 1998)  e Jerónimo Pizarro (2010). A sequência de apresentação das edições dos peritos no menu corresponde à ordem cronológica da data da sua publicação original. As edições dos peritos são portanto muito significativas quer de um ponto de vista filológico, quer de um ponto de vista da socialização da obra. Ainda que a escala do respetivo aparato crítico seja muito variável, os quatro editores trabalharam a partir dos originais, com o objetivo de produzirem uma versão legível e integral do Livro. Além disso, estas edições determinaram a disseminação do Livro do Desassossego desde 1982, quer em português, quer noutras línguas, uma vez que foram tomadas como base para outras edições em português e para inúmeras traduções. Com exceção da edição de Jacinto do Prado Coelho (1920-1984), que foi reimpressa uma única vez sem alterações após a morte do editor, todas as restantes edições têm sido alteradas e corrigidas a cada nova publicação. A edição de Jacinto do Prado Coelho é historicamente significativa por ter sido a primeira, e as restantes são historicamente significativas por continuarem a demonstrar materialmente a possibilidade de reedição e reorganização do Livro. A edição de Jerónimo Pizarro é ainda significativa por ter ordenado os textos por data de composição e por ter desenvolvido um aparato crítico-genético sistemático e exaustivo.

Por que foram escolhidas estas edições específicas dos peritos?

Porque estas quatro edições (Coelho 1982; Sobral Cunha 2008; Zenith 2012 e Pizarro 2010) eram as últimas edições no momento em que a codificação dos ficheiros do Arquivo LdoD teve início, no ano de 2012. A edição de 1982 (reimpressa uma única vez em 1997) é a única que não sofreu alterações. As outras três edições continuam a sofrer pequenas alterações (no corpus, na transcrição, na ordenação), ainda que mantendo o essencial das respetivas estruturas e princípios de ordenação.  Entretanto, desde 2012, foram já publicadas novas edições (Sobral Cunha 2013; Pizarro 2013 e 2014; Zenith 2015).

As edições dos peritos serão atualizadas futuramente?

Embora os peritos tenham manifestado o desejo de ver a última versão das respetivas edições representada no Arquivo LdoD, uma futura atualização dependerá dos recursos disponíveis para recodificar os ficheiros de forma a refletirem as alterações introduzidas numa nova edição determinada. Para garantir o rigor filológico do trabalho realizado, é necessário que as interpretações contidas no Arquivo LdoD para representar as edições dos peritos correspondam a um testemunho específico (neste caso, às edições Coelho-1982, Sobral Cunha-2008, Zenith-2012 e Pizarro-2010) e não a uma combinatória eclética de leituras colhidas em diferentes edições do texto.

Por que não foi incluída a edição de Teresa Rita Lopes (2015)?

Teresa Rita Lopes publicou em 2015 uma nova edição intitulada Livro(s) do Desassossego, na qual integra trinta e cinco textos do Barão de Teive, além dos de Vicente Guedes e Bernardo Soares. Embora a edição de Teresa Rita Lopes seja uma nova demonstração da projetualidade autoral e editorial da obra — reforçando, de certo modo, a justificação teórica do Arquivo LdoD para desenvolver funcionalidades dinâmicas —, não foi possível incluí-la porque todo o trabalho de codificação estava concluído nessa data e não dispúnhamos dos recursos adicionais necessários para recodificar os ficheiros. Caso contrário, esta edição teria sido incluída, uma vez que satisfaz as condições através das quais definimos as edições dos peritos.

Codificação XML-TEI

Como foi feita a codificação dos textos do Arquivo LdoD?

A codificação foi realizada de acordo com as recomendações da Text Encoding Initiative (TEI) na versão P5 da implementação. Um exemplo da matriz XML de codificação pode ser consultado AQUI. O trabalho foi realizado ao longo de quatro anos, por uma equipa de cinco pessoas, num total de doze mil horas de codificação e de revisão.

Que elementos foram codificados?

A codificação XML dos testemunhos e das quatro edições dos peritos contidas no Arquivo LdoD foi feita de forma extremamente granular, de modo a que todas as variações pudessem ser comparáveis quer (a) na escala microtextual interna a cada fragmento, quer (b) na escala macrotextual de organização externa dos fragmentos no Livro, quer ainda (c) ao nível da metainformação sobre cada item do arquivo. Os elementos formalmente representados abrangem (a) pontuação, ortografia, palavras, divisão/agregação de parágrafos e espaços entre parágrafos, mas também (b) divisão/agregação e ordenação de fragmentos na estrutura do Livro, assim como (c) metainformação relativa à atribuição editorial de data e heterónimo ou relativa à natureza material dos testemunhos. No caso dos testemunhos, foram ainda codificados todos os atos de revisão autoral (cancelados, adições, substituições, variantes), bem como a topografia das quebras de linha e do uso de espaços ou traços de divisão entre blocos de texto em todos os documentos. No caso das edições dos peritos foram codificados também todos os espaços relativos e traços de divisão entre parágrafos.

Comparação de Edições

Para que serve a interface de comparação das edições?

A interface de comparação das edições serve para relacionar entre si as várias interpretações de um mesmo fragmento, isto é, as interpretações dos testemunhos e as interpretações das edições dos peritos. A visualização paralela dos fragmentos permite comparar entre si as transcrições de cada fragmento, e também a sua posição relativa dentro da ordenação do Livro.

O que mostra a visualização de realce de diferenças?

Esta funcionalidade mostra os pontos de variação entre as interpretações que estão a ser comparadas. Estes pontos de variação são realçados a azul no corpo do texto, sendo apresentados sob a forma de tabela, a seguir ao texto, na parte inferior da página. As variações na tonalidade azul de realce assinalam a quantidade relativa de variação (sendo que a existência de variação numa única interpretação resulta no tom azul mais claro e a existência de variações em todas as interpretações resulta no tom azul mais escuro, havendo ainda duas tonalidades intermédias).

Quais são as unidades de realce de diferença?

As unidades de realce de diferenças podem ser de quatro tipos: (a) palavra ou grupo de palavras, (b) sinal de pontuação, (c) frase ou grupo de frases e (d) parte ou todo o fragmento. O realce de palavra ou grupo de palavras indica variações ortográficas ou variações substantivas nas transcrições em comparação. Por exemplo, as edições Prado Coelho-1982 e Pizarro-2010 seguem a ortografia do documento original enquanto as edições Cunha-2008 e Zenith-2012 modernizam a ortografia para a norma em vigor à data da publicação. Estes casos são assinalados na tabela de variações pela tipologia “orthographic” (isto é, variação ortográfica). Os casos de variação substantiva na transcrição (por exemplo, quando os peritos optam por variantes distintas ou leem de forma diferente determinado passo) são assinalados na tabela de variações pela tipologia “substantive” (isto é, variação substantiva). O realce de sinal de pontuação indica que as transcrições em comparação não coincidem na pontuação de determinado passo. Estes casos são assinalados na tabela de variações pela tipologia “punctuation” (isto é, variação de pontuação). O realce de frase ou grupo de frases indica que uma ou mais transcrições dividem os parágrafos de forma diferente. Estes casos são assinalados na tabela de variações pela tipologia “paragraph” (isto é, variação na divisão de parágrafos). O realce de parte ou de todo o fragmento indica que as edições dividem os fragmentos entre si de forma diferente, ou seja, a correspondência não é de 1 para 1, mas de 1 para 2 ou para mais de 2. Nestes casos a tabela de variações indica quer as diferenças macrotextuais, quer pontos de variação à escala inferior da palavra ou grupo de palavras, sinal de pontuação e frase ou grupo de frases.

Por que motivo o realce de diferenças repete, por vezes, palavras isoladas que pertencem a um bloco textual realçado?

Quando os parágrafos estão divididos de forma diferente entre si no corpus das cinco transcrições, codificámos dois tipos de diferença que se sobrepõem: a) as diferenças ao nível da palavra e b) as diferenças ao nível do parágrafo no seu todo. O programa interpreta duas vezes as diferenças: antepõe (ou pospõe) as palavras que estão marcadas como diferentes entre si dentro do parágrafo, ao mesmo tempo que realça a marcação da diferença do parágrafo no seu todo. Isto verifica-se porque o método de segmentação paralela que adotámos na codificação não permite a sobreposição de hierarquias. A representação dos dois tipos de diferenças — a diferenças na divisão dos parágrafos e as diferenças entre palavras dentro desses parágrafos — tem de ser feita duplicando a hierarquia da codificação, o que faz com que o realce assinale palavras e parágrafos desse modo.

O que é que a comparação revela sobre as edições?

A comparação permite conhecer melhor cada uma das edições e tornar explícitos critérios editoriais que nem sempre são declarados nos princípios editoriais gerais, quer no que respeita às transcrições individuais, quer no que respeita à ordenação global dos fragmentos. A comparação automática permite, por exemplo, dar conta de diversas opções e intervenções editoriais ao nível da leitura de passos difíceis de decifrar, da escolha de variantes, da pontuação dos textos, da divisão/agregação de parágrafos e da divisão/agregação de fragmentos. A comparação (não apenas destas edições entre si, mas da história de cada uma das edições em comparação com as restantes) revela ainda que, à medida que o tempo passa, as leituras de passos difíceis de ler (e para os quais se ofereceram inicialmente leituras conjeturais) vai apresentando menos variação entre si de edição para edição, na medida em que novas decifrações, com maior de probabilidade de estarem corretas, são incorporadas nas edições subsequentes, mostrando que os peritos cooperam no esforço para ler a caligrafia, por vezes, idiossincrática e variável de Fernando Pessoa. Embora na escala granular da decifração dos carateres e das palavras haja menos variação entre edições à medida que o tempo passa, a comparação revela ainda que os editores que continuam a reeditar o texto (Sobral Cunha, Zenith e Pizarro) são consistentes na macro-organização original dos fragmentos das respetivas edições, que se mantêm fiéis à estrutura e ao modelo que conceberam inicialmente. Com a exceção de pequenas alterações, essa ordenação dos fragmentos no Livro permanece estável de edição para edição. As alterações mais significativas verificam-se nas edições de Teresa Sobral Cunha, no que respeita à inclusão ou exclusão de um número significativo de textos de edição para edição. À escala do Livro, a comparação entre as edições dos peritos permite comprovar a existência de quatro modelos distintos de produção do Livro do Desassossego.

É possível comparar uma interpretação editorial ou autoral com uma interpretação virtual?

Não, pois uma interpretação virtual nunca altera a transcrição da interpretação que usa.

O que mostra a comparação das anotações de fragmentos das edições virtuais?

Nessa interface é possível comparar as anotações que os editores virtuais aplicaram sobre as interpretações virtuais. Por exemplo, o que foi citado, e que notas e categorias foram associadas à citação pelos editores virtuais. Note-se que a comparação é entre interpretações do mesmo fragmento, mesmo quando a interpretação base usada não é a mesma.

Pesquisa

A pesquisa permite selecionar fragmentos de acordo com um conjunto de critérios.

O que é a pesquisa simples?

Na pesquisa simples é possível selecionar o conjunto de fragmentos de acordo com dois  critérios: texto e tipo de fonte. O critério do texto pode-se aplicar a toda transcrição ou apenas ao título. O resultado é o conjunto de interpretações que possui o texto inserido no campo de pesquisa. Note-se que o resultado da pesquisa pode incluir várias interpretações associadas ao mesmo fragmento (isto é, interpretações autorais e interpretações editoriais).

Quais são os caracteres permitidos no critério de pesquisa por texto?

Apenas são permitidos os caracteres alfa-numéricos, o hífen, o "&" comercial e o espaço. Todos os restantes caracteres são ignorados, por exemplo ao inserir-se "al*ma" no campo de pesquisa o resultado incluirá todas as interpretações onde a palavra "alma" surja. Note-se que não há distinção entre minúscula e maiúscula, pelo que no exemplo anterior também se obterá no resultado as interpretações onde surja a palavra "Alma".

O que é a pesquisa avançada?

Na pesquisa avançada é possível usar um maior conjunto de critérios. Adicionalmente é possível formular uma pesquisa que componha os critérios de duas formas: de acordo com todos os critérios ou de acordo com apenas um dos critérios. No caso de ser de acordo com todos os critérios, o resultado conterá os fragmentos que para cada um dos critérios definidos possuem pelo menos uma interpretação que satisfaça esse critério. Por exemplo, numa pesquisa em que no campo do critério de texto se coloca "alma liberdade" e no campo do critério heterónimo se escolhe "Vicente Guedes", vão ser selecionados todos os fragmentos que possuem pelo menos uma interpretação que no seu texto inclui as duas palavras e que tem pelo menos uma interpretação que atribui o fragmento a Vicente Guedes. Note-se que não necessita de ser a mesma interpretação a satisfazer ambos os critérios, basta serem as duas do mesmo fragmento. No caso de a pesquisa ser de acordo com pelo menos um dos critérios, o resultado conterá todos os fragmentos que possuem uma interpretação que satisfaça pelo menos um dos critérios. Usando o exemplo anterior, o resultado incluirá os fragmentos que possuam pelo menos uma interpretação atribuída a Vicente Guedes ou que possuam as palavras "alma" e "liberdade". Em ambos os casos, o resultado da pesquisa inclui as interpretações dos fragmentos selecionados, indicando quais os critérios que cada uma das interpretações satisfaz e assim justificando a razão pela qual o fragmento foi selecionado.

Leitura

A interface de leitura oferece a possibilidade de se ler os fragmentos do Livro do Desassossego, de acordo com as sequências propostas por cada um dos seus editores. Adicionalmente o Arquivo recomenda uma sequência de leitura com base em pesos (que variam entre 0.0 e 1.0, com intervalos de 0.2) que o utilizador pode atribuir a quatro critérios: heterónimo, data, texto e taxonomia. Para o fragmento que o utilizador está atualmente a ler o sistema recomenda o que considera mais próximo de acordo com uma medida de distância entre fragmentos.

Como é calculada a distância entre dois fragmentos?

É calculada aplicando a similaridade do coseno aos vetores construídos para cada um dos quatro critérios. Quando se comparam dois fragmentos, calcula-se a sua similaridade usando os vetores dos critérios para os quais o utilizador atribuiu um peso diferente de zero. Os vetores de critérios são construídos usando a informação associada a todas as interpretações do fragmento e multiplicados pelo peso atribuído pelo utilizador a esse critério, um valor entre 0.2 e 1.0.

Como é calculado o vetor associado ao heterónimo?

O vetor de heterónimo possui 2 células, uma para cada um dos heterónimos, Vicente Guedes e Bernardo Soares. Uma célula possui o valor 1.0 se pelo menos uma das interpretações atribui a heteronomia do fragmento ao heterónimo associado a essa célula e 0.0 no caso contrário. Por exemplo, se um fragmento é atribuído a Vicente Guedes por um dos editores e a Bernardo Soares por dois dos outros editores, o vetor de heterónimo terá 1.0 em ambas as células.

Como é calculado o vetor associado à data?

O vetor de data tem 22 células, uma por cada um dos anos que medeiam entre o ano do primeiro fragmento atribuído ao Livro, 1913, e o ano do último fragmento atribuído, 1934. Se, por exemplo, duas interpretações atribuírem datas diferentes a um fragmento as respetivas células terão o valor 1.0 e as restantes serão preenchidas com valores menores que 1.0 com um decaimento de MAX(0.0, 1.0 - N x 0.1) em que N é a distância entre o ano associado à célula e a célula mais próxima com valor 1.0.

Como é calculado o vetor associado ao texto?

Inicialmente é calculado o conjunto dos 100 primeiros tf-idf (term frequency–inverse document frequency) dos termos de cada um dos dois fragmentos que se estão a comparar. Note-se que este conjunto tem N termos que pode ser menor que 200, 100 termos por cada um dos fragmentos, no caso de haver termos iguais em ambos os fragmentos. Depois é criado um vetor, com um número de células igual a N, a cardinalidade do conjunto, em que a célula associada a um termo possui o valor 1.0 se ele surge no conjunto dos primeiros N termos td-idf desse fragmento, e 0.0 no caso contrário. Dado que as palavras existentes num fragmento variam conforme a transcrição, usa-se a transcrição associada à interpretação autoral representativa.

Como é calculado o vetor associado à taxonomia?

O vetor tem um número de células igual ao número de categorias existentes na taxonomia da Edição do Arquivo LdoD. A célula associada a uma categoria possui o valor 1.0 se a interpretação do fragmento na Edição do Arquivo LdoD atribuiu essa categoria a alguma etiqueta, e tem o valor 0.0 no caso contrário.

O que significa a recomendação de leitura quando todos os pesos dos critérios estão a zero?

Quer dizer que não existe similaridade entre os fragmentos, o valor da similaridade entre quaisquer dois fragmentos é 0.0.

A similaridade é calculada entre fragmentos, mas o que o Arquivo me recomenda para leitura é uma interpretação e não um fragmento, porquê?

A similaridade é calculada entre os fragmentos, mas a leitura deve ser efetuada sobre a transcrição de uma das interpretações. Assim, é sugerida para leitura a transcrição associada à edição da transcrição que o utilizador se encontra atualmente a ler.

Os fragmentos que já foram recomendados podem voltar a ser recomendados?

Apenas são recomendados para leitura os fragmentos que ainda não foram lidos desde que o utilizador iniciou uma sequência de leitura, mas se já apenas restam 50 fragmentos por ler o arquivo volta a considerar na sua recomendação os primeiros 50 fragmentos lidos.

Pode surgir mais do que um fragmento recomendado?

Sim, é sugerido o fragmento mais similar ao que está a ser lido mais todos os fragmentos cuja diferença entre o valor da sua similaridade e o valor da similaridade do sugerido é menor que 0.001, até um máximo de 5 fragmentos. Note-se que o fragmento sugerido é o mais similar que tem uma interpretação na edição da transcrição que se encontra a ser lida.

Porque é que depois de recomendada uma interpretação de fragmento mais nenhuma interpretação do mesmo fragmento volta a ser recomendada, mesmo que a interpretação lida seja de uma edição que possui duas interpretações para esse fragmento?

Isso acontece porque o mecanismo de recomendação de interpretações para leitura é baseado no cálculo da similaridade entre fragmentos.

Edição Virtual

O que é uma Edição Virtual?

Uma edição virtual é uma seleção de fragmentos que um ou mais utilizadores definem escolhendo de entre as interpretações existentes. Uma edição virtual é uma entidade singular pois permite que os seus editores virtuais escolham os fragmentos que desejam incluir, a sua ordenação, e a sua anotação através de notas e categorias. O conjunto de categorias associadas a uma edição virtual define a sua taxonomia.

Quais as limitações ao exercício da função editorial no Arquivo LdoD?

O exercício da função editorial no Arquivo LdoD está limitado à seleção, ordenação e anotação das interpretações dos fragmentos. Os editores virtuais não podem alterar as transcrições ou a modularidade das interpretações selecionadas. Estas limitações são determinadas por dois fatores: por um lado, pela necessidade de controlar a qualidade das transcrições e da codificação que lhes está associada; por outro lado, pela necessidade de limitar a complexidade do processamento dos materiais produzidos pelos utilizadores. A inclusão de um módulo de transcrição e codificação, com o respetivo sistema de validação — particularmente útil num contexto de aprendizagem especializada das práticas de crítica textual —, poderá vir a ser considerada futuramente em função dos recursos disponíveis.

O que é a Edição do Arquivo LdoD?

É uma edição experimental do Arquivo LdoD que usa a interpretação autoral representativa de cada um dos fragmentos. Possui ainda uma taxonomia para o Livro do Desassossego definida pelos editores do Arquivo, que adicionalmente anotaram as interpretações com as categorias da taxonomia.

Como posso criar uma edição virtual?

Na interface virtual pode-se criar uma nova edição virtual. A edição virtual pode usar uma edição, de perito ou virtual, já existente como base, ficando assim com toda a informação associada à edição base. Se não for escolhida uma edição como base, a nova edição virtual inicia-se sem possuir nenhuma interpretação. No caso de usar uma edição virtual como base, a nova edição virtual contém todas as anotações sobre os fragmentos efetuadas ao nível da edição base. Contudo, não é possível alterar essas anotações ao nível da nova edição, mas se elas forem alteradas ao nível da edição base, pelos editores da edição base, os efeitos das alterações são visíveis na nova edição. Este critério foi escolhido para respeitar a autoria das anotações.

Uma edição virtual pode possuir mais do que uma interpretação do mesmo fragmento?

Não, apenas é possível associar uma interpretação por fragmento a uma edição virtual.

Como adiciono uma interpretação a uma edição virtual?

Existem diversas formas de associar uma interpretação de um fragmento a uma edição virtual: (a) quando a interpretação está a ser visualizada no ecrã de comparação de edições, é possível adicioná-la individualmente se ela ainda não fizer parte da edição virtual; (b) na interface de ordenação manual da edição virtual é possível pesquisar fragmentos e adicioná-los à edição virtual.

Como posso remover uma interpretação de uma edição virtual?

Na interface de ordenação manual da edição virtual é possível selecionar uma ou mais interpretações e removê-las.

Quem pode adicionar e remover interpretações a uma edição virtual?

Todos os editores da edição virtual.

Posso colaborar com outras pessoas na construção da edição virtual?

Sim, uma edição virtual pode ter vários editores. Existem dois tipos de papel para os participantes numa edição virtual: os gestores e os editores. Os gestores podem adicionar novos membros à edição virtual, apenas necessitando de saber qual o Nome de Utilizador. Por outro lado, os gestores podem aceitar pedidos de adesão de novos editores. Qualquer utilizador pode efetuar um pedido de adesão a uma edição virtual pública. Um gestor pode remover outro utilizador de editor da lista ou alterar o seu papel. Note-se que os gestores são também, por inerência, editores, possuindo todos os privilégios de um editor.

O que distingue uma edição virtual pública de uma privada?

Uma edição privada apenas está visível e pode ser manipulada pelos seus editores. Uma edição pública está visível para toda a comunidade do Arquivo LdoD, mas apenas pode ser manipulada pelos seus editores, com exceção das anotações, nos casos em que a sua criação seja permitida a utilizadores autenticados. Apenas os gestores de uma edição virtual podem alterar o estado da edição entre pública e privada, assim como o seu nome e acrónimo.

Como posso anotar as interpretações de uma edição virtual?

As interpretações de uma edição virtual podem ser anotadas manual e automaticamente. A anotação manual pode-se aplicar a toda a transcrição ou apenas a uma porção de texto da transcrição. A anotação manual ocorre na interface de comparação de edições. A anotação manual de uma porção de texto efetua-se selecionando o texto, podendo-se associar um comentário à anotação assim como um conjunto de categorias da taxonomia da edição virtual. A anotação manual de toda a transcrição pode ser ver feita na mesma interface que a anotação de uma porção, mas neste caso as categorias ficam associadas a toda a transcrição. Naturalmente, na mesma interface de anotação é possível a remoção de comentários e categorias. A anotação automática das interpretações de uma edição virtual ocorre quando se aplica o algoritmo de geração de tópicos, na interface de edição virtual, ficando a transcrição das interpretações anotadas com as categorias geradas.

Quem pode anotar interpretações de uma edição virtual?

Na interface de taxonomia, em edição virtual, os gestores da edição virtual podem indicar quem pode anotar uma interpretação. São oferecidas duas possibilidades: a criação de anotações é restrita aos editores na edição virtual; ou qualquer utilizador autenticado pode criar anotações. No que diz respeito à edição e remoção de anotações, apenas o utilizador que as criou pode efetuar estas operações.

Como se define o conjunto de categorias de uma taxonomia?

A taxonomia de uma edição virtual pode ser aberta ou fechada, conforme seja possível, ou não, adicionar novas categorias durante a anotação de uma interpretação. A anotação de uma interpretação ocorre na interface de comparação de edições. Nos casos em que a taxonomia é aberta, o conjunto de categorias aumenta sempre que uma categoria não existente na taxonomia é incluída numa anotação. Por outro lado, para ambas, taxonomias abertas e fechadas, é possível manipular o conjunto de categorias existentes através de operações de criação de categoria, junção de duas ou mais categorias, separação de uma categoria em duas, e remoção de categoria. Esta manipulação do conjunto de categorias da taxonomia é feita através da interface taxonomia de edição virtual. É ainda possível aumentar automaticamente o número de categorias de uma edição virtual através da aplicação do algoritmo de geração de tópicos.

Quem pode definir se uma taxonomia é aberta ou fechada?

Na interface de taxonomia, em edição virtual, os gestores da edição virtual podem definir se a taxonomia é aberta ou fechada.

O que é o algoritmo de geração de tópicos?

O algoritmo de geração de tópicos agrupa as interpretações da edição virtual em tópicos. Cada um destes tópicos é incluído na taxonomia como sendo uma nova categoria. No processo de geração, o utilizador pode indicar quantos tópicos diferentes pretende ver gerados, o número de palavras que terá no nome da nova categoria (são escolhidas as palavras mais relevantes do tópico), o valor de semelhança para uma interpretação poder ser incluída no tópico (para a interpretação ser automaticamente anotada pela respetiva categoria), e o número de iterações que o algoritmo deve executar antes de gerar os tópicos (as iterações devem ser entre 1500 e 2000 para os resultados serem confiáveis). Através da aplicação do algoritmo uma interpretação pode ficar associada a várias categorias. Para a geração automática de tópicos deve-se aceder à taxonomia na interface da edição virtual.

Quem pode manipular as categorias de uma edição virtual?

Na interface de taxonomia, em edição virtual, os gestores podem definir se são apenas os gestores que podem manipular as categorias, ou se todos os editores da edição virtual o podem fazer.

Posso usar as categorias das taxonomias das edições base nas anotações da minha edição virtual?

Sim, quando se usa uma edição virtual na criação de uma nova edição virtual pode-se usar as categorias da taxonomia base para anotar as interpretações na nova edição virtual. Essas categorias possuem como prefixo o acrónimo, em maiúsculas, da edição virtual usada. Note-se que se a categoria usada for apagada ou alterado o seu nome na edição virtual base, essas alterações refletem-se na anotação que usou a categoria pois o Arquivo LdoD preserva a autoria das anotações

Como posso reordenar as interpretações numa edição virtual?

Existem dois modos de reordenar as interpretações: um modo manual e um modo assistido. O modo manual ocorre na interface de edição da edição virtual e consiste na seleção das interpretações que se pretendem mudar de posição seguida da sua colocação na nova posição. É ainda possível alterar a ordenação das interpretações numa edição virtual usando o algoritmo de recomendação da edição virtual. Este é o que designamos como modo assistido. O algoritmo de recomendação é idêntico ao usado na recomendação de leitura, com a diferença que a similaridade de taxonomia usa, naturalmente, a taxonomia da edição virtual, em vez da taxonomia da Edição do Arquivo LdoD. Uma vez aplicado o algoritmo de recomendação, todas as interpretações são ordenadas a partir da primeira, ou seja, a segunda interpretação é a mais similar com a primeira, e a terceira a mais similar com a segunda, excluindo a primeira interpretação, e assim sucessivamente. Para gerar uma nova ordenação podem-se alterar os critérios ou colocar uma determinada interpretação como passando a ser a inicial. Uma vez alterada a ordenação, esta pode ser guardada, levando a uma redefinição da numeração associada a cada interpretação.

Quem pode reordenar as interpretações numa edição virtual?

Todos os editores da edição virtual.

Quando uma edição virtual é criada quais são as configurações por omissão?

Por omissão os editores podem anotar as interpretações, mas essa possibilidade está vedada aos utilizadores autenticados, apenas os gestores podem manipular as categorias da taxonomia, sendo o vocabulário da taxonomia aberto.

Quais poderão ser alguns dos cenários típicos associados à criação de edições virtuais?

 

Manuel Portela e António Rito Silva

[atualização 18-08-2017]

 




O Arquivo LdoD foi desenvolvido no âmbito do projeto de investigação “Nenhum Problema Tem Solução: Um Arquivo Digital do Livro do Desassossego” (PTDC/CLE-LLI/118713/2010) do Centro de Literatura Portuguesa da Universidade de Coimbra (CLP). Projeto financiado pela Fundação para a Ciência e a Tecnologia (FCT) e cofinanciado pelo Fundo Europeu de Desenvolvimento Regional (FEDER), através do Eixo I do Programa Operacional Fatores de Competitividade (POFC) do Quadro de Referência Estratégica Nacional (QREN)—União Europeia (COMPETE: FCOMP-01-0124-FEDER-019715). Financiado ainda por Fundos Nacionais através da Fundação para a Ciência e a Tecnologia no âmbito dos projetos de “Financiamento Plurianual —Unidade 759”: PEst-OE/ELT/UI00759/2013, PEst-OE/ELT/UI0759/2014, UIDB/00759/2020 e UIDP/00759/2020.