Tesauros

Palavra de origem latina, surge muitas vezes grafada de acordo com a sua origem: thesaurus,  no singular, thesauris, no plural.

Obra de referência, consiste numa lista de autoridade organizada de descritores e não-descritores de acordo com regras previamente estabelecidas e ligados entre si por relações hierárquicas ou semânticas. Trata-se de uma forma de controlar o vocabulário utilizado na indexação, traduzindo a linguagem natural numa linguagem documental, isto é, sem ambiguidades.

Na ausência de um tesauros, deve-se recorrer a uma lista de cabeçalhos de assunto, elaborada por cada serviço de uma biblioteca, e que servem de guia para estabelecer os cabeçalhos de assunto na indexação.

Os descritores são termos (palavras) que traduzem os conceitos ou ideias expressos na linguagem comum, aquela em que todos nos exprimimos (linguagem natural) numa linguagem artificial sem ambiguidade. Esta linguagem artificial resulta de convenções (conjunto de regras previamente estabelecidas) e é uma linguagem documental.

Num tesauros, os termos (descritores) são agrupadas de acordo com a semelhança de significado, contendo sinónimos e, às vezes, antónimos, geralmente por ordem alfabética.  

A elaboração da lista de termos controlados obedece a regras muito próprias e rigorosas.

O principal objectivo é ajudar o utilizador a para encontrar a palavra (termo) pela qual uma ideia possa ser mais apta e apropriadamente expressa. Traduz as noções expressas em linguagem natural numa linguagem artificial, a linguagem documental, em que se procura retirar toda a ambiguidade que um determinado termo possa conter. Resulta de uma convenção construída a partir de uma conjunto de regras fixadas antes do uso e é, por isso, uma linguagem artificial, mas exprime-se através de termos controlados da linguagem natural. Por outras palavras, os termos usados estão inseridos numa estrutura previamente estabelecida, controlados, mas exprimem-se através da linguagem de uso comum. Nisto se distinguem das tabelas de classificação, porque estas adoptam uma linguagem simbólica, completamente artificial, além de que as classificações têm uma estrutura em que os termos (descritores) se relacionam entre si hierarquicamente.

Não confundir com dicionário, pois este fornece definições para as palavras e um thesaurus apenas lista os sinónimos que tenham relação com o termo inicial.

descritor2

Thesaurus de acesso livre da União Europeia:

logo

transferir

ISO 25964:  norma internacional

Regulamenta a elaboração de thesauri (plural em latim de thesarus), publicada em duas partes. A responsabilidade da produção da norma é da instituição que elabora e publica as normas internacionais em quase todas as matérias: a  International Organization for Standardization ou Organização Internacional de Normalização. Em Portugal, a instituição que tem a função de produzir normas ou de verter para a nossa ordem jurídica as normas ISO é o Instituto Português de Qualidade. As normas portuguesas de documentação e informação são elaboradas na CT7 deste organismo de normalização português.

ipq logo

Um thesaurus compatível com a norma ISO 25964-1 (parte 1) (2011) deve fazer a lista de todos os conceitos disponíveis para a indexação num dado contexto e atribui a cada um termo seleccionado, assim como os sinónimos que se aplicam. As relações entre os conceitos e entre os termos são mostrados, tornando fácil pesquisar. Estabelece os principais tipos de relacionamento incluem:

  • equivalência (entre sinónimos e quase sinónimos – exemplo: motas, motocicletas e motociclos)
  • hierárquicos (entre os conceitos mais amplos e mais restritos – exemplo: flores e rosas)
  • associativa (entre os conceitos que embora estejam relacionados, mas não de uma forma hierárquica – exemplo: uma determinada doença e o vírus que causa essa doença)

Também prevê glossários multilingues, em que os termos são apresentados em diferentes línguas naturais. Não sendo uma operação fácil. a norma fornece recomendações para lidar com as dificuldades.

Fornece um modelo de dados para usar na manipulação de dados do dicionário de sinónimos e um esquema XML para codificar os dados, que podem ser acedidos nosítio da NISO, National Information Standards Organization, uma organização não lucrativa, associada à ANSI (American National Standards Institute), o organismo norte americano de normalização.

A norma também estabelece os critérios que se necessita de ter em conta na escolha do software para gestão do dicionário de sinónimos.

A parte dois da ISO 25964 tem a ver com os problemas de combinar um thesaurus com outro tipo de instrumento de controlo vocabular (knowledge organization system – KOS), incluindo tabelas de classificação, taxonomias, tabelas de cabeçalhos de assuntos, ontologias, listas de autoridade, terminologias e listas de sinónimos.

Artigo