METODOLOGÍA DE ELABORACIÓN DEL TPHA

El ámbito del TPHA es puramente patrimonialista, en él se encuentran recogidas, en el corpus genérico, aquellas disciplinas relacionadas directamente con el Patrimonio Histórico, relegando a un segundo plano aquellas cuya relación es puramente tangencial. Desde el punto de vista disciplinar se encuentran desarrolladas las siguientes áreas temáticas: Arte, Antropología, Archivística. Biblioteconomía. Documentación, Arqueología, Arquitectura, Geología, Historia. Historia del Arte, Museología, Conservación-Restauración.

 
Además el corpus del TPHA recoge conceptos genéricos y específicos, denominaciones de objetos, agentes, técnicas, etc.

La base de los descriptores integrados en el TPHA parten, en un primer momento, de las necesidades que surgen de la puesta en funcionamiento de la Base de Datos de Bienes Muebles "Inventario de la Iglesia Católica", de la que se hizo un vaciado, sin obviar en ningún momento la existencia de una bibliografía específica para cada materia. De ahí que el Grupo de Trabajo se encontró con tres tipos de fuentes de la que extraer descriptores:

   1.- Avance del tesauro
   2.- Bibliografía específica por materias, en la que incluimos tesauros y clasificaciones.
   3.- Vaciado de otras Bases de datos

Para el establecimiento de la macroestructura inicial, el Grupo de Trabajo aplicó la Gramática de Casos, con la finalidad de que entorno a ésta se desarrollase el vocabulario que forma parte del corpus genérico del Tesauro.

Desde un principio el Grupo de Trabajo siguió la metodología recogida en la Norma ISO 2788-1986 (E) de "Directrices para el establecimiento y desarrollo de tesauros monolingües", detectándose que al aplicar la norma existían algunas lagunas o vacíos teóricos. Para solventar dichos vacíos se crearon una serie de convenciones que marcarían una norma interna de trabajo del grupo, que caminaba paralela a la normativa oficial, desarrollándose una serie de actividades paralelas:

1.- Determinar la cobertura temática y los límites extensionales e intencionales del lenguaje.
2.- Revisión y modificación de la macroestructura, codificación de los   macrodescriptores.
3.- Revisión y modificación de la base léxica con incremento, absorción y exclusión de
palabras clave.
4.- Test de relevancia y pertinencia, profundidad y composición de la base léxica.
5.- Introducción de relaciones de equivalencia, control de sinónimos y cuasisinónimos.
6.- Revisión y modificación de la estructura jerárquica por campos.
7.- Construcción del cuadro teórico de vectores para establecer las relaciones  asociativas (TR).
8.- Interrogación de la estructura global, aplicación de la estructura jerárquica y asociativa  entre campos.
9.- Test de coherencia léxica y estructural sobre determinadas muestras.
10.- Elaboración de listados auxiliares, dependiendo de las necesidades de las distintas bases de datos.
11.- Test de indización sobre objetos y documentación.
12.- Redacción de normas de uso.

 
Paralelamente el Grupo de Trabajo tuvo que superar una serie de condicionantes disciplinares admitiendo concesiones interdisciplinares, que en determinados casos pueden causar extrañeza al usuario que accede al Tesauro sin conocimiento interno del mismo. En otros casos con miras a eliminar los significados múltiples de un descriptor se optó por la colocación de calificadores, por ej. Gótico (Estilo), intercalados con el singular/plural y las Notas de alcance.

Otro recurso utilizado fue la de incluir indicadores de facetas, convención que ayuda en la clasificación jerárquica a efectuar ordenaciones arborescentes. Los indicadores de faceta no introducen nivel de profundidad de campo y no pueden ser utilizados como descriptores, aparecen representados entre ángulos <>.

Por último se incluyó la figura del nivelador, (todo aquél término precedido de un asterisco *). Se trata de etiquetas de cualquier nivel de profundidad utilizadas como instrumento de organización interna del corpus del Tesauro, equivalentes a la expresión "No es término de indización".

En cuanto a la Estructura del Tesauro se acordó la creación de dos apartados que acompañan al corpus genérico, nos referimos a los listados asociados y auxiliares. Los primeros incluyen listados de términos polivalentes, con categoría primaria, que complementan la estructura principal de TPHA, éstos pueden ser incorporados en la estructura principal de acuerdo a las necesidades del Sistema de Información, de hecho están incluidos en la estructura asociativa. Los listados auxiliares están formados por identificadores sometidos  a la propia evolución de las distintas bases de datos que utilizan el TPHA. Son listados de identificadores, denominaciones propias de lugares, personas, seres míticos o inmateriales, instituciones, etc., están considerados de segundo nivel y sólo aparecen en la representación jerárquica ya que se encuentran en continuo crecimiento.