ARCHIVO MAESTRO PRIETO
Procesamiento de documentos para la Plataforma AMP
Planilla de Datos Heurísticos
Instructivo
En aras de la eficiencia y eficacia del procesamiento de documentos del archivo LBPF -Biblioteca Nacional- para ser vertidos en la base de datos de la Plataforma AMP, es preciso homogeneizar lo más posible las diversas actividades y tareas que implica el proceso. Como sabemos, dicho proceso se divide en dos tareas principales: por una parte, escaneo y OCR, y, por la otra, corrección del texto obtenido y análisis de su contenido.
A tales efectos, se utilizará la siguiente planilla, que no es más que un simple archivo TXT en que se recogerán los datos heurísticos correspondientes a cada documento:

Como se puede ver, se trata de una planilla muy sencilla, específicamente adaptada al diseño y estructura del sistema CMS en base al cual opera la Plataforma AMP. En total se trata de nueve campos (el Título es sólo a efectos de identificación del documento al que se corresponden). Respecto a los cuales, hay que tener en cuenta lo siguiente:
-
Todos los campos son requeridos, es decir, deben ser llenados para consignar el documento en la base de datos. Si algún campo se desconoce debe indicarse desconocido o desc, en el caso del campo referido al año, que sólo acepta cuatro caracteres.
-
El primer campo, Origen, va por defecto, ya que, al tener la misma procedencia, será siempre el mismo para todos los documentos.
-
De los ocho campos restantes, los cuatro primeros (Anaquel, Tramo, Caja y Carpeta) han de ser llenados por quienes trabajan en la fase de escaneo y OCR, que son quienes tienen acceso de primera mano a dicha información.
-
Los cuatro últimos campos (Autor, Lugar, Año y Síntesis) han de ser llenados por el analista, pues todos ellos se extraen del contenido mismo del documento corregido y analizado.
-
Archivos digitales: a la postre, por cada uno de los documentos procesados, se habrán generado los dos archivos de texto con los que se trabajará en la Plataforma AMP a efectos de su consignación: uno, el correspondiente al contenido del documento propiamente dicho (normalmente en formato WORD) y otro el que contiene sus datos heurísticos (en formato txt; el mismo de la planilla) que no son parte del documento en sí, pero de obligado rigor historiográfico.
-
A efectos de evitar contratiempos y errores, estos archivos digitales resultantes del procesamiento de cada documento deben ser guardados de la siguiente manera:
-
el archivo de texto del documento se guardará como nombre del documento
-
el archivo de texto de la planilla como nombre del documento-planilla
Esto permitirá que ambos archivos permanezcan juntos en la lista ordenada con que el administrador de archivos del PC presenta los archivos almacenados en un disco duro o en cualquier otro dispositivo de almacenamiento periférico.
-
Plataforma AMP
Administración
15 de abril de 2026

















