
Cindy Carr (al fondo) y Karen Paul trabajan en la nueva unidad de digitalización del BLDSC, Boston Spa, UK. Foto: Phil Starling
El BLDSC (British Library Document Supply Centre) ha empezado unas pruebas de 6 meses de duración de suministro automático de páginas digitalizadas.
Uno de los objetivos es encontrar el sistema óptimo de digitalizar documentos, combinando el reconocimiento óptico de caracteres (OCR) con la indización y posterior recuperación de los documentos.
El BLDSC recibe unas 15.000 peticiones diarias de artículos y otros documentos, la mayoría de los cuales satisface mediante fotocopias. Dispone de una gran nave con decenas de fotocopiadoras. Según sus previsiones, dentro de 6 años, o sea, para el año 2000, espera servir un 25% de las peticiones, recuperando los artículos previamente escaneados y almacenados y enviándolos por líneas de telecomunicación.
Hasta ahora se ha estado llevando a cabo un proyecto piloto, escaneando e indizando 50 revistas, pero el BLDSC está negociando una gran ampliación de este número con los editores.
El primero de los softwares que se evaluará será el PixTex/EFS de Excalibur Technologies. Según Phil Barden, del BLDSC, este sistema es especialmente tolerante con los errores y fallos de deletreo del OCR, y permite escanear e indizar el texto completo simultáneamente.
“Representará un gran salto adelante, si se tiene en cuenta lo costosa que es la indización manual”, dice. “Más adelante probaremos ZyImage, de Information Dimensions, que también combina OCR y recuperación de información, y dos sistemas más que aún no se comercializan.
No se tomará ninguna decisión antes de 6 meses. Luego se ensayará el sistema escogido durante 6 meses más, antes de que se integre en la biblioteca electrónica del BLDSC.
BLDSC. Tel.: +44-937-54 60 60; fax: 54 63 33
—
Esta información se publicó en la revista Information World en Español (IWE), n. 23, abril de 1994, p. 12.