Scroll Top

Búsqueda por citas en SCI y PCI

Por Bernabé Zea Checa

Bernabé Zea Checa

 

Bernabé Zea Checa ha trabajado en las áreas de patentes, transferencia de tecnología y recuperación de información desde su graduación en 1988. Durante toda su vida profesional, ha formado a personas desde su puesto en el Centre de Patents de la Universitat de Barcelona. Inicialmente, impartió clases sobre recuperación de información, principalmente científica y de búsqueda de patentes. Poco después, comenzó a impartir formación sobre el sistema de patentes y la transferencia de tecnología.

Foto: CC BY Tomàs Baiget

 

 

Desde que a principios de los años 60 Eugene Garfield fundó el Institute for Scientific Information (ISI) y creó el Science Citation Index (SCI) –la primera obra de una colección que poco a poco ha ido cubriendo distintos campos del conocimiento–, las búsquedas por citas (referencias de otras obras) se han ido convirtiendo en algo habitual para los profesionales de la información.

Algunos de los propósitos para los que fue concebido el SCI son imposibles de realizar mediante cualquier otra fuente de información. Por este motivo los productos del ISI han tenido un gran éxito, y actualmente incluyen el Science, Social Sciences, Arts & Humanities, y CompuMath Citation Indexes, además de algunos índices de citas para campos específicos, que han sido posibles por la aparición del cd-rom como soporte de información.

Sepamos lo que no ofrece…
Sin embargo, la obra de Garfield adolece de algunas limitaciones que, de no tenerse en cuenta, pueden dar lugar a una información incompleta y sesgada. Estas limitaciones son especialmente importantes en el campo de las ciencias, en el que se va a centrar la exposición de este artículo:

  1. La cobertura del SCI, pese a ser una de las mayores fuentes de información existentes, es relativamente pequeña. Debemos pensar que el SCI es multidisciplinar y cubre, entre otros, los campos de la química, física, biología, medicina e ingeniería. Por tanto, su contenido no puede ser comparable con las fuentes de información especializadas existentes para cada uno de estos sectores, como Chemical Abstracts, Inspec, Biological Abstracts (Biosis), Index Medicus (Medline) y Excerpta Medica (EMbase), Engineering Index, respectivamente.

    Por otro lado, en su cobertura ignora completamente las patentes, que, al menos en el campo de las ciencias aplicadas, no hay ninguna duda de que son la fuente de información más importante –debido a su contenido, que en muchos casos no se vuelve a publicar en ningún otro documento, y a su pronta aparición con respecto a las demás fuentes de información, al ser resultado de largas investigaciones y largos períodos de revisión por pares–.

  1. El contenido de las referencias del SCI es otra de sus limitaciones importantes. En un mundo de información en el que la tendencia es ir hacia las bases de datos de texto íntegro, el SCI sólo empezó a incorporar los resúmenes –del propio autor– a partir de 1991.

Si bien la indización de los trabajos citados (o sea, la inclusión de la bibliografía citada por el autor en cada registro o referencia bibliográfica) es una cualidad única de este producto, el resto de información de sus referencias es muy escaso, tanto a la hora de realizar búsquedas, como en el momento de consultar los registros recuperados.

…además de lo que sí

Ante lo expuesto anteriormente, es evidente que la principal función del SCI es dar a conocer quién está citando el trabajo de un determinado investigador, cosa especialmente importante en ambientes académicos, donde es preciso saber el impacto de los trabajos llevados a cabo; y, por otro lado, evaluar la calidad de las revistas donde publicar basándose en la frecuencia de las citas de los trabajos contenidos en ellas.

El estudio de los documentos citados y citantes de un artículo también puede ser útil para llevar a cabo búsquedas “pseudotemáticas”, ya que es de suponer que los trabajos relacionados por citas tendrán un fondo temático común. Es lo que se conoce como “idexación por citas”.

Cómo operar
Una vez establecida la utilidad de SCI, es decir, localizar los documentos que citan el trabajo de un determinado autor, se debe decidir cómo y dónde llevar a cabo esta búsqueda.

El SCI indiza las referencias citadas según el nombre del primer autor del trabajo, seguido de los datos bibliográficos de la publicación. Debido a esta política de indización las consultas eran, hasta hace poco tiempo, especialmente tediosas, ya que para localizar las citas de todos los trabajos de un autor, y no sólo de aquellos en que figurara como primer autor, se debían conocer e introducir una por una todas las publicaciones del autor en estudio. Este hecho hacía que este tipo de búsquedas no fueran efectivas para autores prolíficos a la hora de publicar.

La especial incorporación del SCI en STN (distribuidor de bases de datos online cuyo nombre inicial era Scientific and Technical Network) ha hecho que este problema haya quedado solucionado. La diferencia en la calidad de la implementación de la base de datos SCI en STN con respecto a otros distribuidores de información es tan grande que el propio ISI ha recomendado el uso de este host.

Y realmente no es común que un productor de información se decida a inclinarse por uno de los servicios online que distribuye sus bases de datos.

Ventajas de STN
En STN es posible llevar a cabo una búsqueda por nombre de autor en las bases de datos más importantes de ciencia y tecnología para localizar todos los trabajos en los que ha intervenido. A partir de este conjunto de referencias, y mediante una única orden, se pueden convertir las publicaciones localizadas al formato de citas del SCI y efectuar la búsqueda para conocer todos los documentos que citan a este autor, aunque no sea el primero en firmar.

De esta manera unas pocas instrucciones pueden sustituir la entrada manual de decenas o incluso centenares de referencias; y, además, no es necesario conocer previamente los trabajos del autor. En otras palabras, el conocimiento exhaustivo de los trabajos citantes para elaborar un currículo se ha convertido en algo mucho más sencillo y la base de datos SCI es más útil ahora que nunca.

Conocer qué ofrece cada fuente
Las mejoras descritas en el párrafo anterior, y la mayor utilidad que puede tener SCI gracias a la particular implementación en STN, no deben llevar a pensar que esta base de datos es la solución a todos los problemas.

En mi opinión, el SCI se está utilizando de forma inadecuada. Una mirada a los folletos del ISI nos indica algunos usos de la base de datos, entre los que cabe destacar la posibilidad de seguir los trabajos de un determinado autor. En este caso se debería valorar la utilización de bases de datos más especializadas como Chemical Abstracts o Biosis, que poseen una mayor cobertura de documentos en sus campos específicos y también recogen patentes.

Posiblemente el uso del SCI se debería limitar a los autores que trabajan en la frontera de varios campos, donde una base de datos multidisciplinar puede ser de gran utilidad.

Otra de las posibilidades que indican los folletos del ISI es la de mantenerse informado y al día, aunque por los mismos motivos mencionados antes no es la fuente más recomendable –aunque sí haya que valorar la rapidez de proceso que consiguen al ahorrarse la indización con descriptores–. Y, por supuesto, no se debe utilizar para búsquedas temáticas retrospectivas, ya que no hay que olvidar que los documentos previos a 1991 sólo tienen el título como campo de búsqueda temático.

Búsqueda por citas
La última posibilidad, y más importante, del SCI es el empleo de las referencias citadas y citantes como herramientas de búsqueda temática. Ya se ha indicado que el hecho de una cita implica una relación entre el contenido de dos documentos, y aunque muchas veces el resultado de estas búsquedas puede ser espectacular, ello no siempre es así.

Hay algunos factores que pueden hacer inoperantes las búsquedas temáticas por citas. Por un lado, las publicaciones académicas tienen entre uno de sus objetivos el prestigio de los autores. Bajo este precepto es fácil entender que, en algunos casos, existan autocitas, referencias a grandes investigadores, o citas de publicaciones especialmente importantes en el área general de trabajo, que pueden dar lugar a un gran ruido en la búsqueda.

Por otro lado, y mucho más significativo, es el posible desconocimiento del investigador académico del estado de la técnica actual. Ya se ha comentado la gran importancia de las patentes en los campos de investigación aplicada, y no es menos cierto que esta fuente de información es ignorada en muchos casos por los investigadores que no forman parte de las empresas, que son los que publican con más asiduidad.

Así, lamentablemente es frecuente encontrar grupos de investigación que se mantienen informados mediante Current Contents (la versión impresa de SCI subdividida en diversas series de temas específicos), que no recoge las patentes.

En mi experiencia, es normal encontrar patentes que anticipan casi por completo el trabajo que se lleva a cabo en los grupos de investigación de las universidades o, cuando menos, patentes o incluso artículos desconocidos por los investigadores muy próximos a sus líneas de trabajo.

Por último, también se puede dar el caso de que, pese a conocer algún documento pertinente, el autor se decida a omitirlo para evitar que vaya en contra de su publicación.

La detallada exposición de los inconvenientes que tienen las búsquedas temáticas por citas en SCI no se ha hecho con el fin de desprestigiarlas. Estoy convencido de que pueden ser muy útiles. Mi intención ha sido plasmar estos defectos para poder ilustrar en mayor medida las ventajas de buscar en el Patents Citation Index, la última gran base de datos de la empresa Derwent Information.

Patents Citation Index
El PCI, accesible en Dialog y STN, contiene todas las citas que aparecen en las patentes de 16 oficinas de patentes (entre las cuales no está la Oficina Española de Patentes y Marcas), tanto las realizadas por el propio solicitante como las encontradas por los examinadores de las oficinas en las búsquedas de oficio.

La cobertura temporal es relativamente reciente para la mayoría de oficinas, ya que empieza a mediados de 1994, aunque en el caso de las solicitudes de los EUA se remonta a 1983, y para las solicitudes europeas y PCT (Patent Cooperation Treaty, de la OMPI) a 1978, fecha que coincide con la entrada en funcionamiento de estas oficinas.

Posiblemente, la principal finalidad de la base de datos PCI es la ejecución de búsquedas retrospectivas a través de las citas de las patentes. Los resultados que se obtienen en este tipo de consultas son magníficos, y las búsquedas son útiles para todos los campos de la ciencias aplicadas.

En mi opinión, siempre que se haya localizado una patente interesante está justificado hacer una búsqueda por citas en el PCI, con la excepción quizá de las investigaciones sobre productos químicos concretos, ya que los números de registro de Chemical Abstracts Service son una herramienta que nos permite una gran exhaustividad. Este no es el caso del resto de búsquedas de química, para las cuales también puede ser útil el PCI.

En PCI hay más que patentes
La primera ventaja de PCI es su cobertura de documentos. Ya se ha comentado la importancia de consultar las patentes, pero esta base de datos no se limita a ellas, ya que en las búsquedas que se llevan a cabo en las oficinas de patentes se tienen en cuenta todos los antecedentes de la invención, y, por lo tanto, si hay un artículo interesante también aparecerá citado.

Otra ventaja de PCI es la calidad de sus citas, fundamentada en el conocimiento detallado del estado de la técnica por parte de los solicitantes de las patentes. Es lógico pensar que una empresa antes de invertir enormes cantidades de dinero en investigación realice una búsqueda exhaustiva para conocer los antecedentes de la invención.

En la industria los gastos en I+D sólo se amortizan si ayudan a sacar un producto al mercado, ya que el prestigio tiene un valor diferente que en las instituciones públicas de investigación. Además, en algunos países, como Estados Unidos, el solicitante está obligado por ley a identificar todos los documentos relevantes que conozca, pudiendo perder sus derechos si deliberadamente oculta información.

Pese a lo dicho en el apartado anterior, todavía hay empresas que se embarcan en la solicitud de patentes sin haber realizado previamente una buena búsqueda bibliográfica, o bien que ocultan información que podría ir en contra de sus derechos. Sin embargo, la existencia de búsquedas de oficio en la tramitación de las patentes hace que estos problemas queden solucionados.

Detectives tecnológicos
El examinador de la oficina de patentes tiene la función de encontrar el estado de la técnica más cercano a la invención, y para ello posee medios que no están al alcance de otros profesionales de la información, como pueden ser bases de datos propias o colecciones de documentos clasificados internamente de forma coherente.

Sede de la European Patent Office (EPO) en Múnich, Alemania

 

En un viaje a la Oficina Europea de Patentes (EPO) pude conocer un examinador que llevaba 20 años trabajando, de forma exclusiva, en la elaboración de informes del estado de la técnica relacionados con termómetros. Yo había llevado un ejemplo sobre un termómetro, que me había dado muchos problemas a la hora de elaborar un informe, para ver cómo se trabajaba en la EPO, y este examinador me supo nombrar los documentos más pertinentes prácticamente de memoria, incluyendo algún artículo.

Las fuentes de información accesibles actualmente, sin contar parte del sector químico, no permiten hacer búsquedas exhaustivas. Sin embargo, si conocemos un documento pertinente, podemos conseguir gracias a PCI un informe completo elaborado por un especialista –como mi examinador del termómetro– que utilizaría en su elaboración los mejores medios disponibles.

Otros objetivos informativos
Además de las búsquedas temáticas por citas, la base de datos PCI se puede utilizar para solucionar algunos problemas muy concretos, como pueden ser los siguientes:

  • Control de la competencia.
    La implementación de un servicio de vigilancia para conocer quién cita las patentes de una empresa permite saber quién está investigando en el mismo campo, e incluso preparar oposiciones –impugnaciones– a solicitudes de patentes cercanas o pedir royalties ante la explotación de patentes dependientes (patentes derivadas de otras que pueden pertenecernos). Es seguro que a todas las empresas con cartera de patentes propia les interesaría un servicio de este tipo.
  • Oposiciones.
    El sistema europeo se basa en el informe del estado de la técnica de sus examinadores a la hora de conceder una patente. Una vez ésta ha sido concedida, hay un plazo de 9 meses para presentar oposiciones. En todo el proceso de patentar pueden pasar varios años, en los cuales, si la patente se ha extendido a otros países, se pueden haber publicado informes del estado de la técnica diferentes al europeo, que pueden aportar nuevos documentos útiles ante una posible oposición.Ya se sabe que la realización de una búsqueda 100% exhaustiva es imposible, por lo que los distintos enfoques que dan las oficinas de patentes a sus búsquedas pueden permitir localizar información complementaria muy valiosa. A este respecto es interesante hacer notar que el 80% de las citas de la Oficina de Patentes de Estados Unidos (US Patent Office) son patentes norteamericanas, mientras que en los informes europeos el 50% de los documentos citados son europeos.
  • Localización de patentes importantes.
    En muchas ocasiones un primer descubrimiento científico da lugar al rápido desarrollo de un sector de la técnica. Como ejemplo se pueden citar las patentes de Stanley Cohen y Herbert Boyer, en las que se basó la ingeniería genética tal como la conocemos actualmente. Estos primeros documentos son muy difíciles de localizar, debido a que en el momento de su aparición la indización existente no los podía recoger adecuadamente, pues eran técnicas completamente nuevas. En cambio, la búsqueda por citas permite localizar fácilmente estas patentes revolucionarias debido a que las patentes posteriores que se basan en las técnicas se ven obligadas a citar el primer documento.

Conclusión
Antes de finalizar este artículo, me gustaría hacer un breve resumen de las ideas que he ido exponiendo.

En relación con el SCI, la implementación de esta base de datos en STN es la mejor existente, y permite avanzar en gran manera en la elaboración de los currículos de citas. Esta misma base de datos se puede utilizar para hacer búsquedas temáticas por citas, pero normalmente no debe ser la fuente de elección para hacer búsquedas por temas o para mantenerse al día en la información. Para estas finalidades deben utilizarse bases de datos más específicas y con mejor cobertura de los diferentes campos, como puede ser Chemical Abstracts en química.

Por su parte, PCI es una base de datos que permite completar las búsquedas temáticas y cuyos resultados en tiempo y dinero pueden ser mucho más efectivos que una búsqueda tradicional.

Por lo tanto: ¡no olvidemos usar las citas a la hora de plantear las búsquedas!

Bernabé Zea Checa
Centre d’Estudis de Documentació de Patents (CEDP), Universitat de Barcelona.
Diagonal, 647. 08028 Barcelona.
Tel.: +34-3-339 37 02 / 411 15 77; fax: 411 26 11
segurazea@mafalda.qui.ub.es

Esta información se publicó en la revista Information World en Español (IWE), n. 46, julio-agosto de 1996, pp. 9-12.