Pedro Lázaro Rodríguez, Profesor del Departamento de Biblioteconomía y Documentación, Universidad Complutense de Madrid.
https://www.pedrolr.es
Comparto un paper que se ha publicado en la revista Infonomy, que trata sobre JATS.
Hace aproximadamente un año me metí de lleno a aprender JATS y por el camino vi que muchos JATS publicados en revistas tenían errores tanto en su contenido como en su estructura, atributos y elementos. Tras abrir un working project en Zenodo donde he ido añadiendo (y probablemente siga añadiendo) entregas de estos errores y comentarios, pude formalizar todo para publicarlo tipo paper en Infonomy:
Lázaro-Rodríguez, Pedro (2025). La edición de XML JATS a examen: análisis de errores en artículos de revistas científicas ya publicados. Infonomy, 3(4), e25027. https://doi.org/10.3145/infonomy.25.027
En el trabajo comento y analizo errores en JATS ya publicados por diversas revistas. Hay 7 categorías de errores (una incluye comentarios sobre el plugin más común que usan las revistas en el OJS), más un extra sobre precauciones en el uso de la IA generativa para hacer JATS.
Publicar este tipo de trabajos no es fácil, toda vez que puede no sentar bien a las revistas. Pero la realidad es que el paper puede servir para corregir errores, mejorar y/o pedir cuentas a quien les haya hecho los JATS a las revistas. Ojalá que así se reciba y entienda. Considero que estos estudios y análisis son necesarios y parte de las disciplinas de la información, edición y comunicación científicas.
RESPUESTAS
Rafael Repiso, Profesor de la Universidad de Granada
Editor Jefe de Revista Panamericana de Comunicación
Miembro del Grupo EC3 de Investigación (UGR) y de EC3metrics
Estimado Pedro,
Muchas gracias por compartir tu trabajo y por el esfuerzo que supone abordar un tema tan técnico como necesario y yo diría que altruista. He leído con interés el resumen y visto los casos de las revistas y me parece una aportación valiosa para quienes trabajamos en edición científica, especialmente para esas revistas. Curioso que las bases de datos que las indexan no les hagan advertencias sobre estos errores, porque esa también es una función de las bd de revistas científicas.
El análisis que realizas no solo evidencia problemas recurrentes en la implementación de JATS, sino que también abre la puerta a la mejora continua en nuestras revistas. Coincido plenamente en que este tipo de estudios, lejos de ser críticos en un sentido negativo, contribuyen a profesionalizar los procesos editoriales y a garantizar la calidad de los metadatos que acompañan nuestras publicaciones. Estas revistas además externalizan estos servicios y son en muchos casos incapaces de comprobar la calidad de lo que están contratando, por lo que les has hecho un favor, que además podrán subsanar rápidamente.
Enhorabuena por la publicación en Infonomy y gracias por compartir los recursos y el enlace al artículo. Sin duda será de gran utilidad para muchos de nosotros.
—
Marcos Ferreira Sanmamed, Glaux Publicaciones Académicas S.L.U.
Avenida de Bilbao, 20. 15706 Santiago de Compostela (A Coruña)
https://glaux.es
Estimado Pedro:
En primer lugar felicitarte por el esfuerzo y el trabajo realizado para tu artículo.
Me presento: soy Marcos Ferreira, de Glaux Publicaciones Académicas.
He visto tu artículo y, desde tu mensaje en la lista de correo, me ha llegado reenviado por diferentes vías. Llevo desde el año 2003 (antes de la existencia de JATS) trabajando exclusivamente con XML y, a día de hoy, somos los mayores productores de JATS en España (en número de páginas y artículos procesados).
Me he tomado la libertad de realizar una revisión de pares “abierta” y te remito el artículo con notas que deberían haber sido incluidas en el proceso de revisión de pares. Encontré varios problemas con el artículo, desde su título (que me parece ambicioso) al empleo de términos que inducen a generar confusión en nuestro sector: el de las publicaciones académicas. Como verás en las notas no es lo mismo un error que un fallo. El empleo de XML exige precisión, lo mismo que la terminología para analizar fallos, errores y causas.
Que conste que me alegra ver esfuerzos como el que has realizado. Ya me gustaría ver a más profesionales de Biblioteconomía y Documentación animarse a leer XML como has hecho.
No conocía Infonomy, ya la he añadido a mis favoritos para ver qué artículos interesantes pueden aparecer en ella. Veo que es una publicación de reciente aparición, pero su comité editorial y consejo científico tiene nombres que todos conocemos en este país. Es por este motivo que me ha sorprendido un tanto el texto a medida que avanzaba en su lectura. Desde mi humilde opinión creo que se ha acelerado un poco la revisión de pares, o estos no eran especialistas en XML (con todo mi respeto).
¿Por qué digo esto? Te comento:
- El título es muy ambicioso, desde mi perspectiva: son 15/20 ejemplos de XML que has analizado pero esto no indica que sea un problema generalizado. Para ser científica una publicación debe emplear números: ¿cómo de representativa es la muestra? ¿qué criterios se has seguido para seleccionar estos artículos y no otros?
 - Se indican como errores algo que son fallos. No es lo mismo y es importante ser precisos si queremos aportar a la comunidad para que el conocimiento en XML y formatos interoperables se generalice.
 - No se explica qué tipo de validaciones hay en XML, o qué es RELAX NG y Schematron (ambas son normas NISO de interoperabilidad).
 - Por las capturas en el artículo parece que solo has validado con JATS4R. No se puede validar cualquier tipo de XML con cualquier validador. Se ha de emplear el propio que se corresponda con la declaración DTD del artículo.
 - Por las capturas el artículo se redactó a finales de julio. Por este motivo, simplemente, creo que el proceso de revisión pares ha sido insuficiente. Mi evaluación hubiera sido reenviar para revisión e iniciado una segunda ronda.
 - Ciertas secciones requieren más profundidad. La introducción es demasiado general y detallada, sin embargo la sección 2 Material de trabajo y metodología de análisis es ínfima.
 - No todas las subsecciones de “3. Análisis de errores en XML JATS” deben formar parte de esta sección.
 - En ninguna parte del artículo se explica que se entiende por “interoperabilidad” y si lo detectado en tu análisis afecta a que los datos se transmitan entre sistemas. Hay varios que sé que no son problemáticos, sin embargo están en “errores”. Hay otros, que has detectado muy bien, que sí que son “catastróficos” e impiden la diseminación directamente.
 
Y paro aquí con la lista. Espero que te llegue el PDF con mis notas. Que sepas que para este correo me he descargado la mayoría de los casos tratados:
Y los he abierto con el software específico para realizar este trabajo: un editor “en vivo” de XML.
Me ha sorprendido en algunos casos el número de errores que presentan (concuerdo contigo Pedro):
Artículos como el tuyo son muy necesarios. Te animo a que continúes y, si alguna vez quieres consultar algo, sepas que tienes mi puerta abierta.
En aras de la ciencia abierta remito mi declaración de conflicto de intereses: Declaro que las revistas Quaderns de Psicologia y Aula de encuentro son marcado nuestro, lo que puede explicar mi énfasis en distinguir fallos de errores de XML (y más cuando somos los únicos que trabajamos en este país “en vivo” y con un Schematron propio).
Al equipo de Infonomy sí que le hago un par de recomendaciones, con todo el respeto del mundo:
- En las indicaciones para autores no aparece el modelo de citación/referenciación. Ha sido algo que me ha llamado la atención nada más comenzar a leer. A lo mejor se trata de un estándar que no conozco, que puede ser. El caso es que las citas y referencias plantean problemas. En una revisión de pares esto se detecta muy rápidamente (ya no os digo si disponéis del XML del artículo).
 - En artículos técnicos como el que comento, es mejor una revisión de pares pausada y con expertos en la temática. Publicar muy rápido puede llevar a aumentar la confusión en la comunidad a la que servimos.
 
—
Pedro Lázaro Rodríguez, Profesor del Departamento de Biblioteconomía y Documentación, Universidad Complutense de Madrid.
https://www.pedrolr.es
Qué interesante tu mensaje, me parece que me estás atacando gratuitamente. Te ha faltado decir que salgo mal en la foto. Supongo que te habrás u os habréis dado por aludido, y eso en parte me alegra. Creo que tu revisión abierta sí que es ambiciosa. ¿Distinguir entre fallo y errores? Magnífico. Muchos errores tendrán su origen en fallos. En cuanto a lo que comentas del validador, el de JATS4R incluye los respectivos a las DTDs versión 1.0, 1.1. 1.2 y 1.3. De la 1.4 aún no pero ningún trabajo analizado estaba con la 4. Si llevas tanto tiempo trabajando con XML deberías saberlo. Además, lo pone en la misma herramienta: “This JATS4R validator will validate an XML document against the appropriate JATS DTD (NISO JATS version 1.0, 1.1, 1.2 or 1.3), plus recommendations that have been published on the JATS4R website”. Pero no solo eso, en el trabajo, cuando comento los errores, enlazo a las DTDs de cada uno.
Tú mismo en tu mensaje me comentas esto: “Me ha sorprendido en algunos casos el número de errores que presentan (concuerdo contigo Pedro)”.
Hablas de errores cuando tu principal crítica se refiere a que yo hablo de errores y no de fallos. Es curioso.
En definitiva, no entiendo tu reacción a mi trabajo. Supongo que todo viene por el conflicto de interés que comentas en tu mensaje.
—
Salvador Perelló Oliver, Departamento de Ciencias de la Comunicación y Sociología,
Universidad Rey Juan Carlos.
Campus de Fuenlabrada, Edificio Departamental I – Despacho 040
Camino del Molino, 5. 28942 Fuenlabrada (Madrid), España
https://servicios.urjc.es/pdi/ver/salvador.perello
Mi nombre es Salva Perelló y soy el fundador y responsable de la revista ‘methaodos’ que ha aparecido en este particular artículo sobre los XML-JATS.
Aunque soy un fanático de la polémica, por una vez y sin que sirva de precedente, solo me gustaría plantear algunas cuestiones muy menores, pero en lo simbólico importantes para mí:
1º No soy especialista en cuestiones técnicas profundas, sin embargo soy el único responsable de las decisiones operativas que se adoptan en ‘methaodos’. Por tanto, si en algún momento me expreso en primera persona es precisamente para asumir todos los aspectos técnicos que, según algunos especialistas, podrían no estar funcionando bien.
2º Contrariamente a lo que se ha dicho en algún momento, ‘methaodos’ no externaliza el marcaje de los XML. No hemos contratado jamás a ninguna empresa para realizar este trabajo. Paralelamente, como revista independiente y desvinculada de cualquier tipo de red o plataforma, yo mismo tomé la decisión de no usar la herramienta de marcaje de Redalyc. No estaba de acuerdo con algunas cuestiones que eran para mí innegociables. Durante un tiempo mandábamos los archivos que generábamos, pero nada más.
3º En ese contexto, buscamos una solución de compromiso y completamente independiente para los XML, ya que no nos podíamos -ni podemos- permitirnos externalizar ese proceso a verdaderos profesionales. Para ello en la plataforma de nuestro grupo de investigación ‘methaodos.org’ desarrollamos una adaptación de Annotum, un programa en WordPress desfasado y desactualizado desde hace años y que nosotros revisamos y adaptamos para poder generar los XML que nos permitiera generar los HTML y Mobile que ofrecemos, y a partir de ahí, los ePUb con los que operamos. Los costes de otros programas, p.e. el ofrecido por Adobe, no los podemos mantener y además su curva de aprendizaje era compleja para nosotros en aquel momento. Todos los formatos que ofrece la revista funcionan perfectamente en términos de los objetivos que para mí deben cumplir cada uno de ellos en esta fase de desarrollo de nuestro proyecto editorial, teniendo en cuenta los recursos de los que disponemos, claro.
4º Para mí, por convicción, lo más importante de una revista científica independiente que apuesta por la ciencia abierta de verdad, sin APC’s directos ni encubiertos, no son ni los XML, ni los JATS ni los JOTS si es que estos últimos existen. Y no considero especialmente preocupante que un artículo concreto o varios, presenten fallos o errores del tipo que se plantean aquí. Ojalá dispusiéramos de unos cuantos miles de euros anuales con autorización de elegibilidad para externalizar el marcaje a verdaderos profesionales, pero desgraciadamente no es así. Para mí lo importante es avanzar y mejorar poco a poco ofreciendo sólidos contenidos de acceso libre que faciliten el progreso académico de los autores.
5º Estoy muy orgulloso del trabajo que ‘methaodos’ viene realizando desde su fundación hace 10 años –en circunstancias y contextos extremos– y también de sus logros en términos de posicionamiento, teniendo en cuenta las “economías” de las que disponemos.
6º No procede que entre a valorar ni a reevaluar artículos ya publicados y en algún caso calurosamente aplaudidos. Yo de JATS no sé mucho, y de JOTS –si existen– menos, pero de metodología y evaluación creo que llego al cinquillo, aunque muy justito también. En cualquier caso, me parecen estupendas todas las propuestas de mejora, pero convendría tener presente que no todas las revistas científicas penden de un servicio especializado con una plataforma y un personal técnico dedicado por entero a estos temas. Y hasta es posible que una universidad cuente con un servicio contrastadísimo para estos menesteres, pero los responsables de alguna revista prefieran no depender de terceros, aunque su publicación esté a todos los efectos adscrita a una universidad o centro de investigación.
Gracias por leerme. Es la primera vez que escribo en esta lista que sigo con el máximo interés.
—
Pedro Lázaro Rodríguez, Profesor del Departamento de Biblioteconomía y Documentación, Universidad Complutense de Madrid.
https://www.pedrolr.es
Hola Salvador, agradezco tu mensaje.
Yo también me encargo en una revista de la parte de HTML, EPUB y JATS y en la revista sabemos todo el trabajo que supone. Lo hacemos también sin externalizar nada. Si sirve de algo, en referencia a la conversión a HTML y EPUB las hacemos con Pandoc, software libre y multiplataforma que en apenas dos órdenes te sacan un HTML y un EPUB. Es cierto que yo añado estilos personales y que hay que asegurarse de grabar los cambios que pueden realizarse en las pruebas de maquetación del PDF. Con un DOC bien formato, Pandoc la verdad es que hace magia. Para los JATS programé scripts en python que permiten automatizar en cierto grado el proceso, pero no completamente. Y son muchas horas por artículo.
Entiendo tu convicción sobre lo más importante de una revista científica, y comparto la mía: la de que sea open access diamante. Creo que lo transformativo sería apostar por publicar, revisar y trabajar para revistas open access diamante. Pero bueno, se sale del tema. Referido a JATS, soy bastante crítico con todos los recursos tanto humanos como económicos que se están empleando para ello.
En cuanto a la inclusión de ‘methaodos’ en mi trabajo, creo que lo que comento tiene fácil solución y no requiere de miles de euros ni nada por el estilo. En la Figura 11 de mi trabajo se ve que simplemente sucede que se asigna el idioma español al elemento article-title pero luego el contenido de ese elemento está en portugués. Ya está. No hay más. Esto sucede porque probablemente se haya partido de una plantilla de un artículo en español (por eso el español aparece como el idioma del xml), pero este trabajo va en portugués. Si el trabajo está en portugués, entiendo que el idioma para el xml declarado debería ser el portugués, y en el article-title habría que quitar el xml-lang=”es”. El del título en inglés está bien. Además de eso, está simplemente que en la web del artículo se especifica una licencia y luego en el contenido del JATS otra, pero ahí no me meto.
Sinceramente, estos errores me ocurrieron a mí en los que yo hago. Me di cuenta, los corregí y listo. A partir de ahora presto atención al idioma del artículo para la declaración de los idiomas. Yo con el cambio de año de 2024 a 2025 seguí manteniendo el año del copyright con 2024 para los primeros artículos de 2025. Me di cuenta al tercero o cuarto que hice y lo corregí. Es curioso, porque considero que la revista ARIS que comento en mi trabajo, utilizó como plantilla JATS míos y heredan ese error en el que no han reparado y no han corregido.
En este mensaje hablo de errores. La verdad que me he ido a las definiciones más generales de la RAE, que cualquier persona puede comprobar, y error y fallo aparecen como sinónimos. La crítica de Marcos Ferreira no la comparto. y considero que hablar de errores en XML JATS en la sección 3 de mi trabajo puede referirse a todo lo que concierne JATS como topic: estándar, versiones, herramientas y software para hacerlos, para visualizarlos, etc., Volviendo a lo de la diferencia de error y fallo, si tuviese que diferenciar, y esto es personal, diría que un error lo relaciono más con algo del fundamento, de la estructura de algo; y un fallo, con algo puntual. Sí que pienso que los fallos conducen a errores. Pero bueno, se me dirá que en el contexto de xml…. Y que ya si eso cuando tenga X años de experiencia en el sector… Esto es un tema más sobre la crítica de Marcos. Pero quería matizar porque hablo de error en este mensaje en cuanto a lo del xml-lang.
