Scroll Top

Nube de palabras de una web

nube-palabras-pixabay

Las nubes de palabras se utilizan frecuentemente para ilustrar los textos. Son como una síntesis de los mismos. A veces actúan a modo de brainstorming.

Para que resulten útiles hay que eliminar las palabras vacías o stop words (preposiciones, conjunciones, artículos, verbos auxiliares, etc.). Muchas webs de generación de nubes ofrecen la eliminación automática de esas palabras vacías en inglés, pero si nuestro texto está en castellano tendremos que eliminarlas a mano a partir de una lista de todas las palabras.

En Internet podemos encontrar varios generadores de nubes de palabras, la mayoría gratuitos. Algunos tienen versiones premium:
https://www.wordclouds.com
https://tagcrowd.com
https://www.freewordcloudgenerator.com
https://monkeylearn.com/word-cloud
https://wordart.com
https://worditout.com/word-cloud/create
https://tagcrowd.com
https://www.abcya.com/games/word_clouds
https://wordclouds.ethz.ch
https://www.creativefabrica.com/my-account/?tool=shapecloud

De la lista anterior, sólo los dos primeros permiten obtener la nube de palabras de una web a partir de su url.

Si entramos en https://www.wordclouds.com encontramos esta página:

En el menú desplegable Word List, clicamos la opción “Extract words from web page (URL)”.

Ejemplo:
Esta es la nube de palabras de la web Ediciones Profesionales de la información SL: https://www.scimagoepi.com:

(hemos aplicado la opción Repeat words)

Observamos que varias palabras no aportan nada (que, son, del, etc.) por lo que clicamos en Word List en Edit para eliminarlas.

Y así podremos borrar las palabras vacías que no interesan:

En la figura siguiente presentamos la nube de palabras de Ediciones Profesionales de la Información SL una vez eliminadas algunas palabras vacías:

El sistema permite limitar el número de palabras de la nube a solo a las más frecuentes, para tener así mayor claridad sobre los conceptos principales.
Veamos a continuación la misma nube anterior, pero con menos palabras:

Otra aplicación interesante es la nube de palabras del perfil de un autor o de una revista en Google Scholar Citations. Veamos el perfil de la revista “Profesional de la información”:
https://scholar.google.com/citations?hl=es&user=zv5d9O0AAAAJ

Tomàs Baiget, Editor Jefe
Profesional de la Información / Information Professional
Revista Q1 en Scopus y Q1 en JCR/WoS
Nº 1 mundial en español según Google Scholar Metrics
https://www.directorioexit.info/ficha46
baiget@gmail.com