La importancia de etiquetar correctamente las cosas (Folksonomias)

En los últimos meses me estoy dando cuenta aún más si cabe de lo importante que es etiquetar correctamente los datos y la información para que las herramientas automatizadas puedan encontrar lo que buscan y así reutilizarlo y remezclarlo.

Folksonomias

Gracias a un correcto etiquetado, los usuarios que busquen algo lo encontrarán con mayor facilidad, incluso cosas de nicho que serían mucho más difíciles de encontrar en categorías superiores.
Por ejemplo si yo estoy buscando una discoteca de Madrid que ponga música electropop, el primer nivel de categorización sería el geográfico, en éste caso España > Madrid. Podría haber incluso una segmentación del geográfico, como por ejemplo la zona (Tribunal, Moncloa, Chueca, etc.) si bien éste nivel de detalle es muchas veces innecesario, dependiendo de lo que se esté buscando.

Después ya si vendría la categorización de segundo nivel, es decir: Discotecas. Pero he aquí que ya no podemos descender más. No podemos crear decenas de sub-categorías de discoteca para todos y cada uno de los estilos musicales actuales y/o futuros. Sería poco práctico y una solución un tanto anclada en el pasado.
El usuario se encontraría entonces con un gran listado de discotecas de Madrid y tendría que ir una por una viendo si, con suerte, dentro de la información detallada de esa discoteca indica el estilo musical que ponen. No sería grato buscar una discoteca de electropop y meterse en una de reggaeton.

Las etiquetas vienen a salvarnos: dejemos que los propios usuarios categoricen el inmenso listado de primer o segundo nivel, en base a su conocimiento (seguro que mejor que el nuestro porque son ellos a fin de cuentas los que van a ese tipo de discotecas).
Ahora alguien entrará en la categoría discotecas, y si a simple vista no encuentra lo que busca, podrá descender y segmentar aún más su búsqueda y seleccionar fácilmente una “etiqueta” que describa de forma mucho más acotada lo que en ese momento ande buscando, ya sea “electropop“, “salsa” o “conciertos“.
Es lo que se denomina Folksonomía (del inglés Folksonomy) en contraposición a la categorización clásica y rígida que propone la Taxonomía (del inglés Taxonomy).


Sin embargo ésto que hasta aquí tiene toda la lógica del mundo y parece perfecto, encierra un pequeño inconveniente, y es que las etiquetas son abiertas y técnicamente ilimitadas (ahora mismo Keevu posee más de 450 distintas). Hay muchas formas de llamar a las cosas. Lo que para una persona es “electropop” para otra es “electro-pop” o “electro” o incluso “pop”.
Por eso, muchas etiquetas son redundantes y se solapan. Otras pueden ser incluso antagónicas (pop versus electro). Y sin embargo, designan el mismo local.

Es un gran problema. Se palia un poco con mayor número de usuarios. A mayor número de usuarios etiquetando una misma cosa, más posibilidades de que las “verdaderas etiquetas” como yo las llamo, o aquellas que designan con mayor exactitud el objeto, salgan a flote, porque serán las que más gente haya usado. Pero cuando tienes pocos usuarios, y cada objeto lo categoriza solo una o dos personas, hay un potencial riesgo de que ésta categorización esté completamente sesgada.
Y no solo eso, sino que añade ruido al resto de objetos que quizá ya estén correctamente etiquetados. Además, en definitiva, no es la solución.

La solución pasa por la definición de ontologías que haga que los homónimos y sinónimos se fusionen en términos individuales para designar los objetos deseados. Éstas ontologías pueden definirse manualmente, pero también de forma automática aunque muy básica por inferencias léxicas o morfosemánticas. Es decir, por eliminación de plurales o pluralización de todo (ej: pijo/pijos -> pijos), eliminación de sexo (pijo/pija -> pijo), etc. o por el contexto.
El contexto da mucho juego. Es lo que ya hace Flickr con sus tag-bundles: definir ontologías que cataloguen, por su contexto, todas aquellas etiquetas que se refieren a una misma realidad. Esa misma etiqueta en otro contexto podría significar una cosa completamente distinta.

Hasta aquí nos hemos centrado en los beneficios para los usuarios, pero no cabe duda que tanto o más importantes son los beneficios para los sistemas que interoperan entre sí y utilizan y mezclan la información de distintas fuentas.
En los últimos años hemos visto el auge de los mashups, y precisamemente muchos de éstos mashups se sirven de una correcta arquitectura y catalogación de la información para funcionar. Si lo que tu llamas perro, en otro sistema lo llaman gato, no vamos a poder comunicarnos correctamente y aunque ambos tengamos una información valiosa que por medios “manuales” podríamos cuadrar, mediante automatismos esto no es posible. Y no olvidemos que a lo que se tiende es a que los sistemas sean interoperables entre sí de una forma automática sin intervención alguna por parte del usuario.

En definitiva un tema apasionante, que no hay que dejar de lado, para proporcionar al usuario la mayor calidad de resultados e información posible, para que encuentre lo que busca sin necesidad de hacer más de 3 o 4 clicks y dar palos de ciego, y también para que nos dirijamos más velozmente hacia esa internet colaborativa y 100% mashable, de standares abiertos, donde la web semántica sea una realidad en éste maremágnum de folksonomías y taxonomías y no una ciencia ficción como ahora, y las webs se nutran y crezcan compartiendo la información.



One Response to “La importancia de etiquetar correctamente las cosas (Folksonomias)

  • 1
    meneame.net
    July 29th, 2009 10:08

    La importancia de etiquetar correctamente…

    C&P: "En los últimos meses me estoy dando cuenta aún más si cabe de lo importante que es etiquetar correctamente los datos y la información para que las herramientas automatizadas puedan encontrar lo que buscan y así reutilizarlo y remezc…

Leave a Reply