Dale al Twitt

La imagen del día

La imagen del día

La frase del Día...

"La soja se puede mantener un año o más sin venderse" , Luis Miguel Etchevehere, Presidente de la Sociedad Rural

VEO VEO...

Nueva herramienta aumenta la eficacia de las búsquedas en Wikipedia

10.4.12

Se trata de “Swipe”, un prototipo de plug-in que mejora los resultados de exploración ajustándose a la demanda del usuario

Un equipo de investigadores presentará en la próxima conferencia anual World Wide Web de Lyon, en Francia, un nuevo prototipo de plug-in bautizado como “Swipe”, que supondrá un importante avance para las consultas en Internet, al aplicar la búsqueda semántica a la Wikipedia. Con este sistema, lo que se pretende es mejorar los resultados de exploración ajustándose a la demanda del usuario. Las respuestas se extraen de DBpedia, una colección de 3,6 millones de entradas de datos procedentes de las propias páginas publicadas en la enciclopedia online. 

Por Patricia Pérez.


Wikipedia es la enciclopedia en línea más grande del mundo. Fuente: Wikimedia Commons.
 
Wikipedia es la enciclopedia en línea más grande del mundo. Fuente: Wikimedia Commons.
Cada vez se realizan búsquedas más complejas en Internet, frustradas en muchas ocasiones al no obtener la respuesta deseada desde la consulta inicial. Ello se debe en parte a la sobrecarga de información y heterogeneidad de fuentes en la red de redes, por lo que cada vez se hace más necesario contar con métodos de recuperación de información eficientes. Hoy en día, es imprescindible el uso de motores de búsqueda para tal fin, aunque los resultados no siempre son los esperados, variando en función de las palabras clave utilizadas.

Para salvar este escollo, se trabaja en el desarrollo de métodos de búsqueda semántica que, como su propio nombre indica, tratan de aprovechar las propiedades de la semántica (como el estudio del significado de las palabras) para orientar la exploración y así afinar los resultados. Sin embargo, la dificultad de este tipo de búsqueda estriba en que implica una cierta “humanización” de la máquina, al pretender que procese los contenidos de las páginas de Internet, combinándolos y realizando deducciones lógicas.

La pareja de investigadores formada por Maurizio Atzori de la Universidad de Cagliari en Cerdeña (Italia), y Carlo Zaniolo de la Universidad de California en Los Ángeles (Estados Unidos), parece haber desarrollado una herramienta que podría acabar con las temidas palabras clave. Según avanza la revista New Scientist, se trata de un prototipo de plug-in aplicado a la Wikipedia, lo que permitiría a sus usuarios responder a complejas preguntas en las que la mayoría de los motores de búsqueda tropezarían.

Bautizado como "Swipe", por las iniciales en inglés de Searching Wikipedia by example (algo así como buscar en Wikipedia por ejemplos), el software será presentado en su versión demo en la conferencia World Wide Web en Lyon, Francia, foro que se celebra anualmente a nivel mundial para la discusión y el debate sobre la evolución de la web, la normalización de sus tecnologías asociadas y el impacto de las mismas en la sociedad y la cultura.

Modificar el cuadro de información

Con el desarrollo de este programa pretenden convertir en una búsqueda sencilla consultas tan complejas como averiguar qué actrices ganaron premios de la Academia siendo menores de 30 en los últimos 25 años. Para ello, los investigadores desarrollaron Swipe usando MediaWiki, el software en que se sustenta la Wikipedia, pero extrayendo las respuestas de DBpedia, una amplia colección de 3,6 millones de entradas de datos recogidas a partir de las propias páginas publicadas en la mayor enciclopedia de contenido libre para crear una versión web semántica.

Esta información aparece normalmente en un recuadro situado a la derecha de la mayoría de las páginas de la Wikipedia, conocido como Infobox o cuadro de información, en el que se relacionan detalles que ayudan a describir la palabra consultada, tales como fechas, precios, edades, alturas, nombres, lugares, distancias tiempos de ejecución o coordenadas geográficas.

En un nivel muy básico, el objetivo de Atzori y Zaniolo es utilizar esta herramienta a la inversa: Swipe “activa” esos cuadros de información de Wikipedia, permitiendo a los usuarios modificar los datos que aparecen en ellos para realizar de esta forma una nueva búsqueda de aquellas páginas que coincidan con la información alterada.

los profesores muestran cómo utilizar Swipe con la página de Wikipedia de Robbie Williams. Fuente: Swipe
los profesores muestran cómo utilizar Swipe con la página de Wikipedia de Robbie Williams. Fuente: Swipe
Tres pasos

Para ello el proceso consta de tres pasos. En primer lugar, el usuario debe cargar una página ejemplo o modelo en el navegador, es decir, una página representativa de aquello que se está buscando. Así, un usuario interesado en ciudades debe cargar por ejemplo la página de Wikipedia de Boston, aunque valdría la de cualquier gran ciudad. Este paso inicial proporciona el punto de partida para llevar a cabo la consulta real.

Swipe activa ciertos campos de Wikipedia que generan consultas equivalentes pero ejecutadas desde DBpedia. Así, la página ejemplo se parece a la original de la enciclopedia, con la diferencia de que el cuadro de información puede utilizarse y modificarse ahora para introducir los parámetros de búsqueda que definan la consulta.

De esta forma, el usuario especifica la consulta escribiendo en los campos seleccionados del cuadro de información y, a continuación, se realiza la exploración con un simple clic. Swipe devuelve una relación con aquellas páginas de la enciclopedia que respondan de forma más exhaustiva a la consulta realizada.

Atzori pone como ejemplo la búsqueda en Wikipedia de una lista que incluya cantantes norteamericanas menores de 20 años. “Con Swipe en marcha, vaya a la página de cualquier cantante conocido, por ejemplo Lady Gaga, y en el campo donde indica la edad reemplazar 25 por 20, e igualmente sustituir su origen, Nueva York, por América del Norte. El programa convierte eso automáticamente en una consulta a DBpedia que remite a una página con un listado de entradas coincidentes con su búsqueda”, detalla el investigador.

Asimismo, en un vídeo demostración, los profesores muestran cómo utilizar la página de Wikipedia del cantante de pop Robbie Williams para encontrar una lista de músicos llamados Mike que no toquen pop rock –sobrescribiendo su nombre y ocupación, y colocando el no antes del género pop rock–.

Ventajas y limitaciones

El objetivo de los desarrolladores es que Swipe pueda estar disponible “como una opción de Wikipedia algún día”. Aunque el prototipo está en fase experimental, ya tiene seguidores en otras universidades. Es el caso de Nigel Shadbolt, jefe de la web y el grupo de Ciencias e Internet en la Universidad de Southampton en Inglaterra, quien afirma sentirse atraído “por su sencillez y por la forma de emplear los cuadros de información de Wikipedia para crear consultas importantes”.

“Las bases de datos estructuradas como DBpedia representan una base de conocimiento muy rica”, añade, aunque es consciente de la dificultad que entraña su aprovechamiento por parte del usuario de Internet de nivel medio. “Si pudiéramos construir un motor de consulta que fuera utilizable por todos, sería un verdadero éxito”, asegura Shadbolt.

De momento, con Swipe se podrá maximizar tanto la facilidad de uso como el poder de consulta, permitiendo a los usuarios trabajar directamente en las páginas de Wikipedia que abren en sus navegadores. Con ello se da un importante paso “más allá de las capacidades de los motores de búsqueda en la Web, de sus búsquedas orientadas por palabras clave, y hacia una capacidad de consulta mucho más poderosa, hacia la web 3.0 de la que empezó a hablarse hace ya varios años”, destaca Zaniolo.

En el lado negativo, la herramienta tendrá algunas limitaciones cuando haga su debut. Al utilizar DBpedia, aún quedan muchos enlaces por extraer de la enciclopedia en línea más grande del mundo. Además, todavía no puede entender un correcto inglés, por lo que habrá que jugar con los parámetros de la página para obtener buenos resultados.