Ad verba per numeros

Artículos
Saturday, February 9, 2008, 10:59 AM
David sigue investigando el arte previo de cara a su trabajo de investigación y ha publicado algunas de sus últimas reflexiones. En esta entrada sólo tengo tiempo para ocuparme del comentario que hizo relativo a la longitud media (en número de términos) de las consultas que recibe un buscador y el sesgo que pueden introducir las consultas navegacionales, aquellas que sirven para acceder a un sitio web conocido, p.ej. "paginas amarillas", "euitio uniovi" o "marca".

En relación con el primer punto (estudios estadísticos) creo que le interesaría revisar los trabajos de Jansen et al. (1998), Spink et al. (2001), Jansen y Spink (2000), Wolfram et al. (2001), Spink et al. (2002a), Spink et al. (2002b) y Jansen et al. (2005) que han realizado estudios similares sobre diversos archivos de log.

Por lo que respecta al asunto de las consultas navegacionales y el sesgo que introducen en dichos estudios: no, que yo sepa nadie ha hecho ese estudio que, tal vez, pudiera resultar en un artículo corto interesante aunque habría que discutir un poco los objetivos perseguidos y el método a emplear. En relación con la clasificación (no necesariamente automática) de consultas hay distintos artículos relevantes: Broder (2002) es un clásico aunque Rose y Levinson (2004) también proporcionaron una taxonomía interesante por su nivel de detalle para las consultas informativas. Relacionados tangencialmente con este asunto y con el eventual artículo sobre el sesgo que introducirían las consultas navegacionales podrían estar los trabajos de Lee et al. (2004) o Daumé y Brill (2004).

Otro par de entradas de hoy creo que merecen comentarios aparte pero ahora mismo no tengo tiempo; si en 3 ó 4 días no hay respuesta, ya sabes, dame un toque :)

Y ahora las referencias:



Back Next