Ad verba per numeros
Una vez se han implementado los distintos estadísticos de ponderación que mencionaba en la entrada anterior deberíais disponer de un prototipo que recibe texto plano, lo separa en sentencias y frases y calcula el "peso" de cada n-grama.Ahora habría que construir para cada sentencia un vector formado por los n-gramas de dicha sentencia y sus correspondientes pesos. También serán necesarios uno o más métodos para comparar dichos vectores. Para realizar esta comparación deberéis implementar las medidas de similitud que se describen entre las páginas 63 y 67 de este documento.Al finalizar esta tarea debería ser posible calcular la similitud entre cualquier par de sentencias cualesquiera de un texto dado (un valor real comprendido entre 0 y 1).
Back Next
Back Next