Ad verba per numeros

Corpora paralelos UE, Hojas de ruta
Monday, May 7, 2007, 09:02 AM
Rubén ha terminado de estudiar la forma de descargar mediante un robot los documentos correspondientes a un sitio web de la Unión Europea para obtener un corpus paralelo en 22 idiomas diferentes.

Ahora debería hacer lo siguiente:

  1. Estudiar el modo de garantizar que su sistema puede funcionar de modo automático sin supervisión.
  2. Documentar dicho estudio y escribir un manual de instalación y usuario para el sistema.
  3. Verificar que los documentos almacenados contienen únicamente la nota de prensa y no todo el código HTML de la página web.
  4. Informar en el blog y en el wiki de la marcha de este trabajo


Back Next