Ad verba per numeros

Última hora
Wednesday, February 7, 2007, 01:15 PM
Llego, vía Digg, a este artículo en el que se anuncia que Apple ha obtenido dos nuevas patentes en EE.UU., obviamente de software. La que más me interesa es la segunda: Multi-language document search and retrieval system.

En pocas palabras, Apple ha obtenido la patente para sistemas de recuperación de información que soporten varios idiomas :( ¿Y qué tecnología novedosa va a utilizar? Tokenización y stemming, en cristiano, separar el texto en palabras (eliminando las palabras vacías) y reducir dichas palabras a su raíz o stem... ¿Dónde está la novedad? No idea, dude...

Comencemos con un trocito "jugoso" de la patente:

As a further step, characters with diacritical marks are converted into corresponding unmarked lower case letters, to eliminate match errors that might result from incorrectly accented words.

¡Bravo! Sigamos encontrando "políticos que sudan" cuando buscamos "políticos de Sudán" (ejemplo peripintado sacado de Buscarama).

Pero, eso sí,

While an exemplary embodiment of the invention has been described with reference to languages that are based upon the Roman alphabet, the principles which underlie the invention are equally applicable to languages associated with other alphabets. The presently disclosed embodiments are therefore considered in all respects to be illustrative, and not restrictive.

¡Qué gracioso! La tokenización del chino o el japonés es posible (difícil, eso sí) y el stemming del árabe también es posible (terriblemente difícil) y como Apple afirma lo obvio (que es posible) se ha ganado una patente para poder presionar, en caso necesario, a quien logre lo meritorio: It's not personal, Sonny. It's strictly business.

En resumidas cuentas, otra "mina" más en el campo del software; eso dejando a un lado que a poco que se investigue el "arte previo" deberían aparecer varias publicaciones describiendo sistemas idénticos e invalidando la patente pero, claro está, eso tendría que decidirlo un juez...



Back Next