Un lematizador para el español con R (II)

El otro día publiqué mi pequeño lematizador para el español con R. Era el subproducto de un antiguo proyecto mío de cuyos resultados daré noticia en los próximos días.

Pero veo con infinita satisfacción que Emilio Torres, viejo conocido de quienes, por ejemplo, hayáis asistido a las II o III Jornadas de Usuarios de R, ha estado abundando en el asunto y, ciertamente mejorándolo (cosa que, todo hay que decir, tiene escaso mérito): basta mirar los sus comentarios a la entrada original.

Esta entrada es una invitación para que Emilio lidere un grupo de entusiastas de R y del procesamiento del lenguaje natural para que desarrollen un paquete con un lematizador decente del español y cuantas herramientas concomitantes sean necesarias. Y si puede ser —algún día tengo que comenzar a ejercer de presi para otra cosa que no sean papeleos de ministerio en ministerio— en el seno de la Asociación de Usuarios de R.

Porque, coincido con Emilio, la situación de la NLP en español es lastimosa y diríase que la disciplina no existe en este país (y, de paso, en aquel subcontinente).