Tutorial: instalación de la extensión de R para RapidMiner

Por popular demanda, voy a explorar cómo de dificultoso es instalar el puente entre R y RapidMiner en Windows y a dejar escrito cómo se hace. Lo instalé hace días en Linux (Ubuntu) sin mayor problema. Pero hay quien parece que haberlos tenido en la ubicua plataforma.

No sé mucho de Windows y las diferentes versiones y configuraciones que pueda tener. Sólo sé que que he probado los pasos de este tutorial sobre un Windows 7 Profesional (creo) de 32 bits.

Los pasos son los siguientes:

  1. Descargar RapidMiner de esta página e instalarlo a la Windows: doble click, aceptar, aceptar, etc.
  2. Tal vez mientras tanto, instalar R y el paquete rJava (de no tener alguno de los dos instalados ya previamente).
  3. Añadir el directorio en el que se encuentran R y R.dll a la variable de entorno %PATH% de Windows para que RapidMiner pueda encontrarlos. En mi instalación son dos directorios distintos: C:/archivos de programa/r/r-2.12.0/bin para R y C:/archivos de programa/r/r-2.12.0/bin/i386 para R.dll.
  4. Tener adecuadamente instalado Java en el ordenador. En particular, tener definida la variable de entorno JAVA_HOME apuntando al directorio que contenga un JRE. Es más que probable que sea necesario uno no demasiado antiguo. En mi sistema he usado éste que está en C:/archivos de programa/java/jre6. Hay otro en el directorio de instalación de RapidMiner que también debería funcionar.
  5. Arrancar RapidMiner. Al iniciarse por primera vez, RapidMiner nos pregunta por el directorio donde ubicar el repositorio. Se puede crear uno para él. Inmediatamente se abre una ventana en la que RapidMiner indica que existen actualizaciones disponibles. Como se aprecia en la captura de pantalla, una de ellas es la extensión para R (imagino que quienes tengan ya instalado RapidMiner pueden acceder a la misma ventana de actualizaciones a través de los menús de la aplicación):

  1. Tras seleccionar la extensión para R y confirmar la selección, aparece una ventana con instrucciones adicionales que se refieren, fundamentalmente, a Java (aunque realmente ya hemos hecho todo eso antes).
  2. Reiniciar Rapidminer. Entonces éste pregunta por la ubicación del fichero jri.dll, que se encuentra dentro de la carpeta del paquete rJava de R. En particular, en mi sistema, está en C:/archivos de programa/r/r-2.12.0/library/rJava/jri.
  3. Reininciar RapidMiner,… et voilà: