rJython: un nuevo paquete para llamar a Python desde R

Ya está disponible el paquete rJython que permite llamar a Python desde R. Aunque todavía no se ha subido a CRAN, puede instalarse así: install.packages("rJython", repos="http://R-Forge.R-project.org") Una vez instalado puede probarse el paquete ejecutando, por ejemplo, rJython <- rJython() a <- 1:4 jython.assign(rJython, "a", a) jython.exec(rJython, "b = len( a )") jython.get(rJython, "b") rJython$exec("import math") jython.get(rJython, "math.pi") jython.call(rJython, "len", 1:3) b <- 5:8 rJython$exec("def concat(a,b): return a+b") jython.call(rJython, "concat", a, b) Arquitectura: Jython y rJava El paquete no está basado en el habitual Cpython sino en Jython, un intérprete de Python desarrollado en Java. El motivo es doble: ...

13 de julio de 2010 · Carlos J. Gil Bellosta

Use SAS para predecir como un pulpo

Para el otoño volverá a tener lugar el congreso de usuarios de SAS en España. El anuncio que me acaba de llegar —con su referencia al ubicuo pulpo Paul— no puede ser más desafortunado. Por si desaparece el enlace, reproduzco con una captura de pantalla aquí lo más sustancioso del mismo: Addenda: Comí el jueves con la más infiel de mis lectoras (creo que ni lectora es) y convinimos en que el mensaje de SAS resulta, cuando menos, insultante para cuantos nos dedicamos al sufrido oficio de la estadística y actividades concomitantes. Entre ambos consensuamos un mensaje alternativo que venía a ser el siguiente: ...

13 de julio de 2010 · Carlos J. Gil Bellosta

Contándoles las papelinas a los "expertos"

Hace un tiempo leí un resumen de un libro sobre la fiabilidad de las predicciones de determinados expertos: a toro pasado se las comparaba con los sucesos reales para ver en qué medida habían resultado acertadas. Las conclusiones pueden encontrarlas mis lectores en cualquiera de los dos enlaces anteriores. En España, ahora, contamos con una página que compara las previsiones realizadas por diversos institutos económicos con los valores reales de las magnitudes que con tanto dispendio de recursos y fanfarria de medios publican de vez en cuando. Está sobrada de efectismo y algo falta de legibilidad, pero no puede ser más oportuna. ...

12 de julio de 2010 · Carlos J. Gil Bellosta

Exagerados

Gracias a la entrañable huelga del Metro de Madrid (digo entrañable porque espero que sea la última y la recordemos con añoranza cuando los conductores de carbono hayan sido sustituidos por otros de silicio más diligentes) he terminado de leer este libro. Podría decir muchas cosas sobre él, pero me centraré en un párrafo que aparece en la página 333 de la edición española de Paidós (de la reedición de marzo de 2010, por referencia). Se trata de una cita del libro Silicon Shock de un tal Goeff Simons, escrito en 1985 (atención a la fecha!) que dice así: ...

4 de julio de 2010 · Carlos J. Gil Bellosta

¿Programa Vd. en SAS? ¡Aprenda a ser indispensable!

Si Vd. programa en SAS (para el caso, en otro lenguaje), si su empresa programa en SAS, estará sumamente interesado en leer lo que aquí le cuento. En realidad, si no tiene demasiado tiempo para leer, puede ir directamente a este artículo. Pero permítale en todo caso que le traduzca del inglés un extracto de resumen: Desafortunadamente, el código fácilmente mantenible necesita menos programadores y menos programadores implica inseguridad laboral. En estos tiempos de crisis, los programadores tienen que aprender a volverse indispensables. […] ...

3 de julio de 2010 · Carlos J. Gil Bellosta

Gráficos en R con símbolos arbitrarios: código, comentarios y fin

Prometí el otro día revelar los secretos (pensaba que no lo eran tanto) del gráfico que mostré en esta entrada. Los impacientes tienen aquí todo lo que necesitan. Tienen que ejecutar primero el guión svg2ps.sh que invoca inkscape para transformar los ficheros svg (incluidos en la descarga) de las banderas (obtenidos de la Wikipedia) en ficheros postscript. El programa src.R genera entonces el gráfico utilizando dos paquetes de R: grImport y lattice. El primero permite convertir postscript en xml y posteriormente en objetos de la clase picture. ...

28 de junio de 2010 · Carlos J. Gil Bellosta

Los "mejores" paquetes de R (II): análisis anual de la red social de los participantes en r-help

Hace un tiempo comencé una serie de entradas, que serán finalmente tres, sobre los “mejores” paquetes de R. Esta va a ser la segunda entrega. Siento haber tardado tanto en realizarla: quienes me conocen saben que ocioso no he permanecido. De mis actividades de este periodo daré cumplida cuenta en entradas subsiguientes. Tengo que añadir también como preámbulo que ha sido una conversación sobre análisis de redes sociales con un ex-compañero muy ducho en apropiarse de contraseñas ajenas la que me ha empujado finalmente a ahondar este estudio que tenía, junto a tantos, postergado en una esquina de mi disco duro. ...

28 de junio de 2010 · Carlos J. Gil Bellosta

useR! 2010

Mientras en España no sabemos aún qué pasa con las II Jornadas de Usuarios de R (de hecho, ni siquiera se han corregido las faltas de ortografía de la página de internet de las primeras), las useR! 2010 marchan a todo trapo: en Gaithersburg, Maryland, los días del 20 al 23 de julio no va a faltar ni rms. No va faltar una charla a cuenta de la empresa a la que otras debieran parecerse. Habrá que tener a mano el enlace para cuando uno de los habituales cretinos encorbatados nos vuelva a espetar eso de pero R es una cosa como tan de… universidad… ...

21 de junio de 2010 · Carlos J. Gil Bellosta

Gráficos en R con símbolos arbitrarios

Hace no mucho, en un blog hermano, se habló de cómo podían utilizarse símbolos distintos en los gráficos de R. También hablé yo de funcionarios y renta per cápita. Ahora combino ambas entradas y algo más de mi cosecha para mostrar un gráfico hecho con R utilizando símbolos arbitrarios (las banderas de cada país). El secreto de cómo lo he hecho (y el código completo, claro) lo revelaré la semana que viene. Entre tanto, ¿a alguno de mis lectores se le ocurre cómo pudo haberse hecho?

18 de junio de 2010 · Carlos J. Gil Bellosta

Algoritmos genéticos para la caracterización de máximos en random forests

En minería de datos se buscan modelos que permitan hacer predicciones acerca del comportamiento de los sujetos del estudio. Pero, típicamente, cuanto más complejas son las técnicas, menos intuición ofrecen acerca del porqué de la predicción, pierden inteligibilidad. Existe una omnipresente tensión entre inteligibilidad (una propiedad altamente deseable, incluso, en ocasiones, por requisito legal) y precisión. Un modelo puede resumir mejor o peor una colección enorme de observaciones, pero en ocasiones los mismos modelos son demasiado complejos o herméticos como para ofrecer una interpretación plausible de los datos: ¿qué caracteriza a las observaciones para las que mi modelo predice los valores más altos (o bajos)? ...

16 de junio de 2010 · Carlos J. Gil Bellosta