R

El paquete MicroDatosEs para microdatos públicos

Comencé hace un tiempo un pequeño paquete de R, MicroDataEs, para importar automáticamente a R ficheros de microdatos distribuidos por los diversos organismos estadísticos (españoles, por acotar el ámbito). El objetivo es facilitar el análisis de este tipo de datos a los usuarios de R y como consecuencia:

  • fomentar el uso de R entre aquellos que utilicen frecuentemente este tipo de información y
  • hacer más accesibles estos datos a los usuarios de R.

Quien haya tratado de trabajar, por ejemplo, con los ficheros de microdatos de la EPA que publica el INE comprenderá rápidamente el interés y alcance del paquete. Porque estos datos:

Reetiquetar factores en R

R

La operación que voy a discutir hoy es una que plantea problemas a muchos programadores nuevos en R: cómo renombrar niveles de un factor. Un caso típico ocurre al leer una tabla que contiene datos no normalizados. Por ejemplo,

mi.factor <- factor( c("a", "a", "b", "B", "A") )

donde se entiende que a y A, b y B son la misma cosa. Otro caso similar ocurre cuando se quieren agrupar niveles poco frecuentes como en

mi.factor <- factor(c(rep("a", 1000), rep("b", 500), letters[3:10]))

Para homogeneizar la entrada se recomienda sustituir sobre levels(mi.factor) así:

Hemos cerrado el curso básico de R

R

El curso básico de R ha concluido. Hemos tenido 904 inscritos (aunque de ellos sólo un porcentaje pequeño ha tenido una participación activa) que a lo largo de 5 semanas han seguido el programa que planteamos Juanjo Gibaja y yo.

Quiero dar las gracias a los participantes en el curso y muy particularmente a quienes han contribuido más activamente en nuestra plataforma de preguntas y aprendizaje.

Al acabar hemos hecho una pequeña encuesta entre quienes lo han seguido con los resultados siguientes:

Las IV Jornadas de Usuarios de R están aquí

R

Como imagino que ya sabréis, las IV Jornadas de Usuarios de R están aquí. El anuncio oficial, reproducido debajo, se hizo ayer:

Escribo en nombre de los comités organizador y científico de las IV Jornadas de Usuarios de R para anunciarlas pública y oficialmente.

Tendrán lugar los días 15 y 16 de noviembre en el CREAL, Barcelona y está coorganizadas por el CREAL, el Grupo de Usuarios de R de Barcelona y la Comunidad R Hispano.

¿Afectó el fraude de Barclays al Libor?

Después de la entrada de ayer y de

he decidido mirar a ver qué impacto puede haber tenido el fraude de Barclays, uno de los 16 bancos que aportan datos para calcular el índice, sobre su valor diario.

El procedimiento por el que se calcula el Libor lo describí ayer. Y también indiqué de dónde descargar los datos históricos que proporciona The Guardian. Así que puedo comenzar cargando los datos en R,

Libor, líbor, Fundéu y Barclays, claro

Hace un tiempo pregunté a la Fundéu cómo traducir la expresión over the counter. Pobres, tienen mucho trabajo en esta península asperjada de anglicismos. La respuesta, sinceramente, no me sirvió de mucho: me impedía hacerme entender con mis semejantes.

Hace poco se le planteó también si escribir Euribor o euríbor. Optaron por la segunda por considerar el término como común.

Yo solo estoy de acuerdo con ellos a medias. Por un lado, existe el euríbor (nombre común y propiamente españolizado, con su tilde) que se refiere a cierto precio del dinero (o tipo de interés). Pero existe también el Euribor, que es una medida del euríbor utilizando cierto procedimiento y que, como marca registrada, no se acentúa (como tampoco se acentúan Kodak o Nasdaq).

Gráficos estadísticos y mapas con R

R

Me ha llegado noticia de un nuevo libro sobre R, Gráficos estadísticos y mapas con R recién publicado.

Los autores son Cástor Guisande y Antonio Vaamonde, ambos de la Universidad de Vigo. Y de la ficha del libro extraigo:

En este libro se presentan en primer lugar las técnicas generales para la construcción de gráficos en R, con numerosos ejemplos de aplicación que permitirán al lector utilizar las funciones básicas con soltura, y así poder sacar el mejor partido de R para la construcción de gráficos personalizados.

useR2013, en Albacete

Aunque la noticia ya se sabe desde hace algunos días (y de hecho, la conocía desde antes de que se hiciese oficialmente pública), quiero dejar constancia aquí de ella: el congreso internacional de usuarios de R del año 2013, useR2013!, tendrán lugar en Albacete, en el mes de julio.

Los interesados pueden consultar la página del congreso o seguir su cuenta en Twitter.

Quiero, por un lado agradecer a quienes han hecho posible que esto suceda y muy particularmente a Virgilio Gómez Rubio, a Emilio López Cano —que son, de entre ellos, los que conozco personalmente— su trabajo y desearles mucho éxito.

Hoy ha comenzado el curso básico de R

R

Hoy ha comenzado el curso básico de R. A Juanjo Gibaja y a mí nos ha sorprendido (muy agradablemente, por cierto) el espectacular recibimiento que ha merecido el curso: tenemos prácticamente 700 usuarios registrados.

El programa de la primera semana cubre:

El objetivo no declarado es, sin embargo, que quienes sigan el temario de esta primera semana con aprovechamiento sustituyan Excel por R a la hora de trabajar con tablas (o ficheros csv) y realizar operaciones básicas sobre ellos. ¡Porque no hay color!

Las IV Jornadas de Usuarios de R están en marcha

R

Entusiastas de R todos, regocijémonos: las IV Jornadas de Usuarios de R están en marcha. Aunque el anuncio oficial todavía no se ha hecho, estoy en condiciones de adelantar que este invierno, como viene siendo tradicional y si no se tuercen las cosas, nos veremos todos de nuevo en Barcelona.

Y… hasta ahí puedo leer.

P.D.: También es inminente el anuncio otra gran noticia para la comunidad de usuarios de R…

Hoy hablaremos de r-es.org

R

Hoy voy a hablar del portal de la Comunidad R Hispano, r-es.org. Quiero aprovechar la inusitada popularidad de mi bitácora desde que se anunció el curso básico de R para hacerlo.

Y hacerlo para invitar a todo el mundo a conocerlo, a visitarlo, a participar en él y a mejorarlo.

Porque es posible. Xavier de Pedro lo ha diseñado utilizando Tiki, un gestor documental, que brinda a la comunidad de usuarios la posibilidad, otorga el derecho y, en cierto modo, según se mire, le impone la obligación de enriquecerlo con aportaciones.

La prehistoria de R, según Patrick Burns

R

Para muchos de nosotros, R es algo del siglo XXI. Patrick Burns, sin embargo, es capaz de estirar la memoria hasta hace casi 30 años, 1984, momento en el que S, que era entonces un proyecto experimental de los laboratorios Bell, salió al mundo.

S evolucionó hacia S+ entre 1984 y 1992. Al aparecer R, la situación era aproximadamente así:

Y, de hecho, en las primeras versiones de R, el código (extraído del artículo R: Lessons Learned, Directions for the Future de Ross Ihaka) tenía esta pinta: