La ley de los grandes números y el teorema central del límite en dos animaciones

No las voy a reproducir aquí por si se enfada el autor. Me limitaré a mostrar una captura de la animación correspondiente a la ley de los grandes números, y a la del teorema central del límite, La animación completa (hecha con R) y los detalles, en este enlace.

26 de enero de 2011 · Carlos J. Gil Bellosta

Nuevo paquete para procesar texto en R: stringr

Hadley Wickham, el autor de plyr, reshape y ggplot2, ha vuelto a la carga en su exitoso empeño por hacernos cambiar de forma de programar en R. Con su nuevo paquete, stringr, aspira a facilitarnos aún más la vida. En un reciente artículo, enumera sus ventajas: Procesa factores y caracteres de la misma manera (de verdad, muy práctico) Da a las funciones nombres y argumentos consistentes Simplifica las operaciones de procesamiento de cadenas eliminando opciones que apenas se usan Produce salidas que pueden ser utilizadas fácilmente como entradas a otras funciones Incorpora funciones para procesar texto presentes en otros lenguajes pero no en R

20 de enero de 2011 · Carlos J. Gil Bellosta

Navegando por ahí: un (otro) curso de estadística con R

Navegando por ahí he dado con otro curso de R y otro blog muy interesante. Para facilitar la búsqueda a mis lectores, les dejo acá los enlaces directos a los distintos capítulos: Introduccion a R Modelos lineales Modelos lineales generalizados Diseño de experimentos Modelos lineales mixtos Análisis multivariante ¡Buena lectura!

18 de enero de 2011 · Carlos J. Gil Bellosta

Graficaca a tutiplén

Al autor le preocupa de viejo el problema de la representación gráfica de datos. Piensa que tiene más de arte que de ciencia. Tal vez lo dice porque no se le da bien: confunde tonos y colores y desgarbado es el adjetivo que mejor describe sus trazos. Y como casi todo diletante maltratado de las musas, ejerce de crítico. Y voto a Dios que su crítica es acerba. Le irritan todos los gráficos de tarta (menos este), desea toda clase de malaventura al cretino que lleva lo de Excel en Expansión y vive prisionero de otras manías semejantes. ...

5 de enero de 2011 · Carlos J. Gil Bellosta

Noticia de las II Jornadas de Usuarios de R

Hace un año, al acabar las I Jornadas de Usuarios de R, escribí un pequeño resumen de lo habido en ellas en el blog de mi compañero de penas y oficios Raúl Vaquerizo. Este año, con cierta demora (justificada documentalmente) me dispongo a hacer lo mismo con lo que vivimos hace unos días en las II Jornadas en Mieres. Es obligado en primer lugar agradecer a la Escuela Politécnica de Mieres por haberlas acogido y muy en particular a Belén Prendes, quien desde el primer momento impulsó este proyecto. También hay que agradecer la presencia de quienes, desafiado las dificultades planteadas por la nieve y el plantón laboral de los controladores aéreos, acudieron a la cita. ...

29 de diciembre de 2010 · Carlos J. Gil Bellosta

Programación funcional en R: Filter

Quienes acudan a Mieres la semana que viene me oirán hablar de programación funcional en R. Algo de lo que no hablaré pero que dejaré acá escrito como abrebocas es un pequeño ejemplo de cómo la programación funcional hace tu vida más simple y, sobre todo, prolonga la vida de tu teclado. Voy a ilustrar el uso de una función de R que echábamos de menos los usuarios de Python: Filter. Estaba ahí, sí, pero como escondida. ...

24 de noviembre de 2010 · Carlos J. Gil Bellosta

Comportamiento inesperado... ¿sólo por mí?

El otro día, bajo el encabezamiento Unexpected behaviour of min, tapply and POSIXct/POSIXlt classes?, mandé a la lista de desarrolladores de R el siguiente pedazo de código: before <- Sys.time() Sys.sleep( 1 ) now1 <- now2 <- Sys.time() my.times <- c( before, now1, now2 class( my.times ) ## [1] "POSIXct" "POSIXt min( my.times ) ## [1] "2010-10-28 18:52:17 CEST" ### So far, so good... but: my.period <- c( "a", "b", "b" ) tapply( my.times, my.period, min ) ## a b ## 1288284737 1288284780 ## Where did my POSIXct class go? my.times.lt <- as.POSIXlt( my.times min( my.times.lt ) ## [1] "2010-10-28 18:52:17 CEST"; good tapply( my.times.lt, my.period, min ) # $a # [1] 17.449 # # $b # [1] 52 # # Mensajes de aviso perdidos # In ansmat[index] <- ans : # número de items para sustituir no es un múltiplo de la # longitud del reemplazo # # ¿? :( Invito a mis lectores a lo siguiente: ...

2 de noviembre de 2010 · Carlos J. Gil Bellosta

Una (propuesta de) guía de estilo de R

Síntoma del creciente interés por R es el hecho de que Google haya elaborado y publicado una guía de estilo para R. Me he tomado la libertad de traducirla. Espero que a Google no le importe. Es conveniente (Google, yo y, seguramente, muchos otros lo creemos así) atenerse a un código de estilo a la hora de programar. No es este foro en el que enumerar las ventajas que se derivan de ello: si habéis desarrollado código codo con codo con otros, sabréis a qué me refiero; si no, haced caso al consejo de quienes os precedieron y ahorraréis tiempo y dinero. ...

1 de noviembre de 2010 · Carlos J. Gil Bellosta

II Jornadas de Usuarios de R

Ya es oficial: está abierta la inscripción para participar en las II Jornadas de Usuarios de R que tendrán lugar en la Escuela Politécnica de Mieres los días 1 y 2 de diciembre. Me complace también formar parte del comité científico de dichas jornadas y de encargarme del taller avanzado de R (día 1 de diciembre a las siete de la tarde). ¿Nos veremos en Mieres?

29 de octubre de 2010 · Carlos J. Gil Bellosta

¡Qué mala suerte tengo con las anomalías!

El siempre muy benéfico Banco de Santander me ha proporcionado —onerosamente: veráse el porqué— un conjunto de datos con el que ilustrar a los lectores de este blog en el uso del paquete outliers de R. Los datos son los siguientes: dia <- 17:26 precio <- 10 + c( 22, 21, 39, 18, 24, 26, 26,26,29, 28 ) / 100 Los días son los discurridos desde que di una orden de adquisición de un fondo de inversión a través de dicha entidad financiera hasta que tuve constancia de que se había completado: el dinero se había adeudado de la cuenta corriente y las participaciones, aparecían listadas en la cuenta de valores. El precio contiene los valores liquidativos diarios del fondo durante tales días. He aquí su representación gráfica: ...

29 de octubre de 2010 · Carlos J. Gil Bellosta