R-node, una interfaz "web" para R

Acabo de tener noticia de R-node, una interfaz web para R. Permite abrir una sesión de R remota (o local) a través del navegador e interactuar con R como a través de la consola habitual. Los interesados deberían visitar esta demo y, tal vez, el código fuente en Gitorious.

31 de enero de 2011 · Carlos J. Gil Bellosta

Pensiones: ¿duros a pesetas?

El exministro de trabajo Luis Martínez Novalha escrito un artículo en El País sobre el sistema de reparto en las pensiones. Como economista que es, defiende su tesis con datos. Comienza calculando las cotizaciones de un _ucrónico _español que hubiera de jubilarse hoy: […] yo he hecho un sencillo ejercicio de ucronía consistente en indagar lo que habría ocurrido si en España, en el año 1974, hubiera existido un sistema de capitalización, y un trabajador que hubiera comenzado a trabajar en ese año habría ahorrado en su fondo de pensiones la misma cantidad a lo largo de su carrera laboral (35 años) que la Seguridad Social estableció año a año como base máxima y como tipo de cotización un 28,3%. Ese fondo, que solo invirtió en mercados financieros españoles (Bolsa de Madrid y mercados de deuda) supongo que habría compuesto su cartera de inversión renta fija/renta variable en un ratio 47,4/28,5 y fijó comisiones que entre gestión y depósito se elevaron a un 1,5% sobre el capital acumulado a lo largo de 35 años. En ese caso, y con todos esos supuestos, el trabajador habría acumulado un capital de 479.003,43 euros al que se le mermaron 95.233,50 euros en comisiones (19,88% del capital) que dejaron la cifra disponible para comprar una prima de seguro de rentas vitalicias en 383.769,93 euros. ...

28 de enero de 2011 · Carlos J. Gil Bellosta

Nueva competición de minería de datos: reconocimiento de instrumentos musicales

TunedIT ha organizado una nueva competición de minería de datos, ISMIS 2011 Contest: Music Information Retrieval, que forma parte del 19th International Symposium on Methodologies for Intelligent Systems. Consta de dos tareas distintas: reconocimiento automático de instrumentos musicales y reconocimiento automático de estilos musicales. Existen más de 200 MB de datos que analizar y los premios son de 1000 USD por tarea. Una solución a estos problemas sería útil a la hora de indexar, organizar y realizar búsquedas dentro de datos multimedia ¿Algún voluntario entre los lectores de esta bitácora?

27 de enero de 2011 · Carlos J. Gil Bellosta

La ley de los grandes números y el teorema central del límite en dos animaciones

No las voy a reproducir aquí por si se enfada el autor. Me limitaré a mostrar una captura de la animación correspondiente a la ley de los grandes números, y a la del teorema central del límite, La animación completa (hecha con R) y los detalles, en este enlace.

26 de enero de 2011 · Carlos J. Gil Bellosta

¿"Acaban" las descargas "ilegales" con la cultura?

Corre por ahí la especie de que las descargas impropiamente llamadas ilegales, la piratería y algunos otros apocalípticos jinetes de la modernidad van a acabar con XXX (sustitúyase XXX por la música, la cultura, el cine o los libros). Nos lo dicen los expertos en cantar. Pero, ¿qué nos dicen los expertos en contar? Véamoslo en el capítulo 4 (Cultura y Ocio) del Anuario Estadístico de España 2010. Cine Los datos de producción cinematográfica están disponibles entre 2002 y 2008 (el Ministerio de Cultura, que se encarga de proporcionar el dato, no sabía todavía en 2010 cuántas películas se habían rodado en 2009). El número de largometrajes (incluidas las coproducciones) realizadas en España ha pasado de 106 en 2002 a 173 en 2008 manteniendo una tendencia creciente en el periodo. ...

25 de enero de 2011 · Carlos J. Gil Bellosta

La inesperada aparición del ahorcamiento inesperado

Procrastinando, he dado con este artículo en una bitácora que sigo esporádicamente. Mis lectores no van a entender ni papa de lo que sigue si no siguen el enlace y se enteran de qué va. ¿Ya? Pues continúo con un comentario que el filtro de _spam _de dicha bitácora no me ha dejado publicar. Recoge el siguiente razonamiento: Supongamos que tenemos cinco damas llamadas Lunes, Martes, Miércoles, Jueves y Viernes. Y un condenado a muerte que tiene que ser ahorcado en la semana que comienza. Este ha pedido al alcaide como postrera voluntad no saber la noche previa si va a ser ahorcado al amanecer: quiere dormir plácidamente las últimas horas de su vida. ...

24 de enero de 2011 · Carlos J. Gil Bellosta

Verdades, mentiras, estadísticas... y autopistas radiales

Sin ser un as de las finanzas, resulta más que evidente que la inversión que en su día se hizo para convertir el tramo Madrid-Zaragoza de la N-II en autovía fue más que rentable. La obra fue financiada por el estado y su uso fue gratuito desde el primer día. Pero conforme fue mejorando la red de infraestructuras españolas, la estimación de la rentabilidad de cada euro adicional de inversión en ellas se ha ido complicado. ...

21 de enero de 2011 · Carlos J. Gil Bellosta

Nuevo paquete para procesar texto en R: stringr

Hadley Wickham, el autor de plyr, reshape y ggplot2, ha vuelto a la carga en su exitoso empeño por hacernos cambiar de forma de programar en R. Con su nuevo paquete, stringr, aspira a facilitarnos aún más la vida. En un reciente artículo, enumera sus ventajas: Procesa factores y caracteres de la misma manera (de verdad, muy práctico) Da a las funciones nombres y argumentos consistentes Simplifica las operaciones de procesamiento de cadenas eliminando opciones que apenas se usan Produce salidas que pueden ser utilizadas fácilmente como entradas a otras funciones Incorpora funciones para procesar texto presentes en otros lenguajes pero no en R

20 de enero de 2011 · Carlos J. Gil Bellosta

Dos mapas de distribuciones de probabilidad

Si hace unos días enlazamos desde estas páginas a un cuadro sinóptico que contextualizaba los algoritmos de minería de datos, hoy aprovechamos para divulgar la noticia de otra que relaciona las distribuciones de probabilidad más habituales y sus interdependencias. El lector es libre de plantearse (e incluso responderse) estas preguntas: partiendo de la distribución normal que ocupa el centro del diagrama, ¿qué propiedades distinguen a las que quedan por encima de ella de las que quedan por debajo? ¿se observa algún tipo de patrón en la forma de las distribuciones conforme nos desviamos en alguna de las direcciones NE, SE, SO o NO? A quienes busquen una tabla más completa (aunque sustancialmente más prolija) tal vez les satisfaga la que encuentren en este artículo de L. Leemis y J. McQueston (reproducido también en esta chuleta).

19 de enero de 2011 · Carlos J. Gil Bellosta

Navegando por ahí: un (otro) curso de estadística con R

Navegando por ahí he dado con otro curso de R y otro blog muy interesante. Para facilitar la búsqueda a mis lectores, les dejo acá los enlaces directos a los distintos capítulos: Introduccion a R Modelos lineales Modelos lineales generalizados Diseño de experimentos Modelos lineales mixtos Análisis multivariante ¡Buena lectura!

18 de enero de 2011 · Carlos J. Gil Bellosta