¿Tartas? No gracias

Voy a dejar aquí escrito mi argumento. Para que conste. Para tener que repetirlo cada vez que un exceladicto osa objetar. Por pereza. Para no tener sino que dar el enlace y pasar a otra cosa. Porque vamos para la primavera y es mejor dedicar el tiempo a cosas mejores que a dar vueltas sobre el mismo asunto. El uso de tartas para visualizar fracciones está sancionado (acepción segunda) por la escuela básica: ¿quién no las vio representadas en una pizarra cuando oyó por primera vez en su vida mencionarlas palabras tres octavos, numerador y denominador? El que la formación matemática de muchos no llegase mucho más lejos unido a su prominente presencia en el endiosado Excel ha perpetuado su uso en los negocios y publicaciones para el gran público. ...

2 de marzo de 2011 · Carlos J. Gil Bellosta

RStudio, un nuevo editor multiplataforma para R

Noticia fresca, recién salida del horno: RStudio acaba de salir a la luz. Se trata de un nuevo editor multiplataforma y de código abierto de R . Está desarrollado en C++ y corre en Linux, Windows y Mac OS X. Y no puedo decir mucho más de momento. Pero espero los comentarios de todos los entusiastas de R al respecto.

1 de marzo de 2011 · Carlos J. Gil Bellosta

Programación funcional en R: Reduce

Siguiendo con la serie de artículos sobre programación funcional que comencé hablando de Filter() hace un tiempo, trataré hoy la función Reduce(). El contenido de cuanto sigue debería ser familiar de quienes asistieron al Taller Avanzado de R en las II Jornadas de Usuarios de R. Reduce es el segundo de los tiempos de una abstracción popularizado por Google y otros pero que tiene sus raíces en los lenguajes funcionales (Lisp y otros): map-reduce. En resumen, map es la transformación ...

28 de febrero de 2011 · Carlos J. Gil Bellosta

Hay vida feliz más allá del PIB

Igual que reviso mis propios ingresos y gastos, por eso de que vivimos en democracia, me molesto en revisar los números de esas esferas en que me encuadro fiscalmente: ayuntamiento, comunidad autónoma, país (¡pobrecico!) y Unión Europea. Mis dos principales impresiones al examinar las de la Comunidad de Madrid de 2010 fueron: La opacidad (o ininteligibilidad) de las partidas de ingresos: al parecer, estamos en un periodo transitorio en lo concerniente a la financiación autonómica (aunque apostaría bastante dinero a que todos los años desde el 78 lo han venido siendo en mayor o menor grado) y esto hace muy difícil saber quién paga qué, qué son esos fondos de compensación, a qué hacen referencia los ajustes y, sobre todo, cómo se comparan las cifras de un año con las del anterior. Que la recaudación vinculada al IVA y el IRPF descendió un 31% y un 29% respectivamente entre 2008 y 2009. Yo soy autónomo. En cada factura que emito, cargo un 18% de IVA. Y como yo muchos de los restantes autónomos de España (otros “van por módulos”, que es otra historia). Y como nosotros, todas las empresas. Excepto en algunos casos excepcionales (incremento relativo de ventas al exterior (exentas del impuesto) o aumento de la actividad sumergida), existe una relación lineal entre producción y recaudación por concepto de IVA. ...

25 de febrero de 2011 · Carlos J. Gil Bellosta

¡Que trabaje su tía!

De un blog cuya lectura recomiendo, extraigo este gráfico: Se trata de la llamada curva de Beveridge para España, que relaciona la tasa de paro con la de puestos de trabajo vacantes. Los datos relativos a vacantes para España pueden obtenerse de Eurostats. En la gráfica parecen estar representados en una escala distinta (por mil) que en las tablas (por ciento). Pero debieran ser magnitudes comparables. Aquí aparece una explicación de cómo interpretar la curva: en épocas de bonanza económica debería acercarse al eje Y (poco desempleo, muchos puestos vacantes) y en las de depresión, al X (falta de ofertas de trabajo, desempleo elevado). ...

24 de febrero de 2011 · Carlos J. Gil Bellosta

Centenario de la muerte de Galton

Al cumplirse cien años de la muerte de Francis Galton (1822-1911), mostraré una animación relacionada con una de sus más curiosas invenciones, el quincunx o quincuncio: El interesado puede también descargar el código de R utilizado para generar la animación.

23 de febrero de 2011 · Carlos J. Gil Bellosta

Solo quiero saber si basta con tres casos

Os puedo jurar que lo he vivido. Así, literalmente. Tenían que ser tres y no más. Más vídeos similares, aquí.

22 de febrero de 2011 · Carlos J. Gil Bellosta

Minería de datos: promesas y realidades

Incluso a los que conocemos el mercado desde dentro, la lectura de artículos como este nos descubre un asombroso brave new world. Tanto los nuevos métodos con que dizque se afrontan los problemas más pedestres (como la detección de fraude, la retención de los mejores clientes, etc.) como la misma naturaleza de las áreas en las que se aplican (lucha antiterrorista, predicción de motines, elecciones sangrientas, actos de represión,… ¡e incluso el lanzamiento de cohetes por parte de Hizbolá!) parecen anunciar que ya tocamos lo que Asimov llamaba psicohistoria con la yema de los dedos. ...

21 de febrero de 2011 · Carlos J. Gil Bellosta

Divide y compararás

De este artículo sobre Facebook extraigo dos cifras: Valoración estimada de la compañía (de acuerdo con ciertos analistas, dado que no cotiza): 50.000 millones de dólares Número de usuarios (¿o clientes?): 500 millones. Aunque son de tal magnitud que rozan lo ininteligible, su cociente sí que resulta aprehensible: cien dólares; cien dólares es lo que dizque se está pagando por cada usuario de Facebook (aunque esto no es rigurosamente cierto: se está pagando también por sus futuros usuarios, dado su patrón de crecimiento). ...

18 de febrero de 2011 · Carlos J. Gil Bellosta

Enredando con el paquete googleVis de R

Si el otro día denuncié un gráfico engañabobos (y algún otro me explayaré muy constructivamente sobre el intercambio de correos que mantuve con sus autores), hoy he querido reproducirlo con el paquete googleVis de R. Habedlo: [cf]googleViz[/cf] El código utilizado para generarlo es: library(googleVis) library(reshape) a <- read.csv("http://datanalytics.com/uploads/serie_bde_1.csv")[,1:2] b <- read.csv("http://datanalytics.com/uploads/serie_bde_2.csv", header = F)[,1:2] colnames(a) <- c("fecha", "privado") colnames(b) <- c("fecha", "público") fechas <- data.frame(fecha = a$fecha, orden = 1:nrow(a)) goo.dat <- merge(merge(a, b), fechas) goo.dat <- goo.dat[order(goo.dat$orden),] goo.dat$privado <- goo.dat$privado / 10^9 goo.dat$público <- goo.dat$público / 10^9 goo.dat <- subset(goo.dat, select = c(privado, público)) goo.dat$date <- seq(as.Date("1962-01-01"), by = "month", length = nrow(goo.dat)) goo.dat <- melt(goo.dat, id.vars = "date") goo.tl <- gvisAnnotatedTimeLine(goo.dat, datevar = "date", numvar = "value", idvar = "variable") Finalmente, hay que advertir que no es inmediato el publicar estas visualizaciones en bitácoras como ésta (que utiliza Wordpress). Los detalles de cómo hacerlo, en este enlace.

17 de febrero de 2011 · Carlos J. Gil Bellosta