Precios de la vivienda e intención de voto, por Nestoria

Nestoria, uno de los patrocinadores de las III Jornadas de Usuarios de R, ha realizado un estudio en el que relaciona el precio de la vivienda en Madrid con los últimos resultados electorales obteniendo relaciones tan claras como esta: De hecho, Nestoria —a diferencia de tantos organismos públicos que no publican, valga la antirredundancia, sus datos— proporciona una API para acceder a sus bases de datos de precios. Esto permite cruzar este tipo de información, hasta ahora de difícil obtención, con otras variables para ayudar a comprender mejor determinados fenómenos sociales. ...

7 de diciembre de 2011 · Carlos J. Gil Bellosta

The Little Handbook of Statistical Practice

Quiero hacer publicidad aquí —y, de paso, guardarme una nota para mí mismo para futura referencia— del Little Handbook of Statistical Practice, una colección de breves artículos sobre diversos temas de relevancia estadística recopilados por Gerard E. Dallal. En particular, merece cierta atención su recopilación de Statistical Notes del British Medical Journal.

5 de diciembre de 2011 · Carlos J. Gil Bellosta

Grandes avances criptográficos... según El País

Apenas sé de criptografía y no es un tema que me interese demasiado. Sin embargo leí un artículo en El País de la semana pasada titulado Desvelado el significado oculto del ‘Copiale Cipher’. Se refiere a un libro que contenía los estatutos de cierta secta masónica de mediados del siglo XVIII. Y dice textualmente . Aunque el artículo habla principalmente de la masonería, las normas, la historia del manuscrito y otras lindezas, describe brevemente la técnica de desencriptación: ...

2 de diciembre de 2011 · Carlos J. Gil Bellosta

Creación de un "R portable"

Se supone que R, que está disponible en una multitud de plataformas y sin coste, debería poder instalarse por doquier. Pero sucede en ocasiones que sus usuariossolo disponen de plataformas muy cerradas, sin acceso a privilegios de administración, en organizaciones hostiles al software libre, etc. La solución para poder seguir disfrutando del poder de R en tales circunstancias puede pasar por la utilización de una versión portable de R: una que arranque desde un pincho de memoria sin interferir con el resto del software de la máquina ni requerir permisos de escritura en directorios vetados. ...

1 de diciembre de 2011 · Carlos J. Gil Bellosta

Google Translate, tamaños muestrales y sesgos

Supongo que mis lectores estarán al tanto de Google Translate y tal vez sepan que utiliza métodos estadísticos para traducir: a partir de una muestra amplia de textos con el mismo contenido pero en distintos idiomas llega a deducir que maison, casa y house son una misma cosa. Pero la yuxtaposición puede dar lugar a situaciones jocosas. He aquí un ejemplo con el que la serendipia me ha hecho tropezar recientemente. Supongo que habréis encontrado alguna vez ese texto que comienza por lorem ipsum dolor sit amet… y que los maquetadores y editores gráficos usan como relleno para mostrar su trabajo. Aparece en tantos sitios que… parece haber confundido al traductor de Google como se aprecia a continuación. Si pido traducir, por ejemplo, la frase Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus que forma parte de ese texto, ...

30 de noviembre de 2011 · Carlos J. Gil Bellosta

Doping, héroes patrios y... estadística

Este verano traté de recorrer en bici la ruta del Viaje a la Alcarria de Cela. No lo acabé porque se lesionó mi compañero a la altura de Pareja y tuvimos que regresar a Madrid en furgoneta. Pero recuerdo que, encarando algún repecho, con la lengua afuera, me comentaba qué duro es esto de la bici. Aproveché luego, en la fuente de algún pueblo, con las camisetas empapadas, para comentarle lo despiadado del circunstancial televidente estival, faria en mano, exigiendo a los ciclistas patrios demarres sobrehumanos en el Tourmalet. ...

29 de noviembre de 2011 · Carlos J. Gil Bellosta

R en la enseñanza: unos comentarios a los comentarios

Iba a responder a los comentarios de mi entrada sobre las Jornadas de R y, muy en particular a los de Fernando Fernández, uno de los más fieles lectores de esta bitácora, y me he extendido tanto que he acabado convirtiéndola en una nueva. Pido excusas por haber tal vez abusado de mis prerrogativas para auparme de esta manera. Tanto a él como a otros les chirrió que escribiese comenzamos una nueva época que en el plazo de tres o cuatro años nos va a conducir, con casi total seguridad, a un escenario en el que […] R se use de manera casi exclusiva en la enseñanza de la estadística en los niveles universitarios. ...

28 de noviembre de 2011 · Carlos J. Gil Bellosta

¿Escalas logarítmicas? Puede, pero...

Encontré el otro día una entrada en la bitácora de Bissantz, una empresa alemana de herramientas de visualización y minería de datos, que trataba sobre las ventajas y desventajas del uso de escalas lineales y logarítmicas en cierto tipo de gráficos. Y las ilustraba con un ejemplo que me hizo pensar si no habría algo más. El gráfico malo, en escala lineal, es que representa la evolución del PIB y la deuda estadounidense durante las últimas décadas y tiene una serie de carencias con respecto al gráfico de los mismos datos en escala logarítmica, ...

25 de noviembre de 2011 · Carlos J. Gil Bellosta

Vídeos de las charlas de Alberto Cairo y Alberto Alcaraz

Diríase que estos días no escribo de otra cosa. Pero como que toca. Ya cambiaré de cuerda. En realidad, hoy debería haber escrito sobre unas conferencias de MicroStrategy a las que acudí ayer “para hablar de mi libro”, es decir, dar la tabarra a empresas que usan, más o menos subrepticiamente R en sus productos para que sepan que existe una asociación de usuarios en ciernes y, con un poco de suerte, aflojen algún billete. Porque, aparte de eso,solo pude constatar que la parte relevante del empresariado español no lee a Tufte. ...

24 de noviembre de 2011 · Carlos J. Gil Bellosta

El 3 de diciembre, Open Data Hackathon

Me llega la noticia de que el 3 de diciembre tendrá lugar el Open Data Day, […] una reunión de ciudadanos en ciudades de todo el mundo para escribir aplicaciones, liberar datos, crear visualizaciones y publicar análisis utilizando datos públicos abiertos con el fin de apoyar y animar a adoptar políticas de datos abiertos por parte de los gobiernos locales, regionales y nacionales de todo el mundo. Arturo (del blog Madrid Me Mata) y Oscar Corcho de la UPM están organizando el evento en Madrid. El primero dice que la idea es hacer una pequeña introducción más o menos teórica para después ponernos a trabajar sobre un set de datos, como siempre esa es la parte que está un poco más en el aire y cualquier propuesta en este sentido vendría muy bien. ...

23 de noviembre de 2011 · Carlos J. Gil Bellosta