Por la apertura de los datos públicos

En navegaciones sin rumbo por internet di con una asociación con un proyecto muy prometedor, Pro Bono Público. Aunque no he tenido la ocasión —todavía— de contactar con ellos, creo que los lectores de esta bitácora compartirán conmigo el interés por esta iniciativa. Además, aquellos de mis lectores que tengan más tiempo y arte que yo —y estoy pensando en concreto en una muy fiel seguidora que tiene buena mano para estas cosas— puede que quieran participar en el Desafío Abredatos 2011, que se celebrará próximamente bajo su patrocinio. ...

28 de marzo de 2011 · Carlos J. Gil Bellosta

¿Dónde obtengo mis datos? ¡Pregunta!

Se ha hablado mucho de la avalancha de la información, de la web semántica, del gobierno abierto, del acceso libre a los datos, de compartirlos, etc. Pero a la hora de la verdad, ¿dónde puedo obtener los datos que necesito aquí y ahora para un fin concreto? La respuesta no es sencilla. Por supuesto, tienes los buscadores. Hay información que uno sabe que consta en el INE o tal vez en las páginas de un determinado ministerio u organismo público. Tal vez puedes llamar a ese amigo tuyo que tal vez lo sepa. ...

24 de marzo de 2011 · Carlos J. Gil Bellosta

R y Excel: una alternativa

Los amantes de Excel están de enhorabuena. Ahora tienen una alternativa a RExcel, una extensión de Excel que le permite interactuar con R: XLConnect, un paquete multiplataforma de R que permite: Trabajar con ficheros de Excel 97 (.xls) y OOXML (.xlsx) Crear y eliminar hojas dentro de documentos Leer y escribir rangos de valores (ranges) Leer y escribir hojas de cálculo Añadir gráficos Asociar estilos a celdas Definir el tamaño de las filas y columnas Etc. Está basado en Apache POI, una colección de librerías de Java que permiten manipular ficheros en los formatos más o menos propietarios de Microsoft. Así no es siquiera necesario tener Excel instalado. ¡Ni siquiera trabajar en Windows!

23 de marzo de 2011 · Carlos J. Gil Bellosta

Gráficos (I): introducción

De no mediar contratiempos, a lo largo de los próximos cinco o seis martes iré subiendo a mi bitácora una serie de entradas sobre una (sub)disciplina en alza. Se la conoce por diversos nombres de desigual empaque —infografía, information design, etc.— pero las ubicaré bajo un epígrafe algo más humilde: gráficos. Comenzaré citando a Andrew Gelman. En una reciente entrevista (que no tiene desperdicio), este respondía categóricamente: Sí, la representación gráfica de unos datos siempre es una estadística. ...

22 de marzo de 2011 · Carlos J. Gil Bellosta

Estadística para periodistas y escritores

Hace tiempo, mucho ya, decidí que no me interesaba desarrollar una carrera dentro de la academia. Pesó en la decisión el hecho de que entre las cosas punteras, entre el estado del arte a cuyo progreso se dedican nuestras universidades y lo que de ellas absorbe la sociedad (léase: empresas, instituciones oficiales, la prensa, el vulgo) mediaba una extensa tierra de nadie en la que poder plantar mi alegórica tienda. ...

21 de marzo de 2011 · Carlos J. Gil Bellosta

Asesinatos en perspectiva

En Colombia hay mucho asesinato. Uno va para allá y si del aeropuerto para el hotel no lo han separado de su equipaje, su cartera o de la vida, puede darse por afortunado. La cosa es poco menos grave en Sudáfrica. No en vano fue allá el mundial y lo de los asesinatos nos lo advirtieron en la tele. En Gambia, que está por ahí cerca, la cosa será tres cuartas partes de lo mismo, como cabe esperar. ...

18 de marzo de 2011 · Carlos J. Gil Bellosta

Ya no si sino cuánto

Ya no te preguntan si usas R. Es el signo de los tiempos: ahora te preguntan cuánto; ahora te preguntan si lo usas siempre, casi siempre, a veces, poco y, para los raritos, si no lo usas nunca. ¿Dónde? En las famosas encuestas de Kdnuggets. ¡A ver cuándo vemos un estudio de uso de R por países que nos rojigualdee la cara!

17 de marzo de 2011 · Carlos J. Gil Bellosta

Paréntesis, llaves y rendimiento en R

Conforme se populariza el uso de R, cobran creciente importancia las cuestiones relativas a su rendimiento, su gestión de la memoria, etc. Hasta el punto que incluso uno de sus creadores, Ross Ihaka, ha expresado últimamente su descontento con las limitaciones de R (el enlace es gentileza de Daniel Castro) sugiriendo que sus componentes puramente estadísticos deberían construirse sobre la base de un lenguaje distinto, posiblemente Lisp. Dentro de este contexto de preocupación sobre el rendimiento de R, han aflorado algunas cuestiones acerca de la eficiencia del intérprete a la hora de resolver expresiones matemáticas. Por ejemplo, Radford Neal estudió el desigual desempeño de R frente a ciertas expresiones matemáticas equivalentes: en particular, la expresión ...

16 de marzo de 2011 · Carlos J. Gil Bellosta

Metodología, casuística y tipología

Me enterneció el otro día encontrar un artículo en el que la palabra casuística se utilizaba de manera recta. Y es que cifro el abuso que se hace de los términos metodología, casuística y tipología—junto con la expresión más óptimo, de la que ya nos ocupamos otro día— entre los más irritantes que comete el hablante poco versado en temas ortográficos y léxicos que trata de aparentar lo que no es. Y abundan tristemente en el mundo de la consultoría, que es el que más me compete. Hago constar pues mi denuncia razonada para que no se entienda que mi silencio al respecto es connivencia o, peor aún, ignorancia. ...

15 de marzo de 2011 · Carlos J. Gil Bellosta

Publica o perece

Quienes trabajamos circunstancialmente para investigadores heredamos parte de esa presión que sufren para publicar a toda costa so pena de perecer académicamente. Esa presión introduce en demasiadas ocasiones los sesgos, desviaciones con respecto a la ortodoxia metodológica, etc., cuyos excesos han generado una creciente ola de escepticismo frente a los resultados que aparecen en la literatura, tal y como comentábamos el otro día en estas páginas. Esta entrada —continuación de la anterior y abrebocas para otra que estoy preparando sobre el mismo tema— quiero presentar a mis lectores unos cuantos sucesos famosos que ilustran un fenómeno tal vez poco conocido del gran público: casos en los que los resultados científicos resultan falsos no por defectos metodológicos, no por sesgos involuntarios sino por dolo. ...

14 de marzo de 2011 · Carlos J. Gil Bellosta