Disponible el borrador de la ley de acceso a la información

Ha sido publicado recientemente un borrador de lo que pudiera convertirse en la futura Ley de Transparencia española. Quiere esta ley regular las obligaciones de las administraciones públicas en lo concerniente a la difusión de los datos que obran en su poder y no tiene desperdicio su exposición de motivos, que comienza así: El reconocimiento y garantía del derecho de los ciudadanos a acceder a la información pública es una práctica de buen gobierno. La transparencia constituye una eficaz salvaguarda frente a la mala administración, posibilita a los ciudadanos conocer mejor y vigilar el ejercicio de las potestades, la prestación de los servicios y el empleo de los recursos públicos y estimula a los poderes públicos a funcionar de modo eficiente. Un gobierno transparente es, por ello, un gobierno que genera confianza y que rinde un mejor servicio a la sociedad. ...

5 de julio de 2011 · Carlos J. Gil Bellosta

Miscelánea de citas

Creo que tengo que pedirle excusas a Sam Savage por utilizar citas recopiladas por él para esta entrada mía de hoy. Me atrevo solo porque espero que contribuya a difundir el conocimiento de su libro. Son: Todos los modelos son erróneos, pero algunos son útiles. —George Box, estadístico Mentir un poco está permitido, pero jamás engañar. —Paul Halmos, matemático Un modelo exitoso te cuenta cosas que no le habías pedido que te contase. ...

4 de julio de 2011 · Carlos J. Gil Bellosta

Paquetes huérfanos de R

Ayer hablaba con Juan José Gibaja (al que finalmente conocí en persona) y me contaba cómo había usado un paquete de R —no recuerdo cuál— que misteriosamente había desaparecido de CRAN. —¡Imposible! Los paquetes no desaparecen: quedan huérfanos. Efectivamente, en la lista de paquetes de CRAN, abajo, se mencionan los llamados paquetes húerfanos. Según el README, se trata de paquetes cuyos autores o mantenedores han decidido desentenderse del paquete o los mensajes que les envían desde CRAN rebotan o no son contestados. Tales paquetes pasan al estado ORPHANED y se mantienen en CRAN mientras pasen los checks. Pero, conforme avanzan las versiones de R, puede que algunos de esos paquetes dejen de compilar y entonces son archivados. Existe una lista de paquetes huérfanos archivados cuya última versión puede encontrarse aquí. ...

1 de julio de 2011 · Carlos J. Gil Bellosta

Desarrollo de paquetes con R (II): primeros pasos

La segunda entrada en mi serie sobre la creación de paquetes con R cubre los primeros pasos en la creación de uno. Bastan para tener una primera versión de un paquete en minutos. Pero antes, unos consejos generales: Usar algún tipo de sistema operativo basado en Unix: Linux, Mac OS, etc. o Cygwin en el peor de los casos. Tengo que confesar que yo comencé a usar Linux precisamente por este motivo: los procedimientos y herramientas que se utilizan para construir paquetes de R están influenciados por la tradición Unix. Es cierto que se han creado herramientas para poder desarrollarlos desde Windows pero, después de haber trabajado en Linux, me parecen incómodas y antinaturales: pasar de Linux a Windows es como pasar del Ferrari al borriquillo. Registrar el proyecto en R-Forge, como ya hemos comentado previamente. Dadas sus ventajas —siendo una de las principales permitir probar el paquete sobre varias plataformas distintas (Linux, Mac y Windows) automáticamente—solo se me ocurre un motivo para no utilizarlo: como el código está públicamente disponible, no es válido para desarrollar aplicaciones cerradas y propietarias. Utilizar subversion (o git). Si el proyecto se aloja en R-Forge, subversion es la opción por defecto. Utilizar subversion permite gestionar mejor el desarrollo del paquete y facilita la colaboración entre los diversos autores. La manera en la que recomiendo comenzar a crear un paquete es partiendo de una serie de funciones ya desarrolladas previamente. Ni siquiera hace falta que estén terminadas ni que funcionen correctamente. Por ejemplo, podemos tener las dos funciones siguientes: ...

30 de junio de 2011 · Carlos J. Gil Bellosta

Visualización de datos con Weave

Weave es una plataforma de visualización de datos desarrollada por el Institute for Visualization and Perception Research de la Universidad de Massachusetts en colaboración con el Open Indicators Consortium. A pesar de su buen aspecto, no he tenido tiempo de probarlo. Pero, aprovechando que se acercan las vacaciones, tal vez alguno de mis lectores puede hacerlo y dejar una nota sobre su funcionamiento, ventajas, desventajas y posibilidades. ¿Algún voluntario?

29 de junio de 2011 · Carlos J. Gil Bellosta

Google Refine para analizar, estudiar y limpiar los datos

En esta entrada de hoy, hija de la pereza, reproduzco un vídeo que el lector puede encontrar igualmente en Medialab Prado. Es una presentación de Javier de la Torre, de Vizzuality, una compañía que trabaja en un campo del que nos hemos venido ocupando en estas páginas: la visualización de la información. La presentación tuvo lugar el 15 de febrero de 2011 dentro del evento Barcamp: periodismo de datos. Trata sobre Google Refine.

28 de junio de 2011 · Carlos J. Gil Bellosta

Estadística "como Dios manda"

No sé si sería ésa la traducción más afortunada de straight statistics. Probablemente no. Pero tal vez recoge la idea. Y tampoco tengo esta noche tiempo ni cabeza para distingos y connotaciones. Pero supongo que interesará a mis lectores conocer… … una campaña promovida por periodistas y estadísticos para contribuir a mejorar la comprensión y el uso de la estadística por el gobierno, los políticos, las empresas, los anunciantes y los medios de comunicación. Denunciando las malas prácticas y premiando las buenas, esperamos contribuir a restaurar la confianza pública en la estadística. ...

27 de junio de 2011 · Carlos J. Gil Bellosta

Sobre el libro "The flaw of averages"

Leí hace un tiempo The flaw of averages, un libro poco convencional que recomiendo a mis lectores. Su objetivo último es encomiable: conseguir que personas sin mayor preparación matemática o estadística pero obligadas a tomar decisiones frente a la incertidumbre apliquen el sentido común y entiendan claramente unos principios mínimos. Para lograrlo, asume una postura tal vez anti-intelectualista, tal vez herética. Piensa el autor —¿con motivo?— que, a ciertas personas, conceptos tales como varianza, media, teorema central del límite o función de densidad les dificultan, más que facilitan, la comprensión de lo que la incertidumbre realmente es y de cómo puede afectarlos. ¡Cuánta gente se conforma con conocer la media (p.e., de una estimación)! ...

24 de junio de 2011 · Carlos J. Gil Bellosta

Sweave, investigación reproducible... y más

Me consta que algunos de mis lectores están al tanto de eso que llaman investigación reproducible. De acuerdo con la Wikipedia (en inglés), [E]l término investigación reproducible se atribuye a Jon Claerbout, de la Universidad de Stanford y se refiere a la idea de que el producto final de la investigación no debería circunscribirse a un artículo sino comprender también el entorno computacional completo usado en la generación de los resultados que contiene, tales como el código, los datos, etc., para que puedan ser reproducidos y se pueda avanzar a partir de ellos. ...

23 de junio de 2011 · Carlos J. Gil Bellosta

Diez mandamientos del análisis de datos

Extraigo de la bitácora de Rob J Hyndman y de una manera que roza el plagio mi entrada de hoy. Recoge diez reglas, diez mandamientos para el análisis de datos (en realidad, para el análisis econométrico, pero pueden trasladarse casi sin cambios al ámbito general) propuestas por Peter Kennedy. Son las siguientes: Usa el sentido común (y la teoría económica) Evita el error de tipo III (encontrar la respuesta adecuada a la pregunta incorrecta) Conoce el contexto Inspecciona los datos KISS (Keep It Sensibly Simple) Asegúrate de que tus resultados tienen sentido Considera los beneficios y los costes de la minería de datos Estáte preparado para aceptar soluciones de compromiso No confundas significancia con relevancia Acompaña tus resultados de un análisis de la sensibilidad El lector interesado puede echar un vistazo a la discusión de estas reglas.

22 de junio de 2011 · Carlos J. Gil Bellosta