¿Es abierto todo lo que reluce?

Doy publicidad aquí a una entrada de la bitácora gobernamos.com en la que se presenta un estudio acerca del grado real de apertura de los datos del proyecto Aporta. Para los detalles puede consultarse la entrada original. Pero quiero extraer de ella la referencia al documento Methodology for Releasing Open Data (MELODA), que establece un criterio o método (¡odio emplear metodología!) para determinar el grado de apertura de una fuente de datos, que en su versión simplificada, evalúa si: ...

28 de octubre de 2011 · Carlos J. Gil Bellosta

Oracle R Enterprise

Repugna un tanto ver a R entre las palabras Oracle y Enterprise. Sobre todo siendo Oracle una compañía tan opuesta al espíritu del software libre. Pero es de celebrar que nuestra herramienta de elección esté penetrando el sancta sanctorum del software propietario. Y eso que Oracle se hizo años ya con Thinking Machines, empresa pionera en el campo de la minería de datos y cuyos algoritmos acabaron integrados en Oracle Data Mining. ...

27 de octubre de 2011 · Carlos J. Gil Bellosta

Herramientas de depuración en R

R dispone de un conjunto de herramientas para depurar (debug) programas. Yo suelo usar la función debug de manera casi exclusiva y sistemática, pero leyendo The Art of R Programming he dado con una discusión sistemática sobre el proceso de depuración así como algunas herramientas adicionales. Una de las primeras que menciona el libro es la función stopifnot, que puede ser intercalada en el código para verificar condiciones necesarias (y lanzar un error en caso de que no se cumplan): ...

26 de octubre de 2011 · Carlos J. Gil Bellosta

Liquidez y solvencia

El bombardeo matinal de noticias a que nos tiene acostumbrada la prensa en los últimos tiempos debería tener el efecto secundario positivo de acrecentar nuestra cultura financiera. Pero no estoy seguro de que sea así. Uno de los grandes temas que me da la impresión que confunde todavía al público es la diferencia entre liquidez y solvencia. Yo soy un tipo eminentemente ilíquido: muchos días me enfrento al siguiente problema: aunque pueda permitirme innumerables cafés a razón de 35 céntimos, en ese momento crítico, delante de la máquina expendedora, nunca encuentro la calderilla necesaria. ...

25 de octubre de 2011 · Carlos J. Gil Bellosta

Necesitamos una Asociación de Usuarios de R

Efectivamente, necesitamos una Asociación de Usuarios de R. Por ejemplo, durante la organización de las III Jornadas de Usuarios de R nos hemos enfrentado a muchos problemas que habrían sido mucho más llevaderos de contar con el paraguas institucional de un NIF. El número de actividades a las que una asociación podría dar cobertura es, con un poco de imaginación y generosidad, sumamente amplio. Después de un par de arranques en falso, la cosa va en serio. Tenemos una propuesta de estatutos. Y durante las III Jornadas se procederá a su aprobación de manera que comience a andar. Por eso invito a quienes siguen esta bitácora a echarles un vistazo, acudir a las jornadas e implicarse en el desarrollo de la asociación.

24 de octubre de 2011 · Carlos J. Gil Bellosta

Un problema de probabilidad

Como es viernes, propongo un problema de probabilidad. Es el siguiente: En un curso de inglés elemental hay 5 alumnos y 4 alumnas. En el intermedio, 7 y 3. En el avanzado, 4 y 4. Se promociona a un alumno (uso el masculino aquí genéricamente) del elemental a intermedio. Se elige luego a un alumno (uso genérico del masculino, de nuevo) del intermedio y resulta ser un hombre. ¿Cuál es la probabilidad de que el alumno promocionado fuese también hombre? ...

21 de octubre de 2011 · Carlos J. Gil Bellosta

Día mundial de la estadística

Hoy día 20 de octubre celebramos el segundo día mundial de la estadística. También es el día mundial del chef, supongo que por casualidad. Ambas, la de estadístico y la de chef, son profesiones que es preferible que no se noten. Cuando cobran algo de relevancia, malo. Supongo que por eso es necesario dedicar un día a quienes las practican. El que un chef se equivoque puede ser enojoso: se sonroja el camarero, hay que devolver el plato a la cocina y muchos temen que le pase algo cochino por el camino. Pero, ¿cuando es la estadística la que está torcida (o, tal vez, demasiado cocinada)? ...

20 de octubre de 2011 · Carlos J. Gil Bellosta

Visualización de la incertidumbre sobre el futuro

Recomiendo a mis lectores el artículo Visualizing Uncertainty About the Future de D. Spiegelhalter, M. Pearson e I. Short. Trata sobre qué tipo de representaciones gráficas son más adecuadas para transmitir información acerca de la probabilidad de fenómenos futuros a distintos tipos de audiencias, incluidas las más anuméricas. Abarca desde los incipientes trabajos de Nightingale y Neurath hasta Gapminder y los más modernos desarrollos de la infografía. Aplaude, por ejemplo, la iniciativa del Banco de Inglaterra de publicar información sobre la posible evolución de indicadores económicos futuros de la forma ...

19 de octubre de 2011 · Carlos J. Gil Bellosta

Estrategia, predicción y proyección de la población española

Cayó el otro día en mis manos un artículo, Strategy under Uncertainty, que complementa bastante adecuadamente mi entrada del otro día sobre las proyecciones a corto plazo de la población española que realiza el INE. La estrategia concierne a sucesos futuros. Por ser futuros, son inciertos. Y el artículo describe cuatro niveles distintos de incertidumbre a los que contrapone una serie de posibles estrategias. Los niveles son: Un futuro suficientemente claro: las tendencias son muy claras y no se esperan sorpresas. En resumen, hay un único escenario posible y la estrategia adecuada consiste en adaptarse a él. Varios futuros alternativos: existe un número concreto de alternativas o escenarios, cada uno de las cuales con su propia probabilidad de ocurrir. Por ejemplo, los bares barajaron recientemente dos posibles alternativas: la futura ley podría prohibir fumar taxativamente (como ocurrió) o permitir tal vicio en áreas específicas y adaptadas. A cada suceso puede asignársele una probabilidad discreta, diría un matemático. Un rango de futuros: no existen escenarios discretos y concretos, pero sí un rango de opciones: la demanda puede ser cualquier cifra entre 0 y 1000, etc. Nuestro matemático entendería que este es un problema en el que rigen leyes de probabilidad continua. Absoluta incertidumbre: ocurre cuando es imposible plantear cualquier tipo de función de probabilidad. No obstante, aunque el artículo recoge algunos casos, subraya también que este tipo de situaciones son inestables y suelen degenerar con el tiempo en alguna de las situaciones anteriores. Las tres estrategias fundamentales consisten en: ...

18 de octubre de 2011 · Carlos J. Gil Bellosta

Riesgo en proyectos de IT

Tu proyecto de IT puede contener más riesgo del que piensas. De verdad. Dan fe de ello Bent Flyvbjerg y Alexander Budzier. Los autores describen en el artículo que he enlazado encima varios proyectos que fracasaron estrepitosamente y proporcionan algunos consejos para evitar ese tipo de desenlaces. Sin embargo, para quienes siguen esta bitácora, la reflexión más interesante es la siguiente: Al focalizarse en las medias en lugar de los casos extremos más dañinos, la mayor parte de los gestores y consultores han ignorado el verdadero problema. ...

17 de octubre de 2011 · Carlos J. Gil Bellosta