Medias de medias... ¿a estas alturas de siglo?

Lo sospechaba y ha resultado ser cierto: media de medias. ¡Carajo! El siguiente gráfico que compara la tasa media de paro entre el norte y el sur de España está extraído de El Economista: ¿Cómo se han calculado los porcentajes? Veámoslo (a partir de los datos que aparecen en el artículo); para el sur, promedia las tasas de paro de cada comunidad autónoma así: mean( c( 30.93, 29.55, 22.44, 24.73, 23.6, 24.19, 33.2, 23.81 ) ) # [1] 26.55625 Operación que, obvia decirlo,solo sería correcta si la población de todas las comunidades autónomas implicadas fuese, cuando menos, similar (y, p.e., la población de Andalucía fuese comparable a la de Melilla). ...

3 de noviembre de 2011 · Carlos J. Gil Bellosta

Twain, Grecia, Pisa, Cataluña y deontología

Leí un chiste el otro día: aparecía el ministro de economía de Grecia en su despacho revisando unos informes y comentándole a su asesor: “La única solución es volver a mentir”. No sin cierta dosis de razón nos recuerdan de vez en cuando la cita —de problemática atribución a Mark Twain—: Hay tres tipos de mentiras: mentiras pequeñas, mentiras grandes y estadísticas. Ahora nos enteramos de que Cataluña maquilló el resultado del examen de PISA a la educación: ...

2 de noviembre de 2011 · Carlos J. Gil Bellosta

Hoy somos 7000 millones

Hace 12 años, en la medianoche del 12 de octubre de 1999, Fatima Nevic dio a luz al niño que la ONU, por algún motivo, eligió para dar rostro al habitante 6.000.000.000 de este mundo que habitamos. Hoy 31 de octubre seremos 1000 millones más. ¡Bienvenido, niño 7e9!

31 de octubre de 2011 · Carlos J. Gil Bellosta

¿Es abierto todo lo que reluce?

Doy publicidad aquí a una entrada de la bitácora gobernamos.com en la que se presenta un estudio acerca del grado real de apertura de los datos del proyecto Aporta. Para los detalles puede consultarse la entrada original. Pero quiero extraer de ella la referencia al documento Methodology for Releasing Open Data (MELODA), que establece un criterio o método (¡odio emplear metodología!) para determinar el grado de apertura de una fuente de datos, que en su versión simplificada, evalúa si: ...

28 de octubre de 2011 · Carlos J. Gil Bellosta

Oracle R Enterprise

Repugna un tanto ver a R entre las palabras Oracle y Enterprise. Sobre todo siendo Oracle una compañía tan opuesta al espíritu del software libre. Pero es de celebrar que nuestra herramienta de elección esté penetrando el sancta sanctorum del software propietario. Y eso que Oracle se hizo años ya con Thinking Machines, empresa pionera en el campo de la minería de datos y cuyos algoritmos acabaron integrados en Oracle Data Mining. ...

27 de octubre de 2011 · Carlos J. Gil Bellosta

Herramientas de depuración en R

R dispone de un conjunto de herramientas para depurar (debug) programas. Yo suelo usar la función debug de manera casi exclusiva y sistemática, pero leyendo The Art of R Programming he dado con una discusión sistemática sobre el proceso de depuración así como algunas herramientas adicionales. Una de las primeras que menciona el libro es la función stopifnot, que puede ser intercalada en el código para verificar condiciones necesarias (y lanzar un error en caso de que no se cumplan): ...

26 de octubre de 2011 · Carlos J. Gil Bellosta

Liquidez y solvencia

El bombardeo matinal de noticias a que nos tiene acostumbrada la prensa en los últimos tiempos debería tener el efecto secundario positivo de acrecentar nuestra cultura financiera. Pero no estoy seguro de que sea así. Uno de los grandes temas que me da la impresión que confunde todavía al público es la diferencia entre liquidez y solvencia. Yo soy un tipo eminentemente ilíquido: muchos días me enfrento al siguiente problema: aunque pueda permitirme innumerables cafés a razón de 35 céntimos, en ese momento crítico, delante de la máquina expendedora, nunca encuentro la calderilla necesaria. ...

25 de octubre de 2011 · Carlos J. Gil Bellosta

Necesitamos una Asociación de Usuarios de R

Efectivamente, necesitamos una Asociación de Usuarios de R. Por ejemplo, durante la organización de las III Jornadas de Usuarios de R nos hemos enfrentado a muchos problemas que habrían sido mucho más llevaderos de contar con el paraguas institucional de un NIF. El número de actividades a las que una asociación podría dar cobertura es, con un poco de imaginación y generosidad, sumamente amplio. Después de un par de arranques en falso, la cosa va en serio. Tenemos una propuesta de estatutos. Y durante las III Jornadas se procederá a su aprobación de manera que comience a andar. Por eso invito a quienes siguen esta bitácora a echarles un vistazo, acudir a las jornadas e implicarse en el desarrollo de la asociación.

24 de octubre de 2011 · Carlos J. Gil Bellosta

Un problema de probabilidad

Como es viernes, propongo un problema de probabilidad. Es el siguiente: En un curso de inglés elemental hay 5 alumnos y 4 alumnas. En el intermedio, 7 y 3. En el avanzado, 4 y 4. Se promociona a un alumno (uso el masculino aquí genéricamente) del elemental a intermedio. Se elige luego a un alumno (uso genérico del masculino, de nuevo) del intermedio y resulta ser un hombre. ¿Cuál es la probabilidad de que el alumno promocionado fuese también hombre? ...

21 de octubre de 2011 · Carlos J. Gil Bellosta

Día mundial de la estadística

Hoy día 20 de octubre celebramos el segundo día mundial de la estadística. También es el día mundial del chef, supongo que por casualidad. Ambas, la de estadístico y la de chef, son profesiones que es preferible que no se noten. Cuando cobran algo de relevancia, malo. Supongo que por eso es necesario dedicar un día a quienes las practican. El que un chef se equivoque puede ser enojoso: se sonroja el camarero, hay que devolver el plato a la cocina y muchos temen que le pase algo cochino por el camino. Pero, ¿cuando es la estadística la que está torcida (o, tal vez, demasiado cocinada)? ...

20 de octubre de 2011 · Carlos J. Gil Bellosta