Militancia y datos

Allá por el 2007 publicó The Independent una portada en que se retractaba. El diario había sido un histórico defensor de la legalización de la marihuana. Ese día hizo público su cambio de postura. Al parecer, motivada por las evidencias sobre los efectos sobre la salud mental. Este fin de semana he asistido a una serie de conferencias. En una de ellas participaba el representante de una organización que: Adoptaba de partida una posición militante, de parte, en cierto asunto de interés público. Se definía como data driven, evidence driven, etc. La pregunta obvia y que no tuve ocasión de plantear (por eso la traigo aquí) es la siguiente: si los datos y la evidencia se obstinaran en subrayar la bondad de la posición contraria a la que actualmente mantienen, ¿cuál de sus dos principios abandonarían primero? ...

18 de septiembre de 2017 · Carlos J. Gil Bellosta

Dos argumentos racionales en pro de la homeopatía

La homeopatía es la bestia negra del movimiento escéptico. Su visceralidad contra la homeopatía es tal que bien podría servir de definición positiva y operativa de dicho movimiento demarcándolo mejor que otras, más etéreas y confusas, que refieran sus aspiraciones y objetivos. El movimiento escéptico esgrime la razón en un sentido paternalista y redentor. Que resulta bastante irritante para quienes, estando hartos de ser redimidos y paternalizados, no queremos para los demás lo que aborrecemos para nosotros mismos. ...

15 de septiembre de 2017 · Carlos J. Gil Bellosta

Triste vida

Recorrer multitud de senderos que se bifurcan. Maximizar la correlación. Alegar causalidad. Facturar. Iterar.

14 de septiembre de 2017 · Carlos J. Gil Bellosta

Trucos cutrebayesianos

El contexto Cada día $i$ ocurren eventos de cierta naturaleza (transacciones, fallecimientos, infartos, etc.) que interesa contar. El problema El número de eventos $n_i$ que ocurren el día $i$ no se conoce el día $i$ sino que va siendo conocido progresivamente los días $i+1, \dots$. Pero hace falta una estimación de $n_i$ antes del fin del mundo. Los datos La distribución de los $n_i$ (basados en el histórico). La proporción (probabilidad) $p_\Delta$ de eventos del día $i$ que se conocen el día $i+\Delta$. La solución prebayesiana ...

13 de septiembre de 2017 · Carlos J. Gil Bellosta

Pues los SVMs, al final, no son tan exóticos

Impartí un curso sobre máquinas de vector soporte (SVMs en lo que sigue) en Lima el pasado mes de agosto. Las SVMs (o más propiamente, los clasificadores de margen máximo) son exóticos dentro del repertorio del científico de datos. Lo que buscan es un hiperplano que maximiza el margen entre tirios o troyanos, con o sin penalización para los puntos que insisten en permanecer en la región del espacio que no les corresponde. El modelo se ajusta resolviendo un problema de minimización inhabitual: uno de los llamados programas cuadráticos convexos. (Del que no nos tenemos que preocupar habitualmente porque delegamos la resolución en el software). ...

11 de septiembre de 2017 · Carlos J. Gil Bellosta

A épsilon de todo

Usé a principios del verano una metáfora matemática como justificación de los contenidos de un curso que dicté pero que se puede extender al conocimiento en general. Más bien, a una estrategia para adquirirlos. La estrategia de estar a un ? de todo. La metáfora está basada en el siguiente hecho: en dimensiones altas, casi toda la esfera unidad está a distancia ? de su corteza. En efecto, el volumen de una esfera de radio unitario en dimensión $d$ es $K_d$ y la de una esfera de radio $1-\epsilon$ es $K_d (1-\epsilon)^d$. El ratio entre ambas cantidades es $(1-\epsilon)^{-d}$, que tiende a cero con $d$. ...

11 de septiembre de 2017 · Carlos J. Gil Bellosta

Vampírico como antónimo de empírico

No es exactamente un antónimo, aunque esté más alejado de lo empírico que el de libro, i.e., teórico. Vampírico es un argumento (o hipótesis, u ocurrencia) al que no consigue matar la mera evidencia. Para usos, orígenes y ejemplos, véase esto.

8 de septiembre de 2017 · Carlos J. Gil Bellosta

Ey, ¡en esta serie hay más muertos que en Juego de Tronos!

La serie en cuestión es esta (abridla en otra pestaña para verla en la plenitud de su definición): Con tiene todas (explicar por qué no son todas sería complicado, pero se puede dar el cuantificador casi por bueno) las defunciones (diarias) en España desde la fecha indicada. Los datos brutos están en la figura superior. Las tres siguientes tienen la descomposición estacional, la tendencia y los residuos tal como los estima stl. ...

7 de septiembre de 2017 · Carlos J. Gil Bellosta

Python y R: una perspectiva markoviana

Hoy he visto aquí y he escrito m <- matrix(c(74, 15, 10, 1, 11, 50, 38, 1, 5, 4, 90, 1, 17, 4, 19, 60), 4, 4, byrow = TRUE) m <- m / 100 luego m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m%*% m%*% m%*% m%*% m%*% m%*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m %*% m%*% m%*% m%*% m%*% m%*% m%*% m # [,1] [,2] [,3] [,4] #[1,] 0.1926676 0.1133218 0.6696203 0.02439024 #[2,] 0.1926647 0.1133206 0.6696245 0.02439024 #[3,] 0.1926638 0.1133202 0.6696258 0.02439024 #[4,] 0.1926675 0.1133218 0.6696205 0.02439025 y finalmente res <- eigen(t(m)) res$vectors[,1] / sum(res$vectors[,1]) #[1] 0.19266473 0.11332059 0.66962444 0.02439024 Aquí dice por qué.

6 de septiembre de 2017 · Carlos J. Gil Bellosta

Predecir a los predictores por incordiar

Sirve esta entrada para hacer saber lo fundamental del trabajo de fin de master (TFM en lo que sigue) de Susana Huedo (que busca trabajo y es una chica muy sabida, aplicada y espabilada) en el CIFF. Los TFM que propongo y acabo supervisando jamás tienen vocación de criogénesis anaquélica. A Susana le sugerí un tema muy punk y con recorrido: [tratar de] predecir a los predictores. Fundamentalmente, para joder. Los chefs de encuestas electorales tienen dos discursos —uno previo y otro posterior a la publicación de los resultados—, una serie de recetas y datos que solo excepcionalmente publican. Dirán que se ciñen a una metodología científica, etc. Literatura. ...

5 de septiembre de 2017 · Carlos J. Gil Bellosta