Encuestas, censos, elecciones

Hace unas semanas tuve un lapso de creatividad. Dejé de escribir durante un tiempo y me dediqué al sucedáneo: leer. Terminé, para variar, unos cuantos libros. Uno de ellos es Proofiness, the Dark Arts of Mathematical Deception que está más o menos bien. En su mayor parte abunda sobre fenómenos conocidos, estudiados y sobradamente denunciados: que hay que recurre a argumentos basados en números, estadísticas o construcciones matemáticas más o menos sofisticadas para dar visos de verdad a mentiras flagrantes. Los ejemplos resultarán más afines culturalmente a quienes vivan en la orilla equivocada del Atlántico, aunque son los suficientemente conocidos para que sepamos de qué se habla y que el género es ensayo y no ficción. ...

12 de noviembre de 2015 · Carlos J. Gil Bellosta

Ad more geometrico

De la manera geométrica. No sé si fue Spinoza o si se le adelantó alguno el que trató de explicar la filosofía y la ética como hacían los geómetras con sus puntos, rectas y arcos. Es cosa del XVIII y del XIX, si mal no recuerdo, el pretender trasladar esa manera de pensar científica y racional que tantos avances había proporcionado en física, química, etc. a las ciencias humanas. Ayer viví una reedición. Acudí a las charlas de Machine Learning Spain. Una de ellas fue muy buena: ingenieros aeronáuticos explicando métodos que utilizaban para optimizar estudios de aerodinámica combinando resultados de simulaciones matemáticas con mediciones en túneles de viento. ...

11 de noviembre de 2015 · Carlos J. Gil Bellosta

Asignación en R: ¿flecha o lo innombrable?

Alguien a quien no quiero nombrar (pero que sabe de sobra quién es) me comentaba el otro día algo que no sabía de la asignación en R: las presuntas diferencias entre <- e =. Que en resumen eran: ambos asignan pero = hace una copia del objeto asignado mientras que <- no. Como consecuencia, <- es más eficiente desde el punto de vista de la gestión de la memoria. ¿Será cierto? ¿Qué nos dirá tracemem al respecto? No seáis vagos y probad ...

10 de noviembre de 2015 · Carlos J. Gil Bellosta

Requisitos para mi taller en el "I International Workshop on Advances in Functional Data Analysis"

El jueves día 12 tengo un taller de cuatro horas en el I International Workshop on Advances in Functional Data Analysis. Siendo internacional (y el material está en inglés), me vais a permitir escribir el resto de la entrada urbi et orbi. I will be presenting a hands-on workshop. Those attending it are invited to install a few tools in order to make the most of it during and after the sessions. ...

9 de noviembre de 2015 · Carlos J. Gil Bellosta

Cultura viejuna y anumerismo

Intolerable. Abres las páginas de cultura de cualquier periódico y compruebas que los periodistas no tienen recato alguno en hablar de (incluso elogiar) obras inescrutables de pintores oscuros, géneros minoritarios, libros eruditísimos, películas aburridísimas en que no pasa un carajo, obras teatrales rarísimas con actores semidesnudos que se descuelgan del techo con un arnés, ballets soporíferos y todo tipo de burrufalla que define el estándar de lo que hoy en día se entiende por ser culto. ¡Carajo! ...

5 de noviembre de 2015 · Carlos J. Gil Bellosta

DBSCAN, ¿algo nuevo bajo el sol?

Ha sido en latitudes otras que las habituales que he aprendido y leído (mas no probado) sobre DBSCAN. Se conoce que es un nuevo (aunque ya tiene sus añitos: algo así como 20) método de clústering. Por un lado, se agradecen las novedades. Por el otro, tengo cierta aversión a las cosas que proceden de los congresos de Knowledge Discovery and Data Mining, que es donde fue publicado el algoritmo. En esencia, funciona así: se fijan dos parámetros, e y n. Un punto es central si a distancia e o menor tiene, al menos, otros n puntos. Los clústers los conforman: ...

4 de noviembre de 2015 · Carlos J. Gil Bellosta

Esta tarde doy un curso abierto y gratuito de introducción a la programación

Efectivamente, esta tarde doy un curso de unas tres horas de introducción a la programación. Es gratuito y está abierto a quien quiera pasarse (hasta completar el aforo). Será en las oficinas de KSchool de 18:30 a 21:00. Los interesados pueden escribir a elsa.duran en kschool punto com para reservar la plaza. La sesión es un preámbulo a mi curso de R aunque independiente del mismo. Está pensado para aquellos que no han programado apenas y que quieren tomarlo. No obstante, es de interés general y, reitero, independiente del antedicho curso. ...

3 de noviembre de 2015 · Carlos J. Gil Bellosta

El g-test para tablas de contingencia

Hace unos días recibí una consulta de una vieja amiga lingüista. Ella trabaja en algo que creo que se llama cocolocación: el estudio de palabras que aparecen o que tienden a aparecer juntas en textos. Digamos que es algo así como una correlación o una regla de asociación. Los lingüistas están muy interesados en ese tipo de fenómenos. Tradicionalmente (cada gremio tiene su librillo) usan la información mutua. Pero, al final, lo que tienen es una tabla de contingencia: situaciones en que aparece una, la otra, ambas o ninguna de las palabras. ...

2 de noviembre de 2015 · Carlos J. Gil Bellosta

La falacia del fiscal (pero con frecuencias naturales)

No sé si alguien conoce la historia de Sally Clark. Fue condenada por el asesinato de sus dos hijos. Ambos padecieron, según ella, el síndrome de la muerte súbita del lactante. La probabilidad, sin embargo, de que sus dos hijos lo padecieran (supuesto que son eventos independientes, i.e., que no hay, por ejemplo, factores genéticos comunes) era muy baja: una de 73 millones. Por eso la enchironaron. Pero, ¿qué es 1 / 73e6? Eso es $P(D|I)$, es decir, la probabilidad del suceso (los datos) condicionada a la inocencia de Sally. Sin embargo, la probabilidad que tiene que tener encuenta un juez no es esa sino $P(I|D)$, es decir, la probabilidad de ser inocente a la vista de los datos. ...

21 de octubre de 2015 · Carlos J. Gil Bellosta

La paradoja de Berkson

Queremos calentar unas empanadas en el horno y, ¡oh desgracia!, no funciona. Pueden pasar dos cosas (independientes entre sí): El horno está estropeado ($A$) El horno está desenchufado ($B$) Hemos observado el evento $A \cup B$ y nos preocupa mucho $P(A | A \cup B)$, es decir, que tengamos que llamar al técnico y comernos frías las empanadas a la vista de que el horno no responde. Sin embargo, observamos rápidamente $B$: que habíamos desenchufado el horno. Luego, de repente, nos encontramos ante el cálculo de $P(A | B, A \cup B)$. Dicho de otra manera, evaluar la probabilidad de que el horno esté estropeado a la vista de que: ...

19 de octubre de 2015 · Carlos J. Gil Bellosta