Nuevo vídeo en YouTube: analizo un proyecto de fugas de clientes en Paypal

Acabo de subir a Youtube mi último vídeo:

En él analizo este hilo de Twitter en el que su autor describe un proyecto muy particular —heterodoxo— de ciencia de datos cuyo objetivo consiste identificar y prevenir la fuga de clientes. El hilo ha circulado todo lo viralmente que permite el tema y me ha parecido interesante sacarle un poco de punta.

Más sobre ese corolario del teorema de Rolle que es la curva de Laffer

Es fácil nunca dar con algo que no quieres encontrar: basta con buscarlo donde sabes que no está.

Eso es perfectamente predicable de todos los ensayos de los que tengo noticia para demostrar empíricamente la inexistencia —¡eh!, ¿no habíamos quedado en que que la inexistencia de algo no es demostrable empíricamente?— de ese corolario del teorema de Rolle que se ha dado en llamar curva de Laffer.

Hay que tener en cuenta que en una economía como la española —y más en estos tiempos—, casi el 100% de los agentes económicos operan muy por debajo de ese pico que postulan Laffer y Rolle. De hecho, uno puede ver cómo un porcentaje sustancial de los ocupados en España pertenecen a la categoría de subempleados por insuficiencia de horas.

El mejor negocio de la década

El mejor negocio del mundo sigue siendo —reza el chiste— comprar un argentino por lo que vale y venderlo por lo que dice que vale.

El de la década tiene mucho que ver con la literatura, con la ficción. Consiste en tomar proyectos hechos, semihechos, más o menos disparatados, con o sin sentido de mercado, con o sin asidero con la realidad, que se harían de todos modos, que se descartaron por inviables pero a los que se les puede sacudir el polvo y las polillas, buenos, regulares, malos, vergonzantes, vergonzosos, quijotescos, razonables, fantasiosos, (¿he escrito ya disparatados? creo que sí), etc. y pasárselos a alguien con cierto arte con las palabras para que los describa en un documento formal con profusión de términos tales como resiliente, inclusivo, hidrógeno verde, big data, digitalización, ecología, sostenibilidad, inteligencia artificial, etc.

Formalismos y modelos

Una de las cosas más provechosas que hice durante el encierro consecuencia de la consabida pandemia fue repasar con detenimiento la lógica matemática. En particular, leyendo meticulosamente de tapa a tapa la Introduction to Mathematical Logic de Walicki.

Una de las cosas más provechosas de la lógica matemática es la diferencia entre formalismos (p.e., la lógica proposicional) y sus distintos modelos, que la representan mejor o peor:

A specification of a domain of objects, and of the rules for interpreting the symbols of a logical language in this domain such that all the theorems of the logical theory are true is said to be a “model” of the theory.

Sobre las probabilidades de eventos que ocurren una única vez

La probabilidad se predica de eventos de muy distintas características. Existe un arco entero de casos en cuyos extremos opuestos podemos encontrar los eventos:

  • Obtener cara al lanzar esta moneda.
  • Que X gane las elecciones que ocurrirán en un mes.

La principal diferencia, por si alguien lo lo ha advertido, es que el primer tipo de evento puede repetirse cuantas veces se desee mientras que esas elecciones ocurrirán una única vez. Existen muchas interpretaciones de la probabilidad bajo las que pueden entenderse ambos problemas y todas (¡o casi!), al final, son compatibles de alguna manera con los axiomas de Kolmogorov: podría decirse que se trata de dos modelos distintos para un mismo formalismo, el de Kolmogorov.

Sobre Helium: ¿un esquema piramidal?

Por motivos que no vienen al caso, he estado investigando estos días de reojo Helium, una cosa muy críptica y cuya página web no ayuda en gran medida a clarificar y cuyas deficiencias esta entrada mía contribuya a rectificar. Esta entrada va a ser larga, dividida en varias secciones y con varias de propedéutica antes de entrar en materia.

Vaya en todo caso por delante que existen varias páginas, además de la de Helium, que describen el sistema muy bien, mucho mejor de lo que podría hacerlo yo, desde el punto de vista técnico (como esta). Yo, en todo caso, me voy a centrar más en la dimensión económica de la cosa.

¿Por qué es tan enrevesada la definición de intervalo de confianza?

En esta entrada voy a tratar de reconstruir históricamente el concepto de intervalo de confianza (IC) para tratar de explicar por qué el concepto ha llegado a tener una definición e interpretación tan precisa como confusa (e inútil). La interpretación de lo que realmente son los IC son el coco —el que se lleva a los diletantes que saben poco— con el que amenazar a quienes tienen inseguridades metodológicas y una marca de erudición incontestable para quienes son capaces de enunciarla sin que se les trabe la lengua.

Sobre rectángulos largos y estrechos

Una de las notas que tenía de la lectura del libro de visualización de datos de Healy se refería a los problemas de comparación que crean los rectángulos largos y estrechos. Es decir, cuando el tamaño de ciertas variables se codifica usando el área de rectángulos con dimensiones muy desiguales.

Reflexionando sobre el asunto, vi que el fenómeno de los rectángulos largos y estrechos (o mucha base y poca altura, si se quiere) es el que subyace al llamado problema de la conclusión repugnante, que aparece en ética cuando el criterio de bondad es el de la maximización de la suma de las utilidades individuales: una infinita (base) famélica (altura) legión podría tener unos niveles agregados de utilidad (base $latex \times$ altura) superiores a una población pequeña y feliz.

Gigerenzer sobre riesgo e incertidumbre

Esta es una entrada breve no tanto para comentar el vídeo

como para dejar constancia de algunas notas y referencias a vuelapluma que me sugirió. A saber:

Cierro con una nota personal:

¿La teoría de la probabilidad no extiende la lógica?

Después de haber estado un tiempo —hasta tener que interrumpirlo para convertirme en un elemento socialmente productivo— leyendo sobre cómo la teoría de la probabilidad extiende la lógica (Jaynes, Hacking y compañía), he incurrido en Probability theory does not extend logic. Se trata de un ensayito recomendable pero sobre el que advierto a sus posibles lectores que decae rápidamente de mucho al fango.

De él extraigo una interpretación muy heterodoxa de la probabilidad condicional expresada en términos de la lógica de predicados. Dice el autor que una expresión del tipo

Nutri-Score: el "algoritmo"

Se hablará mucho de Nutri-Score y de cómo es pernicioso dejar en manos de un algoritmo la decisión sobre la conveniencia o no de ciertos alimentos. Nutri-Score se convertirá en otra de esas malévolas encarnaciones de las matemáticas con vocación de destrucción masiva.

Pero que conste que Nutri-Score es, como algoritmo, solamente esto (fuente):

Al menos, esta vez no se lo podrá tachar de opaco.