Un viejo truco para que R vuele

R

Existe un viejo truco —mas no por ello conocido— para que R vuele. Lo aprendí en una conferencia de uno de los padres de R (aunque ya no recuerdo quién era) en la primera década del siglo. El problema que tenía entre manos era el de ajustar unos cuantos miles de regresiones logísticas. Además de hacer uso de los métodos de paralelización, aún muy rudimentarios en la época, uno de los trucos más efectivos que utilizaba era el de desnudar las funciones.

Causalidad y paraísos fiscales

El argumento del artículo Paraísos Fiscales, Wealth Taxation, and Mobility pivota esencialmente sobre el gráfico

que resultará familiar a muchos lectores de este blog (y, si no, mirad esto). Se trata de un estudio causal de libro en el que se pretende medir el efecto de una política ocurrida en 2010 sobre la línea roja y la línea azul.

La política en cuestión es la reintroducción del impuesto del patrimonio en España en 2010 y las líneas azul y rojas… no está claro. Deberían ser, pretenden ser, el incremento de personas sujetas a dicho impuesto en Madrid (en rojo) y en otras regiones (azul). Los autores lo resumen diciendo que el número de ricos viviendo en Madrid ha subido en 6000 mientras que en el resto de las 16 regiones ha decrecido en una media de 375. Convenientemente, 16 * 375 = 6000.

Más sobre si la estadística es una ciencia

A veces nos encontramos con problemas como:

  • curar un orzuelo,
  • calcular el área por debajo de una curva,
  • medir la altura de la torre de una iglesia o
  • estimar la elasticidad del consumo de un producto con respecto a su precio

y utilizamos técnicas como

  • preparar un ungüento de acuerdo con las instrucciones de una vecina octogenaria;
  • pintar la curva sobre un cartón, recortarlo y pesarlo;
  • preguntarle al párroco u
  • obtener datos de precios, consumos y hacer algún tipo de regresión.

Algunas de esas técnicas son tecnologías; otras, no. Todas las tecnologías son técnicas, pero no a la inversa. Una tecnología es una técnica basada en la ciencia.

Una nota sobre el artículo "retractado" porque sus autores habían omitido vínculos con la industria del tabaco

Hace unos días se retractó un artículo sobre la relación entre el tabaco y el covid porque los autores habían omitido cierta presunto conflicto de intereses (los detalles, aquí).

He subrayado la palabra porque en el párrafo anterior: es la más relevante de toda la historia.

No mucha gente sabe que el teorema de Pitágoras es simplemente la proposición 47 de los Elementos de Euclides. Ni a Euclides ni a nosotros nos importa en absoluto si Pitágoras tuvo conflicto de intereses alguno con la industria del cartabón ni con el sindicato de agrimensores. La geometría es una de esas disciplinas científicas donde la identidad del sujeto que propone, describe o demuestra proposiciones queda eliminada de la ecuación, se convierte en algo totalmente irrelevante.

Un artículo muy poco BdE del BdE

En tiempos, cuando me dedicaba a esas cosas, el principal motivo por el que en los bancos que conocí por dentro no usaban otra cosa que GLMs era el BdE. Más concretamente, el carpetovetonismo del BdE: el BdE quería y esperaba GLMs, los bancos construían y mostraban GLMs a los reguladores y todo el mundo vivía feliz y despreocupado de las novedades en su covacha.

Ahora, en el BdE han publicado esto, cuyo resumen es:

Nuevo vídeo en YouTube: analizo un proyecto de fugas de clientes en Paypal

Acabo de subir a Youtube mi último vídeo:

En él analizo este hilo de Twitter en el que su autor describe un proyecto muy particular —heterodoxo— de ciencia de datos cuyo objetivo consiste identificar y prevenir la fuga de clientes. El hilo ha circulado todo lo viralmente que permite el tema y me ha parecido interesante sacarle un poco de punta.

Más sobre ese corolario del teorema de Rolle que es la curva de Laffer

Es fácil nunca dar con algo que no quieres encontrar: basta con buscarlo donde sabes que no está.

Eso es perfectamente predicable de todos los ensayos de los que tengo noticia para demostrar empíricamente la inexistencia —¡eh!, ¿no habíamos quedado en que que la inexistencia de algo no es demostrable empíricamente?— de ese corolario del teorema de Rolle que se ha dado en llamar curva de Laffer.

Hay que tener en cuenta que en una economía como la española —y más en estos tiempos—, casi el 100% de los agentes económicos operan muy por debajo de ese pico que postulan Laffer y Rolle. De hecho, uno puede ver cómo un porcentaje sustancial de los ocupados en España pertenecen a la categoría de subempleados por insuficiencia de horas.