Posts

Los LLMs chinos, ¿ocho meses por detrás del estado del arte?

Uno de los indicadores que sigue la gente hoy en día —y yo con particular interés— es el de «cuántos meses por detrás» de los mejores LLMs estadounidenses se encuentran los modelos chinos. Al respecto, el NIST (National Institute of Standards and Technology de los EEUU) ha publicado el estudio CAISI Evaluation of DeepSeek V4 Pro, que se resume en que el retraso es de ocho meses, y que contiene el gráfico ...

Notas (21): Predicciones, métricas y el rigor de los datos: un recorrido por la actualidad estadística

A veces hay en el mundo una variable aleatoria $X$ que distintos agentes tratan de predecir. Pero en otras ocasiones hay una variable aleatoria $X$, ciertos agentes crean predicciones $Y$ de $X$ y otros están interesados en la predicción de $Y$, tal como describe Matt Levine en Weather Prediction Prediction. The Economist describe los esfuerzos de la India por recuperar la credibilidad de sus estadísticas nacionales tras años de interferencia política. ...

Tres maneras de «atacar» un problema estadístico (¿o es una sola?)

Andrew Gelman escribió recientemente These are the three ways of attacking a statistical problem (illustrated with the NFL example) en el que se enfrenta a un problema estadístico usando tres técnicas distintas. El problema consiste en determinar cuál es el patrón de resultados más frecuente en series de cuatro enfrentamientos entre equipos de fútbol americano: todas las combinaciones $(x_1, x_2, x_3, x_4)$, donde $x_i \in {0, 1}$, desde $(1, 1, 1, 1)$ (el primer equipo gana todos los enfrentamientos) hasta $(0, 0, 0, 0)$ (el primer equipo pierde todos los enfrentamientos). ...

Notas (20): las particularidades del mercado hipotecario en Dinamarca y el declive de la teoría en economía

Un nuevo estudio reseñado en The Economic Value of Eliminating Cancer estima que eliminar la mortalidad por cáncer en EEUU generaría beneficios económicos por valor de 197 billones (españoles) de dólares en un horizonte de 35 años. El análisis destaca que la inversión en investigación para erradicar esta enfermedad ofrece una tasa de retorno excepcionalmente alta, equivalente a miles de dólares anuales por cada hogar estadounidense. La economía era una disciplina que disponía de una teoría (la teoría de precios o el «marginalismo») que usaba para tratar de comprender, explicar y optimizar cierto tipo de fenómenos sociales. Un reciente libro de Tyler Cowen, The Marginal Revolution, da cuenta de las limitaciones de esta teoría y de cómo, debido a ellas, la economía moderna tiende a constituirse como una colección de resultados empíricos ad hoc no sostenidos por teoría general alguna. Price Theory. RIP? y The End of Economics? abundan sobre la cuestión. ...

¿Es tan terrible que no aumente la renta per cápita?

Leo en Marginal Revolution que Entre 2014 y 2024, el PIB real per cápita de Canadá, ajustado por paridad de poder adquisitivo, creció solo un 3,2% en total (un anémico 0,4% anual en promedio), situándose como el tercero más bajo entre 38 naciones avanzadas. Durante el mismo periodo, Estados Unidos registró un crecimiento total del 20,2% (1,9% anual), mientras que el promedio de la OCDE alcanzó el 15,3% (1,4% anual). Las deficiencias en las mediciones no pueden explicar diferencias de cinco a seis veces en las tasas de crecimiento. ...

Notas (19): noticias recientes sobre el mundo de los LLMs

En La Inteligencia Artificial nunca vencerá al funcionario español, Alberto Olmos argumenta que la complejidad intrínseca de la administración pública española actuará como una barrera insuperable para la automatización total por parte de algoritmos. Sam Rose ha creado un «ensayo visual» para explicar desde cero el mecanismo de la «cuantización» de modelos y estimar la correspondiente pérdida de precisión. John D. Cook también estudia el proceso presentando el formato NF4, que usa 4 bits para almacenar floats pero que es más preciso que otras alternativas porque tiene en cuenta la distribución aproximadamente gaussiana de los pesos de los LLMs. ...

Pruebas A/B bayesianas: sobre la elección de una priori compatible con lo que cabe esperar de ella

No voy a robar el tiempo de nadie explicando qué es una prueba A/B. Diré solo que las voy a estudiar desde una perspectiva bayesiana y que voy a analizar críticamente la selección de las prioris. Por centrar ideas, supongo que la tasa de éxito a priori está alrededor del 5% y que mis prioris van a ser, en principio, betas: mu <- .05 sd <- .02 # cálculo de los parámetros de la beta correspondiente beta_params <- function(mu, sd) { var <- sd^2 tmp <- mu * (1 - mu) / var - 1 a <- mu * tmp b <- (1 - mu) * tmp c(a = a, b = b) } parms <- beta_params(mu, sd) print(parms) # a b # 5.8875 111.8625 Una elección estándar de las prioris sería considerar $A, B \sim \text{Beta}(a, b)$ independientes. Entonces cabe preguntarse si la distribución a priori es compatible o no con lo que se esperaría al observar datos. La respuesta es negativa. ...

Notas (18): «pipelines» en R de todos los colores y algunas otras cosas más

Intersecting spheres and GPS explica los principios matemáticos del GPS y, en particular, el del cálculo de la intersección de esferas. Que, además y contrariamente a la primera intuición, puede reformularse como la solución de un sistema de ecuaciones lineales. Todos los días aprendes un poquito más de bash.. Y también sobre cómo hacer para que los distintos módulos de una aplicación en shiny compartan datos. Guillermo Luijk sigue regalándonos artículos en la intersección de la fotografía, la geometría y R: ...

Covid: ¿una o dos transmisiones a humanos?

Volveré al covid más abajo. Antes, propedéutica. Hay dos monedas, la A y la B. Alguien tira una de ellas 100 veces y obtiene 60 caras. Y la pregunta es: ¿qué moneda usó? Un indicador que nos permite razonar sobre qué moneda es más plausible es el factor de Bayes, es decir, la razón $$\frac{P(60/100 | A)}{P(60/100 | B)}$$ Para calcular $P(60/100 | X)$, lanzo la moneda $X$ $N \times 100$ veces, cuento el número de caras en cada una de las $N$ rachas de $100$ tiradas y calculo la proporción de casos en los que obtengo exactamente 60 caras. ...

Notas (17) sobre ciencia: desinformación elitista, historia de la historia de la ciencia y algunas cosas más

Joseph Heath ha acuñado el término highbrow misinformation (¿«desinformación elitista»?): A esto lo denomino «desinformación elitista» no solo por el nivel social y la autoconsideración de quienes creen en ella sino, además, por la forma relativamente sofisticada en que se propaga. A menudo, uno puede encontrar el enunciado exacto sepultado en algún lugar del texto, pero expuesto intencionalmente de tal manera que confunde a la mayoría de los lectores. Andrew Gelman escribe sobre qué creencias se consideran aceptables y cuáles no. Donde «socialmente aceptables» quiere decir exactamente «entre gente de cierta clase social y nivel intelectual». Lo usa para reprochar a algunos haber dado asomos de credibilidad a historias sobre OVNIs. ...