Estadística Pública

¿Es tan terrible que no aumente la renta per cápita?

Leo en Marginal Revolution que Entre 2014 y 2024, el PIB real per cápita de Canadá, ajustado por paridad de poder adquisitivo, creció solo un 3,2% en total (un anémico 0,4% anual en promedio), situándose como el tercero más bajo entre 38 naciones avanzadas. Durante el mismo periodo, Estados Unidos registró un crecimiento total del 20,2% (1,9% anual), mientras que el promedio de la OCDE alcanzó el 15,3% (1,4% anual). Las deficiencias en las mediciones no pueden explicar diferencias de cinco a seis veces en las tasas de crecimiento. ...

Notas (15) sobre estadística: apuntes sobre publicaciones y noticias recientes de interés

David Oks advierte de que las cifras de población de muchos países son falsas. Aunque no hay que dar pábulo a teorías conspiranoicas sobre las cifras de población globales, hay evidencias sólidas de que las que proceden de muchos países pobres (menciona explícitamente Papúa Nueva Guinea, Nigeria, China, la India y Paraguay) tienen sesgos importantes. Saloni Dattani ha escrito un tutorial de visualización de datos que tiene muy buena pinta. Dos sobre análisis clínicos: ...

¿Existe tal cosa como el «PIB fantasma»?

En febrero de 2026, en el blog de Citrini Research se publicó The 2028 Global Intelligence Crisis, un ejercicio de economía-ficción distópica —fechado en junio de 2028— que describía un mundo en el que la IA había arrasado el empleo de cuello blanco con tal rapidez que el flujo circular de la economía se había roto. Muchos trabajos se habían desvanecido mientras los beneficios empresariales se disparaban y, sobre el papel, el PIB seguía creciendo. ...

Notas (9): Algunos enlaces y comentarios sobre temas estadísticos

Mills ratio and tail thickness — John D. Cook nos habla de la razón de Mills ($\int_x^\infty f(t) dt / f(x)$) para estudiar el grosor de las colas de las distribuciones de probabilidad. Por ejemplo, aunque una distribución t con muchos grados de libertad es muy similar a una normal en la parte central, la razón de Mills las distingue claramente por su distinto comportamiento en las colas. What is “workflow” and why is it important? — Sobre el flujo de trabajo del análisis de datos (con inspiración bayesiana), según Andrew Gelman (y sus coautores). R Workflow es la reinterpretación de Frank Harrell del mismo asunto. ...

¿Explica la paradoja de Simpson por qué crece la economía sin que se reduzca del desempleo?

Trae el New York Times un artículo excepcional —y al que se le puede sacar mucha punta—, 3 Theories of What’s Going On With the Contradictory Economic Data, sobre una aparente contradicción en las estadísticas económicas de los EEUU —crecimiento sustancial del PIB acompañado de un estancamiento del mercado laboral— alrededor de la fecha en la que esto se escribe. Las tres explicaciones que ofrece, que en realidad son cuatro, se presentan a continuación. ...

Un par de notas: metaanálisis y estadística pública

Hubo un tiempo en el que, para poder señalar que se hablaba ciencia en mano, había que citar RCTs. Pero los RCTs acabaron adocenándose y ahora estamos en la era de los metaanálisis. Pero algunos —¿cuántos?—, como nos advierte DataColada, son una especie de albóndiga —tan esférica ella— fabricada con carne picada de muy heterogénea procedencia. Los siguientes metaanálisis sobre lo del impacto del salario mínimo en nosequé cosas querrán incluir cuarto y mitad de esto. A todo esto: ¿qué llegará antes, la conclusión sobre lo del salario mínimo o las centrales eléctricas de fusión nuclear? ...

Sobre los efectos heterogéneos, la menguante calidad de las estadísticas públicas y algunos asuntos estadísticos más

El término y concepto de varianza se acuñaron para, al parecer, poder definir el de heredabilidad en la protogenética decimonónica. Dos artículos muy interesantes y accesibles sobre el tema (sobre todo el segundo), son Missing Heritability: Much More Than You Wanted To Know de Scott Alexander y Heritability puzzlers de Dynomight. (Si crees, como yo, que el segundo tiene un gazapo o inconsistencia, deja una nota en los comentarios). Solomon Kurz ha publicado material para aprender Stan con brms (partes I, II y III). Tengo dos objeciones al uso de brms: primero, que al usarlo no se aprende Stan sino otra cosa; y, segundo, que la interfaz de fórmula para la especificación de modelos, que es lo que permite brms, da de sí lo que da de sí y no más. Es cierto que casi siempre buscamos implementar modelos que admiten una interfaz de fórmula, pero esos son, precisamente, los más sencillos y para los que los LLMs tendrían menos problemas para generar el correspondiente código de Stan. ...

"Cuando los datos y las anécdotas no concuerdan, las anécdotas suelen ser correctas"

En la cuenta @StartupArchive_ de Twitter se publicó un vídeo de una entrevista a Jeff Bezos y (¿parte?) de su transcripción. Dice, con mi traducción: Jeff Bezos nos cuenta cómo una vez llamó al servicio de atención al cliente de Amazon en mitad de una reunión para demostrar que una métrica era incorrecta. […] Jeff cuenta una historia de los primeros días de Amazon, cuando sus métricas indicaban que los clientes esperaban menos de 60 segundos para obtener una respuesta después de llamar al número de atención al cliente. Sin embargo, las quejas de los clientes parecían indicar lo contrario. Como explica Jeff: ...

¿Reemplaza pxmake a pxR? Espero que sí (y, además, que ninguno de los dos haga falta pronto)

De pxR ya he hablado alguna vez. Pueden verse las entradas que le he dedicado aquí. pxR es un paquete coral de R que promoví, en el que escribí la mayor parte del código y que aún mantengo muy renuentemente. Permite leer y crear ficheros con el formato px, que utilizan todavía algunos servicios de estadística pública por el mundo. Eso no quita que “antediluviano” sea el adjetivo que mejor lo describe: fue creado antes de la popularización de los formatos modernos y, no en vano, la última de las entradas que le dediqué allá por 2023 se titulaba ¿Dejar morir pxR? ...

Cómo recompensamos a los creadores de ideas y algunos asuntos más

Comienzo con tres artículos recientes sobre un mismo tema: los problemas de los que adolecen las estadísticas públicas y las dificultades que ello supone para la gestión económica. Uno de ellos es este, en el que se da cuenta de la creciente desconfianza de los economistas de muchos países en los resultados de las encuestas que publican los órganos estadísticos. Apunta a dos causas: la infrafinanciación de la función estadística y la desconfianza de la población, manifestada en el derrumbe de la tasa de respuesta en las encuestas. El segundo se refiere a problemas específicos en el cómputo de la tasa de inflación en Argentina provocados por la flagrante desactualización de los ítems de la canasta de referencia. El tercero abunda en las sutilezas del proceso de actualización de dicha canasta. ...