Notas (13) sobre ciencia: de la confianza en los resultados científicos al declive de la ciencia alemana

Tyler Cowen plantea la pregunta del millón: ¿En qué resultados científicos (publicados) podemos confiar?. Supongo que la respuesta está condicionada por el hecho de que es economista y que está anclado en su disciplina, que no es precisamente la química o las matemáticas. Csaba Szabo describe el funcionamiento interno de las «fábricas de artículos científicos», que venden autorías y manipulan datos para lograr publicaciones. The Hypothesis Trap nos recuerda una vez más cómo los científicos tienden a apegarse emocionalmente a sus propias hipótesis, lo que genera sesgos y resistencia al cambio. ...

23 de marzo de 2026 · Carlos J. Gil Bellosta

Los LLMs y la devaluación del conocimiento legible

A la hora de evaluar el potencial impacto de los LLMs en el mercado laboral, tanto en general como en el más concreto de la ciencia de datos y la estadística, es conveniente distinguir entre tipos de conocimiento. En esta entrada voy a considerar una dimensión muy particular en la que la inteligencia de los LLMs y la humana operan de manera muy distinta: la de la legibilidad de la información y el conocimiento. ...

12 de marzo de 2026 · Carlos J. Gil Bellosta

¿Explica la paradoja de Simpson por qué crece la economía sin que se reduzca del desempleo?

Trae el New York Times un artículo excepcional —y al que se le puede sacar mucha punta—, 3 Theories of What’s Going On With the Contradictory Economic Data, sobre una aparente contradicción en las estadísticas económicas de los EEUU —crecimiento sustancial del PIB acompañado de un estancamiento del mercado laboral— alrededor de la fecha en la que esto se escribe. Las tres explicaciones que ofrece, que en realidad son cuatro, se presentan a continuación. ...

14 de enero de 2026 · Carlos J. Gil Bellosta

Unas cuantas notas sobre estadística, teoría y de la decisión y otras cuestiones

Un artículo sobre cómo crear intervalos de predicción conformes en modelos de ML, en particular con modelos basados en XGBoost. Y otro, este, sobre cómo inferir el tamaño muestral a partir de su anchura. También de John D. Cook, ODE to Fisher’s transform. Aparentemente, para normalizar el coeficiente de correlación se puede aplicar una transformación en la que interviene atanh y cuya derivación exige resolver una ecuación diferencial ordinaria. Por su parte, la ecuación diferencial surge de igualar el desarrollo de la curtosis a cero. ...

20 de noviembre de 2025 · Carlos J. Gil Bellosta

LLMs para la predicción de series temporales y algunos asuntos más

El prompt injection es una técnica para robar información a un agente. Si un agente tiene, por ejemplo, acceso al correo electrónico, se le puede enviar un mensaje dándole instrucciones que alteren su comportamiento. Es un problema bien conocido de los agentes y ahora en Defeating Prompt Injections by Design se describe una solución basada en dos agentes, uno de los cuales tiene como función supervisar las acciones del otro. Como no puede ser de otra manera, el MCP plantea grandes problemas de seguridad. ...

13 de mayo de 2025 · Carlos J. Gil Bellosta

Migración de Pocket a Wallabag

Creo que en alguna ocasión he hablado de mi infraestructura para industrializar mi proceso de lectura. A grandes rasgos, funcionaba así: Uso Pocket como repositorio central. Una de las ventajas que ofrece es que dispone de una API pública para operar sobre él. Sigo unos cuantos blogs e importo los RSS a Pocket en un proceso diario que corre vía cron en mi servidor doméstico. Además, en Pocket almaceno artículos interesantes que encontraba mientras navegaba. Un proceso horario reclasifica esos enlaces bajo distintas etiquetas específicas para: Entradas que leer más despacio (p.e., el fin de semana, frecuentemente con el apoyo de NotebookLM). Entradas que archivar en Obsidian. Entradas que me inspiran a escribir sobre asuntos en el blog. Etc. Una de las etiquetas, resumir se asocia a enlaces cuyos contenidos paso luego por un LLM para obtener un resumen del texto. La entrada en cuestión se reetiqueta como resumida y, una vez leído el resumen, considero las distintas opciones: borrarla, reetiquetarla de nuevo, etc. Todo el proceso ocurre con un alto grado de automatización: ...

8 de mayo de 2025 · Carlos J. Gil Bellosta

El bee-bot vía "artefactos" de Claude

El “bee-bot” es un juego infantil educativo no particularmente barato. Así que he construido una versión web de la cosa en poco rato. En particular, le he dicho a Claude: I want to create a webpage to play a version of the bee-bot game for children. In the main canvas there is a grid. In two random squares of the grid, there are a bee and a flower. The interface are four buttons with numbers 1-4, four arrows and a go button. The child needs to type the sequence of numbers and arrows and when the go button is pressed, the bee will move. Say, if the sequence is 2, up, 4, right, 2, the bee will move two squares, then turn up, advance 4 squares, turn right, and move two squares. ...

24 de octubre de 2024 · Carlos J. Gil Bellosta

Monosemanticidad: una introducción para despistados

I Hay gente que estudia el funcionamiento del cerebro. Una de las cosas que buscan es tratar de relacionar funciones cognitivas con regiones concretas. Para eso usan MRI, electrodos, etc. Yo qué sé. Un problema al que se enfrentan los investigadores es que estos procedimientos son o muy intrusivos, o tienen mucho ruido o ambos a la vez. Hay gente que busca entender de manera similar los LLMs y responder a preguntas del tipo: ¿es posible identificar coeficientes (o grupos de coeficientes) relacionados con conceptos concretos? Además, examinar los coeficientes de un LLM es mucho más sencillo que estudiar sinapsis de lejos. De todos modos, no está claro, a priori, que tenga que ocurrir de esa manera, es decir, que tengan que existir regiones (no necesariamente físicamente colindantes) de los coeficientes que estén vinculadas unívocamente a un concepto determinado. ...

16 de julio de 2024 · Carlos J. Gil Bellosta

Más ideas alrededor de la sentencia de lo del bono social de la luz

[En esta entrada abundo en lo escrito la semana pasada sobre el mismo asunto centrándome esta vez en la extraña interpretación que hace el derecho de la automatización, los algoritmos, la IA y todas esas cosas.] I. Comienzo con un par de historias que al principio podría parecer que no vienen al caso. Realicé mi primera declaración de la renta allá por el 93. En esa época, uno iba a un estanco y por 45 pesetas adquiría un sobre grande en el que venían: ...

21 de mayo de 2024 · Carlos J. Gil Bellosta

Ideas alrededor de la sentencia de lo del bono social de la luz

I. En España se ideó un sistema para que los menesterosos disfrutasen de luz cuasigratuita al que se le dio el nombre de bono social eléctrico (o similar). Para recibirlo, el interesado tiene que acreditar una serie de hechos objetivos; luego, un algoritmo determinista —del que la ley y sus reglamentos son el seudocódigo— determina la procedencia o no del bono. Ese algoritmo se implementó en un programa llamado BOSCO. ...

16 de mayo de 2024 · Carlos J. Gil Bellosta