Ia | Carlos J. Gil Bellosta

Notas (19): noticias recientes sobre el mundo de los LLMs

En La Inteligencia Artificial nunca vencerá al funcionario español, Alberto Olmos argumenta que la complejidad intrínseca de la administración pública española actuará como una barrera insuperable para la automatización total por parte de algoritmos. Sam Rose ha creado un «ensayo visual» para explicar desde cero el mecanismo de la «cuantización» de modelos y estimar la correspondiente pérdida de precisión. John D. Cook también estudia el proceso presentando el formato NF4, que usa 4 bits para almacenar floats pero que es más preciso que otras alternativas porque tiene en cuenta la distribución aproximadamente gaussiana de los pesos de los LLMs. ...

Notas (13) sobre ciencia: de la confianza en los resultados científicos al declive de la ciencia alemana

Tyler Cowen plantea la pregunta del millón: ¿En qué resultados científicos (publicados) podemos confiar?. Supongo que la respuesta está condicionada por el hecho de que es economista y que está anclado en su disciplina, que no es precisamente la química o las matemáticas. Csaba Szabo describe el funcionamiento interno de las «fábricas de artículos científicos», que venden autorías y manipulan datos para lograr publicaciones. The Hypothesis Trap nos recuerda una vez más cómo los científicos tienden a apegarse emocionalmente a sus propias hipótesis, lo que genera sesgos y resistencia al cambio. ...

Los LLMs y la devaluación del conocimiento legible

A la hora de evaluar el potencial impacto de los LLMs en el mercado laboral, tanto en general como en el más concreto de la ciencia de datos y la estadística, es conveniente distinguir entre tipos de conocimiento. En esta entrada voy a considerar una dimensión muy particular en la que la inteligencia de los LLMs y la humana operan de manera muy distinta: la de la legibilidad de la información y el conocimiento. ...

¿Explica la paradoja de Simpson por qué crece la economía sin que se reduzca del desempleo?

Trae el New York Times un artículo excepcional —y al que se le puede sacar mucha punta—, 3 Theories of What’s Going On With the Contradictory Economic Data, sobre una aparente contradicción en las estadísticas económicas de los EEUU —crecimiento sustancial del PIB acompañado de un estancamiento del mercado laboral— alrededor de la fecha en la que esto se escribe. Las tres explicaciones que ofrece, que en realidad son cuatro, se presentan a continuación. ...

Unas cuantas notas sobre estadística, teoría y de la decisión y otras cuestiones

Un artículo sobre cómo crear intervalos de predicción conformes en modelos de ML, en particular con modelos basados en XGBoost. Y otro, este, sobre cómo inferir el tamaño muestral a partir de su anchura. También de John D. Cook, ODE to Fisher’s transform. Aparentemente, para normalizar el coeficiente de correlación se puede aplicar una transformación en la que interviene atanh y cuya derivación exige resolver una ecuación diferencial ordinaria. Por su parte, la ecuación diferencial surge de igualar el desarrollo de la curtosis a cero. ...

LLMs para la predicción de series temporales y algunos asuntos más

El prompt injection es una técnica para robar información a un agente. Si un agente tiene, por ejemplo, acceso al correo electrónico, se le puede enviar un mensaje dándole instrucciones que alteren su comportamiento. Es un problema bien conocido de los agentes y ahora en Defeating Prompt Injections by Design se describe una solución basada en dos agentes, uno de los cuales tiene como función supervisar las acciones del otro. Como no puede ser de otra manera, el MCP plantea grandes problemas de seguridad. ...

Migración de Pocket a Wallabag

Creo que en alguna ocasión he hablado de mi infraestructura para industrializar mi proceso de lectura. A grandes rasgos, funcionaba así: Uso Pocket como repositorio central. Una de las ventajas que ofrece es que dispone de una API pública para operar sobre él. Sigo unos cuantos blogs e importo los RSS a Pocket en un proceso diario que corre vía cron en mi servidor doméstico. Además, en Pocket almaceno artículos interesantes que encontraba mientras navegaba. Un proceso horario reclasifica esos enlaces bajo distintas etiquetas específicas para: Entradas que leer más despacio (p.e., el fin de semana, frecuentemente con el apoyo de NotebookLM). Entradas que archivar en Obsidian. Entradas que me inspiran a escribir sobre asuntos en el blog. Etc. Una de las etiquetas, resumir se asocia a enlaces cuyos contenidos paso luego por un LLM para obtener un resumen del texto. La entrada en cuestión se reetiqueta como resumida y, una vez leído el resumen, considero las distintas opciones: borrarla, reetiquetarla de nuevo, etc. Todo el proceso ocurre con un alto grado de automatización: ...

El bee-bot vía "artefactos" de Claude

El “bee-bot” es un juego infantil educativo no particularmente barato. Así que he construido una versión web de la cosa en poco rato. En particular, le he dicho a Claude: I want to create a webpage to play a version of the bee-bot game for children. In the main canvas there is a grid. In two random squares of the grid, there are a bee and a flower. The interface are four buttons with numbers 1-4, four arrows and a go button. The child needs to type the sequence of numbers and arrows and when the go button is pressed, the bee will move. Say, if the sequence is 2, up, 4, right, 2, the bee will move two squares, then turn up, advance 4 squares, turn right, and move two squares. ...

Monosemanticidad: una introducción para despistados

I Hay gente que estudia el funcionamiento del cerebro. Una de las cosas que buscan es tratar de relacionar funciones cognitivas con regiones concretas. Para eso usan MRI, electrodos, etc. Yo qué sé. Un problema al que se enfrentan los investigadores es que estos procedimientos son o muy intrusivos, o tienen mucho ruido o ambos a la vez. Hay gente que busca entender de manera similar los LLMs y responder a preguntas del tipo: ¿es posible identificar coeficientes (o grupos de coeficientes) relacionados con conceptos concretos? Además, examinar los coeficientes de un LLM es mucho más sencillo que estudiar sinapsis de lejos. De todos modos, no está claro, a priori, que tenga que ocurrir de esa manera, es decir, que tengan que existir regiones (no necesariamente físicamente colindantes) de los coeficientes que estén vinculadas unívocamente a un concepto determinado. ...

Más ideas alrededor de la sentencia de lo del bono social de la luz

[En esta entrada abundo en lo escrito la semana pasada sobre el mismo asunto centrándome esta vez en la extraña interpretación que hace el derecho de la automatización, los algoritmos, la IA y todas esas cosas.] I. Comienzo con un par de historias que al principio podría parecer que no vienen al caso. Realicé mi primera declaración de la renta allá por el 93. En esa época, uno iba a un estanco y por 45 pesetas adquiría un sobre grande en el que venían: ...