Cortos

What Is Man, That Thou Are Mindful Of Him? es un texto satírico en el que se le da la vuelta a los argumentos que se hacen contra la inteligencia de los LLMs y volviéndolos contra los errores de razonamiento que cometemos tan frecuentemente los humanos.
Why AI systems might never be secure discute la “tríada letal” (exposición a datos externos, acceso a información privada y capacidad de actuar externamente) que hace de los agentes a los que se confieren las anteriores facultades sistemas intrínsecamente inseguros.
En los materiales del curso Stanford CS221 Autumn 2025 de la U. de Stanford, se puede encontrar el párrafo siguiente:

¡Aprende las operaciones básicas de NumPy con un tutor de IA! Usa un chatbot (p.e., ChatGPT, Claude, Gemini o Stanford AI Playground) para aprender por ti mismo cómo realizar operaciones vectoriales y matriciales básicas con NumPy. Los tutores de IA pueden construir hoy en día tutoriales interactivos excepcionalmente buenos y este año, en CS221, estamos investigando cómo pueden ayudarte a aprender los fundamentos más interactivamente que a través de los ejercicios estáticos clásicos.

Uno de los metaprincipios de la construcción de modelos estadísticos es que la calidad de los modelos es función de la cantidad de información que hay en los datos de entrenamiento. No existe el bootstrap en el sentido etimológico del término: no puede uno levantarse en el aire tirando hacia arriba de los cordones de los zapatos. Pero al hilo de una noticia reciente, Gelman discute si añadir ruido a los datos permite reducir el sobreajuste. Además, en la discusión al respecto, alguien cita el artículo de 1995 Training with Noise is Equivalent to Tikhonov Regularization, una especie de penalización en el tamaño de los coeficientes al modo de la regresión ridge.

Hoy traigo a la atención de mis escasísimos pero selectos lectores una serie de notas que he recopilado en los últimos tiempos porque han llamado mi atención y que he arrejuntado alrededor de la genérica etiqueta de “tecnología”.

Una selección de diez librerías de Python para la creación de UIs. Una vez construí una aplicación de Android nativa que mostraba un dashboard en un móvil viejo 24/7. Sudé tinta. Hoy, casi seguro, lo haría en una fracción del tiempo.
En Extrapolating quantum factoring se cuenta cómo en 2001 un ordenador cuántico podía factorizar el número 15 y, en 2012, el 21. Luego extrapola, pero eso es lo de menos.
Ahora que está de moda medir superficies en “campos de fútbol” no sorprenderá tanto que se utilicen los “litros de agua hirviendo” como indicador de la fortaleza de una clave criptográfica.
The Electrotech Revolution: Some insights into a new way of thinking about the transition muestra una visión optimista del futuro en el que la energía es abundante y barata. La parte más interesante es esa en la que se discute cuánta de la llamada energía primaria actual acaba realmente creando trabajo útil (en lugar de, por ejemplo, calor disipado tontamente en la atmósfera).
The beauty of batteries es otro artículo optimista que discute cómo el despliegue masivo de baterías puede solucionar muchos de los problemas de nuestros sistemas de distribución eléctrica. Por ejemplo, una estación de energía renovable —y, por lo tanto, de generación irregular— remota necesitaría una conexión eléctrica de menor capacidad (y, por lo tanto mucho más económica) si dispusiese de baterías que le permitiesen evacuar la energía de manera constante a lo largo del día. Muchas ampliaciones de capacidad en determinadas líneas podrían evitarse si, con el concurso de las baterías, la energía pudiera distribuirse de manera mucho más homogénea a lo largo del tiempo. En términos estadísticos, las baterías son dispositivos que transforman los extremos en medias.
Tras la electricidad, el agua. How Does the US Use Water? nos habla de esa infraestructura y tecnología que tantas veces damos simplemente por supuesto y en la que apenas paramos mientes.

Cuando escribo sobre mala ciencia, es un clásico incluir artículos de Radiando, como ¿Cuánta radiación recibimos del 5G? Soy particularmente sensible al tema porque mi exvecino del sexto, un tal Bardasano, fue uno de los más prominentes defensores del “el móvil nos va a freír los sesos a todos” del reino. Se lo puede leer en acción en artículos como este.

Hablé aquí, hace ya casi dos años, de un estudio con 37 sujetos a los que —presuntamente, como se estila en la España constitucional— se les encogía el cerebro. Compartía aquella entrada etiqueta con esta: la de mala ciencia. Ahora, The Economist nos cuenta de manera no irónica How becoming a father shrinks your cerebrum glosando aquel mismo estudio. Tengo el indicador de Gell-Mann aceleradísimo.

En In praise of complicated investing strategies, The Economist hace una cuasi-herética defensa de los modelos complejos contra la archimanida navaja de Ockham. En particular, dice:

Todavía es prematuro ir preparando el epitafio de la máxima de Ockham. Pero ni los escépticos rechazan de entrada la idea de que los modelos grandes y complejos puedan producir mejores predicciones que los simples; solo sostienen que esto no tiene por qué ocurrir siempre.

En The Drugs Are Taking Hold, David Rosenthal discute la muy problemática rentabilidad futura del negocio de los LLMs. Usa la palabra burbuja doce veces.
Dynomight escribe un tanto apocalípticamente sobre la potencial capacidad de persuasión de los LLMs. No de los actuales sino de los mucho más inteligentes que se supone que llegarán en algún momento.
Este es un hilo en Reddit sobre las actividades más lucrativas para las que los participantes han usado los LLMs. Una de ellas, interactuar con compañías de seguros.
Salió Qwen-Image-Edit y, después, Nano Banana, que todo el mundo dice que es mejor. Aún no he jugado con ninguno de ellos.
Más sobre el impacto medioambiental de los LLMs. Esta vez, el de Gemini.
¿Pueden los LLMs razonar y planificar? Hay indicios que hacen sospechar que, de hacerlo, lo hacen muy precariamente. Un indicio de ello es, por ejemplo, que generan tokens a la misma velocidad independientemente de la complejidad (en el sentido técnico, matemático, del término) de la tarea propuesta, cosa que es matemáticamente imposible.
Dicen que superwhisper es muy bueno para pasar de voz a texto.
En el blog de Andrew Gelman no son muy entusiastas de los LLMs. Sin embargo, acaban de publicar esto. Pronostico aggiornamento a corto plazo.
Simon Willison ha publicado una lista de algunas de las herramientas que ha creado con LLMs. También ha publicado este ejemplo bastante completo de un análisis de datos realizado a golpe de vibe.

Hubo un tiempo en el que para poder señalar que se hablaba ciencia en mano había que citar RCTs. Pero los RCTs acabaron adocenándose y ahora estamos en la era de los metaanálisis. Pero algunos —¿cuántos?—, como nos advierte DataColada, son una especie de albóndiga —tan esférica ella— fabricada con carne picada de muy heterogénea procedencia.

Los siguientes metaanálisis sobre lo del impacto del salario mínimo en nosequé cosas querrán incluir cuarto y mitad de esto. A todo esto: ¿qué llegará antes, la conclusión sobre lo del salario mínimo o las centrales eléctricas de fusión nuclear?

Todo sobre el rango dinámico de un sensor de imagen (con R).
“Docling simplifica el procesamiento y parseado de documentos en distintos formatos, incluidos PDFs complejos, […].” Es de IBM (¿existe aún?) y, a pesar de eso, el proyecto está alojado en GitHub.
No sé si me gustan los Notebooks 2.0 de Observable, un híbrido de Jupyter y Excel (es decir, notebooks reactivos). ¿Qué pasará cuando tengas en una celda cálculos largos y cambies accidentalmente un valor que le afecta? ¿Tocará ir por café?
En The Bouquet Residence, Steven Wittens critica una tendencia que observa en la estrategia de comunicación de empresas tecnológicas que prima la emoción sobre la información técnica y basada en hechos y datos, particularmente durante las crisis o las caídas de los sistemas.

The Economist trae una pieza, Want better returns? Forget risk. Focus on fear sobre el papel del miedo en la valoración de activos financieros. Sobre cómo modelarlo matemáticamente, menciona:

El riesgo se mide a través de la varianza (sic), pero el FOL (fear of loss) se refiere únicamente a las pérdidas (o la “semivarianza”). Un activo inspira FOMO (fear of missing out) cuando existe la posibilidad de que tenga una subida abrupta e inesperada que se puedan perder quienes la ignoran. Esto lo mide la asimetría de la distribución de rendimientos.

Dinomight sobre las miserias del peer review. Incluye un par de párrafos buenísimos:

¿Pero qué pasa cuando alguien descubre un error en un artículo ya publicado? Sucede todo el tiempo, pero los artículos casi nunca se retiran o corrigen. Nadie hace mucho aspaviento porque, de nuevo, [los autores] son colegas. ¿Por qué crearse enemigos? Incluso si publican un resultado que corrige luego los errores del primer artículo, la gente tiende a medir tanto sus palabras que la crítica es apenas perceptible.

Cortos

Unas cuantas notas sobre LLMs

Unas cuantas notas sobre estadística

Unas cuantas notas sobre tecnología

Unas cuantas notas sobre ciencia de la mala

Unas cuantas noticias sobre temas económicos

Varias noticias sobre el mundo de los LLMs

Un par de notas: metaanálisis y estadística pública

Varios artículos que tenía recopilados sobre tecnología

Sobre acicate como traducción de "nudge" y otros asuntos más

Una serie de notas sobre el siempre fértil campo de la mala ciencia