I.
Si uno hace
n <- 1000
# dos clases del mismo tamaño n
x <- c(rep(0, n), rep(1, n))
# mean(y0) = .45, mean(y1) = .55
y0 <- y1 <- rep(0, n)
y0[1:(.45 * n)] <- 1
y1[1:(.55 * n)] <- 1
# mean(y) = .5
y <- c(y0, y1)
summary(lm(y ~ x))
ING tiene ciertas ventajas en las que noi voy a abundar para aquellos inversores interesados en hacer medrar sus ahorros en carteras de ETFs. Por otra parte, dos de sus principales desventajas son:
- Que la lista de ETFs disponibles no es particularmente amplia.
- Que su buscador de ETFs es manifiestamente perfectible.
Como remedio a (2) me he entretenido en orquestar un sistema que descarga y organiza la lista de ETFs disponibles en ING y hacerla pública
aquí.
I.
Hace unos años, en un congreso de R, hubo un panel de periodistas de datos. En la ronda de preguntas, alguien del público preguntó: “¿cómo manipuláis los datos?” Muy previsiblemente, los tres panelistas respondieron respodieron rápida y destempladamente: “No manipulamos los datos”.
II.
Discriminar —es decir, separar una masa en unidades homogéneas— es una de las tareas tradicionales de la estadística. La técnica más básica y explícita de discriminación (el análisis discriminante lineal), fue introducida por Fisher entre 1936 y 1940 en una serie de artículos, de entre los cuales, el más famoso es
The use of multiple measurements in taxonomic problems,
publicado nada menos que en los Annals of Eugenics, y en cuya segunda página aparece en toda su gloria y para la posteridad en famoso conjunto de datos iris
.
I.
A veces te tropiezas con algún conocido en algún sitio fuera de donde lo frecuentas y lo saludas con un “¿qué haces tú por aquí?”.
El otro día, leyendo sobre
aquellos audaces emprendedores de siglos atrás que perseguían móviles perpetuos
tropecé con William Petty, nada menos.
II.
Tomas varias fotos de un mismo motivo y las combinas (o apilas) usando distintas técnicas. Guillermo Luijk nos ilustra con lo que pasa cuando usas
el mínimo,
el máximo,
la media y
la mediana
como funciones de agregación.
En muchos sitios se habla sobre cómo A causa B —o tiene un efecto de cierto tamaño sobre B—. Mucho menos se suele hablar de la forma de ese efecto. El siguiente gráfico (extraído de
aquí)
muestra ocho de las infinitas formas en que una variable puede tener un efecto sobre otra:
En todas ellas, el efecto global tiene el mismo valor medio.
Los corolarios los dejo para cada cual.
I.
Están apareciendo herramientas basadas en LLMs para industrializar la investigación. Tengo recopiladas, por el momento, cuatro:
Consensus,
Zotero,
Elicit,
Tavily y
FutureSearch. De vez en cuando pruebo Consensus para valorar cómo va mejorando. Y le queda: la última vez, al preguntarle sobre el procedimiento científico para reproducir la dipladenia por esquejes, me sugirió algo así como aplicarle rayos gamma (!).
II.
Unos cuantos enlaces sobre aplicaciones reales —en la economía real— de los LLMs (y los LMMs) en diversas áreas, como el
vídeo (vía sora
),
la música (vía suno
),
la programación (vía devin
) o
el RAG y/o Finetuning.
I.
La teoría dice que el valor ahora (o presente) de un bien $A$ en el futuro, dentro de un tiempo $t$, es $A\exp(-tr)$, donde $r$ es la llamada tasa de descuento.
Entonces, si $A$ son 100 € y la $r$ de cierto individuo es tal que el valor presente de 100 € dentro de un año son 50 €, este individuo valorará de igual manera 50 € hoy o $100 \exp(-r) = 50$ € dentro de un año.