¿Por qué son los eventos (en probabilidad) conjuntos y no otra cosa?

I. Tidyverse (como ejemplo a no seguir) Uno de los grandes problemas del tidyverse en R es que para él, todo son tablas. Existe solo una manera de agrupar información: las tablas. Fuera de ese estrecho marco, existen otras estructuras de datos: árboles, listas, diccionarios, tablas hash, vectores, tuplas, listas linkadas, listas doblemente linkadas, etc. Todo aquello, en definitiva, que en otros lenguajes de programación se explica en el capítulo “Colecciones” del manual.

El origen de uso moderno del término "variable aleatoria" podría estar en un artículo publicado en italiano en una revista oscura en 1913

Sería muy difícil haber aprendido algo de probabilidad sin haber oído o leído a alguien quejarse de que el término “variable aleatoria” es desafortunado; que, en puridad, una “variable aleatoria” es una función; pero que todo el mundo lo hace y que no queda otra que cargar —¡una vez más!— con el peso del consenso y la tradición. Pero cabe preguntarse: ¿hasta dónde y cuándo se remonta? El término tiene evocaciones viejunas y uno está tentado de buscar sus orígenes en, no sé, algún Bernoulli —¿Jacobo?

Sobre la llamada ley del estadístico inconsciente

Es innegable que el rótulo ley del estadístico inconsciente llama la atención. Trata sobre lo siguiente: si la variable aleatoria es $X$ y la medida es $P_X$, entonces, su esperanza se define como $$E[X] = \int x dP_X(x).$$ Supongamos ahora que $Y = f(X)$ es otra variable aleatoria. Entonces $$E[Y] = \int y dP_Y(y)$$ para cierta medida (de probabilidad) $P_Y$. Pero es natural, fuerza de la costumbre, dar por hecho que

RSA para exmatemáticos

Me he escrito a mí mismo lo siguiente: ######################################################### # @gilbellosta, 2022-11-14 # Implementing RSA "by hand" ######################################################### # message msg = 3 # the two "large" primes p1 = 7 p2 = 13 # public key # I choose a number, 5, as part of the public key; # the other part is p1 * p2 pub = (5, p1 * p2) a, n = pub # calculation of the private key # it must be a number b such that # x**(a * b) % n == x % n # for all x # for that, (this comes from Euler's totient theorem) # we need that a*b % totient = 1 totient = (p1 - 1) * (p2 - 1) tmp = [x for x in range(totient) if a * x % totient == 1] b = tmp[0] priv = (b, n) # testing: encrypted_msg = msg**a % n encrypted_msg**b % n Lo quiero acompañar, para futura referencia, de unos enlaces donde se explican de manera concisa y sin perífrasis innecesarias los puntos más críticos de todo lo anterior:

Operacionalización de la "igualdad de opotunidades"

Tiene Google (o una parte de él) un vídeo en Youtube, sobre el que me resulta imposible no comentar nada. Trata, esencialmente, de cómo operacionalizar a la hora de poner en marcha modelos esos principios de justicia, igualdad de oportunidades, etc. de los que tanto se habla últimamente. La definición de igualdad de oportunidades que se postula en el vídeo, tal vez demasiado esquemática por su orientación didáctica, es la siguiente:

Sobre la "African dummy"

2022 es un mal año para recordar un asunto sobre el que tenía anotado hablar desde los inicios del blog, allá por 2010: la llamada African dummy. Mentiría, sin embargo, si dijese que no es oportuno: está relacionado con temas que hoy se consideran importantes, aunque tratado al estilo de los noventa. Es decir, de una manera inaceptablemente —para el paladar de hogaño— distinta. La cosa es más o menos así: en el 91, a R.

¿Qué hora debería ser?

En esta entrada propongo y no resuelvo un problema que puede considerarse o estadístico o, más ampliamente, de ajuste de funciones —sujeto a innumerables ruidos—: determinar qué hora debería ser. Eso de la hora —y me refiero a los horarios de invierno, verano, etc. y más en general, la desviación de la hora nominal con respecto a la solar— se parece un poco a la economía. En economía tienes cantidades nominales y reales.

UMAP, tSNE y todas esas cosas

Estaba repasando cosas sobre reducción de la dimensionalidad y, en concreto, UMAP y tSNE. Me ha parecido conveniente replantear las cosas sobre primeros principios para que todo se entienda mejor. El problema es el siguiente: Tenemos $K$ puntos $x_i$ en un espacio de dimensión $N$. Buscamos su correspondencia con otros $K$ puntos $y_i$ en un espacio de dimensión $n « N$. De manera que las configuraciones de los $x_i$ y los $y_i$ sean similares en el sentido de que la matriz de distancias $(d(x_i,x_j))$ sea parecida a la $(d(y_i, y_j))$.

El equivalente cierto (y apuntes para su aplicación en el monotema ¡tan cansino! de este tiempo)

A veces toca comparar dos variables aleatorias: ¿cuál de dos juegos preferirías? Hay muchas maneras de resolver ese problema, de una larga historia, con mejor o peor fortuna. En el fondo, hay que crear un orden en el conjunto de las variables aleatorias y, en el fondo —y perdónenme mis excolegas matemáticos—, proyectarlas de alguna manera sobre los números reales. Si este número real se elige de alguna manera razonable (p.

Los muchos nombres de la inflación

El IPC es el valor de una canasta arbitraria de bienes de consumo a la que en un momento arbitrario de la historia se le dio un precio arbitrario de 100. Aun cuando gráficamente la curva anterior no da lugar a dudas —y menos si en lugar de una imagen estática hubiese creado otra interactiva—, la gente se empeña en describir su evolución verbalmente usando terminologías confusas que se refieren a distintas relaciones de más o menos interés y utilidad.

2.551879e+18 julios anuales

La entrada de hoy es un ejercicio intrascendente inspirado en cálculos similares, pero aplicados al RU, en el octavo capítulo del muy recomendable librito Sustainable Energy — without the hot air. En él se calcula cuál podría llegar a ser la potencia hidroeléctrica instalada máxima en RU bajo la hipótesis de que se aprovecha la totalidad de la energía potencial de cada gota de agua llovida en aquella desventurada tierra.

¡Cuidado con las discontinuidades (subrepticias o no) en las escalas de color!

El tema de hoy es el mapa distribuido de forma no irónica vía Twitter por algún desavisado al que no merece la pena apuntar con el dedo. Podemos aceptar que, en primera aproximación, pasa el fitro. Existen desde hace un tiempo datos estadísticos ya no por regiones administrativas sino por rejillas de 1 km² y en este gráfico se han limitado a representar esos datos. Uno de los problemas asociados a este tipo de datos (en rejillas) es que donde no vive nadie no hay una rejilla con el dato asociado pop = 0, sino que, directamente, no hay rejilla.

Nuevo vídeo en YouTube: "¿Por qué nos volvemos bayesianos con la edad?"

El vídeo que anuncio hoy, lleva ya un tiempo colgado. Pero se me ha interpuesto la serie sobre la explicación y justificación del bayesianismo y frecuentismo y he retrasado su noticia. De todos modos, es oportuno porque en el vídeo hago referencia a cosas que, cuando se rodó, aún no estaban ni escritas ni publicadas pero que el lector interesado encontrará en esa serie. Confieso que el título contiene ciertas dosis de clickbait.