Si yo fuera rey, ¿cómo serían las encuestas electorales?

El otro día —más bien, aquel día en el que tomé las notas que uso en esta entrada— hubo elecciones regionales en Castilla y León. Durante las semanas anteriores se publicaron los resultados de una serie de encuestas electorales al uso, similares a estos:

Es decir, información típicamente cuantitativa.

Cerraron los colegios electorales, se contaron los votos y al día siguiente la prensa comenzó a discutir una serie de temas cualitativos muy concretos: si cierto partido había incrementado/reducido su número de votos, si tal otro había desaparecido o no, si el ganador habría de necesitar algún tipo de acuerdo, etc. Incluso a nivel provincial, pueden emerger otras, como si cierto partido va a lograr ese escaño que casi siempre se le escapa; si aquel otro partido va a quedarse, como siempre, sin representación, etc.

Causalidad e individualismo metodológico

Frecuentemente, se postulan y estudian relaciones causales del tipo

donde, por simplificar, se han eliminado las variables de confusión, etc. para mostrar su versión más estilizada, la que acaba en los abstracts.

Frecuentemente, además, $C$ y $E$ hacen referencia a magnitudes macro: una campaña de publicidad y los ingresos; una medida económica y el PIB; la presión y el volumen de un gas, etc. Todos sabemos que en esos casos, el diagrama anterior es solo una manera abreviada de representar el verdadero diagrama causal,

WGS84 vs ETRS89 vs ED50 vs Madrid 1870

En esta entrada voy a comparar los sistemas de coordenadas WSG84, ETRS89, ED50 y el vetustísimo Madrid 1870. Además, lo voy a hacer mal y luego voy a explicar no solo por qué sino por qué no es culpa mía.

Primero, las coordenadas de Sol (el Kilómetro 0, para ser más precisos) en WGS84 (EPSG:4326):

library(sf)
options(digits = 10)
sol_wsg84 <- st_sfc(st_point(
    c(40.416634493768065, -3.703811417868093)),
    crs = 4326)
st_coordinates(sol_wsg84)
#             X            Y
# 1 40.41663449 -3.703811418

Ahora, en ETRS89 (EPSG:4258):

Principios de geodesia

[Estas son notas que tenía guardadas para mí en mi Obsidian particular pero que he decidido hacer públicas con una edición mínima por si a alguien les pueden resultar útiles. Seguro que les chirriarán a los muy expertos en el tema. Pero la culpa es suya por no expresarse con claridad y obligarnos a los diletantes a tratar de hacerlo.]

Si tienes un conjunto de datos que representan puntos —o segmentos, o polígonos, o…— sobre la superficie terrestre puedes representarlos sin problemas usando las técnicas habituales. La cosa cambia cuando tienes dos fuentes de datos cartográficas y quieres combinarlas de alguna manera (p.e., una puede ser un conjunto de puntos y otra, un mapa base sobre el que representarlos): un mismo punto sobre la esfera terrestre admite representaciones distintas en distintos sistemas de coordenadas y para combinar fuentes de datos cartográficas distintas es necesario alinear dichos sistemas de referencia.

Probabilidades subjetivas: una redefinición "profesional"

Hace un tiempo traje a estas páginas (aquí) la definición de probabilidad (en su variante subjetivísima) que dizque Sam Savage aprendió de su padre. La reproduzco aquí:

He [L.J. Savage] encouraged me from a young age to think of the probability of an event as the amount I would pay for a gamble that would pay $100 if the event occurred.

Pero, ¿cómo hacen los pros? ¿Cómo hacen realmente los que se ganan la vida haciendo estimaciones probabilísticas subjetivas?

¿Qué es "seguro"?

Esta entrada es un resumen junto con una traducción libre de un capitulito excelente del libro Probability Theory, The Logic of Science de E.T. Jaynes que lleva por título What is safe?.

Uno de los principales mensajes prácticos de este trabajo [el libro] es el [de subrayar] el gran efecto de la información a priori en las conclusiones que uno debería extraer de un conjunto de datos. Actualmente, asuntos muy discutidos, como los riesgos medioambientales o la toxicidad de un aditivo nutricional, no pueden ser juzgados racionalmente mirando únicamente a los datos e ignorando la información a priori que los científicos tienen sobre el fenómeno.

El coste nivelado de la energía: la plantilla

A nadie se le escapa que los mercados energéticos viven tiempos convulsos. Sin embargo, a pesar de que el problema es fundamentalmente económico, la gentecilla blande argumentos de lo más variopinto (e, indefectiblemente, desencaminado).

Para paliar el general desconocimiento de los fundamentos económicos de la cosa, he creado este cuadro de mandos. Implementa dinámicamente las hojas de cálculo que subyacen al documento Levelized Cost of Energy Analysis (v. 15.0) de Lazard, una empresa en cuya página web no explica claramente a lo que se dedica pero de la que podría deducirse que se dedica a la consultoría de alto vuelo.

Causalidad: en defensa de Hume

En 1748, Hume propuso la siguiente (archifamosa, archidiscutida y archicontrovertida) definición de causalidad:

We may define a cause to be an object followed by another, and where all the objects, similar to the first, are followed by objects similar to the second. Or, in other words, where, if the first object had not been, the second never had existed.

Ha sido denunciada, entre otros motivos, por contener una contradicción lógica. En efecto, la primera frase viene a afirmar que la causa es condición suficiente para el efecto ($C \Rightarrow E$, si se quiere), mientras que en la segunda, que es condición necesaria ($\neg C \Rightarrow \neg E$).

Gráficos mejorables en REE

Creo que REE debería replantearse cómo representar la estructura de generación eléctrica en su portal. Me refiero, por supuesto, esto.

Por ejemplo, hoy, en el momento en el que escribo, el portal muestra

Uno podría preguntarse: ¿cuánto está produciendo la eólica (franja verde) a la hora marcada por la línea vertical negra? La respuesta depende de dónde se mire: según el gráfico, unos 8 GW; pero según la leyenda, casi 13 GW.

Doxa, episteme y gnosis: una reinterpretación bayesiana

Dícese que los griegos distinguían tres (cuando menos) tipos de conocimiento:

  • Doxa: o aquello que conocemos porque nos lo han contado, sea en Twitter o en arXiv.
  • Gnosis: o aquello que conocemos por la experiencia personal, a través de los sentidos o, supongo que hoy en día, también a través de instrumentos de medida diversos.
  • Episteme: o aquello que decimos saber porque hemos razonado y tenemos ciertas garantías de su veracidad.

Así planteados, son tres patas de un mismo taburete, tres monedas en el bolsillo, un conjunto, en definitiva, de tres elementos.