Economía

Perder ganando (o a la inversa)

Partes con un capital de 100 euros y te ofrecen un juego: se tira una moneda al aire y si sale cara, tu capital se multiplica por 1.5 (te dan 50 euros); pero si sale cruz, te quedas con el 60% de él (pierdes 40 euros).

El juego tiene un valor esperado de $5$ ($= .5 \times 50 - .5 \times 40$) por lo que, bajo cierto punto de vista, merece la pena apostar. (Bajo otros que involucran el principio de la aversión al riesgo, tal vez no, pero esa es otra historia).

TF-IDF

Imaginemos que queremos categorizar textos (i.e., poder decir algo así como: el texto 1434 trata de biología). Una manera de afrontar el problema, no la única, es contar palabras (o más en general, términos: piénsese en bigramas, trigramas, etc.).

Qué es

Por fijar ideas, pensemos en textos sobre economía (sí, porque voy a referirme a parte del análisis de los textos del blog nadaesgratis.es al que ya me referí aquí).

En total, en casi 33 MB de texto hay muchos términos (estrictamente, unigramas): en total, 81618 lemas (de acuerdo con la definición de Spacy de lema). Tiene sentido filtrar los términos para seleccionar solo aquellos más relevantes para clasificar los textos. Así, por ejemplo:

npl(nadaesgratis.es): el subproducto

Estos días me he entretenido repasando el estado del arte en NLP y otras tecnologías que hace un tiempo no toco y que, la verdad sea dicha, cambian —muy a mejor— una barbaridad. A tal fin, descargué al disco duro el texto de todas las entradas de un blog que leía en tiempos, nadaesgratis.es —unas 4388 entradas, menos unas 30 que ya no existen, a lo largo de 13 años y que vienen a ocupar, en texto no comprimido, como treinta quijotes, unos 33 MB— para mis pruebas.

El coste nivelado de la energía: la plantilla

A nadie se le escapa que los mercados energéticos viven tiempos convulsos. Sin embargo, a pesar de que el problema es fundamentalmente económico, la gentecilla blande argumentos de lo más variopinto (e, indefectiblemente, desencaminado).

Para paliar el general desconocimiento de los fundamentos económicos de la cosa, he creado este cuadro de mandos. Implementa dinámicamente las hojas de cálculo que subyacen al documento Levelized Cost of Energy Analysis (v. 15.0) de Lazard, una empresa en cuya página web no explica claramente a lo que se dedica pero de la que podría deducirse que se dedica a la consultoría de alto vuelo.

Usos de la versión barata de la entropía

Aquí argumenté que

$$\sum_i p^2_i$$

es una versión barata de la entropía. Que sin embargo se usa para:

La versión barata de la entropía tiene una ventaja y una desventaja con respecto a la buena; la ventaja, que es más fácil de calcular, comunicar, etc.; la desventaja, que no goza de sus propiedades algebraicas (que transforman la independencia en una suma). Pero esta última es bastante intrascendente para los dos fines que menciono hoy.

Nuevo vídeo en YouTube: "Modelos estadísticos vs comportamiento estratégico"

En el vídeo se hace referencia a una serie de materiales. Sus coordenadas son:

Abundancia roja: una miniperspectiva matemática e informática

Este, a mitad de la tarde del día en cuya mañana he debido personarme en el quinto pino cargado de originales y sus correspondientes fotocopias para que una enjuta y adusta funcionaria de una de esas onerosas manifestaciones del estado metiese la entrometida nariz en un contrato firmado libérrimamente por dos mayores de edad en pleno uso y disfrute de sus facultades mentales [pausa, pausa, ¡pausa!], es momento sin igual para minirreseñar

Inflación... ¿media?

Estos días se oye que la inflación del 2021 fue del 6.5% pero a la vez y sin solución de continuidad, que fue del 3.1%. Esta entrada sirve para aclarar de dónde salen esas cifras y para qué son útiles.

La fuente de todo es el índice de precios al consumo (IPC), que mide el precio —debidamente normalizado— de una canasta de productos a lo largo del tiempo y que tiene esta pinta:

¿Cómo ha evolucionado la altura media de los animales del zoo de Madrid en los últimos años?

Antes de explicar el por qué del título de la entrada y justificarla propiamente, permítaseme mostrar esto:

Es una gráfica que muestra la evolución de la altura media de los españoles durante el último siglo, aprox. Los datos son coherentes con la evidencia que muchos tenemos al recordar cómo eran los amigos de nuestros abuelos, los tamaños de las camas de antaño, la altura de las puertas y techos de las casas de pueblo, etc. De los museos antropológicos siempre saco la misma sensación: esa gente era enana, carajo.

Medias ponderadas a lo Uluru

Dicen que el brote de inflación que estamos viviendo es atípico (y según algunos, menos preocupante) porque no está generalizada sino concentrada en un número pequeño de productos.

Trae The Economist en su número del 6 de noviembre (de 2021) un artículo al respecto que tiene cierto interés estadístico. Comienza comparando la inflación de ahora con la de otros años donde el incremento de los precios fue, de acuerdo con cómo se computa tradicionalmente la inflación, igual, a través de la distribución de los incrementos de precios sobre las distintas categorías:

Sobre la economía conductual

[Esta entrada recoge una serie de notas y reflexiones sobre el asunto del título desgajadas de un proyecto de vídeo que vengo posponiendo varias semanas y que toca el asunto semitangencialmente.]

I.

En muchas disciplinas científicas (y no solo científicas: también, por ejemplo, en la dialéctica de Marx y Engels) existen unos resultados que por algún motivo se conocen tradicionalmente como leyes (p.e., la de la gravitación universal). Haciendo una enumeración rápida de algunas que me saltan a la memoria, constato que ninguna de ellas deja de ser una observación empírica. Al menos, en su origen.

Nuevo vídeo en YouTube: sobre el futuro a corto y medio plazos de la ciencia de datos como negocio en España

Un título tan largo amerita, como menos, un vídeo igualmente largo,

y un panel de lujo, que incluye a Luz Frías (Circiter), Pelayo Arbués (Idealista) y Alejandro Llorente (Piperlab).

El vídeo existe en lugar de no existir, aparte de por la amabilidad de los participantes en el debate, por la perplejidad que me causa el inesperado cambio de tendencia en el mercado (de la ciencia de datos en España), que ha pasado de un crudo invierno post-pandémico, en el que parecía que la inversión privada se retraía hasta el nihil, a una situación de desbordamiento.