gam vs rrff (y, en general, modelos generativos vs cajas negras)

Para modelizar una serie temporal, y simplificándolo mucho, ¿gam o rrff? Como todo, depende. El otro día oí de un caso en el que los segundos vencían a los primeros claramente. Natural.

Hay contextos con una estructura matemática clara y potente. En particular, muchos en los que trabajo actualmente. ¿Para qué usar una herramienta genérica cuando cuento con una específica? Esos datos, mis datos, exigen estructura matemática.

Luego hay otros casos en los que uno se lanza al río. Luego uno siempre quiere invertir el proceso y ver qué carajos está ocurriendo con los datos (véase esto).

"Democratic people's republic" de algo que empieza por ge

Hay gente que es del parecer de que existen contubernios sanitarios (constituidos por empresas farmacéuticas y profesionales de la salud conchabados con ellos) que proceden de la siguiente manera:

  • Tratan de convencernos de que determinados rasgos de la personalidad son patológicos.
  • Cuando lo consiguen, recetan sus remedios químicos para sanarlos.
  • Alguien gana mucha pasta.

Con esto de la GDPR pasa algo parecido:

  • Tratan de convencernos de que cuando subimos fotos de nuestro gato a internet, en realidad, alguien nos está robando las fotos de nuestro gato.
  • Se sacan de la manga la GDPR.
  • Alguien va a ganar mucha pasta.

Ni un solo bien, ni un solo servicio va a generar la GDPR. Al puro estilo lampedusiano, todo va a cambiar para que todo quede igual (ya lo veréis). Solo que engordará la superestructura, se engrosarán los rangos de los parásitos de corbata y todo será un poquito más lento, un poquito más difícil y un poquito más caro.

CIS, ideología, gráficos y, sí, este blog

Si no estáis suscritos a @politibot en Telegram, hacedlo (y si no usáis Telegram, hacedlo también).

Hoy hablanban del último barómetro del CIS y han tenido la gentileza de mencionarme:

La entrada a la que hacían referencia es esta (a la que tal vez alguien, a quien le corresponda y dada su importancia, debería sacar más punta).

No obstante, el mismo episodio de @politibot incluía

que es un gráfico que, cuanto más miro, menos entiendo: ¿qué barras son las que deben sumar 100%? Ni idea.

gam/bam admiten efectos aleatorios

R

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

gam/bam admiten efectos aleatorios

Y solo me enteré anoche (gracias a José Luis Cañadas).

(Para más detalles, esto o esto).

Curso (mío) de estadística bayesiana aplicada con Stan en BCN

A primeros de julio (de 2018) impartiré un curso de 15 horas de estadística bayesiana aplicada con Stan en la UPC (Barcelona). La información relevante está aquí y aquí.

El proyecto y su definición es un tanto contradictorio en sus propios términos, lo reconozco. Es muy difícil hacer algo aplicado y, a la vez, bayesiano. Y más, con Stan. Además, podrían acusarme de hipócrita: ¿cuándo fue la última vez que facturé (recuérdese: facturable es el grado máximo de aplicado) por algo hecho con Stan? Porque la idea, en el fondo, es otra: esencialmente, cómo replantear modelos y estrategias de modelización, aunque se implenten con herramientas métodos de índole frecuentista, para enriquecerlos con la visión bayesiana.

Colaboración con adversarios

¿Debe usarse casco para circular con bici por las ciudades? Pues la respuesta, incluso la data driven, depende a quién leas. Ídem con cualquier otro asunto.

Por eso es relevante la propuesta de colaboración con adversarios. Que se resume en:

  • Dos personas con visiones opuestas sobre un tema se proponen colaborar en la redacción de un estudio.
  • Cada una de ellas se responsabiliza, pues, de aportar todo tipo de estudios y evidencia al respecto, cuidando de no omitir, por la cuenta que tiene, la más relevante para hacer prevalecer punto de vista.
  • Finalmente, desarrollan una síntesis conjuntamente.

De alguna manera, este procedimiento subcontrataría en los autores del estudio el esfuerzo que hoy en día se delegan en el lector interesado: recopilar opiniones y estudios encontrados para poder llegar al momento de la síntesis. Con los problemas que plantea la asimetría de información (uno tal vez no sea experto en la materia y menos aún en la visión que del asunto tienen tirios y/o troyanos), el sesgo debido a la disponibilidad de datos, su desigual accesibilidad, etc.

Liberalismo: los axiomas y sus corolarios

Una malhadada fisura en la rótula me ha tenido boca arriba más horas de las habituales durante el último mes. Por evitar el aburrimiento, no me ha quedado otra que interponer una tableta entre cara y techo de la que leer más o menos desordenadamente. Uno de los volúmenes que ha devorado mi sobrevenida afición por la lectura ha sido Liberalismo, de von Mises.

[Llegado a este punto, me ha dado la sensación de tener que justificar por qué he leído ese y no otro libro. Pero también he sentido que debía hacerlo como si me hubiesen visto apropiándome de unas cremas en un supermercado o saliendo de un lupanar. Así que he optado por no hacerlo, decir que lo he leído porque me ha dado la gana y mandar a quien le parezca mal a freír churros.]

Leaflet con capas WMS de Correos, Catastro, etc.

R

Esta entrada es un subproducto del trabajo que pocería que he realizado estos días en caRtociudad.

caRtociudad permite generar mapas estáticos al estilo de ggmap. Iba a poner algún ejemplo, pero los dejo para otro día.

La cosa es que mejorando caRtociudad::get_cartociudad_map, se me ha pasado por la cabeza la posibilidad de realizar la integración no ya con ggmap sino con leaflet. Y así (¡probadlos!), para los códigos postales,

library(leaflet)

leaflet() %>% addTiles() %>%
  setView(-3.703399, 40.41688, zoom = 14) %>%
  addWMSTiles(
  "http://www.ign.es/wms-inspire/ign-base",
  layers = "codigo-postal",
  options = WMSTileOptions(format = "image/png",
    transparent = TRUE),
  tileOptions(tms = TRUE),
  attribution = "")

Para las secciones censales,

t y as.raster no conmutan; ¿por qué no conmutarán?

R

Creo una minimatriz, la convierto en un raster y la represento:

m <- matrix(c(0, 0, 0.33, 0.66, .9, .9), 2, 3)
m
#      [,1] [,2] [,3]
# [1,]    0 0.33   .9
# [2,]    0 0.66   .9

r <- as.raster(m)
r
#           [,1]      [,2]      [,3]
# [1,] "#000000" "#545454" "#FFFFFF"
# [2,] "#000000" "#A8A8A8" "#FFFFFF"

plot(r, interpolate = FALSE)

Ahora, con la matriz traspuesta,

r_t_1 <- as.raster(t(m))
r_t_1
#           [,1]      [,2]
# [1,] "#000000" "#000000"
# [2,] "#545454" "#A8A8A8"
# [3,] "#E6E6E6" "#E6E6E6"

obtengo

Redundancias (o por qué empeñarnos en tener tantos datos cuando con una fracción sobra)

[Esta entrada no contiene ni respuestas ni, tan siquiera, buenas preguntas. Solo vuelco en ella ideas más o menos inconexas que me rondan la cabeza. Tal vez alguien sepa reformularlas mejor, plantear la pregunta concreta que exige el asunto y, con suerte, responderla con claridad y distinción.]

Mi proyecto trata de la estimación de los parámetros que rigen una determinada curva (altamente no lineal) de la que se tienen N observaciones en el tiempo. Igual que tengo N podría tener 2N o N/2.