Post-bayesianismo, una microintroducción
Hace muchos años leí un artículo sobre el naive Bayes en procesamiento del lenguaje natural cuya referencia he perdido absolutamente. No obstante, recuerdo muy bien su esquema general, que es lo relevante como introducción para lo que sigue.
Venía a decir que, efectivamente, método del naive Bayes era muy útil en NLP. Este clasificador se construye a partir de primeros principios y se puede usar directamente, tal cual viene en la caja, para obtener resultados decentes. Sin embargo, la experiencia indicaba que el método, en la práctica, funcionaba mejor si se lo sometía a una serie de cambios ad hoc. Con estas modificaciones, el clasificador resultante guardaba cierta similitud con respecto al original: cambiaba la priori por otra cosa que se le parecía pero que no era igual; cambiaba la verosimilitud por otra cosa que era, de nuevo, parecida pero no exactamente la misma, etc.
Es decir, que aquello que se construía desde primeros principios podía verse superado por una versión ad hoc. Algo parecido se plantea en el artículo Bayes and big data: the consensus Monte Carlo algorithm. Ahí el objetivo consiste en modificar la forma teórica de la posteriori en otra que se adapte a las necesidades concretas del problema en cuestión, es decir, poder ajustar el modelo en paralelo. En particular, en lugar de usar la priori $p(\theta)$, propone usar $p^{1/C}(\theta)$, donde $C$ es el número de simulaciones independientes, para preservar la cantidad de información disponible en el sistema.
El post-bayesianismo (y véase también esto) es un conjunto de técnicas que parte de los modelos bayesianos teóricos (típicamente, generativos) que uno puede construir desde primeros principios pero va más allá de ellos introduciendo modificaciones —como, p.e., aplicar un determinado exponente a la verosimilitud para aplastarla— que ayuden a obtener mejores resultados prácticos en determinadas situaciones concretas. Aunque ello implique abandonar el rigor deductivo e introducir variantes tácticas salidas de la chistera de los trucos particulares de cada uno. Así las cosas, podría haberse llamado bayesianismo hiper-subjetivo, ¿no?