Para esto que me da de comer no vale XGBoost
Los físicos crean modelos teóricos. Los economistas crean modelos teóricos. Los sicólogos crean modelos teóricos. Todo el mundo crea modelos teóricos: epidemiólogos, sismólogos, etc.
Estos modelos teóricos se reducen, una vez limpios de la literatura que los envuelve, a ecuaciones que admiten parámetros (sí, esas letras griegas). Frecuentemente, esos parámetros tienen un significado concreto: son parámetros físicos (con sus unidades, etc.), son interpretables como el grado de influencia de factores sobre los fenómenos de interés, etc. Frecuentemente, casi toda la ciencia de la cosa reside en ellos.
Pero esos coeficientes y parámetros raramente se deducen en las ciencias experimentales. No son como $latex \pi$ o $latex e$. Al contrario, se miden al enfrentar los modelos con datos (experimentales en el mejor de los casos, observacionales si no queda otro remedio).
(De hecho, tal es el origen de las -metrías: econo-, sico-, etc.)
Algunos nos ganamos el pan últimamente (no, no teorizo; no, no soy un filósofo; me limito a extender lo que indico en la descripción de mis facturas) en calcular esos parámetros y hacer inferencia sobre los mismos: nos dan ecuaciones, nos dan datos y nos preguntan sobre, p.e., $latex \gamma$ y su distribución.
Pero no sé para qué demonios me sirve el dichoso XGBoost para eso. No sé en qué página de esos libros famosos de ciencia de datos hay referencia alguna a ese problema. Aún no he visto la primera competición de Kaggle que trate el asunto.