Intento aprender algo de Python y Sklearn, pero para mi trabajo necesito ejecutar regresiones que utilicen distribuciones de error de las familias Poisson, Gamma y especialmente Tweedie.
No veo nada en la documentación sobre ellos, pero están en varias partes de la distribución R, por lo que me preguntaba si alguien ha visto implementaciones en alguna parte de Python. ¡Sería genial si me pudieras orientar hacia implementaciones SGD de la distribución Tweedie!
Respuestas:
Hay movimiento para implementar modelos lineales generalizados con distribuciones de error de Poisson, gamma y Tweedie en scikit-learn.
Statsmodels tiene implementaciones de modelos lineales generalizados con distribuciones de error de Poisson, Tweedie y gamma.
Mientras actualizo esta respuesta, Spark ML también (experimentalmente) admite distribuciones de Poisson, Tweedie y gamma.
fuente
H2O tiene modelos lineales generalizados .
Sin embargo, usan marcos H2O, por lo que no puede usar Pandas / Numpy directamente.
fuente