Estoy tomando un curso de postgrado en Estadística Aplicada que utiliza el siguiente libro de texto (para darle una idea del nivel del material que se está cubriendo): Conceptos y métodos estadísticos , por GK Bhattacharyya y RA Johnson.
El profesor nos exige que usemos SAS para las tareas.
Mi pregunta es: ¿hay una biblioteca (s) Java que se puede usar en lugar de SAS para los problemas que normalmente se ven en esas clases.
Actualmente estoy tratando de conformarme con Apache Math Commons y, aunque estoy impresionado con la biblioteca (es fácil de usar y comprensible), parece que carece incluso de cosas simples como la capacidad de dibujar histogramas (pensar en combinarlo con una biblioteca de gráficos )
He mirado a Colt, pero mi interés inicial disminuyó bastante rápido.
Agradecería cualquier aporte, y he examinado preguntas similares en Stackoverflow, pero no he encontrado nada convincente.
NOTA: conozco las bibliotecas R, SciPy y Octave y Java que realizan llamadas a ellas. Estoy buscando una biblioteca nativa de Java o un conjunto de bibliotecas que puedan proporcionar las funciones que busco.
NOTA: Los temas cubiertos en dicha clase incluyen típicamente: pruebas de una muestra y dos muestras e intervalos de confianza para medias y medianas, estadísticas descriptivas, pruebas de bondad de ajuste, ANOVA de una y dos vías, inferencia simultánea, pruebas varianzas, análisis de regresión y análisis de datos categóricos.
Respuestas:
Cuando me veo obligado a usar Java para estadísticas básicas, las matemáticas de apache commons son el camino a seguir. Para tramas, uso y recomiendo JFreeChart . Este último está muy extendido, por lo que stackoverflow incluso tiene una etiqueta poblada .
Editar
Si uno busca una suite, entonces tal vez Deducer es una opción. La GUI se basa en JGR, mientras que las partes estadísticas se llaman en R. Parece que se puede ampliar tanto a través de R como de Java . Uno podría, por ejemplo, omitir las llamadas al Rengine pero llamar a las bibliotecas Java referenciadas en su lugar. Pero lo admito, todavía no lo intenté.
Hasta donde he entendido el OP, lo óptimo sería algo así como Rapidminer for Statistics , ya que Rapidminer es un framework java puro que admite el acceso GUI (incluidas las visualizaciones), el uso como biblioteca y el desarrollo de complementos personalizados. Que yo sepa, no existe algo así para las estadísticas. No recomiendo Rapidminer para esa tarea en particular , porque que yo sepa, solo incluye las pruebas estadísticas más básicas. Las visualizaciones se han extendido últimamente, pero no puedo estimar cuán personalizables son ahora.
fuente
Echa un vistazo a Suan Shu: NumericalMethod.com . No es gratis en general, pero es gratis para uso académico.
fuente
Similar a la sugerencia de Steffen de RapidMiner, es posible que desee considerar Weka . Sin embargo, puede estar orientado más específicamente al aprendizaje automático de lo que espera. Tiene muchos algoritmos para tareas como agrupación, clasificación y regresión. Weka tiene una GUI, pero también se puede usar como una biblioteca de software. He visto histogramas en la GUI, pero no estoy seguro de si es fácil reutilizarlos a través de la biblioteca o no.
fuente
Pruebe http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html
Está bien documentado y proporciona muchas funciones estadísticas y matemáticas útiles. Pero desafortunadamente no es de código abierto. Entonces, si eso no te molesta, entonces la biblioteca debería estar bien.
Sin embargo, no sé si proporciona una salida gráfica.
fuente
El entorno informático DataMelt tiene muchas bibliotecas estadísticas de Java casi para cualquier tema. Puede usarlo usando Jython como se recomienda en el sitio web, pero lo uso con Java y Groovy.
Puedo decir más: el proyecto DataMelt cubre los siguientes temas estadísticos:
Aquí hay un ejemplo de regresión no lineal que utiliza el enfoque de probabilidad de registro para ajustar los datos con errores:
El paquete es gratis.
fuente