Estoy buscando un paquete de software estadístico que pueda usar en un curso introductorio de estadística para un programa de estudio de ciencias sociales. Los estudiantes no tienen conocimiento previo de estadística y tampoco tienen experiencia con lenguajes de programación. El objetivo es presentarles conceptos estadísticos básicos (como medias, varianza, suma de cuadrados, valores p, ... y finalmente regresión lineal) y permitirles realizar análisis básicos por su cuenta utilizando conjuntos de datos de ejemplo. El curso debe tratar sobre el aprendizaje de conceptos haciendo estadísticas en lugar de memorizar fórmulas (aunque creo que las fórmulas son importantes).
Por lo tanto, estoy buscando una alternativa a la sintaxis habitual (como R normal) o al software de apuntar y hacer clic (como SPSS o Rcmdr). El software debe ser fácil de aprender y debe tener una interfaz gráfica de usuario clara que visualice los conjuntos de datos y ofrezca gráficos y tablas estándar. Lo mejor sería si visualizara todos los diferentes pasos de un análisis (por ejemplo, lectura y manipulación de datos, cálculo de medidas descriptivas, elaboración de tablas y gráficos descriptivos, cálculo de medidas inferenciales, trazado de gráficos inferenciales, exportación a un informe).
¿Tiene sugerencias de software estadístico (de código abierto o gratuito) que sea adecuado para aprender y practicar primero las estadísticas?
EDITAR
Gracias por sus sugerencias. He examinado gretl y otros dos programas que he encontrado durante mi consulta en línea: RapidMiner y Statistical Lab . [1]
He descubierto que gretl
la interfaz y la salida son más claras y enfocadas que, por ejemplo, Rcmdr, SPSS o Stata. Por lo tanto, es una herramienta bien calificada para comenzar a enseñar estadísticas desde mi punto de vista.
Sin embargo, la GUI del diagrama de flujo de RapidMiner
yStatistical Lab
me impresionó al visualizar los pasos individuales de un análisis estadístico (comenzando con la carga de datos). Creo que esto podría ser útil para muchos estudiantes que luchan con el enfoque habitual en las explicaciones matemáticas. Por supuesto, RapidMiner me parece demasiado sobrecargado con funciones, menús y botones para principiantes, mientras que el Laboratorio de Estadística está mucho más enfocado. La gran ventaja del Laboratorio de Estadística es la "Calculadora R" similar a una consola con un "Asistente de código R" que ayuda a producir la sintaxis real de R, ya que el Laboratorio de Estadística depende R
de sus cálculos.
Finalmente, decidí comenzar con el Laboratorio de Estadística en el primer semestre al presentar los conceptos básicos y cambiar a RStudio (y Rcmdr) en el segundo semestre.
[1]: Gnumeric, SciPy, Scilab, GNU Octave y similares me parecen menos dirigidas a las ciencias sociales.
Respuestas:
Tal vez Gretl? http://gretl.sourceforge.net/
Es gratis y se utiliza en nuestra Universidad para estadísticas de pregrado.
fuente
Evitaría la mayoría de las cosas "famosas", MatLab , Maple , Mathematica , JMP , SAS o Minitab , porque cuando sus estudiantes se gradúan tienen que pagar miles de dólares por año para usarlo profesionalmente. Cada compañía tiende a tener su herramienta favorita particular, y si les enseña una herramienta que su compañía no pagará, entonces su conjunto de habilidades se desperdicia. Tampoco me gustan las bibliotecas patentadas: capacitan a los usuarios para presionar botones y si el usuario quiere ir a otro lugar (JMP o lo que sea) no hay transferencia de aprendizaje.
Python inclding SciPy / NumPy es bastante bueno. Es de código abierto y está bien soportado. Tiene una gramática fácil de aprender. Todavía se interpreta para que no grite rápido, pero si no conocen ningún script o hoja de cálculo, es mucho más rápido de lo que podrían necesitar. PythonXY es una buena versión, tiene buenas bibliotecas y soporte. También me gusta que la programación GUI sea posible a través de ella. La creación de aplicaciones independientes en Windows es un poco desafiante pero probablemente muy superior al nivel de sus alumnos. (editar) Sabio y CythonMejorar sustancialmente la propuesta de valor de Python. La interfaz y la usabilidad se mejoran sustancialmente. Un código compilado que es 1000 veces más rápido que un código interpretado bastante bueno me suena genial (o sorprendente). EDITAR: Me he divertido usando las distribuciones de Anaconda (también conocida como conda), y también son muy fáciles de usar.
No soy un gran fan de Perl . Está un poco anticuado. Se trata de analizar y procesar texto más que matemáticas / ciencias. No me malinterpreten, puede hacer matemáticas / ciencias, pero si conoce VBA, entonces MSWord puede hacer matemáticas / ciencias. Ser capaz no es lo mismo que tener un trabajo en particular como enfoque principal.
Me gusta R , aunque no lo hagas, porque está siendo desarrollado agresivamente por doctores calificados en matemáticas / estadísticas. Esto significa que, a pesar de que la gramática puede ser complicada, tendrá bibliotecas actualizadas y probadas sin errores. (En general)
Excel no es un mal comienzo. Una vez que conoces una hoja de cálculo, es más fácil usar cualquier otra. En un entorno empresarial, casi todas las empresas tienen la oficina de MicroSloth , por lo que Excel no es una mala idea. No me gustan sus scripts, pero eso es solo preferencia, todavía puedo usarlo. Cuesta unos 150 dólares estadounidenses en comparación con 5000 dólares estadounidenses para algunos de los otros softwares, por lo que su costo de entrada para la gente normal es más razonable.
El lenguaje de script JMP es ajeno. No se traduce a otro software (no SAS). Mantente alejado de eso. La única característica canjeable del lenguaje es que puede (en un sentido limitado) ejecutar el código "R". Si está codificando en "R" simplemente use "R" y "RStudio".
No he usado MathCAD, así que no puedo hablar de su relevancia. Creo que es más simbólico, menos sobre la importación de datos externos. Es más barato, hasta ahora. No es gratis y abierto. Facilidad en sí no se traduce a facilidad en otro idioma. ( EDITAR ) También en esta categoría se encuentra EES , que tampoco me impresiona fuera de una ventana de uso muy estrecha.
EDITAR : LabVIEW me ha impresionado un poco . Es lo suficientemente simple de usar que unas pocas horas pueden hacer que alguien sea capaz. Funciona realmente rápido, como literalmente 1000 veces más rápido que MatLab para literalmente el mismo código ( MathScript ). Si tiene algo de trabajo pesado, vale la pena considerarlo un poco. Cuesta dinero, pero algo en el vecindario de 1/5 de hierro grande convencional.
La mejor de las suertes
EDITAR: No usaría el Laboratorio de estadísticas porque incluso cuando selecciona "inglés" para el idioma, sale en alemán, y no se desinstala en Windows 7. Ambas debilidades administrativas hacen que sea imposible. No puedo operarlo, y cuando intenté eliminarlo, falló.
Por prueba y error descubrí la configuración del menú para que se muestre en inglés. Parece ser una interfaz relativamente simple (y, por lo tanto, útil y coherente) en algunas bibliotecas R para el procesamiento y visualización de datos. Tendré que analizarlo más a fondo, así que en este punto "el jurado aún está fuera".
EDITAR más:
-> Aquí <- es un enlace divertido a otra discusión sobre herramientas y bancos de trabajo.
fuente
Puede intentar usar Gnumeric, una hoja de cálculo altamente pensada, también hay una hoja de cálculo de Open Office. Siempre que explique las dificultades del uso de hojas de cálculo, particularmente Excel, después de la universidad en sus vidas prácticas posteriores, es posible que no tengan el lujo de algo como SPSS, pero aún podrían obtener un servicio útil de estos productos gratuitos que no son demasiado exigentes en matemáticas y habilidades de programación. . Muchos entornos de oficina contienen Excel de forma predeterminada.
Mira esto:
http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Estadísticas y Excel 2007
y busque referencias similares como
http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=es#d85edd4978e53568 Keeling, Kellie B. y Pavur, Robert J. (2007). Un estudio comparativo de la fiabilidad de nueve paquetes de software estadístico. Estadística computacional y análisis de datos, 51, 3811–3831.
fuente
He estado más calmo . La licencia es barata, como 10 dólares y proporciona tanto cálculos / gráficos como excelentes simulaciones / actividades para que los estudiantes practiquen. Además, en su sitio web, tienen algunas herramientas, principalmente en distribuciones que pueden resultarle útiles.
fuente
Hemos comenzado a usar Rguroo. Este software se acaba de lanzar. Está basado en R, pero no se requiere conocimiento de codificación R. También es una aplicación web, por lo que simplemente debe iniciar sesión en un navegador. Mis alumnos pueden guardar su trabajo en cualquier etapa y volver para completar su trabajo. La interfaz gráfica de usuario es muy intuitiva y los resultados se ven geniales.
fuente
Hemos estado usando la versión beta de Rguroo en nuestros cursos introductorios de estadística en la Universidad Estatal de California, Fullerton, durante los últimos tres años. Ahora (agosto de 2019) han lanzado una versión oficial, consulte https://Rguroo.com. Este es un software de estadísticas de aplicaciones web que funciona en cualquier navegador. Este software está diseñado para la enseñanza y ofrece una demostración y capacitación personal para profesores; solo envíeles un correo electrónico o llámelos para organizar una demostración. El software ejecuta R en segundo plano, pero no necesita saber R, todo es apuntar y hacer clic. Tiene muchas características excelentes, que incluyen resultados detallados, excelentes herramientas gráficas, calculadora de probabilidad y herramientas de simulación. Me gustan especialmente las características de reproducibilidad donde puede guardar su trabajo en cualquier etapa y regresar y continuar donde lo dejó. También puede compartir su trabajo con los estudiantes a través de lo que llaman archivos RGR. En pocas palabras ... es genial y seguimos usándolo.
fuente
Yo personalmente uso el software DataMelt para la enseñanza de la estadística. Está muy bien documentado, tiene tutoriales, libros y muchos ejemplos para ver. Lo que también es importante es que uno puede buscar cualquier ejemplo, y puede obtener una respuesta razonable (en Javadoc y fragmentos de código). Los estudiantes pueden aprender no solo Python (que es el lenguaje de programación predeterminado), sino también cómo codificar métodos estadísticos en Java. En mi opinión, esta es una fortaleza importante: los estudiantes no necesitan aprender un lenguaje "estadístico" muy especializado, como R-stat. También pueden aprender Java al mismo tiempo, lo que puede abrir muchas oportunidades si deciden ir a la industria.
fuente
Hay un nuevo software llamado Rguroo que es una aplicación web. Es muy conveniente de usar, ya que no requiere descargas ni instalación. Rguroo tiene un motor R, pero su uso no requiere codificación R, ya que le permite utilizar la potencia de R mediante la interfaz gráfica de apuntar y hacer clic. Cada análisis es salvable y reproducible. Hemos estado usando este software para nuestros cursos introductorios e intermedios de estadística en los últimos tres años. En este punto es gratis y puede crear una cuenta en www.Rguroo.com. Según la información que tengo, seguirá siendo gratuita para todos los profesores y tendrá un cargo de suscripción anual razonable, entre 10 y 20 dólares, para los estudiantes.
fuente