Álgebra simbólica por computadora para estadísticas

8

¿Qué funcionalidad debería existir en un CAS específicamente orientado a las estadísticas?

Los sistemas de álgebra simbólica como Mathematica y Maple a menudo se usan para problemas de cálculo, lógica y física, pero rara vez se usan para estadísticas. ¿Por qué es esto?

¿Qué construcciones estadísticas podrían agregarse a un sistema de álgebra simbólica para mejorar su uso en este campo? ¿Cuáles son algunos ejemplos de código específicos que a muchas personas les gustaría poder hacer?

Piense en los siguientes tres usuarios: estadístico de investigación, investigador no estadístico que usa estadísticas en otro campo (como biología), estudiante de estadística.

Trabajaré en el código de estadísticas de SymPy durante los próximos meses y me gustaría solicitar información para la funcionalidad deseada. Las cosas que uso no son necesariamente las que usa la comunidad en general.

MRocklin
fuente
Hay un paquete dedicado a las estadísticas, vea el proyecto R para computación estadística ( r-project.org ).
Roman Luštrik 05 de
1
Sí, R es genial para las estadísticas. Sin embargo, tiende a especializarse en cálculos en su mayoría numéricos. Estoy interesado en lo que podemos hacer para ayudar a los investigadores en manipulaciones simbólicas.
MRocklin 05 de
2
No es evidente que ninguno de estos sistemas simbólicos necesite "construcciones estadísticas" añadidas a ellos. Mathematica ha hecho mucho de eso en la versión 8, pero aún no es probable que se convierta en una plataforma popular para estadísticas aplicadas o estudiantes. Una razón es que un buen software de estadísticas soporta el trabajo no matemático mucho mejor que el software matemático: ingreso de datos, administración, transformación, consulta y documentación. El software de estadísticas generalmente también admite una gran galería de métodos de visualización de datos.
Whuber
2
No estoy seguro de por qué crees que CAS rara vez se usa en estadísticas; Yo personalmente uso Mathematica todo el tiempo. Casella & Berger incluso tiene un apéndice dedicado a Mathematica. Pero como estadístico, generalmente paso más tiempo con datos que haciendo matemáticas, como señala @whuber.
JMS
2
También reconozca que muchos (¿la mayoría?) Investigadores académicos y estudiantes tienen acceso gratuito a paquetes maduros como Maple y Mathematica a través de máquinas uni y / o licencias de sitio.
JMS

Respuestas:

9

Soporte para álgebra matricial. La gran mayoría de las estadísticas practicadas es multivariante e involucra matrices, y a menudo la simplificación de los formularios matriciales requiere reglas especiales que no se traducen fácilmente de un caso univariado, por lo que un buen soporte matricial sería realmente útil.

usuario2839
fuente
2
Esto es algo en lo que Mathematica ya es bueno.
Whuber
Excelente punto ¿Qué se podría agregar a un sistema que ya expresa bien el álgebra lineal? ¿O es suficiente una expresión sólida de matrices?
MRocklin
1
@ MR En lugar de preguntar qué se podría agregar a estos sistemas, piense por qué está haciendo esto. ¿Para quien? ¿Qué usos quieres apoyar? ¿Cuáles son las razones de peso (si las hay) para agregar procedimientos estadísticos a un sistema simbólico? En otras palabras, comience con una buena especificación funcional.
Whuber