solo por curiosidad ... ¿Qué idioma se usa más aquí? R? MATLAB? ¿Pitón? ¿Java? ¿Qué hay para prototipo o para producción? Por ejemplo, creo que MATLAB se usa principalmente para la creación de prototipos, python para ambas prot. y producción
solo por curiosidad ... ¿Qué idioma se usa más aquí? R? MATLAB? ¿Pitón? ¿Java? ¿Qué hay para prototipo o para producción? Por ejemplo, creo que MATLAB se usa principalmente para la creación de prototipos, python para ambas prot. y producción
Tengo datos que son equivalentes a: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... Me gustaría hacer un análisis de este conjunto de datos para obtener una matriz de correlación que tendría una implicación similar a: si compró x, es probable que compre...
¿Qué funcionalidad debería existir en un CAS específicamente orientado a las estadísticas? Los sistemas de álgebra simbólica como Mathematica y Maple a menudo se usan para problemas de cálculo, lógica y física, pero rara vez se usan para estadísticas. ¿Por qué es esto? ¿Qué construcciones...
[Primero publiqué esta pregunta en Stack Overflow aquí, pero no recibí ninguna respuesta, así que pensé en intentarlo aquí. Disculpas si no se permite volver a publicar.] He estado tratando de usar esta implementación del algoritmo Holt-Winters para pronosticar series temporales en Python, pero me...
Me gustaría trazar regiones de confianza 2D (en 1-sigma, 2-sigma) para un modelo que he ajustado a los datos. He usado PyMC para generar 50k muestras posteriores de MCMC para mi modelo con 6 parámetros. Sé que el proceso para crear regiones de confianza es algo similar a: 1.) crear un histograma...
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 8 meses . Prueba A /
Estoy tratando de escribir mi propio código Python para calcular estadísticas t y valores p para pruebas t independientes de una y dos colas. Puedo usar la aproximación normal, pero por el momento estoy tratando de usar la distribución t. No pude hacer coincidir los resultados de la biblioteca de...
Soy desarrollador web y estadístico novato. Mis datos se parecen a esto Subject Week x1 x2 x3 x4 x5 y1 A 1 .5 .6 .7 .8 .7 10 B 1 .3 .6 .2 .1 .3 8 C 1 .3 .1 .2 .3 .2 6 A 2 .1 .9 1.5 .8 .7 5 B 2 .3 .6 .3 .1 .3 2 D 2 .3 .1 .4 .3 .5 10 Estoy tratando de predecir y1 como producto de las variables...
Tengo pequeños conjuntos de datos de tamaño 40-50 puntos. Sin suponer que los datos se distribuyen normalmente, quería conocer los valores atípicos con un 90% de confianza al menos. Pensé que boxplot podría ser una buena manera de hacerlo, pero no estoy seguro. Cualquier ayuda apreciada. También...
Estoy trabajando en un modelo de aprendizaje de categoría en línea que utiliza el descenso de gradiente estocástico para adaptarse a un modelo de mezcla gaussiana. El modelo se basa en el modelo de aprendizaje en línea utilizado en Toscano y McMurray (2010). Si bien el descenso de gradiente parece...
Me gustaría encontrar los límites mínimo / máximo de una ventana deslizante de tamaño mínimo que contiene una cierta fracción del número total de elementos en una matriz o colección de números. Ejemplo: tomar números enteros para que sea más fácil de explicar, digamos que la proporción de...
Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly...
Después de investigar un poco sobre el tema, he notado un sorprendente déficit de paquetes de inferencia y bibliotecas que dependen de métodos de optimización o transmisión de mensajes para Python y R. Que yo sepa, estos métodos son extremadamente útiles. Por ejemplo, para una red de Bayes...
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 4 años . Python es un montón de bibliotecas ML (como...
Soy un principiante que usa el aprendizaje automático (terminé el curso de Ng), estoy usando scikit-learn en python. Quiero encontrar la mejor manera de detectar anomalías en nuestro sistema. Tenemos eventos en curso que ocurren en un horario (cada pocos minutos / horas), y quiero detectar cuándo...
Quiero realizar análisis de sentimientos en el texto, he revisado varios artículos, algunos de ellos usan "Naive Bayes" y otros son "Recurrent Neural Network (LSTM)" , por otro lado, he visto una biblioteca de Python para el análisis de sentimientos que es nltk Utiliza "Naive Bayes". ¿Alguien puede...
Actualmente estoy buscando algunos datos producidos por una simulación de MC que escribí: espero que los valores se distribuyan normalmente. Naturalmente, tracé un histograma y parece razonable (¿supongo?): [Arriba a la izquierda: histograma con dist.pdf(), arriba a la derecha: histograma...
Entiendo cómo funciona la covarianza es que los datos que están correlacionados deberían tener una covarianza algo alta. Me he encontrado con una situación en la que mis datos parecen correlacionados (como se muestra en el diagrama de dispersión) pero la covarianza es casi cero. ¿Cómo puede la...