Preguntas etiquetadas con python

8

¿Qué lenguaje de programación para la inferencia estadística?

solo por curiosidad ... ¿Qué idioma se usa más aquí? R? MATLAB? ¿Pitón? ¿Java? ¿Qué hay para prototipo o para producción? Por ejemplo, creo que MATLAB se usa principalmente para la creación de prototipos, python para ambas prot. y producción

r matlab python java

8

Cómo hacer un análisis de correlación de 'cerveza y pañales'

Tengo datos que son equivalentes a: shopper_1 = ['beer', 'eggs', 'water',...] shopper_2 = ['diapers', 'beer',...] ... Me gustaría hacer un análisis de este conjunto de datos para obtener una matriz de correlación que tendría una implicación similar a: si compró x, es probable que compre...

correlation econometrics python cross-correlation

8

Álgebra simbólica por computadora para estadísticas

¿Qué funcionalidad debería existir en un CAS específicamente orientado a las estadísticas? Los sistemas de álgebra simbólica como Mathematica y Maple a menudo se usan para problemas de cálculo, lógica y física, pero rara vez se usan para estadísticas. ¿Por qué es esto? ¿Qué construcciones...

python computational-statistics computing mathematica maple

8

Usando Holt-Winters para pronosticar en Python

[Primero publiqué esta pregunta en Stack Overflow aquí, pero no recibí ninguna respuesta, así que pensé en intentarlo aquí. Disculpas si no se permite volver a publicar.] He estado tratando de usar esta implementación del algoritmo Holt-Winters para pronosticar series temporales en Python, pero me...

forecasting python

8

Cálculo de regiones de confianza 2D a partir de muestras MCMC

Me gustaría trazar regiones de confianza 2D (en 1-sigma, 2-sigma) para un modelo que he ajustado a los datos. He usado PyMC para generar 50k muestras posteriores de MCMC para mi modelo con 6 parámetros. Sé que el proceso para crear regiones de confianza es algo similar a: 1.) crear un histograma...

confidence-interval mcmc python

8

Pruebas A / B en Python o R [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 8 meses . Prueba A /

r python ab-test

8

Rastreando los supuestos hechos por la función ttest_ind () de SciPy

Estoy tratando de escribir mi propio código Python para calcular estadísticas t y valores p para pruebas t independientes de una y dos colas. Puedo usar la aproximación normal, pero por el momento estoy tratando de usar la distribución t. No pude hacer coincidir los resultados de la biblioteca de...

statistical-significance t-test python

8

Series temporales con múltiples sujetos y múltiples variables.

Soy desarrollador web y estadístico novato. Mis datos se parecen a esto Subject Week x1 x2 x3 x4 x5 y1 A 1 .5 .6 .7 .8 .7 10 B 1 .3 .6 .2 .1 .3 8 C 1 .3 .1 .2 .3 .2 6 A 2 .1 .9 1.5 .8 .7 5 B 2 .3 .6 .3 .1 .3 2 D 2 .3 .1 .4 .3 .5 10 Estoy tratando de predecir y1 como producto de las variables...

r regression time-series multiple-regression python

8

Encontrar valores atípicos sin asumir una distribución normal

Tengo pequeños conjuntos de datos de tamaño 40-50 puntos. Sin suponer que los datos se distribuyen normalmente, quería conocer los valores atípicos con un 90% de confianza al menos. Pensé que boxplot podría ser una buena manera de hacerlo, pero no estoy seguro. Cualquier ayuda apreciada. También...

nonparametric python outliers matplotlib

8

Ajuste de un modelo de mezcla gaussiana usando descenso de gradiente estocástico

Estoy trabajando en un modelo de aprendizaje de categoría en línea que utiliza el descenso de gradiente estocástico para adaptarse a un modelo de mezcla gaussiana. El modelo se basa en el modelo de aprendizaje en línea utilizado en Toscano y McMurray (2010). Si bien el descenso de gradiente parece...

python online gaussian-mixture gradient-descent

8

Recuperando el ancho mínimo que contiene la fracción especificada de todos los valores

Me gustaría encontrar los límites mínimo / máximo de una ventana deslizante de tamaño mínimo que contiene una cierta fracción del número total de elementos en una matriz o colección de números. Ejemplo: tomar números enteros para que sea más fácil de explicar, digamos que la proporción de...

python descriptive-statistics shortest-half

8

¿Por qué un modelo estadístico se sobreajusta si se le da un gran conjunto de datos?

Mi proyecto actual puede requerir que construya un modelo para predecir el comportamiento de un determinado grupo de personas. el conjunto de datos de entrenamiento contiene solo 6 variables (la identificación es solo para fines de identificación): id, age, income, gender, job category, monthly...

modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

8

Motores de inferencia variacional

Después de investigar un poco sobre el tema, he notado un sorprendente déficit de paquetes de inferencia y bibliotecas que dependen de métodos de optimización o transmisión de mensajes para Python y R. Que yo sepa, estos métodos son extremadamente útiles. Por ejemplo, para una red de Bayes...

r python bayes variational-bayes

8

Biblioteca completa de aprendizaje automático para Java / Scala [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 4 años . Python es un montón de bibliotecas ML (como...

machine-learning python software java

8

Detección de anomalías en series temporales

Soy un principiante que usa el aprendizaje automático (terminé el curso de Ng), estoy usando scikit-learn en python. Quiero encontrar la mejor manera de detectar anomalías en nuestro sistema. Tenemos eventos en curso que ocurren en un horario (cada pocos minutos / horas), y quiero detectar cuándo...

time-series python scikit-learn anomaly-detection

8

Diferencia entre Naive Bayes vs Recurrent Neural Network (LSTM)

Quiero realizar análisis de sentimientos en el texto, he revisado varios artículos, algunos de ellos usan "Naive Bayes" y otros son "Recurrent Neural Network (LSTM)" , por otro lado, he visto una biblioteca de Python para el análisis de sentimientos que es nltk Utiliza "Naive Bayes". ¿Alguien puede...

machine-learning neural-networks python natural-language

8

Pruebas de normalidad inconsistentes: Kolmogorov-Smirnov vs Shapiro-Wilk

Actualmente estoy buscando algunos datos producidos por una simulación de MC que escribí: espero que los valores se distribuyan normalmente. Naturalmente, tracé un histograma y parece razonable (¿supongo?): [Arriba a la izquierda: histograma con dist.pdf(), arriba a la derecha: histograma...

hypothesis-testing normal-distribution python kolmogorov-smirnov

8

¿Por qué este conjunto de datos no tiene covarianza?

Entiendo cómo funciona la covarianza es que los datos que están correlacionados deberían tener una covarianza algo alta. Me he encontrado con una situación en la que mis datos parecen correlacionados (como se muestra en el diagrama de dispersión) pero la covarianza es casi cero. ¿Cómo puede la...

python descriptive-statistics covariance