Preguntas etiquetadas con r

14

¿Qué significa que una regresión lineal sea estadísticamente significativa pero que tenga un r cuadrado muy bajo?

Entiendo que significa que el modelo es malo para predecir puntos de datos individuales, pero ha establecido una tendencia firme (por ejemplo, y sube cuando x

14

Comprensión intuitiva de la diferencia entre coherente y asintóticamente imparcial

Estoy tratando de obtener una comprensión intuitiva y sentir la diferencia y la diferencia práctica entre el término consistente y asintóticamente imparcial. Conozco sus definiciones matemáticas / estadísticas, pero estoy buscando algo intuitivo. Para mí, mirando sus definiciones individuales, casi...

bias convergence unbiased-estimator asymptotics intuition

14

Caret glmnet vs cv.glmnet

Parece haber mucha confusión en la comparación de usar glmnetdentro caretpara buscar una lambda óptima y usar cv.glmnetpara hacer la misma tarea. Se plantearon muchas preguntas, por ejemplo: Modelo de clasificación train.glmnet vs. cv.glmnet? ¿Cuál es la forma correcta de usar glmnet con...

r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

14

Ajuste de hiperparámetros: búsqueda aleatoria vs optimización bayesiana

Entonces, sabemos que la búsqueda aleatoria funciona mejor que la búsqueda de cuadrícula, pero un enfoque más reciente es la optimización bayesiana (usando procesos gaussianos). Busqué una comparación entre los dos y no encontré nada. Sé que en el cs231n de Stanford solo mencionan la búsqueda...

bayesian hyperparameter

14

¿Qué es una prueba estadística robusta? ¿Qué es una prueba estadística poderosa?

Algunas pruebas estadísticas son robustas y otras no. ¿Qué significa exactamente la robustez? Sorprendentemente, no pude encontrar esa pregunta en este sitio. Además, a veces, la solidez y la potencia de una prueba se discuten juntas. E intuitivamente, no pude diferenciar entre los dos conceptos....

statistical-significance power robust

14

¿Por qué la regresión lineal utiliza una función de costo basada en la distancia vertical entre la hipótesis y el punto de datos de entrada?

Digamos que tenemos los puntos de datos de entrada (predictor) y de salida (respuesta) A, B, C, D, E y queremos ajustar una línea a través de los puntos. Este es un problema simple para ilustrar la pregunta, pero también puede extenderse a dimensiones más altas. Planteamiento del problema El...

regression linear fitting cost-maximization

14

¿Cuál es el valor máximo de la divergencia Kullback-Leibler (KL)

Voy a usar la divergencia de KL en mi código de Python y obtuve este tutorial . En ese tutorial, implementar la divergencia de KL es bastante simple. kl = (model * np.log(model/actual)).sum() Según tengo entendido, la distribución de probabilidad de modely actualdebería ser <= 1. Mi...

machine-learning distance kullback-leibler

14

Modelo de efectos mixtos: compare el componente de varianza aleatoria en los niveles de una variable de agrupación

Supongamos que tengo participantes, cada uno de los cuales da una respuesta 20 veces, 10 en una condición y 10 en otra. Encajo un modelo lineal de efectos mixtos que compara en cada condición. Aquí hay un ejemplo reproducible que simula esta situación usando el paquete en :S

r mixed-model lme4-nlme

14

Regresión lineal cuando Y es acotado y discreto

La pregunta es sencilla: ¿es apropiado usar la regresión lineal cuando Y es acotado y discreto (por ejemplo, el puntaje de la prueba 1 ~ 100, alguna clasificación predefinida 1 ~ 17)? En este caso, ¿"no es bueno" usar regresión lineal, o es totalmente incorrecto

regression multiple-regression least-squares linear bounds

13

Cómo simular un análisis de potencia personalizado de un modelo lm (usando R)

Siguiendo las preguntas recientes que tuvimos aquí . Esperaba saber si alguien se había encontrado o podía compartir el código R para realizar un análisis de potencia personalizado basado en la simulación de un modelo lineal. Más tarde, obviamente, me gustaría extenderlo a modelos más complejos,...

r power power-analysis

13

Estime el tamaño de una población que se muestrea por el número de observaciones repetidas

Digamos que tengo una población de 50 millones de cosas únicas, y tomo 10 millones de muestras (con reemplazo) ... El primer gráfico que adjunto muestra cuántas veces pruebo la misma "cosa", lo cual es relativamente raro. La población es mayor que mi muestra. Sin embargo, si mi población es de...

r sampling expectation-maximization

13

Una explicación fácil para el diagrama de coordenadas paralelas.

He leído y visto muchas parcelas de coordenadas paralelas. ¿Alguien puede responder el siguiente conjunto de preguntas: ¿Qué son las gráficas de coordenadas paralelas (PCP) en palabras simples, para que un laico pueda entender? Una explicación matemática con cierta intuición si es posible ¿Cuándo...

r data-visualization

13

OLS es AZUL. Pero, ¿qué pasa si no me importa la imparcialidad y la linealidad?

El teorema de Gauss-Markov nos dice que el estimador OLS es el mejor estimador lineal imparcial para el modelo de regresión lineal. Pero supongamos que no me importa la linealidad y la imparcialidad. Entonces, ¿hay algún otro estimador (posible no lineal / sesgado) para el modelo de regresión...

regression unbiased-estimator

13

Significación de correlación cruzada en R

¿Cómo saber si las correlaciones en diferentes rezagos obtenidos de la correlación cruzada (función ccf) de dos series de tiempo son significativas.

r statistical-significance cross-correlation

13

Agregar coeficientes para obtener efectos de interacción: ¿qué hacer con los SE?

Tengo una regresión multivariada, que incluye interacciones. Por ejemplo, para obtener la estimación del efecto del tratamiento para el quintil más pobre, necesito agregar los coeficientes del regresor del tratamiento al coeficiente de la variable de interacción (que interactúa con el tratamiento y...

regression standard-deviation standard-error

13

¿Puedo semiautomatizar los diagnósticos de convergencia de MCMC para establecer la longitud de quemado?

Me gustaría automatizar la elección del quemado para una cadena MCMC, por ejemplo, eliminando las primeras n filas según un diagnóstico de convergencia. ¿En qué medida se puede automatizar este paso de forma segura? Incluso si aún verifico dos veces la autocorrelación, el seguimiento de mcmc y...

r bayesian mcmc

13

LARS vs descenso coordinado para el lazo

¿Cuáles son los pros y los contras de usar LARS [1] versus usar el descenso coordinado para ajustar la regresión lineal regularizada por L1? Estoy principalmente interesado en los aspectos de rendimiento (mis problemas tienden a tener Ncientos de miles y p<20). Sin embargo, cualquier otra...

regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

13

Calcule los errores estándar de Newey-West sin un objeto lm en R

Hice esta pregunta ayer en StackOverflow, y obtuve una respuesta, pero acordamos que parece un poco hack y que puede haber una mejor manera de verlo. La pregunta: me gustaría calcular los errores estándar de Newey-West (HAC) para un vector (en este caso, un vector de devoluciones de acciones). La...

r standard-error autocorrelation heteroscedasticity

13

¿GLMNET o LARS para calcular las soluciones LASSO?

Me gustaría obtener los coeficientes para el problema LASSO ||Y−Xβ||+λ||β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. El problema es que las funciones glmnet y lars dan respuestas diferentes. Para la función glmnet pido los coeficientes de en lugar de solo λ , pero aún obtengo...

r machine-learning regression lasso regularization

13

Comprender las comparaciones de resultados de agrupamiento

Estoy experimentando con la clasificación de datos en grupos. Soy bastante nuevo en este tema e intento comprender el resultado de algunos de los análisis. Usando ejemplos de Quick-R , Rse sugieren varios paquetes. He intentado usar dos de estos paquetes ( fpcusando la kmeansfunción y mclust). Un...

r clustering