Supongamos que tengo una muestra de frecuencias de 4 eventos posibles:
Event1 - 5
E2 - 1
E3 - 0
E4 - 12
y tengo las probabilidades esperadas de que ocurran mis eventos:
p1 - 0.2
p2 - 0.1
p3 - 0.1
p4 - 0.6
Con la suma de las frecuencias observadas de mis cuatro eventos (18) puedo calcular las frecuencias esperadas de los eventos, ¿verdad?
expectedE1 - 18 * 0.2 = 3.6
expectedE2 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.6 = 10.8
¿Cómo puedo comparar los valores observados con los valores esperados? para probar si mis probabilidades calculadas son buenos predictores?
Pensé en una prueba de ji cuadrado, pero el resultado cambia con el tamaño de la muestra (n = 18), quiero decir, si multiplico los valores observados por 1342 y utilizo el mismo método, el resultado es diferente. Tal vez una prueba emparejada wilcox funciona, pero ¿qué sugieres?
Si puede sugerir en R, sería mejor.
r
statistical-significance
chi-squared
multivariate-analysis
exponential
joint-distribution
statistical-significance
self-study
standard-deviation
probability
normal-distribution
spss
interpretation
assumptions
cox-model
reporting
cox-model
statistical-significance
reliability
method-comparison
classification
boosting
ensemble
adaboost
confidence-interval
cross-validation
prediction
prediction-interval
regression
machine-learning
svm
regularization
regression
sampling
survey
probit
matlab
feature-selection
information-theory
mutual-information
time-series
forecasting
simulation
classification
boosting
ensemble
adaboost
normal-distribution
multivariate-analysis
covariance
gini
clustering
text-mining
distance-functions
information-retrieval
similarities
regression
logistic
stata
group-differences
r
anova
confidence-interval
repeated-measures
r
logistic
lme4-nlme
inference
fiducial
kalman-filter
classification
discriminant-analysis
linear-algebra
computing
statistical-significance
time-series
panel-data
missing-data
uncertainty
probability
multivariate-analysis
r
classification
spss
k-means
discriminant-analysis
poisson-distribution
average
r
random-forest
importance
probability
conditional-probability
distributions
standard-deviation
time-series
machine-learning
online
forecasting
r
pca
dataset
data-visualization
bayes
distributions
mathematical-statistics
degrees-of-freedom
Juan
fuente
fuente