He tenido dificultades para comprender el significado de "muestra aleatoria", así como "variable aleatoria iid". Traté de encontrar el significado de varias fuentes, pero me confundí cada vez más. Estoy publicando aquí lo que probé y llegué a saber:
Probabilidad y estadística de Degroot dice:
Muestras aleatorias / iid / Tamaño de muestra: considere una distribución de probabilidad dada en la línea real que puede representarse con un pf o un pdf . Se dice que variables aleatorias forman una muestra aleatoria a partir de esta distribución si estas variables aleatorias son independientes y el pf marginal o pdf de cada una de ellas es . Dichas variables aleatorias también se dice que son independientes e idénticamente distribuidas, abreviadas en iid Nos referimos al número n de variables aleatorias como el tamaño de la muestra.n X 1 , . . . , X n f
Pero uno de los otros libros de estadísticas que tengo dice:
En un muestreo aleatorio, garantizamos que cada unidad individual de la población tenga la misma probabilidad (probabilidad) de ser seleccionada.
Entonces, tengo la sensación de que los iids son elementos que construyen una muestra aleatoria, y el procedimiento para obtener una muestra aleatoria es el muestreo aleatorio. Estoy en lo cierto?
PD: Estoy muy confundido sobre este tema, por lo que agradeceré una respuesta elaborada. Gracias.
fuente
Respuestas:
No dice cuál es el otro libro de estadísticas, pero supongo que es un libro (o sección) sobre muestreo de población finita .
Cuando muestrea variables aleatorias, es decir, cuando considera un conjunto de n variables aleatorias, sabe que si son independientes, f ( x 1 , ... , x n ) = f ( x 1 ) ⋯ f ( x n ) , e idénticamente distribuido , en particular E ( X i ) = μ y Var ( X i )X1, ... , Xnorte norte F( x1, ... , xnorte) = f( x1) ⋯ f( xnorte) mi( Xyo) = μ para todo i , entonces:
¯ X = ∑ i X iVar ( Xyo) = σ2 yo
dondeσ2es el segundo momento central.
El muestreo de una población finita es algo diferente. Si la población es de tamaño , en el muestreo sin reemplazo hay ( Nnorte posibles muestrasside tamañonyson equiprobables:
p(si)=1( Nnorte) syo norte
Por ejemplo, siN=5yn=3, el espacio de muestra es{s1,...,s10}
y las muestras possibile son:
s 1 ={1,2,3}, es 2 ={1,2,4}, s 3 ={1,2,5}, s 4
Este es un ejemplo rápido de cómo una muestra aleatoria iid (variable aleatoria) y una muestra aleatoria (población finita) pueden diferir. La inferencia estadística se refiere principalmente al muestreo de variables aleatorias, la teoría de muestreo se trata del muestreo de población finita.
fuente
No lo aburriré con definiciones y fórmulas probabilísticas, que puede recoger fácilmente en cualquier libro de texto (o aquí es un buen lugar para comenzar)
fuente
Una variable aleatoria, generalmente escrita X, es una variable cuyos valores posibles son resultados numéricos de un fenómeno aleatorio. El fenómeno aleatorio puede producir resultados que tienen valores numéricos capturados por la variable aleatoria, por ejemplo, número de caras en 10 lanzamientos de una moneda o ingresos / alturas, etc. en una muestra, pero eso no es necesario.
Más generalmente, una variable aleatoria es una función que asigna resultados aleatorios a valores numéricos. Por ejemplo, cada día puede ser soleado, nublado o lluvioso. Podemos definir una variable aleatoria que tome el valor 1 si llueve, 2 si está nublado y 3 si está soleado. El dominio de una variable aleatoria es el conjunto de resultados posibles.
Para establecer una variable aleatoria debe haber un proceso o experimento asociado con posibles resultados que no puedan predecirse con certeza.
Llegando ahora al tema de la independencia. Dos variables aleatorias son independientes si el valor de una de ellas no afecta el PDF de la otra. No revisamos nuestras predicciones con respecto a las probabilidades de diferentes valores de una variable cuando sabemos algo acerca de la otra variable. Por lo tanto, en el caso de la independencia, los PDF posteriores son idénticos a los PDF anteriores. Por ejemplo, cuando lanzamos una moneda imparcial repetidamente, la información que tenemos sobre el resultado de los 5 lanzamientos anteriores no afecta nuestra predicción sobre el lanzamiento actual, siempre será 0.5. Sin embargo, si se desconoce el sesgo de la moneda y se modela como una Variable aleatoria, entonces el resultado de los 5 lanzamientos anteriores afecta nuestras predicciones con respecto al lanzamiento actual porque nos permite hacer inferencias con respecto al sesgo desconocido de la moneda.
Llegando ahora al tema del muestreo. El propósito de Sampling es informarnos sobre las propiedades de una distribución subyacente que no se conoce y se debe inferir. Recuerde que una distribución se refiere a la probabilidad relativa de posibles resultados en el espacio muestral (que también puede ser un universo condicional). Entonces, cuando tomamos muestras, elegimos un número finito de resultados del espacio muestra y reproducimos el espacio muestral en una escala más pequeña y manejable. La probabilidad igual se refiere al proceso del Muestreo, no a la probabilidad de los Resultados en la Muestra. El muestreo de igual probabilidad implica que la Muestra reflejará las proporciones de los resultados en el Espacio muestral original. Por ejemplo, si preguntamos 10, 000 personas si alguna vez fueron arrestadas, es probable que la muestra que terminemos no sea representativa de la población, el espacio muestral, ya que las personas que habrían sido arrestadas podrían negarse a responder, por lo tanto, la proporción de posibles resultados (arrestado - no arrestado) diferirá entre nuestra muestra y la población por razones sistemáticas. O si elegimos un vecindario en particular para realizar una encuesta, los resultados no serán representativos de la ciudad en su conjunto. Por lo tanto, el muestreo de probabilidad igual implica que no hay razones sistemáticas, aparte de la aleatoriedad pura, que nos hacen creer que las proporciones de los posibles resultados en nuestra muestra son diferentes de las proporciones de los resultados en el Espacio de Población / Muestra. por lo tanto, la proporción de posibles resultados (arrestados - no arrestados) diferirá entre nuestra muestra y la población por razones sistemáticas. O si elegimos un vecindario en particular para realizar una encuesta, los resultados no serán representativos de la ciudad en su conjunto. Por lo tanto, el muestreo de probabilidad igual implica que no hay razones sistemáticas, aparte de la aleatoriedad pura, que nos hacen creer que las proporciones de los posibles resultados en nuestra muestra son diferentes de las proporciones de los resultados en el Espacio de Población / Muestra. por lo tanto, la proporción de posibles resultados (arrestados - no arrestados) diferirá entre nuestra muestra y la población por razones sistemáticas. O si elegimos un vecindario en particular para realizar una encuesta, los resultados no serán representativos de la ciudad en su conjunto. Por lo tanto, el muestreo de probabilidad igual implica que no hay razones sistemáticas, aparte de la aleatoriedad pura, que nos hacen creer que las proporciones de los posibles resultados en nuestra muestra son diferentes de las proporciones de los resultados en el Espacio de Población / Muestra.
fuente
Una muestra aleatoria es la realización de una secuencia de variables aleatorias. Esas variables aleatorias pueden ser iid o no.
fuente