Comprendí que las estadísticas descriptivas describían cuantitativamente las características de una muestra de datos, mientras que las estadísticas inferenciales hacían inferencias sobre las poblaciones de las que se extrajeron las muestras.
Sin embargo, la página de wikipedia para estados de inferencia estadística :
En su mayor parte, la inferencia estadística hace proposiciones sobre las poblaciones, utilizando datos extraídos de la población de interés a través de alguna forma de muestreo aleatorio.
El "en su mayor parte" me ha hecho pensar que quizás no entiendo adecuadamente estos conceptos. ¿Existen ejemplos de estadísticas inferenciales que no hagan proposiciones sobre las poblaciones?
terminology
descriptive-statistics
inference
user1205901 - Restablecer Monica
fuente
fuente
Respuestas:
Viniendo de un fondo de ciencias del comportamiento, asocio esta terminología particularmente con los libros introductorios de estadísticas. En este contexto, la distinción es que:
El punto importante es que cualquier estadística, inferencial o descriptiva, es una función de los datos de la muestra. Un parámetro es una función de la población, donde el término población es lo mismo que decir el proceso de generación de datos subyacente.
Desde esta perspectiva, el estado de una función dada de los datos como estadística descriptiva o inferencial depende del propósito para el que la esté utilizando.
Dicho esto, algunas estadísticas son claramente más útiles para describir características relevantes de los datos, y algunas son muy adecuadas para ayudar a la inferencia.
Desde esta perspectiva, las cosas importantes para entender son:
Por lo tanto, puede definir la distinción entre descriptiva e inferencial en función de la intención del investigador que utiliza la estadística, o puede definir una estadística en función de cómo se usa normalmente.
fuente
Una forma de inferencia se basa en la asignación aleatoria de tratamientos experimentales, y no en el muestreo aleatorio de una población (incluso hipotéticamente). Oscar Kempthorne fue un defensor.
La predicción es otra área en la que no necesariamente se formulan proposiciones sobre poblaciones. (No sé si todos querrían llamar a la predicción "inferencia", pero está Geisser (1993), Inferencia predictiva: una introducción ). A menudo, la predicción se deriva de un modelo de población ajustado, pero no siempre; por ejemplo, el ejemplo de clasificación de @ Matt, el promedio de modelos (bayesiano o basado en pesos de Akaike) o algoritmos de pronóstico como el suavizado exponencial.
Nota: creo que "estadística inferencial versus estadística descriptiva" se refiere más a menudo a la estadística estadística, en lugar de a cantidades calculadas a partir de muestras. No hay diferencia esencial entre una estadística inferencial y una estadística descriptiva; como señaló @Jeremy, es una cuestión de qué uso le estás dando.
fuente
No estoy seguro de que la clasificación necesariamente haga una declaración sobre las poblaciones de las que se extraen los puntos de datos. La clasificación, como probablemente sepa, utiliza datos de entrenamiento que consisten en algunos vectores de "características", cada uno etiquetado con una clase específica, para predecir las etiquetas de clase que pertenecen a otros vectores de características sin etiquetar. Por ejemplo, podríamos usar los signos vitales de un paciente y el diagnóstico de un médico para predecir si otros pacientes están sanos o enfermos.
Algunos clasificadores, llamados "clasificadores generativos", intentan modelar explícitamente las poblaciones o el proceso de generación de datos que produce cada clase. Por ejemplo, el algoritmo Naive Bayes calculaPAGS( clase = c | características ) para cada clase do , suponiendo que las características sean todas independientes. Estos modelos podrían verse razonablemente como declaraciones sobre la población.
Sin embargo, otros clasificadores buscan diferencias entre las clases sin modelar las clases mismas; Estos se llaman clasificadores discriminativos. Un ejemplo clásico es el clasificador vecino más cercano, que asigna un ejemplo sin etiquetar a la clase de su vecino más cercano (donde cerrar se define de alguna manera sensata para el problema). No parece que contenga mucha información, si es que hay alguna, sobre las poblaciones de las que se extrajeron los puntos de datos.
Si está interesado en la diferencia entre estadística descriptiva e inferencial, podría ser más fructífero pensar en el propósito del análisis. Una estadística descriptiva, como la media, podría decirle cuántas truchas hay en un lago típico: describen algo. Una estadística inferencial, como unt -test, podría decirle si generalmente hay más truchas que bajos en estos lagos-- le permite hacer una afirmación sobre una estadística descriptiva.
fuente
En una línea, dados los datos, las estadísticas descriptivas intentan resumir el contenido de sus datos con una pérdida mínima de información (dependiendo de qué medida utilice). Puedes ver la geografía de los datos (algo así como ver el gráfico de rendimiento de la clase y decir quién está arriba, abajo, etc.)
En una línea, dados los datos, intenta estimar e inferir las propiedades de la población hipotética de la que provienen los datos. (Algo así como, comprender a los estudiantes de séptimo grado a través de la buena muestra de la clase, suponiendo que la población subyacente es lo suficientemente grande como para que no se puedan tener en cuenta en su totalidad)
fuente
En breve
Estadísticas descriptivas es el análisis de datos que describen, muestran o resumen datos de manera significativa; es simplemente una forma de describir nuestros datos / hablar sobre toda la población. algunos de ellos son medidas de tendencia central y medidas de dispersión
La estadística inferencial es una técnica que nos permite utilizar muestras para hacer generalizaciones sobre las poblaciones de las cuales se extrajeron las muestras.
fuente
estadística descriptiva es el análisis de datos que describen, muestran o resumen datos de manera significativa; es simplemente una forma de describir nuestros datos / hablar sobre toda la población. algunos de ellos son medidas de tendencia central y medidas de dispersión
La estadística inferencial es una técnica que nos permite utilizar muestras para hacer generalizaciones sobre las poblaciones de las que se extrajeron las muestras.
fuente