Me estoy acercando a los tipos de datos y necesito ayuda:
Si mira la imagen de arriba (tomada desde aquí ), tiene los tipos de datos como este:
- Cuantitativo (discreto, continuo)
- Cualitativa (Nominal (N), Ordinal (O), Binario (B)).
Pero si miras la siguiente imagen (desde aquí ), las categorías son:
- Cuantitativo (discreto (NOB))
- Cualitativo
Una imagen tiene NOB en Cualitativa, la otra lo tiene en Cuantitativa. ¿Cuál es el correcto?
categorical-data
dataset
ordinal-data
binary-data
Propensión
fuente
fuente
Respuestas:
Estas tipologías pueden confundir fácilmente tanto como explican.
Por ejemplo, datos binarios., tal como se presenta en muchos textos o cursos introductorios, ciertamente suena cualitativo: sí o no, sobrevivió o murió, presente o ausente, hombre o mujer, lo que sea. Pero puntúe las dos posibilidades 1 o 0 y todo será perfectamente cuantitativo. Dicha puntuación es la base de todo tipo de análisis: la proporción de mujeres es solo el promedio de varios 0 para hombres y 1 para mujeres. Si me encuentro con 7 mujeres y 3 hombres, puedo promediar 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 para obtener la proporción 0.7. Con las respuestas binarias, tiene un camino abierto para iniciar una regresión logit y probit, y así sucesivamente, que se centran en la variación en la proporción, fracción o probabilidad sobrevivida, o algo similar, con cualquier otra cosa que lo controle o influya. Nadie debe preocuparse por la codificación arbitraria. La proporción masculina es solo 1 menos la proporción femenina,
Casi lo mismo es cierto cuando se consideran datos nominales u ordinales , ya que cualquier análisis de dichos datos depende de contar primero cuántos caen en cada categoría y luego puede ser tan cuantitativo como desee. Los gráficos circulares y los gráficos de barras, tal como se encontraron por primera vez en los primeros años, muestran eso, por lo que es sorprendente cuántas cuentas pierden esto en las explicaciones.
Dicho de otra manera, puede clasificar los datos sin procesar u originales como se informaron por primera vez y como aparecen en, por ejemplo, la celda de una hoja de cálculo o base de datos. Pero su forma original no es inmutable. Imagine algo marcado como una muerte por perplejidad al leer demasiados libros de texto superficiales. Eso se puede escribir en un certificado, pero el análisis estadístico nunca se detiene allí. Hay una agregación a los recuentos (cuántas de esas muertes en un área y un período de tiempo), una reducción de las tasas (cuántos en relación con la población en riesgo), y así sucesivamente.
Entonces, la forma en que los datos se codifican por primera vez rara vez inhibe su uso de otras maneras y la transformación a otras formas. La etimología de los datos es aquí reveladora: traduciendo el latín original literalmente, son como se te han dado , pero no hay ninguna regla en contra de convertirlos a muchas otras formas.
fuente
Todo, no pude encontrar una imagen que reuniera todo, así que hice una basada en lo que he estado estudiando. Poner las escalas de medición en el mismo diagrama con los tipos de datos me confundía, así que traté de mostrar que hay una distinción allí.
Agradezco tu ayuda y pensamientos! Saludos, inclinada
fuente
Depende de lo que quiera decir con "datos cuantitativos" y "datos cualitativos".
Creo que los dos sitios que cita utilizan los términos de manera diferente. Supongamos, por ejemplo, que le preguntas a la gente:
¿Qué tipo de datos es este? La variable es nominal: son solo nombres, no tiene ningún orden. Pero muchas personas lo llamarían cuantitativo porque la clave es cuántos eligen qué candidato. Eso es opuesto a los datos cualitativos que podrían ser transcripciones de entrevistas sobre lo que más les gusta de Obama (o Romney o quien sea).
Una mejor manera de verlo es distinguir claramente los datos cuantitativos de las variables cuantitativas.
fuente
Ninguno de estos cuadros son correctos. Son bastante absurdas y tienes razón en confundirte (aparte de la contradicción).
Parecen combinar las ideas del tipo de variable fundamental y la selección de variables para modelar un sistema (con un pdf).
Hay 3 tipos de variables fundamentales (excluyendo subtipos): Nominal (categórico / cualitativo), ordinal y continuo (numérico, cuantitativo). Ordinal tiene una naturaleza cualitativa y cuantitativa.
El atributo no es realmente un tipo básico, pero generalmente se discute de esa manera al elegir un gráfico de control apropiado, donde uno elige el mejor pdf con el que modelar el sistema. Esto a veces se denomina "datos de atributos", pero su tipo es nominal (también conocido como categórico, etc.). Como Nick mencionó, contamos los nominales, por lo que puede confundirse con un tipo numérico, pero no lo es.
fuente
Encontré esta pregunta mientras buscaba niveles de medición y conceptos relacionados. Creo que los cuadros en la pregunta carecen del contexto. Cuando hacemos la categorización, definimos las reglas para agrupar los objetos de acuerdo con nuestro propósito. Entonces, ¿cuál es el propósito? ¿Y estamos hablando de las variables?
Podríamos clasificar las variables de acuerdo con los niveles de medición , luego podríamos tener 4 escalas (grupos) con las siguientes reglas:
nominal : los atributos de una variable se diferencian solo por nombre (categoría) y no hay orden (rango, posición).
ordinal : los atributos de una variable se diferencian por orden (rango, posición), pero no sabemos el grado relativo de diferencia entre ellos.
intervalo : los atributos de una variable se diferencian por el grado de diferencia entre ellos, pero no hay cero absoluto, y la relación entre los atributos es desconocida.
ratio : los atributos de una variable se diferencian por el grado de diferencia entre ellos, hay cero absoluto y podríamos encontrar la proporción entre los atributos.
Y este es solo un enfoque de Stanley Smith Stevens. Hay varias otras tipologías.
Las variables continuas y discretas son conceptos matemáticos donde tenemos un rango de números reales y:
La variable continua puede tomar cualquier valor en este rango. El número de valores permitidos es incontable.
mientras que para una variable discreta, el número de valores permitidos en el rango es finito o infinitamente contable.
fuente