¿Es nominal, ordinal y binario para datos cuantitativos, datos cualitativos o ambos?

9

Me estoy acercando a los tipos de datos y necesito ayuda:

ingrese la descripción de la imagen aquí

Si mira la imagen de arriba (tomada desde aquí ), tiene los tipos de datos como este:

  • Cuantitativo (discreto, continuo)
  • Cualitativa (Nominal (N), Ordinal (O), Binario (B)).

ingrese la descripción de la imagen aquí

Pero si miras la siguiente imagen (desde aquí ), las categorías son:

  • Cuantitativo (discreto (NOB))
  • Cualitativo

Una imagen tiene NOB en Cualitativa, la otra lo tiene en Cuantitativa. ¿Cuál es el correcto?

Propensión
fuente
55
Cada viñeta en la descripción de "datos discretos" es incorrecta y engañosa.
whuber

Respuestas:

5

Estas tipologías pueden confundir fácilmente tanto como explican.

Por ejemplo, datos binarios., tal como se presenta en muchos textos o cursos introductorios, ciertamente suena cualitativo: sí o no, sobrevivió o murió, presente o ausente, hombre o mujer, lo que sea. Pero puntúe las dos posibilidades 1 o 0 y todo será perfectamente cuantitativo. Dicha puntuación es la base de todo tipo de análisis: la proporción de mujeres es solo el promedio de varios 0 para hombres y 1 para mujeres. Si me encuentro con 7 mujeres y 3 hombres, puedo promediar 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 para obtener la proporción 0.7. Con las respuestas binarias, tiene un camino abierto para iniciar una regresión logit y probit, y así sucesivamente, que se centran en la variación en la proporción, fracción o probabilidad sobrevivida, o algo similar, con cualquier otra cosa que lo controle o influya. Nadie debe preocuparse por la codificación arbitraria. La proporción masculina es solo 1 menos la proporción femenina,

Casi lo mismo es cierto cuando se consideran datos nominales u ordinales , ya que cualquier análisis de dichos datos depende de contar primero cuántos caen en cada categoría y luego puede ser tan cuantitativo como desee. Los gráficos circulares y los gráficos de barras, tal como se encontraron por primera vez en los primeros años, muestran eso, por lo que es sorprendente cuántas cuentas pierden esto en las explicaciones.

Dicho de otra manera, puede clasificar los datos sin procesar u originales como se informaron por primera vez y como aparecen en, por ejemplo, la celda de una hoja de cálculo o base de datos. Pero su forma original no es inmutable. Imagine algo marcado como una muerte por perplejidad al leer demasiados libros de texto superficiales. Eso se puede escribir en un certificado, pero el análisis estadístico nunca se detiene allí. Hay una agregación a los recuentos (cuántas de esas muertes en un área y un período de tiempo), una reducción de las tasas (cuántos en relación con la población en riesgo), y así sucesivamente.

Entonces, la forma en que los datos se codifican por primera vez rara vez inhibe su uso de otras maneras y la transformación a otras formas. La etimología de los datos es aquí reveladora: traduciendo el latín original literalmente, son como se te han dado , pero no hay ninguna regla en contra de convertirlos a muchas otras formas.

Nick Cox
fuente
5

Todo, no pude encontrar una imagen que reuniera todo, así que hice una basada en lo que he estado estudiando. Poner las escalas de medición en el mismo diagrama con los tipos de datos me confundía, así que traté de mostrar que hay una distinción allí.

ingrese la descripción de la imagen aquí

Agradezco tu ayuda y pensamientos! Saludos, inclinada

Propensión
fuente
¡Las variables cuantitativas discretas (como los recuentos) también se pueden medir usando la escala de intervalo o de relación! Ver aquí , por ejemplo.
Rodvi
3

Depende de lo que quiera decir con "datos cuantitativos" y "datos cualitativos".

Creo que los dos sitios que cita utilizan los términos de manera diferente. Supongamos, por ejemplo, que le preguntas a la gente:

Did you vote for Obama, Romney, someone else or no one in the presidential election?

¿Qué tipo de datos es este? La variable es nominal: son solo nombres, no tiene ningún orden. Pero muchas personas lo llamarían cuantitativo porque la clave es cuántos eligen qué candidato. Eso es opuesto a los datos cualitativos que podrían ser transcripciones de entrevistas sobre lo que más les gusta de Obama (o Romney o quien sea).

Una mejor manera de verlo es distinguir claramente los datos cuantitativos de las variables cuantitativas.

Peter Flom
fuente
En el primer caso, hay una variable, que contiene el nombre del presidente. La variable es cualitativa, para ser precisos es nominal. En el segundo caso, cada nombre de presidente corresponde a una variable individual, que contiene a los votantes. Si se conocen los nombres de los votantes y contiene los nombres de los votantes, entonces la variable es nominal. Si tiene número de votos, la variable es cuantitativa, para ser precisos está en la escala de razón.
Ioannis Iliadis - Ilousis
2

Ninguno de estos cuadros son correctos. Son bastante absurdas y tienes razón en confundirte (aparte de la contradicción).

Parecen combinar las ideas del tipo de variable fundamental y la selección de variables para modelar un sistema (con un pdf).

Hay 3 tipos de variables fundamentales (excluyendo subtipos): Nominal (categórico / cualitativo), ordinal y continuo (numérico, cuantitativo). Ordinal tiene una naturaleza cualitativa y cuantitativa.

El atributo no es realmente un tipo básico, pero generalmente se discute de esa manera al elegir un gráfico de control apropiado, donde uno elige el mejor pdf con el que modelar el sistema. Esto a veces se denomina "datos de atributos", pero su tipo es nominal (también conocido como categórico, etc.). Como Nick mencionó, contamos los nominales, por lo que puede confundirse con un tipo numérico, pero no lo es.

mandata
fuente
1
Mandata, según lo que dices, ¿qué cambios harías en el cuadro que hice anteriormente? Aprecio tu ayuda. Saludos, inclinada
inclinada el
Mandata, todos estos cuadros de diferentes expertos son en parte correctos. La cuestión es que las personas entienden las palabras y los conceptos de manera no idéntica, pero prefieren, durante un tiempo prolongado o breve, apilarse a su propia comprensión cómoda. Por ejemplo, algunas personas rechazarán llamar a la escala ordinal "cuantitativa" mientras que otras aceptarán, dependiendo de si la "cantidad" es necesariamente manifiesta de una categoría de ser potencialmente subyacente.
ttnphns
@Propensión. Esa tabla es mejor que la última. Consideraría discreta una calidad de tipo, no un tipo en sí mismo. Nominal y ordenado son completamente discretos, mientras que contable (finito o infinito) cuantitativo también lo es. Binario también es una característica de tipo (es un subconjunto de discreto). El binario rara vez está ordenado, y casi siempre está representado por variables nominales. Categórico y nominal son sinónimos. La diferencia entre las variables ordenadas apenas tiene sentido, puede ser parcial o totalmente desconocida, o no relevante (lo último implica falta de sentido), pero no afirmaría eso.
mandata
@ttnphns, estoy de acuerdo con lo que dices en espíritu, pero ambos tienen serios errores conceptuales. el primero mezcla la idea del tipo de datos de atributo, que se usa para seleccionar un gráfico de control, qué tipo de datos básico. El segundo tiene nominal como un subconjunto de discreto que es un subconjunto de continuo. Podría subconjunto discreto, pero nominal pertenece bajo cualitativo. Tal vez está ahí porque uno cuenta los eventos nominales discretamente, pero incluso si es por eso que es incorrecto.
mandata
No creo que la teoría del intervalo / relación sea una forma válida de describir el tipo de variable. Podría ser bueno para determinar qué funciones son razonables cuando uno no se siente seguro acerca de las matemáticas, pero más allá de eso, veo una escala como una transformación de otra escala si representan las mismas dimensiones o unidades.
mandata
1

Encontré esta pregunta mientras buscaba niveles de medición y conceptos relacionados. Creo que los cuadros en la pregunta carecen del contexto. Cuando hacemos la categorización, definimos las reglas para agrupar los objetos de acuerdo con nuestro propósito. Entonces, ¿cuál es el propósito? ¿Y estamos hablando de las variables?

Podríamos clasificar las variables de acuerdo con los niveles de medición , luego podríamos tener 4 escalas (grupos) con las siguientes reglas:

nominal : los atributos de una variable se diferencian solo por nombre (categoría) y no hay orden (rango, posición).
ordinal : los atributos de una variable se diferencian por orden (rango, posición), pero no sabemos el grado relativo de diferencia entre ellos.
intervalo : los atributos de una variable se diferencian por el grado de diferencia entre ellos, pero no hay cero absoluto, y la relación entre los atributos es desconocida.
ratio : los atributos de una variable se diferencian por el grado de diferencia entre ellos, hay cero absoluto y podríamos encontrar la proporción entre los atributos.

Y este es solo un enfoque de Stanley Smith Stevens. Hay varias otras tipologías.

Las variables continuas y discretas son conceptos matemáticos donde tenemos un rango de números reales y:

La variable continua puede tomar cualquier valor en este rango. El número de valores permitidos es incontable.
mientras que para una variable discreta, el número de valores permitidos en el rango es finito o infinitamente contable.

wombatonfire
fuente