¿Cuál es la diferencia entre datos discretos y datos continuos?

63

¿Cuál es la diferencia entre datos discretos y datos continuos?

Albort
fuente
2
¿Intentaste con Google primero? Para mí, da esto .
robin girard
Aquí hay un buen video que responde a su pregunta. youtube.com/watch?v=MIX3ZpzEOdM
2
Solo piense en lo digital y lo analógico. Lo mismo, diferentes nombres.
Pithikos
Realmente no sé cuál es la diferencia entre datos "discretos" y "continuos". Por algunas razones, las clases de introducción de estadísticas parecen disfrutar realmente haciendo que los estudiantes memoricen reglas para distinguir estas dos cosas. Hasta donde he podido entender, las diferencias no están en los datos, sino en cómo elegimos modelar los datos.
user795305
1
Este fue el mejor resultado en Google, @robingirard.
denson

Respuestas:

58

Los datos discretos solo pueden tomar valores particulares. Potencialmente puede haber un número infinito de esos valores, pero cada uno es distinto y no hay área gris en el medio. Los datos discretos pueden ser numéricos, como números de manzanas, pero también pueden ser categóricos, como rojo o azul, o masculino o femenino, o bueno o malo.

Los datos continuos no están restringidos a valores separados definidos, pero pueden ocupar cualquier valor en un rango continuo. Entre dos valores de datos continuos puede haber un número infinito de otros. Los datos continuos son siempre esencialmente numéricos.

A veces tiene sentido tratar los datos numéricos que son propiamente de un tipo como del otro. Por ejemplo, algo como la altura es continua, pero a menudo no nos importan demasiado las pequeñas diferencias y, en cambio, agrupamos las alturas en una serie de contenedores discretos . Por el contrario, si contamos grandes cantidades de alguna entidad discreta (granos de arroz, termitas o centavos en la economía), podemos optar por no pensar en 2,000,006 y 2,000,008 como valores crucialmente diferentes, sino como puntos cercanos en un continuo aproximado.

A veces también puede ser útil tratar los datos numéricos como categóricos, por ejemplo: bajo peso, normal, obesidad. Esto suele ser solo otro tipo de binning.

Rara vez tiene sentido considerar los datos categóricos como continuos.

radio telefono
fuente
@walktalky como @jeromy alude, al menos en psicología, a las variables categóricas, como las respuestas a las preguntas, a menudo se presume como una representación de un rasgo subyacente, por lo que, en ese sentido, los datos categóricos a veces se toman como continuos.
richiemorrisroe
@richiemorrisroe Se podría analizar la diferencia entre los datos y el supuesto rasgo, pero, por supuesto, tiene razón. Se hicieron algunos puntos adicionales muy interesantes en respuesta a esta pregunta de seguimiento .
walkytalky
gracias por el enlace, esas respuestas son de hecho muy interesantes.
richiemorrisroe
> " Potencialmente puede haber un número infinito de esos valores, pero cada uno es distinto y no hay un área gris en el medio ". En realidad, es perfectamente posible tener una distribución discreta con valores distintos y, al mismo tiempo , para dos valores distintos que elija, siempre tienen más valores entre ellos ('área gris' en cierto sentido). No aparecen con tanta frecuencia en la práctica, pero es perfectamente posible que lo hagan de verdad; de hecho, puedo pensar en dos ejemplos distintos (si están relacionados) que pueden surgir fácilmente.
Glen_b
por lo tanto, para aclarar, incluso si tuviera 10 mil millones de filas de datos ohlc para un activo accionario, ¿aún se consideraría discreto? pero luego el precio de un activo no puede ser entre 1 e infinito, ¿cómo pensar en este tipo de situación?
PirateApp
19

Los datos son siempre discretos. Dada una muestra de nvalores en una variable, el número máximo de valores distintos que la variable puede tomar es igual n. Ver esta cita

Todos los espacios muestrales reales son discretos, y todas las variables aleatorias observables tienen distribuciones discretas. La distribución continua es una construcción matemática, adecuada para el tratamiento matemático, pero no prácticamente observable. EJG Pitman (1979, p. 1).

Por lo general, se supone que los datos de una variable se extraen de una variable aleatoria. La variable aleatoria es continua en un rango si hay un número infinito de valores posibles que la variable puede tomar entre dos puntos diferentes en el rango. Por ejemplo, se supone que la altura, el peso y el tiempo son continuos. Por supuesto, cualquier medición de estas variables será finitamente precisa y, en cierto sentido, discreta.

Es útil distinguir entre
variables discretas ordenadas (es decir, ordinales), no ordenadas (es decir, nominales) y binarias.

Algunos libros de texto introductorios confunden una variable continua con una variable numérica. Por ejemplo, una puntuación en un juego de computadora es discreta aunque sea numérica.

Algunos libros de texto introductorios confunden una variable de proporción con variables continuas. Una variable de conteo es una variable de proporción, pero no es continua.

En la práctica real, una variable a menudo se trata como continua cuando puede tomar un número suficientemente grande de valores diferentes.

Referencias

  • Pitman, EJG 1979. Alguna teoría básica para la inferencia estadística. Londres: Chapman y Hall. Nota: Encontré la cita en la introducción del Capítulo 2 del libro de Murray Aitkin Inferencia estadística: un enfoque bayesiano / de probabilidad integrado
Jeromy Anglim
fuente
12
Una probabilidad también es una "construcción matemática" y no "directamente observable". ¿Esto significa que la probabilidad no existe? En general, esta respuesta parece interesante basa en una premisa insostenible de que los datos deben ser caracterizada por los valores que no tienen más que por los valores de un modelo matemático permite que tengan. La última es la característica crucial, no la primera. Todo esto sugiere que lo que importa en la distinción continua / discreta es cómo pensamos sobre los datos (es decir, cómo los modelamos).
whuber
3
Hay una pequeña fábula inteligente que ilustra el punto de @ whuber: Lord (1953), "Sobre el tratamiento estadístico de los números de fútbol", American Psychologist , 8 , pp750-51.
Scortchi - Restablece a Monica
Gracias, @ Scortchi. Las versiones web están disponibles a través de una búsqueda de Google Académico . Lord se dirige a un concepto erróneo, acaloradamente debatido hace 60 años, sobre la medida en que la "teoría de la medición" debería influir (o incluso limitar el alcance del) análisis estadístico. Mi punto era diferente sobre la distinción entre construcciones modelo y observaciones.
whuber
12

Las temperaturas son continuas. Puede ser de 23 grados, 23.1 grados, 23.100004 grados.

El sexo es discreto. Solo puedes ser hombre o mujer (en el pensamiento clásico de todos modos). Algo que podrías representar con un número entero como 1, 2, etc.

La diferencia es importante ya que muchos algoritmos estadísticos y de minería de datos pueden manejar un tipo pero no el otro. Por ejemplo, en la regresión regular, la Y debe ser continua. En regresión logística, la Y es discreta.

Neil McGuigan
fuente
55
Y
8

Los datos discretos solo pueden tomar ciertos valores.

Ejemplo: el número de estudiantes en una clase (no puede tener medio estudiante).

Los datos continuos son datos que pueden tomar cualquier valor (dentro de un rango)

Ejemplos:

  • Altura de una persona: podría ser cualquier valor (dentro del rango de alturas humanas), no solo ciertas alturas fijas,
  • Tiempo en una carrera: incluso puedes medirlo en fracciones de segundo,
  • El peso de un perro
  • La longitud de una hoja,
  • El peso de una persona
Subrato Mukherjee
fuente
2
También puede decirnos dónde copió y pegó la respuesta de: mathsisfun.com/data/data-discrete-continuous.html
philmcole
Muy bien descrito.
Arsman Ahmad
0

En el caso de la base de datos, siempre almacenaríamos los datos de forma discreta, incluso si la naturaleza de los datos es continua. ¿Por qué debería enfatizar la naturaleza de los datos? Deberíamos tomar la distribución de datos que podrían ayudarnos a analizar los datos. SI la naturaleza de los datos es continua, le sugiero que los use mediante análisis continuo.

Tomemos un ejemplo de continuo y discreto: MP3. Incluso el tipo de "sonido" es analogía, si se almacena en formato digital. Deberíamos analizarlo siempre de forma análoga.

Tony
fuente
0

Por un lado, desde un punto de vista práctico, estoy de acuerdo con la respuesta de Jeromy Anglim. Al final, la mayoría de las veces tratamos con variables discretas, aunque desde un punto de vista teórico son continuas, y eso tiene un impacto real, por ejemplo, para la clasificación. Recuerde el artículo de Strobl que indica que los bosques aleatorios están sesgados hacia variables con múltiples puntos de corte (mayor precisión pero naturaleza potencialmente similar). Desde mi experiencia personal, las redes neuronales probabilísticas también pueden presentar un sesgo cuando las variables presentan una precisión diferente a menos que sean del mismo tipo (es decir, continuas). Por otro lado, desde un punto de vista teórico, la clasificación clásica (por ejemplo, continua, discreta, nominal, etc.) es, en mi humilde opinión, correcta. De acuerdo, creo que el nombre fuente del artículo de Quinlan que describe el algoritmo M5, que es un "regresor", es una gran elección. Entonces, la definición y las implicaciones de continuo versus discreto son relevantes dependiendo del 'entorno'.

Refs:

Quinlan JR (1992). Aprendizaje con clases continuas. En: La 5ta Conferencia Conjunta Australiana sobre IA. Sydney (Australia), 343–348.

Strobl C., Boulesteix A.-L., Zeileis A. y Hothorn T. (2007). Sesgo en medidas aleatorias de importancia variable del bosque: ilustraciones, fuentes y una solución. BMC Bioinformatics, 8, 25. doi: 10.1186 / 1471-2105-8-25

Rafa_Mas
fuente
-1

Los datos discretos toman valores particulares, mientras que los datos continuos no están restringidos a valores separados.

Los datos discretos son distintos y no hay un área gris en el medio, mientras que los datos continuos ocupan cualquier valor sobre un valor de datos continuo.

Ahmad ibraheem
fuente
-2

Datos discretos Pueden tomar valores particulares. Son numéricos.

manuella
fuente
Bienvenido a CV! Gracias por responder, pero tómese el tiempo para ver las respuestas anteriores y considere si está agregando algo útil.
Scortchi - Restablece a Monica
-3

Los datos discretos pueden tomar solo valores enteros, mientras que los datos continuos pueden tomar cualquier valor. Por ejemplo, el número de pacientes con cáncer tratados por un hospital cada año es discreto, pero su peso es continuo. Algunos datos son continuos pero se miden de manera discreta, por ejemplo, su edad. Es común informar su edad como decir, 31.

Graham Cookson
fuente
11
Los datos pueden ser discretos sin estar restringidos a enteros. O números, para el caso. Siempre es posible representar datos discretos con enteros, pero eso no significa que los datos solo puedan tomar tales valores.
walkytalky
-4

Los datos discretos hablan específicamente de los valores finitos y los datos continuos hablan de los valores de ifinita .....

MD Shahid
fuente
2
¿Cuidado para elaborar?
chl