Informar resultados de ajuste de curvas en un artículo científico

11

(Espero que esta pregunta se ajuste a este sitio; si no, acepte mis disculpas).

Ejecuté una cierta simulación y obtuve una serie temporal y (t), t = 0, 1, ... 20. Después de probar algunas funciones, descubrí que:

y(t) =~ 1 / (A t + B)

Donde A y B son coeficientes que calculé usando regresión lineal, con R ^ 2> 0.99.

¿Cuál es la forma estándar de informar tales resultados en un artículo científico? Específicamente:

R. No tengo una explicación teórica, por qué el resultado se ve así (sé que debería estar disminuyendo, y que está limitado desde abajo, pero no mucho más). Fue solo una suposición exitosa. ¿Debo describir todas las otras conjeturas fallidas que intenté?

B. Cada vez que ejecuto la simulación, obtengo valores ligeramente diferentes de A y B. ¿Debo informar una ejecución aleatoria o debo ejecutar la simulación muchas veces y promediar los resultados? Si es así, ¿cuántas veces es suficiente?

Erel Segal-Halevi
fuente
¿Qué quieres transmitir? ¿Qué representa cada simulación individual?
Bill Barth
Es una simulación de la propiedad de la tierra. Hay N ciudadanos y N terrenos. Inicialmente, cada terreno se entrega a un ciudadano aleatorio. Luego, cada año, cada terreno se vende con una cierta probabilidad p, y si de hecho se vende, el comprador se selecciona al azar. Después de 50 años, ejecuto un procedimiento de "Jubileo" en el que algunas tierras se devuelven a los propietarios originales, si estos propietarios actualmente no tienen tierras. Mido el número de ciudadanos sin tierra (y) después de cada Jubileo (t). Ciertamente, y (t) no aumenta. Quiero mostrar que está disminuyendo en una tasa predecible, y que converge a 0.
Erel Segal-Halevi
Me parece que debe desarrollar una representación estadística de y , entonces (media, mediana, etc.). BAB
Bill Barth
2
Considere un modelo con N + 1 especies diferentes donde , que denota la concentración de propietarios con parcelas de tierra. Ahora puede aplicar la teoría de la cinética química a su problema. n = 0 ... N nxnn=0Nn
Deathbreath
Bill: ¿quieres decir que debo calcular A y B muchas veces, luego informar la media y el estándar? Creo que un mejor enfoque es hacer una regresión lineal única con todas las muestras de todas las simulaciones. Pero, ¿cuántas veces debo ejecutar la simulación?
Erel Segal-Halevi

Respuestas:

5

Estás tratando de adaptar una ley de poder a tu distribución. Muy interesante. Estos aparecen todo el tiempo en la teoría de gráficos , las redes sociales y muchos otros lugares.

Hay algunos tutoriales sobre cómo ajustar sus datos aquí y aquí .

Además, en referencia a la pregunta A., ¿cómo depende la probabilidad de que una persona compre tierra de la cantidad de tierra que ya tiene? Es posible que pueda usar el modelo de Barbasi para explicar por qué una ley de potencia se ajusta razonablemente a sus datos.

actualización: he usado esto y funciona muy bien: https://pypi.python.org/pypi/powerlaw

dranxo
fuente
+1 para todos los enlaces! También pensé en la ley de potencia, pero su forma simple (y = A t ^ k) no implica la forma que encontré, debido a la constante B (y = (A t + B) ^ - 1). ¿Hay una forma más general?
Erel Segal-Halevi
Si está interesado en describir la forma de la curva, entonces debe factorizar y cambiar antes de ajustar una ley de potencia. El hecho de que tenga una B no es relevante para la forma de la curva.
dranxo
Lo siento, no te entendí, ¿qué quieres decir con "entonces deberías factorizar y cambiar"?
Erel Segal-Halevi
Establezca x = t + B / A. Entonces (At + B) ^ {- 1} = (A * x) ^ {- 1} que es la forma en los enlaces.
dranxo
1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo
7

Algunas reflexiones sobre su pregunta:

  • La forma en que informe el ajuste de su modelo dependerá en gran medida de su audiencia y su campo. Por ejemplo, en mi campo, las estadísticas de ajuste de modelos como R ^ 2 rara vez se informan, lo que se considera ni impresionante ni particularmente útil. En cambio, se describen algunos criterios sobre cómo llegó al modelo al que llegó, y luego informa los resultados de su modelo; todos asumimos que realmente se ajusta correctamente al modelo.
  • "Sucedí este formulario" es una mala explicación. Una muy mala. A pesar de la afición por las historias de genio accidental, como el descubrimiento de la penicilina o la quinina, la "suerte ciega y tonta" no es un proceso científico confiable. Por ejemplo, ha demostrado que ese formulario es bueno para ajustar sus datos, pero aún no ha demostrado que sea el mejor para ajustar sus datos. R ^ 2 por sí solo no es una métrica suficiente para evaluar qué tan bien su modelo se ajusta a los datos. Ver el cuarteto de Anscombe .
  • Como @rcompton mencionó, parece que estás tratando de ajustar una distribución de la ley de energía sin saberlo, pero incluso si logras ajustar bien una ley de energía, es realmente mejor si encuentras alguna razón por la que crees que es una ley de energía . Puede ser suficiente trazar Y con el tiempo, dirigirse a CrossValidated (o una universidad / departamento más cómodo con las estadísticas) y revisar sistemáticamente las distribuciones que podrían darle aproximadamente esa apariencia. Hay otros, además de la distribución de la ley de poder, que pueden darle un ajuste superior.
Fomite
fuente
+1 para las ideas. "revise sistemáticamente las distribuciones que podrían darle aproximadamente esa apariencia". - ¿Dónde puedo encontrar estos?
Erel Segal-Halevi
@ErelSegalHalevi Puede comenzar en CrossValidated, este sitio asociado que se refiere a estadísticas y análisis de datos.
Fomite