Modelado de precios de alquiler: ¿qué método de interpolación usar?

13

Tengo un conjunto de datos nacional de ~ 1,4 millones de hogares. Allí tengo información sobre el alquiler, el tamaño (número de habitaciones y m2) y algunas características adicionales de cada hogar.

Me gustaría usar estos datos para crear una superficie de precios de alquiler para todo el país y usar esta información como un proxy para estimar los valores de ~ 1.5 millones de hogares restantes que son propietarios o no tienen información de alquiler.

Un par de preguntas aquí:

¿Es este enfoque apropiado para este tipo de problema?

¿Qué método de interpolación sería el más adecuado para usar aquí?

Además, ¿sería posible tener en cuenta información sobre, por ejemplo, el tamaño del hogar?

Estoy en ArcGIS 9.3 con licencia ArcInfo.

radek
fuente
1
Parece que los sistemas de evaluación masiva asistida por computadora (CAMA) tendrían que hacer algo similar. Me pregunto cómo lo manejan. en.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Respuestas:

10

La idea es buena, pero la implementación propuesta puede ser demasiado simplista para ser creíble. Los alquileres son propiedad de los sistemas económicos. Además de estar influenciados por la ubicación, están relacionados con otras variables económicas de maneras importantes: estado de la economía local (y nacional), precios locales de la vivienda, disponibilidad de capital, tasas de empleo, etc. Para hacer un buen trabajo necesita un modelo econométrico . Podría beneficiarse tener algunos términos de retraso espacial , pero antes de considerar tales complicaciones, debe incluir muchas de estas covariables económicas.

Dicho esto, su capacidad para tener éxito depende de las relaciones entre los datos que tiene y las rentas que desea predecir. Si sus datos son una muestra representativa de todo el país y están dispersos geográficamente (piense en las casas como pasas de uva en una cookie y tiene datos sobre todas las demás pasas en la cookie), entonces podría ser suficiente un modelo relativamente simple. Si sus datos están enfocados geográficamente, tal vez tenga información sobre las pasas en el lado derecho de la cookie y quiera hacer predicciones para las pasas en el lado izquierdo, entonces el problema es más difícil.

Un buen punto de partida sería ajustar un modelo econométrico lineal convencional de rentas a las características del hogar y las características espaciales brutas (como las políticas tributarias estatales o del condado), calcular los residuos y comenzar a explorar los residuos espacialmente (usando variografía , suavizado del núcleo espacial) , etc.) para capturar los efectos geográficos.

Software adecuado está disponible como add-ons para R .

whuber
fuente
@whubber El enlace al documento que describe la variografía parece estar muerto. ¿Hay alguna posibilidad de actualizarlo?
radek
1
Gracias @radek. Es sorprendentemente difícil encontrar una exposición de variografía en la Web que sea introductoria pero precisa y no sea solo un manual de software. Encontré una tesis doctoral reciente que, a juzgar por su resumen e introducción, parece ser clara y exhaustiva y comienza desde un punto relativamente elemental.
whuber
7

Como una introducción muy suave a los temas sobre regresión espacial, recomendaría consultar el libro de trabajo GeoDa (los capítulos 22 a 25 serán de gran interés). Incluso si no desea utilizar el software, es una descripción muy completa de la regresión espacial.

¿Las funciones de regresión incorporadas en ArcMap manejarán esa cantidad de datos (no es que ningún software tenga dificultades con tantos puntos?)

Andy W
fuente
3
(+1) 1.4 millones de puntos no es problema para la regresión. (El esfuerzo en algoritmos de mínimos cuadrados, por ejemplo, es típicamente proporcional al cubo del número de variables. La configuración de las ecuaciones requiere solo un escaneo rápido a través del conjunto de datos). El verdadero problema es que 1.4 millones de casos tendrán un rico y estructura detallada: un buen análisis sería extremadamente laborioso. (Este conjunto de datos podría generar un montón de tesis doctorales en economía, estoy seguro). Por lo tanto, el truco es hacer todo el trabajo que sea necesario para obtener respuestas suficientemente precisas y defendibles para la tarea en cuestión.
whuber
3

He visto un trabajo similar realizado para los precios de la vivienda utilizando el modelado hedónico. Consulte http://scholar.google.com/scholar?hl=es&q=hedonic+price+geography para ver ejemplos.

Ian Turton
fuente
2
(+1) Estoy de acuerdo en que la literatura sobre modelos hedónicos de precios de la vivienda se aplica en gran medida a esta pregunta. Sin embargo, reformulé sugerirlo, ya que una persona que no está familiarizada con la regresión puede encontrar el trabajo de todos esos economometristas desalentadores (¡sé que a veces lo hago!). de interés.
Andy W