Tengo un conjunto de datos nacional de ~ 1,4 millones de hogares. Allí tengo información sobre el alquiler, el tamaño (número de habitaciones y m2) y algunas características adicionales de cada hogar.
Me gustaría usar estos datos para crear una superficie de precios de alquiler para todo el país y usar esta información como un proxy para estimar los valores de ~ 1.5 millones de hogares restantes que son propietarios o no tienen información de alquiler.
Un par de preguntas aquí:
¿Es este enfoque apropiado para este tipo de problema?
¿Qué método de interpolación sería el más adecuado para usar aquí?
Además, ¿sería posible tener en cuenta información sobre, por ejemplo, el tamaño del hogar?
Estoy en ArcGIS 9.3 con licencia ArcInfo.
Respuestas:
La idea es buena, pero la implementación propuesta puede ser demasiado simplista para ser creíble. Los alquileres son propiedad de los sistemas económicos. Además de estar influenciados por la ubicación, están relacionados con otras variables económicas de maneras importantes: estado de la economía local (y nacional), precios locales de la vivienda, disponibilidad de capital, tasas de empleo, etc. Para hacer un buen trabajo necesita un modelo econométrico . Podría beneficiarse tener algunos términos de retraso espacial , pero antes de considerar tales complicaciones, debe incluir muchas de estas covariables económicas.
Dicho esto, su capacidad para tener éxito depende de las relaciones entre los datos que tiene y las rentas que desea predecir. Si sus datos son una muestra representativa de todo el país y están dispersos geográficamente (piense en las casas como pasas de uva en una cookie y tiene datos sobre todas las demás pasas en la cookie), entonces podría ser suficiente un modelo relativamente simple. Si sus datos están enfocados geográficamente, tal vez tenga información sobre las pasas en el lado derecho de la cookie y quiera hacer predicciones para las pasas en el lado izquierdo, entonces el problema es más difícil.
Un buen punto de partida sería ajustar un modelo econométrico lineal convencional de rentas a las características del hogar y las características espaciales brutas (como las políticas tributarias estatales o del condado), calcular los residuos y comenzar a explorar los residuos espacialmente (usando variografía , suavizado del núcleo espacial) , etc.) para capturar los efectos geográficos.
Software adecuado está disponible como add-ons para R .
fuente
Como una introducción muy suave a los temas sobre regresión espacial, recomendaría consultar el libro de trabajo GeoDa (los capítulos 22 a 25 serán de gran interés). Incluso si no desea utilizar el software, es una descripción muy completa de la regresión espacial.
¿Las funciones de regresión incorporadas en ArcMap manejarán esa cantidad de datos (no es que ningún software tenga dificultades con tantos puntos?)
fuente
He visto un trabajo similar realizado para los precios de la vivienda utilizando el modelado hedónico. Consulte http://scholar.google.com/scholar?hl=es&q=hedonic+price+geography para ver ejemplos.
fuente