API / feeds de datos disponibles como paquetes en R

53

EDITAR: La vista de tareas CRAN de Servicios y tecnologías web contiene una lista mucho más completa de fuentes de datos y API disponibles en R. Puede enviar una solicitud de extracción en github si desea agregar un paquete a la vista de tareas.


Estoy haciendo una lista de los diversos feeds de datos que ya están conectados a R o que son fáciles de configurar. Aquí está mi lista inicial de paquetes, y me preguntaba qué más me estoy perdiendo.

Estoy tratando de limitar esta lista a fuentes de datos / API "en tiempo real" o "casi en tiempo real", donde los datos subyacentes pueden cambiar entre descargas. Hay muchas listas para conjuntos de datos estáticos, que solo requieren una descarga.

Actualmente, esta lista está sesgada hacia datos financieros / series temporales, y podría usar algo de ayuda para expandirla a otros dominios.

Datos libre:
Fuente de Datos - Paquete
de Google Finance datos históricos - quantmod
hojas Google Finanzas de equilibrio - quantmod
datos históricos Yahoo Finanzas - quantmod
datos históricos Yahoo Finanzas - URBANA
Yahoo Finanzas cadena de opciones actuales - quantmod
estimaciones de los analistas histórica Yahoo Finanzas - fImport
Yahoo Finanzas estadísticas clave actual - Importación - parece estar roto
OANDA tipos de cambio históricos / precios de los metales - Indicadores
macroeconómicos históricos de Quantmod FRED - Indicadores macroeconómicos históricos de Quantmod
World Bank - WDI
Datos históricos del volumen de búsqueda de Google Trends - RGoogleTrends
Google Docs - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - twitteR
Zillow - Zillow
New York Times - RNYTimes
US Census 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - requiere una cuenta gratuita
Factual.com - factualR
Geocode direcciones - RDSTK
Mapa de coordenadas a límites políticos - RDSTK
Weather Underground - Roll your own
Google Noticias - liar
Ciencias de la Tierra netCDF de datos - Cómo crear sus propios
datos climáticos - Rollo de sus propios
datos de salud pública - liar
OAI Harvester - OAI cosechadora
RAmazonS3 - servidor de almacenamiento S3 de Amazon
Rflikr - Flikr api

Requiere una suscripción:
Bloomberg - RBloomberg
LIM - LIM
Comercios y cotizaciones de NYSE - RTAQ
Interactive Brokers - IBrokers

Zach
fuente
1
depende de lo que quiera decir con 'fácil de configurar' ... Tengo una serie de scripts personalizados que son 'fáciles de configurar'
David LeBauer
2
En este momento estoy definiendo "fácil de configurar" como "el paquete existe" o "alguien ha publicado / publicado una función para descargar los datos"
Zach
Definiría además "los paquetes existen" como "el paquete está en CRAN" o "el paquete está en R Forge", "el paquete está en un repositorio público similar a CRAN".
Zach
Adición: API del Registro Federal (en proceso).
p.
Este hilo también puede ser de interés: Importación precio de las acciones de Yahoo Finanzas en R .
gung - Restablece a Monica

Respuestas:

8
  1. Las instrucciones para usar R para descargar datos de netCDF se pueden encontrar aquí , un formato común utilizado para almacenar datos de ciencias de la Tierra, por ejemplo, como en datos geoespaciales marinos de OpenEarth o controladores de modelos climáticos y pronósticos de UCAR

  2. rnpn (en desarrollo) le permite obtener datos de la Red Nacional de Fenología, un proyecto de ciencia ciudadana para rastrear el momento del reverdecimiento, floración y senescencia de las plantas. Vea la publicación del blog del desarrollador .

  3. -obsolete- RClimate proporciona herramientas para descargar y manipular datos climáticos de archivos planos (con tutoriales, incluido aquí )

  4. Descargar datos históricos de finanzas con tseries::get.hist.quote

  5. Documentos de Michael Samuel que descargan datos de salud pública

  6. raster::getData proporciona acceso a variables climáticas a través de worldclim

David
fuente
¿Qué son los "datos netCDF"?
Zach
@Zach NetCDF es un tipo de forma estructurada universal de almacenar grandes conjuntos de datos. Un enfoque alternativo se basa en el formato HDF5 .
chl
@David (+1) ¡Muchas gracias por el cuarto punto!
chl
¿Qué pasó con RClimate? No puedo encontrar el paquete en ningún lado
Daniel Ryback
ahora hay una biblioteca ncdf4 en R para manejar netcdf4. Es más complicado de instalar que ncdf pero creo que el último está en desuso. Hace unos años, incluso logré instalar netcdf4 con Min GW64 para hacer que este paquete funcione en Windows :) si lo hice, significa que es factible ... y parece que D. Pierce (autor del paquete) está proporcionando fuentes en su sitio web cirrus.ucsd.edu/~pierce/ncdf
robin girard
8

Hay un proyecto destinado a crear paquetes R con este objetivo (interfaz R para API en tiempo real) llamado rOpenSci , que tiene 18 paquetes actualmente disponibles o en desarrollo. Algunos (rnpn, rfishbase) ya están en su lista.

Gran lista! y divulgación completa: soy parte del proyecto rOpenSci.

cboettig
fuente
1
  1. ONETr : interacción eficiente con la API O * NET ™, que ofrece datos de descriptores ocupacionales del Departamento de Trabajo de los EE. UU.
RunChiRun
fuente