¿Dónde puedo obtener datos brutos públicos gratuitos? [cerrado]

26

En el desarrollo web, un mashup es una página web o aplicación que usa y combina datos , presentación o funcionalidad de dos o más fuentes para crear nuevos servicios.

Hay muchas fuentes para obtener datos (información en bruto). Los gobiernos son buenos ejemplos.
Sin embargo, muchos de ellos cuestan y tienen licencias complicadas. Por ejemplo, SMHI en Suecia vende datos de temperatura, mientras que nuestro país vecino, Noruega, los entrega de forma gratuita.

Uno diría qué tipo de aplicación está creando y qué datos necesita. Diría que dame algunos datos interesantes y haré un buen mashup de ellos. Podría trazarlo en Google Maps, por ejemplo.

Entonces la pregunta es: ¿Dónde puedo obtener datos gratuitos?

Nota: ¡No estoy interesado en la minería de datos usando un webcrawler!

Por favor comparte tus fuentes conmigo.

Amir Rezaei
fuente
¿Qué tipo de datos estás buscando? ¿Cualquier información que pueda obtener de forma gratuita?
Jetti
Cualquier dato que pueda tener un significado para una gran cantidad de personas.
Amir Rezaei el
1
¿Qué tal odata.stackexchange.com ?
ChrisF
@ChrisF: "Esta página contiene los siguientes errores: error en la línea 2 en la columna 29: Char 0x0 fuera del rango permitido A continuación se muestra una representación de la página hasta el primer error". Al hacer clic en el enlace odata.
Chris
@Chris: funciona bien para mí, pero si tiene un caso repetible, informe el problema al equipo de MSO. Solo soy un moderador;)
ChrisF

Respuestas:

11

Para obtener información general, un buen lugar para comenzar podría ser la página de datos abiertos de Wikipedia, específicamente las partes inferiores de la página ( organizaciones que promueven datos abiertos , ver también y enlaces externos )

Iba a convertir el resto de esta publicación en una lista de fuentes de datos para datos basados ​​en países y regiones ... pero el periódico Guardian UK ya se fue y compiló un World Government Data Store, así que no tiene sentido duplicar el esfuerzo, en su lugar, yo ' Solo señalaré ...

guardian.co.uk/world-government-data

... para un catálogo de muchas iniciativas de datos abiertos a nivel de país y ciudad.
(No se basa en el Reino Unido, aunque parece centrarse en los países de habla inglesa).

En el momento de la edición, contiene datos de Reino Unido, Estados Unidos, Australia, Canadá, Nueva Zelanda y España vasca.

Una cosa que no figura en la lista, pero que vale la pena mencionar, es la información de mapeo de Ordnance Survey UK .

Peter Boughton
fuente
The Guardian también tiene la buena costumbre de proporcionar los datos a los que se hace referencia en sus historias la mayor parte del tiempo.
Jon Hopkins el
6

Hay datos por todo el lugar de cada tipo. El mejor enfoque es averiguar qué tipo de datos necesita, encontrar un sitio web que los tenga y ver si el sitio ofrece una API. Sin embargo, aquí hay algunas fuentes generales:

Yevgeniy Brikman
fuente
3

Para obtener un catálogo completo de datos del gobierno de EE. UU. Y formatos compatibles, consulte aquí: http://www.data.gov/

Robert Harvey
fuente
3

La ciudad de Nueva York tiene una serie de fuentes gratuitas de datos de tránsito de la MTA .

También hay muchos otros conjuntos de datos públicos interesantes en Nueva York, como los datos de inspección de salud de restaurantes.

codificador de mundo real
fuente
3

Alguien hizo la misma pregunta sobre Reddit Compsci hace un tiempo ... esto es lo que tenía que decir entonces . Creo que todo sigue en pie.

Examine algunos de estos sitios, estoy razonablemente seguro de que hay algo allí para captar su interés.

Dependiendo de lo que intente hacer, hay toneladas y toneladas de conjuntos de datos por ahí. Uno con el que es divertido jugar, pero que puede o no ser relevante para usted, es el conjunto de datos de correo electrónico de Enron . Es el resultado de MUCHOS correos electrónicos corporativos internos de Enron citados y publicados al público durante el gran escándalo de Enron .

Y si no puede encontrar exactamente los datos que desea, no subestime la posibilidad de escribir su propio rastreador / raspador. Según los datos que desee, puede ser bastante sencillo rastrear la web para su propio conjunto de datos. Hay todo tipo de herramientas, desde wget hasta apache droids , para ayudarlo a recuperar información mediante programación.

crimen mental
fuente
2

Datos del agua

Puede usar NOAA para recuperar grandes cantidades de datos para jugar. Lo he usado varias veces y la API no es tan mala. Si no te importa qué y simplemente cuánto es a donde iría.

Josh K
fuente