¿Qué sitios web para compartir fotos exponen los números de serie de la cámara?

26

¿Qué sitios web exponen los números de serie del cuerpo de la cámara de la imagen original EXIF?

Flickr es un sitio web para compartir fotos que expone muchos metadatos de fotos (de los datos EXIF ) e incluso facilita el acceso gracias a la API de Flickr . Picasaweb de Google también ofrece información del EXIF ​​pero no el número de serie.

¿Hay otros sitios que me puedan ayudar?

Como un poco de antecedentes sobre lo que estoy haciendo, estoy tratando de cotejar una base de datos de números de serie de cámaras y las URL de las imágenes donde se encontraron. ¡Solo soy yo haciendo algo gratis con la esperanza de poder atrapar a algunas de las personas que roban nuestras preciosas cámaras! Espero que esto no sea demasiado fuera de tema, ya que no estoy tratando de vender nada, ¡solo estoy tratando de hacer algo bueno!

Descargo de responsabilidad: soy el autor de stolencamerafinder ;)


Actualización : según lo solicitado por fbuchinger, aquí hay una actualización rápida del estado del proyecto:

Muchos sitios (incluido Facebook desafortunadamente) eliminan las notas del fabricante del EXIF. Hasta ahora, he encontrado que la fuente más rica de números de serie es Flickr. Supongo que es porque las personas a menudo cargan imágenes de tamaño completo (leídas "sin editar"). En mi sitio ( stolencamerafinder.com ) ofrezco una aplicación Java WebStart que recolecta datos de Flickr a través de su API. Como hay un límite en la velocidad a la que hago llamadas API, lo he escrito para que el trabajo se comparta entre el número de clientes de inicio web, reduciendo así el ancho de banda y la CPU en los clientes cuantas más personas lo ejecuten. Si está leyendo esto y tiene, por ejemplo, acceso de administrador a un servidor en el trabajo que no hace mucho, ¿por qué no dejarlo ejecutándose allí?)

También he escrito un complemento de Google Chrome que solo está atento a las imágenes en sitios web que tienen un número de serie incrustado. No espero un rendimiento muy alto de esta aplicación, la idea principal era descubrir qué sitios web pueden ser buenas fuentes para escribir herramientas de araña a medida y luego rastrearlos.

He publicitado mi API para stolencamerafinder y estoy buscando a otros programadores a escribir programas de ayuda que pueden servir como rastreadores web.

Al hacer este proyecto, he recopilado muchos datos interesantes que pondré en el sitio web pronto, como qué modelos de cámaras hacen y no escriben números de serie útiles. ¡La Nikon D50, por ejemplo, simplemente escribe "D50" como su número de serie!

Estaría extremadamente agradecido por cualquier comentario (bueno o malo) que pueda tener sobre mi proyecto.

-Mate

quemaduras mate
fuente
8
Posiblemente más útil y comercializable sería ofrecer un servicio para rastrear dónde se han (re) utilizado sus "fotos", posiblemente sin licencia.
Rowland Shaw
Actualicé

Respuestas:

6

Me encanta la idea de un ladrón. ;)

Me he dado cuenta de que DeviantArt.com parece "capturar" todos los metadatos EXIF ​​que están incrustados en las imágenes cargadas. No muestra todo, sin embargo, hay algunas partes del sitio (muchas de ellas solo para miembros que pagan) que muestran información más detallada sobre una imagen cargada, y he visto una lista completa de datos de etiquetas.

Supongo que, técnicamente hablando, podría hacer algo similar a TinEye.com (Búsqueda inversa de imágenes) que indexa las imágenes y las búsquedas por similitud de contenido. TinEye es útil porque combina imágenes por contenido, pero tiene sus limitaciones. Las fotomanipulaciones creadas con alguien con derechos de autor son difíciles de identificar. La búsqueda por número de serie proporcionaría un enfoque alternativo y complementario.

Técnicamente, podría obtener cualquier información exif que esté incrustada en las imágenes cargadas en Internet. Si el número de serie de la cámara está incrustado, tendrá lo que está buscando. Debería raspar una copia de cada imagen de los sitios que indexa, extraer cualquier EXIF ​​(u otro dato de etiqueta) de las imágenes indexadas y rastrear la información con un enlace de regreso a la fuente. Probablemente también podría usar los principales motores de búsqueda como Bing y Google para encontrar imágenes para indexar (las búsquedas básicas de imágenes de palabras clave, como nombres de fotógrafos, ubicaciones, etc. podrían ser suficientes). Probablemente no necesite mantener la imagen alrededor (y hacerlo podría implicar problemas legales de todos modos), pero al menos tendría un índice de datos de etiqueta EXIF ​​/ IPTC, posiblemente un número de serie y un enlace de origen.

jrista
fuente
1
Una trampa es que, si la foto se manipula de alguna manera, es muy probable que se elimine o reduzca el EXIF. La disponibilidad de datos EXIF ​​en un sitio para compartir fotos y búsquedas de imágenes generales depende completamente del meta contenido de la imagen cargada. Sin embargo, buscar la posibilidad de metadatos que se puedan usar para buscar cámaras robadas es una buena idea en sí misma.
nik
@nik: Es cierto, estaría a merced de lo que se carga ... Es una lástima que los flujos de trabajo en la mayoría de las herramientas, como Photoshop, Lightroom, etc., no conserven los datos de las etiquetas en guardados y modificaciones.
jrista
Gracias por señalarnos. ¡Son hasta 1.6 mil millones de imágenes que hacen que mis 0.3 millones se vean bastante basura! Pero si ellos pueden hacerlo, yo también. Me pondré a trabajar en escribir un rastreador web más genérico para arañar todos los sitios web ...
Matt se quema el
@matt: Es cierto, tienen 1.600 millones, pero no buscan por número de serie. Si pudieras buscar tanto por contenido como por número de serie, tendrías una ventaja sobre ellos. ; P
jrista
Tenga en cuenta que en muchos sitios no puede acceder al archivo original a menos que tenga algún estado de membresía o conexión con el usuario que lo cargó. Por lo tanto, es posible que solo pueda descargar una versión reducida que a menudo tiene rayas EXIF. Las herramientas de carga a veces también lo hacen, enviando el archivo solo con información de copyright. Nota: Facebook lo elimina todo, incluso los derechos de autor de EXIF ​​y ha recibido mucho entusiasmo de los fotógrafos por eso.
Itai
6

ACTUALIZAR:

¡Gracias por la actualización del estado del proyecto! En primer lugar, el enfoque con la aplicación Java WebStart es interesante: ¿utiliza diferentes claves de API de Flickr para cada instancia de WebStart o Flickr limita las solicitudes de API basadas en una combinación de API / IP?

Ejecuté su aplicación webstart y arrojó 0 números de serie después de escanear 50 fotos. No he visto su código fuente, pero debe tener en cuenta que solo una pequeña minoría de cámaras (en su mayoría dslrs) escribe números de serie en los metadatos exif.

Recomiendo descargar las imágenes de muestra del repositorio de información meta de Phil Harvey y ejecutar exiftool en él para ver qué modelos realmente producen números de serie. A continuación, puede reducir la búsqueda de la aplicación de inicio web a estos modelos y, por lo tanto, mejorar la proporción de éxito.


Me topé con tu pregunta cuando comencé a explorar photo.stackexchange.com.

Hace 2 años, tuve una idea muy similar al Stolencamerafinder y en realidad comencé a implementarlo en Python. Sin embargo, lo detuve debido a varias razones:

  • La mayoría de los números de serie de la cámara almacenados en los datos EXIF ​​son editables y, por lo tanto, falsificables (al menos con exiftool) -> riesgo de falsas alertas o "spam de número de serie" (al menos cuando el servicio comienza a popularizarse)

  • La mayoría de las personas usan cargadores de imágenes que cambian el tamaño de sus imágenes y, por lo tanto, a menudo descartan todas o muchas partes de los datos EXIF ​​(recuerde que el número de serie siempre se almacena en una nota de fabricante exif patentada que a menudo se cae durante las conversiones de imágenes) -> baja proporción de imágenes inspeccionadas : números de serie extraídos.

Sin embargo, tengo curiosidad por cómo se ha desarrollado su proyecto ... ¿podría dar un breve resumen de estado?

fbuchinger
fuente
Hola. Acabo de agregar una actualización en la pregunta principal anterior. Si tiene alguna pregunta / sugerencia, me encantaría escucharla. -Matt
Matt arde
Solo uso una clave de API, pero cada instancia de inicio web se comunica a través del sitio web para equilibrar la carga del trabajo para que no se exceda la cuota.
Matt arde
Me preocupa por qué la aplicación webstart no funcionó para usted. Debería encontrar publicaciones seriadas en aproximadamente 1/4 de todas las fotos escaneadas. ¿Hay algún mensaje en los registros de la consola de Java? Descargué esas imágenes de muestra un poco más atrás y escribí un script de Python para generar algunas estadísticas. Los publicaré en línea pronto, ya que otros pueden encontrarlo interesante.
Matt arde
6

Como mi primera respuesta está más centrada en los detalles técnicos, decidí abrir una segunda respuesta para darle una visión general de mi idea original de "camerafinder" llamada "CATT" (Herramienta antirrobo de cámara). Siéntase libre de usar mis ideas, pero por favor, acreditenme con cuidado ...

Al contrario que el buscador de cámara robado, CATT funciona de forma opcional. Como propietario de una cámara, se registra en el sitio CATT, crea un perfil de usuario y luego registra sus cámaras.

Para hacerlo, debe tomar una fotografía de un código QR generado aleatoriamente que se muestra en la pantalla. Luego carga la foto sin modificar en el sitio CATT. Cuando se completa la carga, el servidor lee los metadatos de la foto y busca un número de serie incrustado. También trata de decodificar el código QR de la imagen y lo compara con un hash almacenado. Esto es para evitar que alguien pueda registrar su cámara simplemente cargando una foto arbitraria tomada con esa cámara.

Cuando le roban la cámara, inicia sesión en el sitio de CATT y marca ese dispositivo como robado. Para rastrear las cámaras robadas, planeamos un analizador de número de serie exif del lado del cliente en javascript como script de mozilla greasemonkey (similar a su extensión de Chrome). Solo debe ejecutarse en páginas de flickr que contengan imágenes originales (gracias al soporte del patrón de url de greasemonkey) para no ralentizar demasiado el navegador. El script se pondría en contacto con el servidor CATT de forma regular para obtener una lista de series de cámaras robadas. Si la serie de la imagen que se muestra actualmente muestra una coincidencia, se mostrará una alerta.

Vi que su extensión de Chrome sigue un enfoque similar (aunque solo parece recopilar las publicaciones seriadas). En su caso, aprovecharía la extensión con la Api de archivo W3C (actualmente Firefox y Chrome), para que el usuario también pueda inspeccionar fotos almacenadas localmente y no solo aquellas incrustadas en páginas web. Esto seguramente aumentará su "cosecha del número de serie", porque ningún "hombre en el medio" (flickr facebook, etc.) eliminará los datos exif.

Aquí hay una interesante demostración de Mozilla sobre Exif Extraction con la API de archivos W3C .

fbuchinger
fuente
Muchas gracias por esto, una gran información e ideas. El QRCode es v. Inteligente. No estoy seguro de entender cómo la API de archivos es tan útil para mí en la forma en que mencionas (quién permitiría el acceso a archivos locales y tener imágenes de una cámara robada), pero es exactamente lo que estoy buscando para escribir un simple herramienta de extracción en serie para la página de inicio de mi sitio web. En lugar de "Ingrese su número de serie", puedo permitir que las personas busquen con una imagen que ya tienen (también evita errores). Otra ventaja es que a veces tengo que usar el número de serie interno como ID, no el que está en la caja de la cámara.
Matt arde
Por cierto, esa página de demostración solo funcionó para mí en Firefox, no en Chrome. También estoy empezando a pensar que esta página no es ideal para discutir todo esto, ¡pero lo hará por ahora! PD. Estoy viajando por Asia en este momento, así que no se ofenda si alguna vez me tomo unos días (/ semanas) para responder, sus comentarios me han sido muy útiles, gracias.
Matt arde
la demostración del lector exif funciona en chrome> 5, el error es causado por una función de registro no esencial (verifique en la consola de chrome y redefínelo como función vacía). Feliz viaje!
fbuchinger
Sobre el caso de uso de archivos locales: creo que queremos decir lo mismo: una extracción en serie js cam para archivos locales que es parte de su sitio web de cámara robada, no necesariamente de la extensión. Podría usarse para determinar el estado de la cámara en función de alguna foto de muestra (por ejemplo, tomada durante la compra de una cámara usada para asegurarse de que no se la robó a otra persona). Por cierto: ¿extendió el analizador Exif de Jacob Seidelin por su cuenta o fue la extracción del número de serie su trabajo?
fbuchinger
Extendí su analizador yo solo, pero hasta ahora solo he logrado leer las secciones Canonnote y Panasonic makernote. (mi conocimiento del formato IFD es pobre en el mejor de los casos). Necesito darle el crédito adecuado por su trabajo en mi sitio, ya que es principalmente su trabajo. Cuando esté satisfecho con mis ediciones, se lo enviaré de regreso como una posible mejora / versión alternativa.
Matt quema