¿Qué sitios web exponen los números de serie del cuerpo de la cámara de la imagen original EXIF?
Flickr es un sitio web para compartir fotos que expone muchos metadatos de fotos (de los datos EXIF ) e incluso facilita el acceso gracias a la API de Flickr . Picasaweb de Google también ofrece información del EXIF pero no el número de serie.
¿Hay otros sitios que me puedan ayudar?
Como un poco de antecedentes sobre lo que estoy haciendo, estoy tratando de cotejar una base de datos de números de serie de cámaras y las URL de las imágenes donde se encontraron. ¡Solo soy yo haciendo algo gratis con la esperanza de poder atrapar a algunas de las personas que roban nuestras preciosas cámaras! Espero que esto no sea demasiado fuera de tema, ya que no estoy tratando de vender nada, ¡solo estoy tratando de hacer algo bueno!
Descargo de responsabilidad: soy el autor de stolencamerafinder ;)
Actualización : según lo solicitado por fbuchinger, aquí hay una actualización rápida del estado del proyecto:
Muchos sitios (incluido Facebook desafortunadamente) eliminan las notas del fabricante del EXIF. Hasta ahora, he encontrado que la fuente más rica de números de serie es Flickr. Supongo que es porque las personas a menudo cargan imágenes de tamaño completo (leídas "sin editar"). En mi sitio ( stolencamerafinder.com ) ofrezco una aplicación Java WebStart que recolecta datos de Flickr a través de su API. Como hay un límite en la velocidad a la que hago llamadas API, lo he escrito para que el trabajo se comparta entre el número de clientes de inicio web, reduciendo así el ancho de banda y la CPU en los clientes cuantas más personas lo ejecuten. Si está leyendo esto y tiene, por ejemplo, acceso de administrador a un servidor en el trabajo que no hace mucho, ¿por qué no dejarlo ejecutándose allí?)
También he escrito un complemento de Google Chrome que solo está atento a las imágenes en sitios web que tienen un número de serie incrustado. No espero un rendimiento muy alto de esta aplicación, la idea principal era descubrir qué sitios web pueden ser buenas fuentes para escribir herramientas de araña a medida y luego rastrearlos.
He publicitado mi API para stolencamerafinder y estoy buscando a otros programadores a escribir programas de ayuda que pueden servir como rastreadores web.
Al hacer este proyecto, he recopilado muchos datos interesantes que pondré en el sitio web pronto, como qué modelos de cámaras hacen y no escriben números de serie útiles. ¡La Nikon D50, por ejemplo, simplemente escribe "D50" como su número de serie!
Estaría extremadamente agradecido por cualquier comentario (bueno o malo) que pueda tener sobre mi proyecto.
-Mate
Respuestas:
Me encanta la idea de un ladrón. ;)
Me he dado cuenta de que DeviantArt.com parece "capturar" todos los metadatos EXIF que están incrustados en las imágenes cargadas. No muestra todo, sin embargo, hay algunas partes del sitio (muchas de ellas solo para miembros que pagan) que muestran información más detallada sobre una imagen cargada, y he visto una lista completa de datos de etiquetas.
Supongo que, técnicamente hablando, podría hacer algo similar a TinEye.com (Búsqueda inversa de imágenes) que indexa las imágenes y las búsquedas por similitud de contenido. TinEye es útil porque combina imágenes por contenido, pero tiene sus limitaciones. Las fotomanipulaciones creadas con alguien con derechos de autor son difíciles de identificar. La búsqueda por número de serie proporcionaría un enfoque alternativo y complementario.
Técnicamente, podría obtener cualquier información exif que esté incrustada en las imágenes cargadas en Internet. Si el número de serie de la cámara está incrustado, tendrá lo que está buscando. Debería raspar una copia de cada imagen de los sitios que indexa, extraer cualquier EXIF (u otro dato de etiqueta) de las imágenes indexadas y rastrear la información con un enlace de regreso a la fuente. Probablemente también podría usar los principales motores de búsqueda como Bing y Google para encontrar imágenes para indexar (las búsquedas básicas de imágenes de palabras clave, como nombres de fotógrafos, ubicaciones, etc. podrían ser suficientes). Probablemente no necesite mantener la imagen alrededor (y hacerlo podría implicar problemas legales de todos modos), pero al menos tendría un índice de datos de etiqueta EXIF / IPTC, posiblemente un número de serie y un enlace de origen.
fuente
ACTUALIZAR:
¡Gracias por la actualización del estado del proyecto! En primer lugar, el enfoque con la aplicación Java WebStart es interesante: ¿utiliza diferentes claves de API de Flickr para cada instancia de WebStart o Flickr limita las solicitudes de API basadas en una combinación de API / IP?
Ejecuté su aplicación webstart y arrojó 0 números de serie después de escanear 50 fotos. No he visto su código fuente, pero debe tener en cuenta que solo una pequeña minoría de cámaras (en su mayoría dslrs) escribe números de serie en los metadatos exif.
Recomiendo descargar las imágenes de muestra del repositorio de información meta de Phil Harvey y ejecutar exiftool en él para ver qué modelos realmente producen números de serie. A continuación, puede reducir la búsqueda de la aplicación de inicio web a estos modelos y, por lo tanto, mejorar la proporción de éxito.
Me topé con tu pregunta cuando comencé a explorar photo.stackexchange.com.
Hace 2 años, tuve una idea muy similar al Stolencamerafinder y en realidad comencé a implementarlo en Python. Sin embargo, lo detuve debido a varias razones:
La mayoría de los números de serie de la cámara almacenados en los datos EXIF son editables y, por lo tanto, falsificables (al menos con exiftool) -> riesgo de falsas alertas o "spam de número de serie" (al menos cuando el servicio comienza a popularizarse)
La mayoría de las personas usan cargadores de imágenes que cambian el tamaño de sus imágenes y, por lo tanto, a menudo descartan todas o muchas partes de los datos EXIF (recuerde que el número de serie siempre se almacena en una nota de fabricante exif patentada que a menudo se cae durante las conversiones de imágenes) -> baja proporción de imágenes inspeccionadas : números de serie extraídos.
Sin embargo, tengo curiosidad por cómo se ha desarrollado su proyecto ... ¿podría dar un breve resumen de estado?
fuente
Como mi primera respuesta está más centrada en los detalles técnicos, decidí abrir una segunda respuesta para darle una visión general de mi idea original de "camerafinder" llamada "CATT" (Herramienta antirrobo de cámara). Siéntase libre de usar mis ideas, pero por favor, acreditenme con cuidado ...
Al contrario que el buscador de cámara robado, CATT funciona de forma opcional. Como propietario de una cámara, se registra en el sitio CATT, crea un perfil de usuario y luego registra sus cámaras.
Para hacerlo, debe tomar una fotografía de un código QR generado aleatoriamente que se muestra en la pantalla. Luego carga la foto sin modificar en el sitio CATT. Cuando se completa la carga, el servidor lee los metadatos de la foto y busca un número de serie incrustado. También trata de decodificar el código QR de la imagen y lo compara con un hash almacenado. Esto es para evitar que alguien pueda registrar su cámara simplemente cargando una foto arbitraria tomada con esa cámara.
Cuando le roban la cámara, inicia sesión en el sitio de CATT y marca ese dispositivo como robado. Para rastrear las cámaras robadas, planeamos un analizador de número de serie exif del lado del cliente en javascript como script de mozilla greasemonkey (similar a su extensión de Chrome). Solo debe ejecutarse en páginas de flickr que contengan imágenes originales (gracias al soporte del patrón de url de greasemonkey) para no ralentizar demasiado el navegador. El script se pondría en contacto con el servidor CATT de forma regular para obtener una lista de series de cámaras robadas. Si la serie de la imagen que se muestra actualmente muestra una coincidencia, se mostrará una alerta.
Vi que su extensión de Chrome sigue un enfoque similar (aunque solo parece recopilar las publicaciones seriadas). En su caso, aprovecharía la extensión con la Api de archivo W3C (actualmente Firefox y Chrome), para que el usuario también pueda inspeccionar fotos almacenadas localmente y no solo aquellas incrustadas en páginas web. Esto seguramente aumentará su "cosecha del número de serie", porque ningún "hombre en el medio" (flickr facebook, etc.) eliminará los datos exif.
Aquí hay una interesante demostración de Mozilla sobre Exif Extraction con la API de archivos W3C .
fuente