¿Evitar que los motores de búsqueda inversa encuentren el origen de su imagen?

15

Estoy planeando hacer un juego, donde le doy al usuario una imagen relacionada con el anime y tienen que adivinar de dónde es.

Sin embargo, la mayoría de las imágenes, especialmente del anime popular, son fáciles de usar en la búsqueda inversa de Google para encontrar y señalar el anime.

Traté de ver si podía hacer para que no reconociera la imagen, pero desafortunadamente mis trucos no fueron lo suficientemente buenos.

Imagen original:

Imagen original

Escala de grises con volteo horizontal:

Escala de grises con volteo horizontal

Marca de agua

Marca de agua

Desconcertando la imagen con escala de grises:

Desconcierta la imagen con escala de grises

La escala de grises con giro horizontal y vertical funcionó para esta imagen, pero no siempre funciona:

Escala de grises con giro horizontal y vertical

Además, los métodos mencionados anteriormente son bastante fáciles para que las personas adivinen el anime.

Me gustaría saber si hay algún buen truco que pueda usar en mis imágenes para que no funcione en los motores de búsqueda inversa y, sin embargo, no sea tan complicado que pueda implementar en mi programa.

Por ejemplo, escala de grises, recorte, volteo son cosas bastante fáciles de lograr en C #.

Premio
fuente
3
Me gusta la idea de confundir la imagen para mayor dificultad. Sin embargo, si alguien realmente quiere jugar tu juego, tengo problemas para ver cómo la búsqueda inversa de Google será un problema para los jugadores. ¿Están los jugadores en duelo por quién lo encontrará primero? Me preocuparía más tener los derechos de licencia de las imágenes si planeas comercializar tu juego.
curioso
2
@Emilie Sí, hay un sistema de clasificación semanal y mensual y solo la primera respuesta correcta cuenta para recibir los puntos para esa imagen específica. No es un juego que se venderá , y la imagen original se señalará a los artistas con los derechos correspondientes. Es algo realmente simple que me gustaría agregar a nuestro canal de chat.
Premio
1
El problema es que la búsqueda inversa de imágenes debería ser capaz de evitar el daño a la imagen o no es realmente buena, por lo que su tecnología fundamental de lucha y finalmente perderá.
joojaa
44
Tratar de proteger los medios digitales para la piratería, o cualquier tarea en esa línea, probablemente terminará en que no logre frustrar a las personas deshonestas y arruine la experiencia para sus usuarios honestos. A veces tienes que hacer un intercambio de tal dedo.
GiantCowFilms
1
Detente ahí. Dar crédito no es obtener permiso para usar la imagen. Es material con copyright. Si su juego engaña una búsqueda, probablemente no sobrevivirá a una investigación de violación de propiedad intelectual. No continúe sin obtener un permiso por escrito de los propietarios de los derechos de autor para el "USO DE SU PROPIEDAD INTELECTUAL". Es posible que se sorprenda gratamente al descubrir que le dan permiso en función de su uso previsto para un juego. No adivines No espero Averigüe antes de poner más esfuerzo en su milagro.
Stan

Respuestas:

9

Creo que estaba en el camino correcto con su opción de marca de agua, pero dejó demasiado tacto de la imagen original. Aquí hay dos imágenes que probé que Google no pudo encontrar:

Tablero de damas

ingrese la descripción de la imagen aquí
Resultados de búsqueda de imagen inversa

Mosaico

ingrese la descripción de la imagen aquí
Resultados de búsqueda de imagen inversa

Otro ejemplo

ingrese la descripción de la imagen aquí
Resultados de búsqueda de imagen inversa

La primera imagen devuelve muchos resultados de "bandera a cuadros", y la segunda devuelve muchas imágenes de mosaico / collage. ¡El tamaño importa! Inicialmente lo probé con un patrón de tablero de ajedrez mucho más pequeño (16px); Google todavía pudo identificar eso. Estos cuadrados de 32 px parecen ser un medio feliz.

Basado en la información que DanS proporcionó, creo que esta sería una técnica confiable para engañar a Google (¡y fácilmente automatizada!). Solo puedo suponer que alguien que pudo identificar este anime aún podría hacerlo a partir de estas imágenes.


Irónicamente, las imágenes que he creado eventualmente serán indexadas por Google y conducirán a esta publicación, ¡lo que frustrará el propósito!

JohnB
fuente
1
Eso es lo que terminé haciendo con una ligera diferencia, que ya no creo formas regulares como cuadrados, parece funcionar en buena medida y sí, en algún momento se indexará, pero para entonces tendremos nuevas imágenes. los que ya respondieron no vuelven a la cola. Gracias por tomarte el tiempo.
Premio
2
Aún más ironía. Es posible que le hayas dado a Google una pista sobre qué mejorar.
joojaa
9

Google puede usar un sistema diferente, pero una gran cantidad de tales servicios (incluido tineye) usan hashes perceptuales donde el hash general está lo suficientemente cerca como para ser una coincidencia, en lugar de ser exacto.

Hace unos años apareció un documento que detallaba el proceso. No he podido encontrar un enlace, pero el sistema básico se basa en una cadena de acción para generar los hashes.

  • Reduzca la imagen a pequeña escala, generalmente 32x32 o 64x64
  • Convierte la imagen a escala de grises
  • Aumente el contraste a un valor predefinido, para garantizar un alto nivel de diferencia entre los tonos blanco y negro.
  • Calcule el pHash a partir de los píxeles en la imagen resultante

El proceso se repetiría para cualquier imagen cargada, y luego se verificaría con hashes indexados para encontrar coincidencias cercanas. En resumen, la imagen debe cambiarse drásticamente en grandes porciones para engañar a cualquier sistema como este.

Vux
fuente
Alguna información interesante allí, me encantaría consultar el artículo.
Prix
2

Simplemente cree una imagen negativa del original e inviértalo de nuevo con css. El usuario verá la imagen como normal, con la misma calidad pero al descargarla está invertida.

.myImageClass {

 filter: invert(100%);

}

La imagen negativa no coincidirá con el original (resultado de búsqueda NL):

Ejemplo de búsqueda

Además, probé reduciendo los colores a 256, Paint Shop Pro es el rey en hacer esto. La imagen no coincidirá directamente con el original. Si combina esto con el método anterior, podría ser excelente.

Codebeat
fuente
0

Puedes hacer algo como esto:

ingrese la descripción de la imagen aquí

No es 100% a prueba de balas, pero debería eliminar la mayoría de los motores de identificación de imágenes.

Lo que hice fue agregar ruido blanco y negro a la imagen, así como algo de desplazamiento. Jugar con los colores, por ejemplo. solo desplazar uno o dos canales de color sería aún más efectivo, pero complejo de implementar.

GiantCowFilms
fuente
1
Lo intentaré con algunas imágenes populares y veré cómo funciona en este momento. Entré en un rompecabezas cerrado donde abro cuadrados cuando se dan respuestas incorrectas. Por lo tanto, solo ve la imagen cada X píxeles a la vez que parecía haber funcionado hasta ahora.
Premio
Sí, eso no funciona a menos que pongas suficiente ruido para hacer que toda la imagen sea irreconocible, lo que frustra el objetivo que tengo. Gracias.
Premio
44
Excepto que, por supuesto, la búsqueda con esa imagen ruidosa Google encuentra de inmediato las fuentes. El algoritmo probablemente busca dentro del espacio de Fourier y su ruido no hará mucho por eso.
joojaa
@joojaa Yah, lo noté, pero Prix me pidió que le mostrara una imagen de lo que sugerí como comentario, así que publiqué una respuesta.
GiantCowFilms
@GiantCowFilms Lame, este es exactamente el tipo de filtro que será ignorado por una búsqueda de imágenes.
Navin
0

Intente cambiar el formato de archivo en el que está guardando. Las búsquedas de imágenes inversas comienzan utilizando algunos datos que se registran intrínsecamente en la imagen, por lo que probablemente sus técnicas de ofuscación no han funcionado. Los JPEG son particularmente malos sobre esto, los PNG no tanto. Sin embargo, con imágenes especialmente populares, esto podría no funcionar.

Idealmente, encuentre una manera de mostrar la imagen en forma encapsulada con la que el usuario no pueda interactuar directamente (copiar -> pegar). Desafortunadamente, no tengo los detalles técnicos sobre cómo se puede lograr esto actualmente, solo que he observado que las imágenes utilizadas en material Flash / Shockwave tienen esa propiedad.

En segundo lugar: el plan en su conjunto, utilizando imágenes con derechos de autor sin buscar primero los permisos apropiados de sus propietarios, incluso suponiendo que proporcione la atribución tan pronto como se resuelva el rompecabezas, lo pone en riesgo de una solicitud de eliminación u otro tipo de acción legal, especialmente si estás ejecutando el juego en cualquier volumen. Si es posible ejecutar el juego usando fanart (dado que es más probable que obtenga el permiso apropiado para usar fanart que el contenido canónico), probablemente sea mejor hacerlo.

Bennie
fuente
Nada de esto tiene que ver con la pregunta de OP. Supongo que llego un poco tarde a la fiesta, pero: Google no usa datos EXIF ​​y OP no va a tener problemas legales porque es una organización sin fines de lucro.
Navin
0

Debes confundir el motor de búsqueda.

La mejor manera de vencer la búsqueda automática de imágenes es proporcionar imágenes alternativas que no se puedan identificar o que provengan de fuentes en conflicto, y que confundan el patrón especificado que se debe identificar.

Por ejemplo, si proporciona una imagen compuesta de tres imágenes en bandas o tiras alternas y solicita la identificación de la imagen compuesta solo de cada tercera banda, de modo que, si se aísla de las otras bandas, aparecería como una imagen con espacios ( donde se superponen las bandas de las otras imágenes).

Un cerebro humano invoca "Cierre" para conectar perceptivamente las imágenes relevantes en una cohesiva que pueda identificarse. La clave es suficientemente identificable, pero irrelevante en el resto de la imagen para confundir el motor.

La segunda pregunta podría ser con la misma imagen pero preguntando por cada tercera banda comenzando con la segunda banda. En efecto, podría usar una imagen con tres componentes diferentes y, por lo tanto, tres respuestas diferentes.

Las búsquedas automatizadas no pueden atacar un problema espacial a menos que las bandas no relacionadas estén físicamente aisladas de la búsqueda. Difícil de hacer.

Stan
fuente
Sería muy molesto para el usuario verlo
Zach Saucier,
@ZachSaucier Se supone que es tanto un juego desafiante como algo que evita el software cada vez más inteligente. No puedo comentar sobre los otros aspectos. ¿Cómo es esto muy diferente de un tablero de ajedrez en la medida en que es molesto?
Stan
-3

Detente ahí. No copie Utiliza obras de arte originales. EDITAR: Trate esto como FYI.

Al copiar, indirectamente está tratando de eludir la protección de la propiedad intelectual. Estas jugando con fuego.

También hay una falla en su razonamiento y razonamiento: otorgar crédito NO es obtener permiso para usar la imagen . No es una situación "o". Es material con copyright. No importa si el resultado se pone a la venta o no. Su ganancia, financiera o de otro tipo, no tiene consecuencias para el delito. Incluso si el proyecto fuera para investigación académica o científica, necesitaría permiso de los propietarios de los derechos de autor, no crédito para ellos.

Si su juego engaña una búsqueda, probablemente no sobrevivirá a un abogado motivado que persigue una investigación de violación de propiedad intelectual.

No continúe sin obtener un permiso por escrito de los propietarios de los derechos de autor para el "USO DE SU PROPIEDAD INTELECTUAL".

Es posible que se sorprenda gratamente al descubrir que le dan permiso en función de su uso previsto para un juego. Mantenga notas con fechas y bocetos. Si descubre que las personas con las que se acercó toman su concepto, demande por razones de confidencialidad. (Eso implica un documento legal de NDA separado y probablemente más tiempo del que vale).

No adivines No espero Averigüe antes de poner más esfuerzo en su milagro. Puede ser más fácil pedir disculpas que pedir permiso, pero el camino es legal, ético y más gratificante.

Stan
fuente
3
Esto no busca responder la pregunta que se hace. Es mejor acortarlo y hacer un comentario
Zach Saucier