Alguien ha clonado mi blog de WordPress, ¿cómo puedo evitar que dañe el SEO?

Mi blog de WordPress está completamente clonado. Ese sitio de clonación se está actualizando en tiempo real con mi blog. Me sorprende que alguien realmente pueda hacer eso.

¿Qué debo hacer para detener el impacto perjudicial en mi ranking en los motores de búsqueda? ¿Hay alguna forma de decirle a Google que no indexe ese sitio?

wordpress scraper-sites Tanvir Hasan
fuente

Veo que esto ahora parece haber sido "arreglado": el sitio clonado ya no es "clonado". ¿Cómo lograste esto al final?

MrWhite

@ w3d Después de dos semanas y varias conversaciones con Amazon Hosting, decidieron cerrar ese sitio clonado. Gracias a todos.

Tanvir Hasan

tenga en cuenta que dmca.com y google.com/webmasters/tools/dmca-dashboard son diferentes cuando se trata de reclamar una infracción.

Showcase Imagery

Respuestas:

Simplemente están cargando su sitio a través de un script del lado del servidor. Todo lo que necesita hacer es bloquear la dirección IP de su servidor a través de .htaccess. Simplemente abra los registros de acceso de su servidor, abra la página clonada en su sitio, luego vea su registro para la nueva entrada y tendrá su dirección IP.

Tampoco estaría de más enviar una solicitud DMCA a Google, pero esto no será realmente necesario ya que ese contenido desaparecerá instantáneamente una vez que bloquee su dirección IP.

John Conde
fuente

Voy a duplicar la sugerencia de hacer una solicitud DMCA a Google. Estamos viendo varias formas de esto últimamente y no estoy seguro de cuál sería la recompensa. Sin embargo, sugeriría que no los bloquee durante un período mientras Google lo hace, luego los bloquearía, pero es posible que no tenga que hacerlo cuando Google los elimine de la lista. Solo sugiero que si presenta una queja DMCA con Google, les dé un período para investigar antes de bloquear. De lo contrario, simplemente bloquéelos de inmediato.

closetnoc

Hola John Conde, he tratado de bloquear el bloqueo de su dirección IP a través del archivo .htaccess usando este código "" orden de Denegar, Permitir denegar desde [esa dirección IP] "Pero ese sitio de clonación todavía se está actualizando en tiempo real con el mío. el código correcto para bloquear esa ip?

Tanvir Hasan

@TanvirHasan Esa es la idea correcta, siempre que tenga la dirección IP correcta. ¿ Sigue apareciendo esa dirección IP en su registro de acceso cuando visita el "sitio clonado"?

MrWhite

Mi proveedor de alojamiento lo puso en el archivo .htaccess y ellos son los que obtienen esa dirección IP del registro. Pero no está funcionando.

Tanvir Hasan

¿Esto alguna vez se resolvió?

closetnoc

(Además de la respuesta de @ John.)

¿Hay alguna forma de decirle a Google que no indexe ese sitio?

Es curioso que, si bien parecen haber clonado todo (incluidos los mapas de sitio XML ^{* 1} ), no han clonado el archivo robots.txt. De hecho, el archivo robots.txt en ese sitio bloquea activamente el rastreo de todo. Por lo tanto, no parece haber nada que hacer a este respecto. Hacer una búsqueda en el sitio en ese dominio devuelve solo el dominio simple y un aviso que indica que está bloqueado por robots.txt.

(¿Tienes curiosidad por saber cuál sería su intención al hacer esto? ¿Podrías suponer que cometieron un error con robots.txt, y tal vez sea así, pero esto me parece más una excepción deliberada?)

Además, aunque sus mapas de sitio XML están clonados, no están actualizando las URL en ellos (como lo están haciendo en las páginas principales del sitio), por lo que todavía están apuntando hacia su sitio.

^{* 1} Con respecto a los mapas de sitio XML. En su sitio, "sitemap.xml" es en realidad una redirección a "sitemap_index.xml" y el sitio clonado realmente ha clonado la redirección ... ¡que redirige a su sitio! (Seguramente un error de su parte). "Sitemap_index.xml" es solo un índice, que enlaza con otros 4 mapas de sitio. Si alguno de estos mapas de sitio reales se solicita directamente en el sitio clonado, se clonará correctamente y se actualizarán las URL. Sin embargo, habría dicho que es poco probable que estos mapas de sitio se encuentren en el sitio clonado debido a la redirección inicial de "sitemap.xml". (?) Aunque si enviaran "sitemap_index.xml" directamente, eso obviamente evitaría la redirección.

Señor White
fuente

Hice una solicitud al mapa del sitio hace solo unos minutos y hay una redirección 301 desde el sitio de spam al sitio original.

closetnoc

@closetnoc ¡Ah, sí! Me perdí eso antes. "sitemap.xml" es en realidad una redirección en el sitio original también ... redirige a "sitemap_index.xml". ¡El sitio de spam parece estar clonando esta redirección que envía al usuario de vuelta al sitio original! Si solicita cualquiera de los 4 mapas de sitio enumerados en "sitemap_index.xml" directamente en el sitio de spam, entonces el sitio de spam los clona correctamente, sin embargo, debido a la redirección inicial, supongo que serán difíciles de encontrar, a menos que sepan enviar "sitemap_index.xml" en lugar de "sitemap.xml". He actualizado la respuesta. Gracias.

MrWhite

Si el sitio produce vínculos de retroceso hacia usted, es importante utilizar la herramienta Google Disavow; de lo contrario, el algoritmo funcionará en su contra, independientemente.

https://www.google.com/webmasters/tools/disavow-links-main

cree un archivo .txt y agregue:

domain:thedamnsitethatcloned.com

luego cárguelo a Google a través de las Herramientas para webmasters de Google.

Estos son exactamente los pasos que tomaría para resolver este problema. Sé que muchos webmasters se enfrentan a este problema. He tenido este problema antes y no parece haber una respuesta directa en Google (irónicamente) (por eso quiero ayudar). Matt Cutts es el tipo al que se supone que debes escuchar sobre estos problemas, pero escucharlo es como tratar de ganar una partida de ajedrez contra una supercomputadora dentro de una casa en llamas (no se puede encontrar ayuda).

Los atajos:

Regístrese con DMCA y coloque la insignia en su sitio web.
Reúna todo el contenido copiado pegando las primeras 60 palabras de su sitio web en Google y envíe VIA https://www.google.com/webmasters/tools/dmca-dashboard Las solicitudes DMCA solo aceptarán enlaces permanentes.
Rechazar CADA sitio que haya copiado contenido que se vincula a usted. Haga esto en cada página de su sitio web.

Mi primera respuesta fue desautorizar el dominio, pero olvidé mencionar que debes desautorizar:

www. Y
no www.

(Google los cuenta como dos dominios separados).

Juan
fuente