WordPress con SOFT 404 en Google Search Console (WMT) ¿Qué causa Q82019309.com?

8

El sitio de mi hermano que diseñé para él tiene cientos de SOFT 404 informados en la Consola de búsqueda de Google, anteriormente Herramientas para webmasters de Google. En general, encuentro que arreglar el 404 suave es fácil, pero esto me tiene un poco perplejo. Todos los errores de software devuelven una cadena impar que contiene una Q82019309.comsubcarpeta ocasional Aristocratdentro de la cadena /?=.

Los 404 generalmente se parecen a:

  • Codificado: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Descifrado: /search/大奖总代Q82019309.com

El enlace de información proporciona:

  • Codificado: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Descifrado: /?s=大奖总代Q82019309.com

Al principio creía que este era un problema aislado, pero al investigar descubrí que este problema realmente afecta a miles de sitios web y que alguien debe conocer la causa. Cuando busco en WordPress Q82019309.com o Aristocrat Q82019309.com en Google , estoy abrumado con la cantidad de resultados, incluidos algunos sitios de gran reputación como:

Pregunta (s):

Entonces, ¿qué está causando estos errores suaves 404 con una cadena Q82019309.comcon o sin Aristocrat?

Simon Hayter
fuente
Su sitio ha sido pirateado. Q82019309.com está comprometido.
closetnoc
Ir al sitio Q82019309.com dice que es un sitio de ataque y estoy de acuerdo en que es dudoso, pero me resulta difícil creer que todos estos sitios hayan sido pirateados con algo que utiliza una cadena de consulta en la búsqueda. Hay cientos de miles de sitios web literarios que informan sobre Q82019309.com ... de buena reputación ... ¿seguro que no todos son pirateados?
Simon Hayter
Los enlaces parecen ser todos spam. Un perfil muy típico. Además, esto parece ser específico para los sitios de WP. Esto parece ser bastante reciente, en unos pocos días (más o menos 4). Verifique la instalación de WP para asegurarse de que todo esté actualizado. Ver: web.nvd.nist.gov/view/vuln/…
closetnoc
Fue descubierto hace más de una semana 13.
Simon Hayter
Creo que tendré que mirar a través de los errores.log y access.logs para identificar si alguien intentó o ingresó a través de un nuevo truco.
Simon Hayter

Respuestas:

2

Tuvimos el mismo problema en wisepops.com desde el 3 de enero de 2017.

Google se queja de Soft 404 incluso si la indexación está deshabilitada en estas páginas. La página de búsqueda de Wordpress tiene por defecto este meta:

<meta name="robots" content="noindex,follow">

Decidí hacer que las páginas de búsqueda sin resultados devuelvan un código HTTP 404. Dado que la consulta de búsqueda está en la URL, está bien manejarla de esta manera.

Para Wordpress, agregué al final de las funciones de mi tema.php:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');
Wisepops
fuente
@ wisepops.com: Tengo el mismo problema con este estúpido ataque de búsqueda de spam. ¡Gracias por el codigo! ¡Funciono muy bien para mi! Ahora la búsqueda vacía devuelve un 404 limpio y eso es genial. Sincerly, Mitschu
Mitschu
¿Enviaría esto a un usuario real que realiza una búsqueda y obtiene cero resultados a una página 404 también?
brandozz
1

Me parece que su algo está vinculado a la funcionalidad de búsqueda de su sitio con malas consultas. Esas consultas de búsqueda obtienen "no se encontraron resultados". Googlebot está encontrando esos enlaces y está permitiendo que Googlebot rastree la búsqueda de su sitio. Debido al "sin resultados", Google los detecta como "soft 404".

Dejar que Google rastree los resultados de búsqueda de su sitio es un gran no-no. Google puede penalizar todo tu sitio. Ver Matt Cutts: resultados de búsqueda en resultados de búsqueda . No debe permitir el rastreo de los resultados de búsqueda con robots.txt :

Disallow: /search
Disallow: /?s=

Entonces Googlebot tampoco rastreará esas URL e informará errores allí.

Stephen Ostermiller
fuente
Stephen, ¿esto reslovó los 404 suaves? De hecho, agregué esto a mi robots.txt y marqué todos mis 404 en la página de búsqueda como corregidos. Una vez que verifique, marcaré esto como correcto. Pero esta parece ser la mejor solución.
brandozz