Actualmente estamos desarrollando un sitio que actualmente tiene 8 millones de páginas únicas que crecerán a unos 20 millones de inmediato, y eventualmente a unos 50 millones o más.
Antes de criticar ... Sí, proporciona contenido único y útil. Continuamente procesamos datos sin procesar de registros públicos y al hacer un poco de depuración de datos, resúmenes de entidades y mapeo de relaciones, hemos podido generar contenido de calidad, desarrollando un sitio que es bastante útil y único, en parte debido a la amplitud de datos.
Su PR es 0 (nuevo dominio, sin enlaces), y nos estamos arañando a un ritmo de aproximadamente 500 páginas por día, lo que nos coloca en aproximadamente 30,000 páginas indexadas hasta el momento. A este ritmo, llevaría más de 400 años indexar todos nuestros datos.
Tengo dos preguntas:
- Es la tasa de indexación directamente correlacionada con PR, y con eso quiero decir que está lo suficientemente correlacionada como para que al comprar un dominio antiguo con buena PR nos lleve a una tasa de indexación viable (en el vecindario de 100,000 páginas por día).
- ¿Hay algún consultor SEO que se especialice en ayudar al proceso de indexación? Estamos de lo contrario va muy bien con SEO, en -página especialmente, además, la competencia por nuestra "cola larga" frases de palabras clave es bastante bajo, por lo que nuestros bisagras de éxito sobre todo en el número de páginas indexadas.
Nuestro principal competidor ha logrado aproximadamente 20 millones de páginas indexadas en poco más de un año, junto con una clasificación Alexa 2000-ish.
Calidades notables que tenemos en su lugar:
- la velocidad de descarga de la página es bastante buena (250-500 ms)
- sin errores (no hay errores 404 o 500 al ser arañado)
- Utilizamos las herramientas para webmasters de Google e iniciamos sesión diariamente
- URL amigables en su lugar
- Tengo miedo de enviar mapas del sitio. Algunas publicaciones de la comunidad SEO sugieren un nuevo sitio con millones de páginas y no hay relaciones públicas sospechosas. Hay un video de Google de Matt Cutts hablando de una incorporación por etapas de sitios grandes , también, para evitar un mayor escrutinio (aproximadamente a las 2:30 en el video).
- Los enlaces del sitio en los que se puede hacer clic ofrecen todas las páginas, no más de cuatro páginas de profundidad y, por lo general, no más de 250 (-ish) enlaces internos en una página.
- El texto de anclaje para enlaces internos es lógico y agrega relevancia jerárquicamente a los datos en las páginas de detalles.
- Anteriormente habíamos establecido la frecuencia de rastreo más alta en las herramientas para webmasters (solo una página cada dos segundos, máximo). Hace poco volví a "dejar que Google decida", que es lo que se recomienda.
fuente
Respuestas:
Algunas estrategias potenciales:
Finalmente, debería decir esto. El SEO y la indexación son solo pequeñas partes para administrar un sitio de negocios. No pierdas el foco en el ROI por el bien del SEO. Incluso si tiene mucho tráfico de Google, no importa si no puede convertirlo. El SEO es importante, pero debe mantenerse en perspectiva.
Editar :
Como una adición a su caso de uso: puede considerar ofrecer opiniones o testimonios para cada persona o empresa. Además, la entrega de credenciales de usuario como StackOverflow podría atraer a al menos algunas personas a vincular a su propio perfil en su sitio. Eso alentaría algunos enlaces externos a sus páginas profundas, lo que podría significar que se indexe más rápido.
fuente
Sin embargo, no sucederá de la noche a la mañana, le garantizo que vería más páginas arañadas antes si se agregan enlaces entrantes a contenido profundo (particularmente páginas de mapa de sitio o índices de directorio que apuntan a contenido aún más profundo) desde sitios de gran tamaño similar que han estado alrededor por un tiempo
Dudoso, a menos que esté hablando de un dominio antiguo que ha tenido una cantidad significativa de actividad (es decir, contenido acumulado y enlaces entrantes) a lo largo de los años.
Cuando planteas la pregunta de esa manera, estoy seguro de que encontrarás muchos SEO que proclaman en voz alta "¡sí!" pero, al final del día, las sugerencias de Virtuosi Media son tan buenos consejos como los que obtendrá de cualquiera de ellos (sin mencionar los consejos potencialmente malos).
Por lo que parece, debería considerar la utilización de canales de desarrollo comercial y relaciones públicas para construir la clasificación de su sitio en este punto: obtenga más enlaces a su contenido (preferiblemente al asociarse con un sitio existente que ofrezca contenido dirigido regionalmente para vincular a su contenido dividido regionalmente, por ejemplo), consigue que más personas naveguen a su sitio (algunos tendrán la barra de herramientas de Google instalada para que su tráfico pueda funcionar hacia el descubrimiento de páginas) y, si es posible, haga que se hable de su negocio en las noticias o en las comunidades de las personas que lo necesitan (si planea cobrar por ciertos servicios, considere anunciar un período de prueba gratuito para generar interés).
fuente
Hay dos posibles opciones que conozco que pueden ser de ayuda.
Uno: un pequeño truco que probé con un sitio web que tenía tres millones de páginas y que funcionó sorprendentemente bien fue lo que mi colega acuñó un ciclo de rastreo. Es posible que tenga que manipular un poco la idea para que se ajuste a su sitio.
Básicamente, establecimos un día en el que no pensábamos que obtendríamos mucho tráfico (Navidad) y literalmente copiamos una lista de cada enlace en nuestro sitio y pegamos cada uno en un archivo php que se llamó en cada página web. (El archivo php de la barra lateral)
Luego percibimos que debíamos ir a la consola de búsqueda de Google (anteriormente herramientas para webmasters de Google) y le pedimos a Google que buscara una URL y rastreara cada enlace en esa página de URL.
Dado que tiene tantos enlaces, y las páginas que enlazan también tienen una cantidad abundante de enlaces, Google entra en un poco de bucle y rastrea el sitio de una manera mucho más rápida. Al principio era escéptico, pero funcionó a las mil maravillas.
Antes de hacer esto, debe asegurarse de tener una configuración de base de datos extremadamente eficiente y un servidor muy potente, de lo contrario podría sobrecargar el servidor o dañar su SEO debido a los lentos tiempos de carga de la página.
Si esa no es una opción para usted, siempre puede consultar las API de la consola en la nube de Google. Tienen una API de consola de búsqueda para que pueda escribir un script para agregar cada página web como su propia instancia de sitio web en la consola de búsqueda o para que Google busque cada una de sus URL.
Los apis pueden complicarse extremadamente rápido, pero son una herramienta increíble cuando se usan correctamente.
¡Buena suerte!
fuente
Jugar al sistema nunca es una buena idea si tienes un negocio legítimo que valora su reputación en línea. Además, si su sitio realmente proporciona valor, cuanto más tiempo esté disponible (¿supongo que está haciendo algún tipo de marketing?), Más enlaces de retroceso se acumularán, por lo que su RP aumentará y su tasa de rastreo aumentará.
Además, si tiene una buena estructura de enlaces en su sitio (todas sus páginas se pueden descubrir en un número razonable de clics / enlaces), entonces solo necesita enviar los índices principales a través del mapa del sitio. Una vez que Google indexe esas páginas, Google las rastreará y Google indexará el resto de las páginas por sí solo.
fuente
Una cosa que noté con las herramientas para webmasters de Google es que comienzan permitiendo una frecuencia de rastreo máxima de aproximadamente dos solicitudes por segundo. Luego, aproximadamente una semana más tarde, si descubren que se accede con frecuencia al sitio web, entonces le permitirán aumentar su límite.
Co-ejecuto un sitio web que alberga más de 500,000 imágenes originales y, a veces, mi límite máximo es de 10 solicitudes por segundo porque recibo al menos 700 a 1000 visitas al día, si no más.
Entonces, lo que puede hacer es consultar con las herramientas para webmasters todas las semanas para ver si puede aumentar el límite de rastreo. Cuando cambie el límite de rastreo, Google lo restablecerá a su configuración preferida después de que haya pasado cierto día (que la interfaz le mostrará). Luego, ese día, eleva el límite nuevamente.
fuente
He tenido experiencia en este tipo de sitio. Ejecuté un directorio de artículos hace muchos años y el% de páginas indexadas y, lo que es más importante, el rendimiento real se correlacionó directamente con la cantidad de dominios de referencia, es decir, la cantidad de sitios web únicos que se vinculan. Un sitio grande con millones de páginas necesita varios 1,000 dominios razonables que se vinculan para funcionar por derecho propio.
Seguramente no va a suceder de la noche a la mañana, pero si construyes entre 5 y 10 buenos enlaces por día a tiempo, comenzará a suceder, entonces estarás en condiciones de generar ingresos y usar eso para pagar un equipo profesional de SEO para construir enlaces para ti.
Estoy construyendo un sitio similarmente rico en información en este momento, sus primeros días, pero tengo el mismo problema con alrededor de 4 millones de páginas de contenido con una tasa de rastreo de 700-1,000 páginas por día.
fuente