Blog
Sugerencias para webmasters y proveedores de alojamiento
- marzo 20th, 2012
- News
- 0 Comments
Algunos webmasters de nuestros foros han publicado consultas sobre incidencias relacionadas con el alojamiento que afectan a sus sitios. Para ayudar a los proveedores de alojamiento y a los webmasters a reconocer, diagnosticar y solucionar tales incidencias, nos gustaría compartir con los usuarios algunas de las incidencias habituales que hemos encontrado y sugerencias para solucionarlas.
Bloqueo del rastreo de Googlebot: esta es una incidencia muy habitual que normalmente suele deberse a la configuración incorrecta de un cortafuegos o del sistema de protección DoS y, en algunas ocasiones, al sistema de administración de contenido que utiliza el sitio. Los sistemas de protección juegan un papel importante en el alojamiento y se suelen configurar para bloquear (en algunos casos, automáticamente) niveles inusualmente elevados de solicitudes del servidor. No obstante, como Google a menudo lleva a cabo más solicitudes que un usuario humano, estos sistemas de protección pueden impedir que Googlebot rastree tu sitio web. Para comprobar si se produce este tipo de incidencia, utiliza la función Explorar como Googlebot de las Herramientas para webmasters de Google. Comprueba también si existen otros de los errores de rastreo que se incluyen en las Herramientas para webmasters de Google.
Ofrecemos diversas herramientas para los webmasters y los proveedores de alojamiento que quieran tener un mayor control sobre el rastreo de Googlebot y para mejorar la eficacia del rastreo:
- Ofrecemos ayuda detallada sobre cómo controlar el rastreo de Googlebot a través del protocolo de exclusión de robots y la configuración de parámetros de URL;
- Si te preocupan los robots malintencionados que utilizan el user-agent de Googlebot, te ofrecemos una forma de comprobar si un rastreador es realmente Googlebot.
- Si quieres modificar la frecuencia con la que Googlebot rastrea tu sitio, puedes verificar tu sitio en las Herramientas para webmasters de Google y modificar la frecuencia de rastreo de Googlebot. Los proveedores de alojamiento también pueden verificar en las Herramientas para webmasters la propiedad de sus direcciones IP.
Certificados SSL no válidos: para que los certificados SSL de tu sitio web se consideren válidos, deben coincidir con el nombre del sitio. Entre las incidencias habituales se incluyen certificados SSL caducados y servidores configurados incorrectamente de forma que todos los sitios web del servidor utilizan el mismo certificado. La mayoría de navegadores web intentará advertir a los usuarios en estas situaciones, mientras que Google intenta avisar a los webmasters de la incidencia mediante el envío de un mensaje a través de las Herramientas para webmasters de Google. La solución para estas incidencias consiste en comprobar que se utilizan certificados SSL válidos para todos los dominios y los subdominios del sitio web con los que los usuarios interactuarán.
DNS comodín: los sitios web se pueden configurar para responder a todas las solicitudes de subdominio. Por ejemplo, el sitio web de la URL example.com se puede configurar para responder a las solicitudes de tal.example.com, talcual.example.com y otros subdominios.
Existen ciertos casos en los que se recomienda esta configuración. Por ejemplo, un sitio web de contenido generado por usuarios puede optar por proporcionar a cada cuenta su propio subdominio. Sin embargo, en algunos casos el webmaster puede que no quiera utilizar esta configuración, ya que puede provocar que el contenido se duplique innecesariamente en todos los nombres de host y también puede afectar al rastreo de Googlebot.
Para reducir el número de incidencias relacionadas con la configuración de un DNS comodín, configura tu sitio web para que no lo utilice o configura el servidor para que no responda exitosamente a nombres de host no existentes denegando la conexión o devolviendo un encabezado HTTP 404.
Configuración incorrecta del alojamiento virtual: esta incidencia consiste en que muchos hosts o nombres de dominio alojados en el mismo servidor devuelven siempre el contenido de un único sitio, es decir, a pesar de que el servidor aloja varios sitios, solo devuelve uno independientemente del contenido que se solicite. Para detectar esta incidencia, debes comprobar que el servidor responde correctamente al encabezado HTTP del host.
Contenido duplicado en todas las URL específicas de alojamiento: muchos hosts ofrecen URL para tu sitio web para realizar pruebas o actividades de desarrollo. Por ejemplo, si alojas el sitio web http://a.com/ en el proveedor de alojamiento example.com, el host puede ofrecerte acceso a tu sitio a través de una URL como las siguientes: http://a.example.com/ o http://example.com/~a/. Te recomendamos que configures las URL específicas de alojamiento para que no se pueda acceder a ellas públicamente (protección mediante contraseña). En caso de que estas URL sean accesibles, nuestros algoritmos elegirán normalmente la URL que los webmasters quieran. Si nuestros algoritmos seleccionan en vez las URL específicas de alojamiento, puedes hacer que estos elijan tus URL preferidas implementando correctamente técnicas de canonicalización.
Páginas de error leve: algunos proveedores de alojamiento muestran páginas de error que utilizan un código de estado HTTP 200 (que significa "correcto") en lugar de un código de estado de error HTTP. Por ejemplo, un mensaje de error de página no encontrada podría devolver un código HTTP 200 en lugar de un código HTTP 404, convirtiéndola en una página de error 404 leve, o un mensaje de sitio web temporalmente no disponible podría devolver un código de error 200 en lugar del código de estado HTTP 503 adecuado. Aunque intentamos detectar las páginas de error leve, si nuestros algoritmos no detectasen las páginas de error leve de un host web, estas podrían indexarse con el contenido de error. Esto puede provocar incidencias relacionadas con la clasificación o con la selección de URL entre dominios.
Puedes comprobar el código de estado que se devuelve de forma sencilla: comprueba los encabezados HTTP que devuelve el servidor utilizando una de las herramientas disponibles como, por ejemplo, la función Explorar como Googlebot. Si una página de error devuelve un código HTTP 200, cambia la configuración para devolver el código de estado de error HTTP correcto. Asimismo, permanece atento a los informes de errores 404 leves de las Herramientas para webmasters de Google que se incluyen en la página de errores de rastreo de la sección de diagnósticos.
Marcos y modificación de contenido: los proveedores de alojamiento pueden modificar inesperadamente el contenido de la página de los webmasters normalmente mediante la inclusión de secuencias de comando o de imágenes en la página. Los hosts web también pueden ofrecer tu contenido en otras páginas a través de marcos o iframes. Para comprobar si un host web está modificando tu contenido de forma inesperada, consulta el código fuente de la página que ofrece el host y compáralo con el código que subiste.
Ten en cuenta que ciertas modificaciones del código del servidor pueden ser de gran utilidad. Por ejemplo, un servidor que utilice el módulo para Apache mod_pagespeed u otras herramientas puede reducir tu código para optimizar la velocidad de las páginas.
Spam y software malintencionado: hemos comprobado que algunos hosts web y servicios de subdominios masivos son importantes fuentes de spam y software malintencionado. En Google, intentamos ser precisos al proteger a nuestros usuarios y la calidad de búsqueda. Sin embargo, si comprobamos que un importante grupo de sitios de un host web específico incluye spam o distribuye software malintencionado, nos veremos obligados a tomar medidas sobre el host web en su totalidad. Consulta los siguientes artículos para obtener más información sobre el control del software malintencionado:
- La entrada de blog sobre alertas de navegación segura para administradores de red (Inglés), útil para los proveedores de alojamiento.
- El artículo sobre notificaciones de software malintencionado de las Herramientas para webmasters de Google se debe tener en cuenta para sitios web individuales.
- La documentación de API de Google Safe Browsing para los desarrolladores.
Por Pierre Far, analista de tendencias de webmasters