Cómo eliminar correctamente contenido de una web

Cuando eliminamos una página o una noticia de una página web, normalmente eliminamos a la vez una o más URLs. Esas URLs antiguas devolverán un error 404 (página no encontrada). ¿Eso es lo que queremos? De vez en cuando si, normalmente no.

Error 401: Contenido eliminado

¿Eliminar una página completamente o redirigirla?

La primera elección que hay que realizar es si queremos eliminar completamente una página o redirigir la URL a otra que tenga contenido similar o relacionado (o directamente a la home).

Normalmente siempre optaremos por redirigir una página a otra mediante una redirección permanente 301. De esta forma cualquier usuario que llegue a la página web buscando ese contenido y no lo encuentre, automáticamente será enviado a otro contenido relacionado a la home en vez de ver una página de error 404 (que suele ser frustrante).

Pero también hay casos en los cuales queramos no redirigir ese contenido porque no haya contenido relacionado con el que se ha eliminado y no se quiere mantener la relación del contenido con la web. En este punto profundizaremos algo más adelante.

¿Qué ventajas tiene una redirección permanente 301?

Si usamos una redirección permanente 301 para redirigir la URL de un contenido que ya no está disponible a otra URL le estamos diciendo a los buscadores que ese contenido permanentemente ha cambiado de ubicación.

La ventaja principal es que el buscador además va a traspasar la fuerza de los enlaces que apuntaran a la URL antigua a la nueva URL (no al 100% pero si en gran medida; esto es una discusión que da para un post que probablemente escriba algún día).

OJO: Con la cantidad de redirecciones permanentes que se realiza de una URL a otra, ya que hay un límite máximo de redirecciones que por ejemplo sigue el buscador Google. O sea, que no sigue ilimitadas redirecciones, sino un máximo de X.

Con este tipo de redirección conseguimos enviar al usuario a una página alternativa a la que estaba intentando acceder y darle información al buscador del cambio de ubicación para que cambie el resultado de búsqueda (y traspase la fuerza de los enlaces a la nueva URL).

Error 404: Página no encontrada

¿Cuándo interesa eliminar una página completamente?

Hay veces que nos interesa eliminar complemente una URL y su contenido. Uno de los mejores ejemplos es cuando estamos ante una web hackeada a la que se le han inyectado cientos de páginas para la venta de medicamentos para la disfunción eréctil masculina, las famosas pastillas azules, que aquí no quiero mencionar directamente. En este caso puede ser que tengamos indexadas en el buscador cientos de estas páginas que aparecen en sus resultados de búsqueda.

Normalmente tenemos la tendencia a realizar una limpieza y luego redirigir esas URLs a la home con una redirección 301. Pero esto muchas veces hace que esos resultados sigan en los resultados del buscador más tiempo del que nos gustaría.

Por otro lado esas páginas creadas dentro de la web suelen tener enlaces desde otras webs también hackeadas para darles autoridad y esos enlaces no los queremos a otras páginas de nuestra web (para que no nos visite Google Penguin).

¿Cuál es la mejor solución para eliminar completamente una página?

Si eliminamos la página sin más, automáticamente dará un error 404 (contenido no encontrado). La problemática de un código 404 es que el buscador no puede saber si esa URL se ha eliminado a propósito o si solo no está disponible temporalmente por un error.

Si queremos eliminar completamente el contenido de una URL lo mejor, más correcto y efectivo es que envíe una código HTTP: 410 (contenido eliminado). Indicándole al buscador que ese contenido se ha eliminado conseguiremos que la elimine antes de su índice.

Un tema a tener en cuenta es que actualmente Google no tiene un soporte completo del código HTTP 410:

  • Una página que devuelve un código 410 es eliminada más rápidamente del índice de Google.
  • Pero Google Search Console (lo que antes era Google Webmaster Tools) muestra las páginas que devuelven un 410 en los errores de rastreo dentro de la categoría de “no encontrado”, al igual que los errores 404.

Pero el primer punto bien merece la pena.

P.D. En el caso del ejemplo de hackeo de la web, no está de más crear un archivo DISAVOW con los enlaces de las otras webs hackeadas para indicarle a Google que no las tenga en cuanta a la hora de evaluar la relevancia de una web.

 

Espero que os haya parecido interesante y que le veáis la utilidad a los códigos 410.

Imágenes: Yongcharoen_kittiyaporn, Vjom

Descubre porqué somos Apasionados del Marketing

Mira también

Screaming Frog: herramientas SEO molonas

Screaming Frog: herramientas SEO molonas

El de consultor SEO es un trabajo que requiere estar en continua formación ya que …