La guía para identificar y solucionar el contenido duplicado de tu web

El contenido duplicado es una lacra que ha perseguido a todo proyecto de Internet, y que ha tumbado a muchos otros.

Actualmente, uno de los principales quebraderos de cabeza para los directores generales de las compañías, y los responsables de marketing, es aparecer en las primeras posiciones de los principales motores de búsqueda (en España especialmente en Google). Incluso algunas empresas ni siquiera aparecen en las primeras páginas de los resultados de las búsquedas y, por lo tanto, tanto la captación y fidelización de clientes potenciales, como las ventas en sí, se resienten irremediablemente.

Posicionarse en los primeros lugares de los buscadores no es tarea fácil, especialmente cuando “luchamos” con palabras clave demasiado genéricas. La competencia es feroz, y eso no se puede evitar. Lo que sí se puede evitar es cualquier fallo flagrante, que te penalice en los buscadores. El principal, que muchas grandes compañías han cometido, es el contenido duplicado, uno de los mayores culpables de un descenso del tráfico cualificado, y por lo tanto, de la captación de nuevos clientes potenciales.

¿Qué es el contenido duplicado?

Existe contenido duplicado cuando hay más de una versión idéntica de una página web indexada por los motores de búsqueda. Cuando existen varias versiones de una página en un índice, es complicado para los motores de búsqueda decidir qué página mostrar para una consulta de búsqueda relevante.

Los motores de búsqueda tienen como objetivo proporcionar la mejor experiencia de usuario posible. Y se ven obligados a elegir qué versión creen que es la mejor opción para esa consulta (dependiendo de factores como qué página se publico antes, la autoridad de los dominios,…)

 

Las principales causas del contenido duplicado

Los principales delincuentes del contenido duplicado los podemos resumir:

1- Parámetros URL

Las URLs a menudo pueden contener parámetros adicionales, que responden a la forma en que están siendo rastreadas (IDs de campañas de marketing , los ID de análisis ), o por el propio gestor de contenidos (CMS), que añade sus propios parámetros personalizados.

Por ejemplo, las siguientes URLs podrían conducir todas a la misma página:

http://www.example.com/page1
http://www.example.com/page1?source=organic
http://www.example.com/page1?campaignid=3532

2- La impresión de las páginas

Una página web puede tener una opción para producir una versión para imprimir de la página. Esto a menudo puede conducir a problemas de contenido duplicado. Por ejemplo, las siguientes URL llevarían a la misma página.

http://www.example.com/page1
http://www.example.com/printer/page1

3- Los identificadores de sesión

Muchos ‘sites’ suelen rastrear la sesión de un usuario a través de su página web. Por ejemplo, los sitios que ofrecen funciones personalizadas que permiten recordar al usuario interacciones pasadas, carritos de compra abandonados,…

El problema viene cuando los ID de sesión quedan añadidos a la URL y esto provoca versiones duplicadas de una página. Por ejemplo, las siguientes URLs llevarían a la misma página.

http://www.example.com/page1
http://www.example.com/page1?sessionid=12455

Problemas con el contenido duplicado

Los principales problemas del contenido duplicado son:

– Los motores de búsqueda no saben cuál es la versión de la página que se debe indexar.

– Los motores de búsqueda no saben qué versión de la página deben clasificar para una consulta de búsqueda.

– Los motores de búsqueda no saben si la página debe ser dividida en varios modelos.

Activo inspirado en un artículo del blog de Hubspot de Kieran Flanagan

¿Cómo encontrar el contenido duplicado?

Hay una herramienta que toda empresa debe utilizar para encontrar problemas de contenido duplicado en su sitio: Google Webmaster Tools (aunque luego existen muchas como Screaming Frog que también sirven para este objetivo)

1- Herramientas para webmasters de Google

Google Webmaster Tools te permitirá encontrar con facilidad las páginas con los dos titles o metadescriptions duplicados. Simplemente debes hacer clic en “Mejoras de HTML ” en “Buscar Apariencia”.

Google_Webmaster_Tools_ – _HTML_Improvements

Google_Webmaster_Tools_ – _Duplicate_Descriptions

Al hacer clic en alguno de estos enlaces, la herramienta te mostrará qué páginas tienen titles o metadescriptions duplicadas.

 contenido duplicado

La fijación del contenido duplicado

El contenido duplicado es un problema que puede afectar tanto al tráfico orgánico y posicionamiento en buscadores, aunque es algo que se puede arreglar de manera relativamente sencilla. Las tres maneras más rápidas de hacer frente a los problemas de contenido duplicado son:

1- Etiquetas canónicas

Las etiquetas canónicas permiten informar a los motores de búsqueda cuál de las diferentes páginas con un mismo contenido es la que debe indexar y ofrecer en las búsquedas. Las etiquetas canónicas se encuentran en la cabecera de una página web y se pone de la siguiente manera:

Elija la página que desea indexar, y anote la URL.

Ir a las páginas duplicadas que no deben ser indexadas, e introduzca el código en la sección

2- Redireccionamiento 301

Una redirección 301 será tu mejor aliada si necesitas cambiar la dirección de las páginas para que sean URLs amigables o SEO-friendly. El Redireccionamiento 301 le dice a Google que pase toda la autoridad del enlace a una nueva URL y te permite clasificar esa URL para consultas de búsqueda relevantes.

3- Meta Tags

Los Meta Tags se utilizan para indicar a los motores de búsqueda no indexen una página en particular. Para evitar el contenido duplicado en tu página web debes incluir <meta name=”robots” content=”noindex, nofollow”/> en tu archívo robots.txt para indicarle al robot que pase por tu web que no siga ese enlace.

El contenido duplicado es un verdadero problema para muchas páginas web , pero que puede resolver fácilmente si sigues los consejos que te hemos ofrecido. De todas maneras, si quieres una estrategia SEO personalizada haz clic aquí.


//

Suscríbete gratis al blog | INCRENTA

LEE TAMBIÉN ESTOS ARTÍCULOS
Showing 2 comments
  • Carlos Pablak
    Responder

    Me parece que tienes un error en el concepto de meta tag, o metaetiqueta.
    El texto de una meta descripcion, por ejemplo, <meta name="description" … es un resumen del contenido que de la página, que normalmente aparece debajo del título en los resultados de búsqueda.

    No todas las Meta Tags se utilizan para indicar a los motores de búsqueda no indexen una página, solo la indicada para robots <meta name="robots" content="noindex, nofollow"/> tiene el carácter restrictivo para evitar el rastreo de una página ("noindex") y evitar el seguimiento de los enlaces ("nofollow").

    Las 2 lineas del ejemplo que estas exponiendo, son solo cierres de etiquetas naturales de HTML presentes en toda página, incluso en esta.

  • Increnta
    Responder

    Hola Carlos, ya dicen que 100000 ojos ven mejor que dos. Gracias por el aviso, lo cambiamos inmediatamente. Saludos :)

Leave a Comment