Páginas Huérfanas. Cómo Encontrarlas Y Arreglarlas

El enlazado interno es uno de los más interesantes en SEO  y tiene que ver con la estructura del sitio, el Link Juice. Pero este artículo se centra en cómo encontrar páginas huérfanas, qué son, cómo encontrarlas y por qué son importantes.

Última actualización: 23 de marzo del 2021

¿Qué son las páginas huérfanas?

El término técnico “páginas huérfanas” aglutina URLs o sub-páginas que no han podido ser encontradas a través del hipervínculos internos o enlazado interno ya que no están enlazadas.

Estas URLs que no están enlazadas internamente “flotan” en el conjunto de URLs de un dominio sin ser encontradas por un crawler o rastreados estándar. Esto significa que no pueden ser encontradas tampoco por el bot de Google. Por lo tanto, en otras palabras, esta URL o página, se pierde en la nada. ¿Para qué creó esta página si no es posible encontrarla?

Por lo tanto, debe reparar sus páginas huérfanas de forma regular. Si no conoce el tecnicismo de arreglarlo, haré esto por ti. Ponte en contacto conmigo ahora.

¿Cómo puedo encontrarlas?

Las páginas huérfanas solo pueden ser encontradas si se combinan diferentes fuentes de datos. Un análisis de las diferencias entre los datos de estas fuentes puede llevar a descubrirlas, pero les aviso, las páginas huérfanas no deben confundirse con las “páginas finales o muertas”, que ciertamente, pudieran ser un problema para el enlazado interno, pero no nos valen como páginas huérfanas.

Estas páginas que están aisladas o  sin conexión con otras páginas se pueden identificar con diferentes métodos.

Necesita una lista de todas las URL de un dominio y compararla con una lista de URL rastreadas.

Diferentes proveedores de servicios, incluido Google, proporcionan herramientas especiales que funcionan como un rastreador. El rastreador basado en texto LYNX es un ejemplo de esto. La coincidencia de las URL rastreadas y todas las URL existentes se debe realizar manualmente o exportando los datos.

La diferencia de la lista de URLs del sitio – La lista de URLs rastreadas= Páginas huérfanas.

En la siguiente sección explicaré como conseguir las páginas huérfanas mediante la diferencia de la lista de URLs del sitio – La lista de URLs rastreadas.

Elaborando la Lista de URLs del sitio:

La lista de todas las URLs del sitio, las puede encontrar en su archivo de sitemap.xml que se encuentra así: https://nombre de dominio/sitemap.xml.

Simplemente selecciónelas y cópielas e insértelas en un archivo Excel.

Si no tiene un archivo sitemap.xml puede crear uno gratuito usando xml-sitemaps.com que le permite crear un mapa del sitio XML de hasta de 500 páginas. Podrá descargar su sitemap.xml y construir su lista de URLs del sitio.

Elaborando la Lista de URLs rastreadas:

Debido a que si una página está indexada, fue por supuesto rastreada. Entonces en la consola de búsqueda de Google en el apartado Cobertura, asegúrese de seleccionar «Todas las páginas conocidas», marque la casilla Válidas.

Consiguiendo la lista de todas las URLs rastreadas por Google

Nos interesarán las páginas de estado «Válidas» Tipo «Enviada e indexada». Haga doble clic en ella para mostrarlas todas. Puede exportarlas con el botón superior Exportar y elija el formato CSV. Se descargará un archivo .zip. Ábralo, de los 3 archivos en su interior encontrará uno de nombre Tabla.CSV que contendrá las URL y la última fecha de rastreo.

Repita la misma operación con las páginas conocidas de estado «Válidas», Tipo «Indexada, noenviada en sitemap». Haga doble clic en ella para mostrarlas todas.

Una, fusione, estas 2 listas en una para tener la lista de todas las URLs rastreadas en una sola lista.

Convierta la lista de formato csv a excel. Sino sabe hacer esto busque en Google convertir un archivo csv en archivo excel.

Con esto tendremos la lista de todas las URLs rastreadas en formato Excel.

Cotéjelas para comparar, examinar y apreciar sus diferencias e identificar las páginas huérfanas. Una manera de hacer esto se explica a continuación:

Agregue la lista que consiguió de su sitemap.xml, «todas las URLs del sitio», debajo de la lista de todas las URLs rastreadas, de manera que pueda ordenar la lista por URLs, conseguirá que unas URLs se repitan y otras no. Las que no se repiten son las URL huérfanas.

Existen varios tipos de páginas o URLs:

Causas de páginas huérfanas

  • Un enlace perdido o un enlace defectuoso o un enlace roto a una página hace que sea inaccesible para los motores de búsqueda.
  • A menudo las páginas huérfanas se diseñan como páginas de prueba para probar contenido o diseños específicos dentro de un grupo particular de usuarios sin que los motores de búsqueda puedan rastrear estas páginas.
  • La tercera aplicación es que las páginas huérfanas se utilizan como Doorway Pages porque no tienen enlaces entrantes, pero pueden proporcionar enlaces salientes sin backlinks. En este caso, sirven como página de entrada para otras páginas o contenido. Un robot de búsqueda no podrá encontrar este contenido, por lo que deben evitarse desde una perspectiva de SEO. También suelen violar las políticas de Google.

Los usuarios pueden ingresar la URL directamente en la línea de dirección de los navegadores web, pero en este caso, deben conocer la dirección exacta.

Las páginas huérfanas también se distinguen de las páginas sin salida.

Las páginas sin salida no contienen enlaces salientes y no conducen a otro contenido. Tanto los usuarios como los robots de búsqueda no tienen forma de salir de la página a través de un enlace saliente.

Estas páginas que no reciben enlaces no son beneficiosas porque el principio de rastreo de un motor de búsqueda se basa en los siguientes hipervínculos.

Si una página no contiene enlaces entrantes internos o externos, la página no está en el árbol de estructura de una construcción HTML y está aislada de otras páginas.

En este punto, el robot del motor de búsqueda debe detenerse y rastrear una parte diferente del sitio web. Puede suceder que los robots de los motores de búsqueda no puedan capturar todas las páginas debido a las páginas huérfanas, ya que repetidamente se pierde en las URL y tiene que abortar la búsqueda.

Las publicaciones o páginas que no contienen enlaces internos entrantes y los robots de los motores de búsqueda no pueden rastrearlas.

No incluya páginas huérfanas en los archivos sitemap.xml

Se considera una mala práctica incluir páginas huérfanas en los archivos sitemap.xml ya que los motores de búsqueda rastrearán estás páginas.

El rastreo de páginas huérfanas desactualizadas desperdiciará tu presupuesto de rastreo. Si una página huérfana en tu sitemap.xml tiene contenido valioso, te recomiendo que la enlaces internamente.

Las publicaciones huérfanas también pueden incluir páginas que tienen muy pocos enlaces entrantes, que a su vez provienen de páginas que están parcial o totalmente huérfanas.

En general, la estructura de enlaces de una página debe distribuirse uniformemente para pasar el Link juice internamente a páginas importantes y proporcionar una buena experiencia de usuario.

Cómo encontrar páginas huérfanas en WordPress

Pasar por el proceso de encontrar manualmente cada página que no tiene un enlace que apunte a ella es innegablemente una tarea abrumadoramente tediosa.

Probablemente tenga que configurar una hoja de cálculo con una lista de todas las publicaciones y páginas de su sitio, (cómo lo describí en la sección «Cómo puedo encontrarlas», lo cual ya es una tarea abrumadora, y luego revisarlas una por una para ver si tienen enlaces que apunten a cada una.

La forma más fácil de identificar páginas huérfanas en su blog de WordPress es con una membresía Yoast SEO Premium. Cuesta $ 89 al año por un sitio, incluido un año de actualizaciones y soporte gratuitos.

Cuando instale y active el plugin premium, tendrá una nueva opción en la lista de Publicaciones dentro de WordPress. Este plugin también analiza la legibilidad de su entrada o artículo. También  permite trabajar fácilmente las redirecciones de las URL antiguas a las publicaciones actualizadas.

Utilizando este plugin en WordPress podrá tener una pestaña con el contenido huérfano de su sitio:

Encontrar paginas huérfanas en WordPress con el plugin Yoast

De esta manera podrá encontrar paginas huérfanas en WordPress con el plugin Yoast y  arreglar todo su contenido huérfano, sin embargo; debo aclarar que Yoast no comprueba enlaces entrantes en páginas de etiquetas ni categorías.

Cómo encontrar páginas que no tienen enlaces que apunten a ellas en sitios que no son WordPress

Como señalé más arriba, las páginas huérfanas se pueden identificar con diferentes métodos. Necesita una lista de todas las URL de un dominio y compararla con una lista de URL rastreadas.

En esta publicación explicaré cómo encontrar páginas del sitio la herramienta WebSite Auditor. Esta es una poderosa herramienta que puede utilizar para auditar su sitio web. Puede descargar la versión de prueba y gratuita de WebSite Auditor haciendo clic en el botón verde Download.

Encontrar páginas huérfanas con WebSite Audit

Con la herramienta WebSite Auditor puede encontrar las páginas de su sitio que no están vinculadas internamente y, por lo tanto, son imposibles de encontrar tanto para los usuarios como para los motores de búsqueda, algo muy perjudicial para seo.

Para encontrar páginas huérfanas en su sitio, deberá crear un proyecto o reconstruir su proyecto de WebSite Auditor. Para hacer esto, vaya al módulo Páginas y haga clic en botón reconstruir proyecto.

  • En el Paso 1 de la creación de un proyecto, marque la casilla Mostrar opciones avanzadas. Debe ejecutar un escaneo completo del sitio para recopilar todas las páginas y recursos de su sitio (CSS, imágenes, videos, JavaScript, PDF, etc.) para que luego pueda auditar y analizar todo su sitio web.

Cómo encontrar páginas huérfanas conWebSite Auditor. Paso 1. Introducir la URL del sitio web

Haga clic en el botón verde Siguiente.

  • En el Paso 2, seleccione Buscar páginas huérfanas. Una vez que se complete el rastreo, podrá encontrar páginas huérfanas en el módulo Páginas, marcadas con la etiqueta de página huérfana.

Especifique las opciones del rastreador, especifique también el robot, en este caso Googlebot, marque la casilla Buscar páginas huérfanas

Dependiendo de cuán grande sea el sitio, es posible que deba esperar un par de minutos hasta que se hayan escaneado todas las páginas.

De forma predeterminada, WebSite Auditor rastrea su sitio utilizando una araña llamada SEO-PowerSuite-bot, lo que significa que obedecerá las instrucciones de los robots para todos los bots (agente de usuario: *). Es posible que desee modificar esta configuración para rastrear el sitio como Google, Bing, Yahoo, etc., o descartar las instrucciones de los robots por completo y recopilar todas las páginas de su sitio, incluso las no permitidas en su robots.txt.

Si desea descartar el archivo robots.txt durante el rastreo, simplemente desmarque la casilla Seguir instrucciones de robots.txt. Finalmente, presione Siguiente para continuar con el rastreo.

Especifique las opciones del rastreador: especifique también el robot, en este caso Googlebot, marque la casilla Buscar páginas huérfanas y haga clic en Finalizar.

Como es posible que haya ocultado sus páginas de destino de esta manera a propósito, WebSite Auditor no marca las páginas huérfanas como un ‘Error’, sino que muestra una etiqueta de ‘Aviso’ para ellas.

Sin embargo, aquí hay algunos otros casos en los que debe conocer sus páginas huérfanas:

  • Es posible que entreguen contenido antiguo que no desea en su sitio web y desea eliminar de su archivo de mapa del sitio, para no confundir tanto a los usuarios como a los rastreadores.
  • Son útiles y la gente sigue visitándolos a través de vínculos de retroceso, pero estas páginas pierden la oportunidad de recibir suficiente tráfico y link juice. Si les agrega enlaces internos, funcionarán mucho mejor.
  • Pueden quedar como páginas huérfanas accidentalmente durante la migración de un sitio web. Determinar si las páginas existentes todavía tienen enlaces internos es crucial.
  • Paso 3. visualiza la estructura de tu sitio. Haga clic en la parte izquierda Estructura del sitio> Visualización

Visualiza la estructura del sitio

Las páginas huérfanas y las partes aisladas de su sitio pueden ocultar buena información a sus visitantes. En muchos casos, la forma más eficaz de detectar instantáneamente estos problemas en la arquitectura de su sitio es visualizar la estructura del sitio.

Visualice una estructura general de su sitio. Vaya a Estructura del sitio> Visualización. En su espacio de trabajo, verá un mapa gráfico de sus páginas y las relaciones entre ellas. Los nodos azules son redireccionamientos. Los nodos rojos son enlaces rotos. Los nodos aislados son páginas huérfanas.

 1. De forma predeterminada, la herramienta muestra 1,000 páginas (que se pueden ajustar hasta 10,000 páginas) que están organizadas por Click Depth o profundidad de clic.

La profundidad de enlace describe la cantidad de clics necesarios desde la página de inicio antes de llegar a otra página, ya sea para los usuarios o los rastreadores robóticos implementados por los motores de búsqueda. Una página vinculada desde su página de inicio, por ejemplo, tiene una profundidad de clic de uno. Si tiene un sitio web grande, es mejor visualizarlo parte por parte (por ejemplo, categorías principales, un blog, etc.).
2. Todas las conexiones de los nodos se muestran como flechas (unidireccionales o bidireccionales) que representan el estado exacto de las relaciones entre las páginas. También es posible arrastrar cualquier nodo a cualquier lugar del gráfico (para visualizar una mejor imagen), así como acercar y alejar.
3. Puede colocar el cursor sobre cualquier nodo para revelar información adicional:

Puede hacer clic en cualquier nodo para revelar solo sus conexiones o haga clic en el botón Mostrar todas las conexiones de las páginas para ver todas las conexiones, no solo las más cortas:

botón mostrar todas las conexiones de una página web

 

Existe otra forma mucho más fácil de encontrar y arreglar las páginas huérfanas con WebSite Auditor.

Simplemente haga clic en Estructura del sitio>páginas

Encontrando páginas huerfanas en WebSite Auditor

Obtendremos datos tan interesantes y útiles como la profundidad de clics y enlaces hacia la página, sí ésta columna muestra cero(0) la página en cuestión es una página huérfana y usted deberá crear vínculos hacia ella desde otras páginas de  su sitio para resolver el problema. Es importante acotar que usted puede personalizar las columnas que desea mostrar en este informe para agregar columnas o quitar las que desee.

Aquí puede leer Cómo encontrar páginas huérfanas en su sitio web con Site Audit de SemRush

Otra herramienta realmente impresionante para encontrar páginas huérfanas

Esta herramienta es muy buena para encontrar páginas huerfanas: Ryte, régistrese para conseguir una cuenta gratuita.

Luego de loguearse tendrá su propio dashboard y después de configurar su proyecto con su dominio, en la sección Website Success, en la sección Links a la izquierda de su panel, ubique Pages Without incoming links (páginas sin enlaces entrantes) y haga clic allí.

Conseguirá algo parecido a esto:

paginas sin enlaces entrantes o paginas huerfanas con Ryte

 

Cómo Arreglarlas

Revisa todas las páginas huérfanas de tu sitio web y haz lo siguiente:
– Si ya no necesitas la página, elimínala
– La página debe tener contenido valioso y atraer tráfico a tu sitio web, incluye un enlace a ella en otra página de tu sitio
– Si la página satisface una necesidad específica y no requiere un enlace interno, déjala como está.
La mayoría de las herramientas seo pueden encontrar y arreglar páginas huérfanas.

 

Contenido Relacionado:

 

Errores De Enlazado Interno
Blog PPC
Planificador De Palabras Clave De Google
Cómo Recuperarse del Efecto Google Panda
Servicios de SEO En La Página Para Conducir Tráfico Valioso
Consultora Adwords o Ads. Experta ¡Contrata ya!
Factores Seo On Page Que Determinan Su Clasificación
Cómo Hacer Una Campaña SEO Paso A Paso
Cómo Evitar Sanciones de Google
Herramientas CSS no utilizadas. Análisis
Consultora SEO. CPA Marketing
Optimización SEO Off Page. Servicio SEO Off Page
Mejorar El Porcentaje De Impresiones En Google Ads
Tutorial De Google Ads Para Principiantes
¿Qué Es Una Auditoría De PPC?
Volumen De Búsquedas De Palabras Clave
Eliminar CSS no utilizadasQue Es Una Pagina Intersticial
Porque Aparece Not Provided En Google Analitycs
Cómo Optimizar La Velocidad De Carga Con Lighthouse
Ranking En las SERPs
Herramientas Que Amo
Que Es EL Spam De Comentarios
¿Qué es CSS crítico? ¡Genéralo!
El ABC De Google Analytics. Cómo utilizar Analytics
Copia De Seguridad WordPress Sin Plugin

¿De cuánta utilidad te ha parecido este contenido?

¡Haz clic en una estrella para puntuar!

promedio de puntuación

Hasta ahora, ¡no hay votos!. Sé el primero en puntuar este contenido.

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Sigueme
Últimas entradas de Estela Silva H. (ver todo)

Política de comentarios: Me encantan los comentarios y agradezco el tiempo que los lectores dedican para compartir ideas y para retroalimentación. Sin embargo, todos los comentarios son moderados manualmente y aquellos que considero spam o comentario promocional se eliminarán.

Soporte a su negocio en el campo del posicionamiento web, optimización web y auditorías profesionales. Gracias a mis acciones, los sitios web obtienen un tráfico segmentado que se traduce directamente en ventas y conversiones en el sitio web con  efectos seguros durante muchos años.

Servicios de Comercio electrónicoServicios de e-Marketing y Estrategías
Montar una tiendaPosicionamiento en Goole
Posicionamiento de tiendasMarketing de contenidos
Notificaciones pushAuditorías de Contenido
Auditorías SEO
Páginas Web Gratis
Gestión de Google Ads
Asesoramiento y Consulta
Reparación de Sanciones de Google
Entrenamiento SEO
Reparación de Sitio Hackeado
Acelerar WordPress