Introducción

El SEO tradicional se basaba en la medición de clics, pero la aparición de los asistentes de IA ha creado una nueva capa de visibilidad que las métricas convencionales no capturan. Estos asistentes, como Perplexity o ChatGPT Search, resumen y citan contenido antes de que se produzca un clic, transformando la forma en que el público consume información y confía en ciertas fuentes.

Este artículo propone una metodología de prueba proxy sin código para que los profesionales del marketing puedan medir la visibilidad de su contenido en sistemas de recuperación híbrida. A través de la comparación de los resultados de los buscadores léxicos (Google Top 10) con las citas de los asistentes semánticos (fuentes de IA), se pueden calcular métricas clave para diagnosticar la alineación o divergencia de la autoridad en el nuevo ecosistema de búsqueda.

Advertencia previa: este artículo contiene matemáticas. Si resolver ecuaciones te produce dolor de cabeza o ganas de comerte una tarta entera, prepárate (o ve a por esa tarta). Pero si te gustan las matemáticas, disfrutas con las ecuaciones y realmente crees que k=N (¡masoquista!), este artículo te va a encantar mientras exploramos la búsqueda híbrida con cierta profundidad.

Resumen optimizado para AI Overview (Puntos Clave)

Los asistentes de IA y los buscadores tradicionales utilizan dos sistemas de recuperación distintos, lo que provoca desacuerdos en la visibilidad del contenido:

  1. Recuperación Léxica (Buscadores): Se basa en la coincidencia directa de palabras clave (ej., algoritmo BM25).
  2. Recuperación Semántica (Asistentes de IA): Se basa en el significado y los embeddings (huellas dactilares matemáticas del texto) para encontrar contenido conceptualmente relacionado.

Los sistemas de búsqueda modernos utilizan la Fusión de Rango Recíproco (RRF) para combinar ambas listas de resultados. Aunque los profesionales del marketing no pueden ver el proceso interno de RRF, sí pueden observar el resultado externo: la superposición o divergencia entre los Top 10 de Google y las citas de los asistentes.

Cómo Medir la Visibilidad Híbrida (Prueba Proxy):

El proceso de medición se basa en recopilar y comparar manualmente las 10 mejores URL de Google y las URL citadas por un asistente de IA (ej. Perplexity) para un conjunto de consultas.

Métrica Cálculo Significado Diagnóstico
Tasa de Visibilidad Compartida (SVR) Intersección (URLs coincidentes) ÷ 10 Mide la alineación entre SEO tradicional y la IA. Alto SVR significa que la relevancia léxica y semántica están sincronizadas.
Tasa de Visibilidad Única del Asistente (UAVR) Citas únicas del asistente ÷ Total de citas del asistente Muestra el material «novedoso» que introduce la IA. Alto UAVR indica que el asistente confía en fuentes distintas a las del Top 10 de Google.
Recuento de Citas Repetidas (RCC) Suma de Frecuencias de Dominio ÷ Número de Consultas Refleja la consistencia con la que un dominio (propio o de la competencia) es citado. Alto RCC sugiere una alta confianza semántica.

 

Puntos Clave de Optimización:

Para aumentar la visibilidad en sistemas de recuperación híbrida:

  • Claridad Estructural: Escribir en bloques cortos de afirmación/evidencia (200-300 palabras).
  • Formato Consistente: Usar encabezados jerárquicos, viñetas y anclas estables.
  • Datos Estructurados: Aplicar schema (FAQ, HowTo, Product) para que los vectores entiendan el contexto.
  • Autoridad: Publicar versiones canónicas en PDF y estandarizar marcas de tiempo y campos de autor, ya que los asistentes a menudo citan formatos fijos y verificables.

Estas métricas ofrecen a los ejecutivos una forma concreta de cuantificar cuánto de su SEO existente se traslada al descubrimiento por IA y cómo la autoridad se mueve entre los sistemas de clasificación y recuperación.

El cambio de paradigma en la visibilidad online

Durante años (décadas, en realidad), el SEO ha funcionado dentro de un único bucle de retroalimentación. Optimizábamos, posicionábamos y medíamos. Todo tenía sentido porque Google nos proporcionaba el marcador. Estoy simplificando, pero entiendes la idea.

Ahora, los asistentes de inteligencia artificial se sitúan por encima de esa capa. Resumen, citan y responden preguntas antes de que se produzca un clic. Tu contenido puede aparecer, parafrasearse o ignorarse, y nada de esto se refleja en las analíticas tradicionales.

Esto no convierte el SEO en algo obsoleto. Significa que un nuevo tipo de visibilidad funciona ahora en paralelo. Este artículo presenta ideas sobre cómo medir esa visibilidad sin código, sin acceso especial ni desarrolladores, y cómo mantenernos anclados en lo que realmente sabemos.

Por qué es importante ahora

Los motores de búsqueda tradicionales siguen generando casi todo el tráfico medible. Solo Google procesa casi 4.000 millones de búsquedas al día. En comparación, el volumen total anual de consultas de Perplexity ronda los 10.000 millones.

Sí, los asistentes siguen siendo pequeños en comparación. Pero están moldeando cómo se interpreta la información. Ya puedes verlo cuando ChatGPT Search o Perplexity responden una pregunta y enlazan sus fuentes. Esas citas revelan qué bloques de contenido (fragmentos) y dominios confían actualmente los modelos.

El desafío es que los profesionales del marketing no disponemos de un panel nativo que muestre con qué frecuencia ocurre esto. Google ha añadido recientemente datos de rendimiento del Modo IA en Search Console. Según la documentación de Google, las impresiones, clics y posiciones del Modo IA ahora se incluyen en el tipo de búsqueda general «Web».

Esa inclusión importa, pero está mezclada. Actualmente no hay forma de aislar el tráfico del Modo IA. Los datos están ahí, simplemente plegados dentro del grupo más grande. Sin desglose porcentual. Sin línea de tendencia. Todavía no.

Hasta que esa visibilidad mejore, propongo que podemos utilizar una prueba proxy para entender dónde coinciden asistentes y buscadores y dónde divergen.

Dos sistemas de recuperación, dos formas de ser encontrado

Los motores de búsqueda tradicionales utilizan recuperación léxica, donde emparejan palabras y frases directamente. El algoritmo dominante, BM25, ha impulsado soluciones como Elasticsearch y sistemas similares durante años. También está en uso en los motores de búsqueda comunes actuales.

Los asistentes de IA se basan en la recuperación semántica. En lugar de palabras exactas, mapean el significado mediante embeddings (incrustaciones), las huellas dactilares matemáticas del texto. Esto les permite encontrar pasajes conceptualmente relacionados incluso cuando las palabras exactas difieren.

Cada sistema comete errores diferentes. La recuperación léxica pierde sinónimos. La recuperación semántica puede conectar ideas no relacionadas. Pero cuando se combinan, producen mejores resultados.

Dentro de la mayoría de los sistemas de recuperación híbrida, los dos métodos se fusionan usando una regla llamada Reciprocal Rank Fusion (RRF) o Fusión de Rango Recíproco. No necesitas poder ejecutarla, pero comprender el concepto te ayuda a interpretar lo que medirás más adelante.

RRF explicado en lenguaje sencillo

La recuperación híbrida combina múltiples listas clasificadas en una lista equilibrada. Las matemáticas detrás de esa fusión son RRF.

La fórmula es simple: la puntuación es igual a uno dividido por k más el rango. Esto se escribe como 1 ÷ (k + rango). Si un elemento aparece en varias listas, sumas esas puntuaciones.

Aquí, «rango» significa la posición del elemento en esa lista, comenzando con 1 como el primero. «k» es una constante que suaviza la diferencia entre elementos clasificados en las primeras posiciones y en posiciones medias. La mayoría de los sistemas suelen usar algo cercano a 60, pero cada uno puede ajustarlo de manera diferente.

Vale la pena recordar que un modelo vectorial no clasifica resultados contando coincidencias de palabras. Mide qué tan cerca está el embedding de cada documento del embedding de la consulta en un espacio multidimensional. El sistema luego ordena esas puntuaciones de similitud de mayor a menor, creando efectivamente una lista clasificada. Parece una clasificación de motor de búsqueda, pero está impulsada por matemáticas de distancia, no por frecuencia de términos.

Un ejemplo práctico con números pequeños

Hagámoslo tangible con números pequeños y dos listas clasificadas. Una de BM25 (relevancia de palabras clave) y una de un modelo vectorial (relevancia semántica). Usaremos k = 10 para mayor claridad.

Documento A está clasificado número 1 en BM25 y número 3 en la lista vectorial.

  • Desde BM25: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909
  • Desde la lista vectorial: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769
  • Súmalas: 0,0909 + 0,0769 = 0,1678

Documento B está clasificado número 2 en BM25 y número 1 en la lista vectorial.

  • Desde BM25: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833
  • Desde la lista vectorial: 1 ÷ (10 + 1) = 1 ÷ 11 = 0,0909
  • Súmalas: 0,0833 + 0,0909 = 0,1742

Documento C está clasificado número 3 en BM25 y número 2 en la lista vectorial.

  • Desde BM25: 1 ÷ (10 + 3) = 1 ÷ 13 = 0,0769
  • Desde la lista vectorial: 1 ÷ (10 + 2) = 1 ÷ 12 = 0,0833
  • Súmalas: 0,0769 + 0,0833 = 0,1602

El Documento B gana aquí, ya que se clasifica alto en ambas listas. Si aumentas k a 60, las diferencias se reducen, produciendo una mezcla más suave y menos dominada por los primeros puestos.

Este ejemplo es puramente ilustrativo. Cada plataforma ajusta los parámetros de manera diferente, y ninguna documentación pública confirma qué valores k usa cada motor. Piensa en ello como una analogía de cómo múltiples señales se promedian juntas.

Dónde vive realmente esta matemática

Nunca necesitarás codificarlo tú mismo, ya que RRF ya forma parte de las pilas de búsqueda modernas. Estas son algunas de las plataformas que implementan este tipo de sistema desde sus proveedores fundamentales. Si lees todo esto, tendrás una comprensión más profunda de cómo plataformas como Perplexity hacen lo que hacen:

Todos siguen el mismo proceso básico: recuperar con BM25, recuperar con vectores, puntuar con RRF y fusionar. Las matemáticas anteriores explican el concepto, no la fórmula literal dentro de cada producto.

Observar la recuperación híbrida en la práctica

Los profesionales del marketing no podemos ver esas listas internas, pero sí podemos observar cómo se comportan los sistemas en la superficie. El truco está en comparar lo que Google clasifica con lo que cita un asistente, luego medir la superposición, la novedad y la consistencia. Estas matemáticas externas son una heurística, un proxy para la visibilidad. No son las mismas matemáticas que las plataformas calculan internamente.

Paso 1: Recopilar los datos

Elige 10 consultas que importen a tu negocio.

Para cada consulta:

  1. Ejecútala en Google Search y copia las 10 mejores URLs orgánicas
  2. Ejecútala en un asistente que muestre citas, como Perplexity o ChatGPT Search, y copia cada URL o dominio citado

Ahora tienes dos listas por consulta: Top 10 de Google y Citas del Asistente.

(Ten en cuenta que no todos los asistentes muestran citas completas, y no todas las consultas las activan. Algunos asistentes pueden resumir sin listar fuentes en absoluto. Cuando eso suceda, salta esa consulta, ya que simplemente no se puede medir de esta manera.)

Paso 2: Contar tres cosas

  1. Intersección (I): cuántas URLs o dominios aparecen en ambas listas
  2. Novedad (N): cuántas citas del asistente no aparecen en el top 10 de Google. Si el asistente tiene seis citas y tres se superponen, N = 6 − 3 = 3.
  3. Frecuencia (F): con qué frecuencia aparece cada dominio en las 10 consultas

Paso 3: Convertir los recuentos en métricas rápidas

Para cada conjunto de consultas:

Tasa de Visibilidad Compartida (SVR) = I ÷ 10

Esto mide cuánto del top 10 de Google también aparece en las citas del asistente.

Tasa de Visibilidad Única del Asistente (UAVR) = N ÷ total de citas del asistente para esa consulta

Esto muestra cuánto material nuevo introduce el asistente.

Recuento de Citas Repetidas (RCC) = (suma de F para cada dominio) ÷ número de consultas

Esto refleja con qué consistencia se cita un dominio en diferentes respuestas.

Ejemplo práctico:

Top 10 de Google = 10 URLs. Citas del asistente = 6. Tres se superponen.

  • I = 3
  • N = 3
  • F (para ejemplo.com) = 4 (aparece en cuatro respuestas del asistente)

Por tanto:

  • SVR = 3 ÷ 10 = 0,30
  • UAVR = 3 ÷ 6 = 0,50
  • RCC = 4 ÷ 10 = 0,40

Ahora tienes una instantánea numérica de cuán estrechamente los asistentes reflejan o divergen de la búsqueda.

Paso 4: Interpretar

Estas puntuaciones no son en absoluto puntos de referencia de la industria, simplemente puntos de partida sugeridos. Siéntete libre de ajustar según lo necesites:

  • SVR alto (> 0,6) significa que tu contenido se alinea con ambos sistemas. La relevancia léxica y semántica están sincronizadas
  • SVR moderado (0,3 – 0,6) con RCC alto sugiere que tus páginas son semánticamente confiables pero necesitan marcado más claro o enlaces más fuertes
  • SVR bajo (< 0,3) con UAVR alto muestra que los asistentes confían en otras fuentes. Eso a menudo señala problemas de estructura o claridad
  • RCC alto para competidores indica que el modelo cita repetidamente sus dominios, por lo que vale la pena estudiarlos en busca de pistas de schema o diseño de contenido

Paso 5: Actuar

Si el SVR es bajo, mejora los encabezados, la claridad y la rastreabilidad. Si el RCC es bajo para tu marca, estandariza los campos de autor, schema y marcas de tiempo. Si el UAVR es alto, rastrea esos nuevos dominios, ya que pueden tener ya confianza semántica en tu nicho.

(Este enfoque no siempre funcionará exactamente como se describe. Algunos asistentes limitan el número de citas o las varían regionalmente. Los resultados pueden diferir según la geografía y el tipo de consulta. Trátalo como un ejercicio observacional, no como un marco rígido.)

Por qué estas matemáticas son importantes

Estas matemáticas dan a los profesionales del marketing una forma de cuantificar el acuerdo y el desacuerdo entre dos sistemas de recuperación. Son matemáticas de diagnóstico, no de clasificación. No te dicen por qué el asistente eligió una fuente; te dicen que lo hizo, y con qué consistencia.

Ese patrón es el borde visible de la lógica híbrida invisible que opera entre bastidores. Piensa en ello como observar el clima mirando el movimiento de los árboles. No estás simulando la atmósfera, solo leyendo sus efectos.

Trabajo en la página que ayuda a la recuperación híbrida

Una vez que veas cómo se desarrollan la superposición y la novedad, el siguiente paso es ajustar la estructura y la claridad.

  • Escribe en bloques cortos de afirmación y evidencia de 200-300 palabras
  • Usa encabezados claros, viñetas y anclas estables para que BM25 pueda encontrar términos exactos
  • Añade datos estructurados (FAQ, HowTo, Product, TechArticle) para que vectores y asistentes entiendan el contexto
  • Mantén las URLs canónicas estables y marca temporalmente las actualizaciones de contenido
  • Publica versiones canónicas en PDF para temas de alta confianza; los asistentes a menudo citan primero formatos fijos y verificables

Estos pasos apoyan tanto a los rastreadores como a los LLM, ya que comparten el lenguaje de la estructura.

Informes y presentación ejecutiva

A los ejecutivos no les importan BM25 o los embeddings tanto como la visibilidad y la confianza.

Tus nuevas métricas (SVR, UAVR y RCC) pueden ayudar a traducir lo abstracto en algo medible: cuánto de tu presencia SEO existente se traslada al descubrimiento por IA, y dónde se cita a los competidores en su lugar.

Combina esos hallazgos con los totales de rendimiento del Modo IA de Search Console, pero recuerda: actualmente no puedes separar los datos del Modo IA de los clics web regulares, así que trata cualquier estimación específica de IA como direccional, no definitiva. También vale la pena señalar que todavía puede haber límites regionales en la disponibilidad de datos.

Sin embargo, estos límites no hacen que las matemáticas sean menos útiles. Ayudan a mantener expectativas realistas mientras te dan una forma concreta de hablar sobre la visibilidad impulsada por IA con la dirección.

La brecha entre búsqueda y asistentes no es un muro. Es más una diferencia de señal. Los motores de búsqueda clasifican páginas después de que se conoce la respuesta. Los asistentes recuperan fragmentos antes de que exista la respuesta.

Las matemáticas en este artículo son una idea de cómo observar esa transición sin herramientas de desarrollador. No son las matemáticas de la plataforma; son un proxy del profesional del marketing que ayuda a hacer visible lo invisible.

Al final, los fundamentos siguen siendo los mismos. Todavía optimizas para claridad, estructura y autoridad.

Ahora puedes medir cómo esa autoridad viaja entre sistemas de clasificación y sistemas de recuperación, y hacerlo con expectativas realistas.

Esa visibilidad, contada y contextualizada, es cómo el SEO moderno permanece anclado en la realidad.

Sobre la aplicabilidad práctica: Este marco metodológico está diseñado para profesionales del marketing digital que necesitan cuantificar el impacto de los asistentes de IA sin depender de herramientas técnicas complejas. Las métricas propuestas (SVR, UAVR, RCC) proporcionan un punto de partida basado en datos observables que cualquier profesional puede recopilar y analizar manualmente, lo que democratiza el acceso a insights sobre visibilidad en sistemas de IA.

¿Listo para elevar el potencial de su marca?

+34 684 308 382

¿Buscas una agencia que cumpla con los factores E-E-A-T de Google?

En agencia de marketing Leovel, hemos desarrollado estrategias exitosas para empresas de toda España durante más de una década. Te invitamos a conocer nuestro servicio especializado de posicionamiento web SEO y AEO.

Auditoría SEO

Privacy Preference Center