¿Qué son las palabras LSI (Latent Semantic Indexing) y cómo impactan en una estrategia SEO?

mano y lupa con palabras clave LSI

¿Qué son las palabras LSI (Latent Semantic Indexing) y cómo impactan en una estrategia SEO?

Las palabras LSI se corresponden con términos y frases que guardan una estrecha relación contextual. Desde la introducción de la Indexación Semántica Latente en 1988 y su integración en Google a principios de este siglo, las palabras clave LSI permanecen en el punto de mira de los especialistas en SEO, por su influencia en la clasificación de resultados orgánicos de búsqueda.

Pequeñas actualizaciones en el algoritmo de Google pueden afectar a millones de resultados en sus SERPs. Ejemplos recientes son Penguin, Hummingbird o Brandy. Con este último, lanzado en febrero de 2004, se implementó la Indexación Semántica Latente (LSI, por las siglas de Latent Semantic Indexing), método analítico que supuso un primer paso hacia la ‘humanización’ de los googlebots y que culminaría más de una década después con la actualización Bert.

LSI y el procesamiento del lenguaje natural en Google

La Indexación Semántica Latente se originó en la década de los ochenta en la esfera de las matemáticas, y servía para descomponer valores singulares e identificar relaciones entre conceptos en un documento. Su utilidad para los motores de búsqueda reside en la consideración del contexto de las palabras en el proceso de rastreo, análisis e indexación de páginas en Internet.

Por así decirlo, el método LSI permite identificar el significado real de una frase o término observando el resto de palabras del documento. De este modo se reducen los errores en búsquedas confusas para los ‘robots’ de Google. Tradicionalmente la polisemia y las omisiones han sido ‘terreno’ fértil para los resultados erróneos en consultas de búsqueda, por la dificultad de los algoritmos para comprender lo que dicen, no dicen y quieren decir los internautas.

Un ejemplo de consulta polisémica es ‘vaca para citroen berlingo’, que devuelve búsquedas relacionadas con bacas, es decir, accesorios para asegurar la carga en vehículos comerciales, no con ganado vacuno. La tecnología LSI permite a Google detectar la errata del usuario —«vaca» en lugar de «baca»— y enviarle los resultados adecuados. Otro tanto sucede con ‘cuadro de mtb carbono’, consulta que carece de interés pictórico y que, por tanto, devuelve resultados de ofertas relacionadas con bastidores tubulares de bicicleta.

Fuente de problemas son igualmente la sinonimia y la sinécdoque, comunes en el habla popular y que ponía en serios apuros a Google y otros motores de búsqueda antes de la llegada de la Indexación Semántica Latente —que no deberías confundir con el SEO Semántico—. A la búsqueda de «recetas de crema quemada», los algoritmos incluyen los resultados que contienen «recetas de crema catalana», por ser un sinónimo. Similar es el caso de «mejor autor de las letras gallegas», una consulta que devuelve contenidos relacionados con Camilo José Cela o Rosalía de Castro, porque vincula adecuadamente el término «letras» con «literatura».

Palabras LSI: un vistazo a su definición

Las palabras clave o keywords LSI son, en esencia, palabras y frases relacionadas a nivel semántico con un tema, coincidente con el de la página, entrada de blog, etcétera. Considerando que la keyword principal y el tema de un texto suelen concordar, las palabras LSI adoptan a veces la forma de una long tail o de una keyword derivada de aquella, siendo este un fenómeno infrecuente.

búsqueda en google de palabras clave LSI

La función de autocompletado y el apartado de búsquedas relacionadas de Google ayudan a encontrar palabras clave LSI, a igual que Keyword Research Tool y herramientas específicas como LSI Graph.

Si «coches híbridos» fuera el asunto central de un documento cualquiera, una posible selección de palabras clave LSI incluiría «motores híbridos» y «conducción híbrida», preguntas del estilo «cómo conducir un híbrido enchufable» y «cómo funciona un coche híbrido» o menciones a unidades específicas como «toyota prius». Esta miscelánea de palabras impactaría positivamente en el posicionamiento SEO, orientando primero a los crawlers de Google en sus tareas de rastreo y ayudando después a sus algoritmos a comprender mejor el contenido de páginas web.

(Hablar de Google y de palabras LSI en condicional es lo más prudente, pues los mercadólogos digitales no se ponen de acuerdo acerca del valor real de las palabras LSI, como se expondrá más adelante).

La investigación de palabras LSI cuenta en la actualidad con herramientas y recursos diversos. Los más accesibles y simples los ofrece el gigante de las búsquedas de Internet, Google. Su función de autocompletado y su sección de consultas relacionadas son un ‘vivero’ de términos LSI. Google Keyword Research Tool ayuda igualmente a identificar estas palabras clave. Herramientas específicas para términos LSI, como LSI Graph o las alternativas ofrecidas por Twinword, Keysearch, KeywordKeg o Keys4up, también echan una mano en su búsqueda.

Keywords LSI, benéficas para el SEO

El empleo de palabras clave LSI beneficiaría al posicionamiento de páginas y sitios web en Google de diversas formas. En primer lugar, y subrayando lo dicho anteriormente, este tipo de keywords facilita a los robots de búsqueda la comprensión textual del documento, evitando que sea clasificado indebidamente y mostrado en consultas sin relación ni interés, un error que aumenta las tasas de rebote y reduce el tiempo de permanencia.

mano de humano y robot tirando de una cuerda

Los errores de ‘comprensión’ lectora de los ‘googlebots’ han sido solventados con la introducción del método LSI y actualizaciones como Bert. De ahí que el gigante de las búsquedas de Internet sea hoy capaz de percibir las sutilezas del lenguaje humano.

Las keywords LSI aumentarían el tráfico indirecto, es decir, procedente de consultas incidentales: rescatando el ejemplo anterior, correspondería a los internautas que no estén interesados en los «coches híbridos» en general, sino en «cómo conducir un híbrido enchufable» en particular. De este modo, páginas y sitios web que en condiciones normales no recibirían exposición en ciertas búsquedas, logran incrementar su visibilidad en las SERPs y por tanto su número de visitantes.

Con las palabras LSI se logra, además, prevenir la optimización excesiva de palabras clave o keyword stuffing, una de las tácticas SEO que ya no funcionan en Google. Porque adoptando un enfoque LSI se tiende a diversificar más las palabras clave utilizadas, en detrimento de las molestas repeticiones y de los excesos en la densidad de palabras clave, males éstos perjudiciales para la experiencia de navegación.

Del beneficio anterior se deriva otro: la Indexación Semántica Latente minora las posibilidades de que una página o sitios web sean etiquetados de spam, un verdadero estigma para cualquier SEO specialist, por acarrear serias penalizaciones de Google.

LSI y SEO, un binomio rodeado de polémica

La búsqueda «keywords LSI» devuelve 723 mil resultados en Google… pese a que Google asegura que tales palabras no existen. Lo que sí existe es un acalorado debate en el mundo del SEO acerca de la utilidad y valor del LSI para el buscador propiedad de Alphabet. Esta controversia pareció resolverse cuando el analista de tendencias para webmaster de Google, John Mueller, sentenció en 2019 que «no existen las palabras clave LSI; cualquiera que te diga lo contrario, está equivocado» en un tuit de 2019.

Para el puertorriqueño Dr. Garcia, alias Orion, voz saliente en los foros de Search Engine Watch, las palabras y enlaces LSI carecen de fundamento. «Ahora se puede ver a un equipo de especialistas en marketing de motores de búsqueda recitando estos términos en sus conferencias de marketing de búsqueda, foros, blogs, comunicados de prensa», etcétera, quienes «afirman vender ‘servicios basados ​​en LSI’ y hacen ‘optimización de sitios web basada en LSI’ o ‘construcción de enlaces basada en LSI’, […] fáciles de vender a los ignorantes, especialmente cuando los clientes todavía tienen dificultades para averiguar qué significa SEO o HTML».

personas discutiendo lsi

La polémica ha perseguido a las palabras clave LSI desde su aplicación en el marketing digital, principalmente por la posible obsolescencia de este método y la negativa de ‘insiders’ de Google a que esté siendo usado en sus algoritmos de búsqueda.

Otros especialistas en marketing cuestionan las afirmaciones de Mueller. En una publicación de Ignite Visibility, John E. Lincoln reconoce que «es difícil creer que las palabras y frases relacionadas [LSI] no tengan absolutamente ningún impacto en el SEO». Connor Lahey, de Semrush, desoye a Mueller y refuta a las voces críticas con las keywords LSI. Que no haya evidencia de que «Google use la indexación semántica latente como la tecnología para comprender la relación entre las palabras y descubrir el tema de una página, eso no significa que no se esté haciendo eso mismo de otra manera».

Siendo la tecnología LSI muy anterior a las actualizaciones Brandy y Bert de Google, es ilógico pensar este método de procesamiento siga vigente en sus algoritmos. Pero esta posible obsolescencia no resta validez a las palabras clave LSI, que de alguna forma allanan el camino a los googlebots en su epopeya particular: comprender el lenguaje humano para ofrecer a cada consulta el resultado adecuado.