Que una empresa tenga los recursos necesarios para analizar el lenguaje, en una era digital como la que estamos viviendo, es crucial. Nadie se debería conformar con analizar el lenguaje de una manera superficial y distante, ya que cada comentario o mención puede impactar considerablemente a la reputación corporativa. Es necesario saber entender y analizar a la perfección qué es lo que se comunica, cómo y cuándo se comunica.
El embedding
Para eso, y gracias a la inteligencia artificial, existen sistemas, como los embeddings que descifran el verdadero significado detrás de cada comunicación.
Los embeddings son modelos de lenguaje que procesan el lenguaje natural, y que una vez recopilados los datos, lo representan con vectores de números de alta definición.
Significan una auténtica revolución en el análisis de texto frente al modelo tradicional, ya que permiten marcar la diferencia entre reaccionar ante problemas y anticiparse a ellos. Al poder captar los matices más sutiles del lenguaje, desde el significado de las palabras hasta el contexto en que se utilizan y la función lingüística que desempeña en el mensaje, un embedding permite, de una manera visual, que las empresas puedan llegar a descubrir conexiones inesperadas entre diversos términos.
¿Qué hace un embedding?
El hecho de que el embedding de Enigmia se haya ampliado a más de 1500 dimensiones facilita que la IA, a la hora de analizar un texto, pueda hacerlo con más precisión y profundidad, y puede llegar a las siguientes áreas:
El tono y la carga emocional
El embedding consigue, por medio de diferentes factores, captar la emoción y el tono subjetivo que se plasma en el medio y reflejarlo con claridad en los vectores numéricos.
El sistema será capaz de ilustrar en la distancia del vector que las oraciones ‘la empresa reportó un incremento récord’ y ‘la empresa enfrenta una grave caída’ hablan de desempeño, pero que cada una tiene un tono diferente.
Estructura y función
El embedding también es capaz de reflejar la estructura gramatical y la función sintáctica de la oración. Refleja en el vector si el texto es una afirmación, una negación, una pregunta, un mandato, etc., aunque el token sea similar.
Tiempo, lugar y personas
El embedding es capaz de contestar y reflejar las preguntas de quién, cuándo y dónde con los datos de la oración, independientemente de si aparecen explícita o implícitamente.
Ante las oraciones ‘El presidente anunció medidas en 2020’ frente a ‘El ministro sugirió reformas en 2024’ el embedding es capaz de detectar que el tiempo y los actores
implicados son diferentes, a pesar de que el tono y la acción sea parecida.
Compatibilidad y lógica
El embedding es capaz de analizar la compatibilidad lingüística, es decir, si dos oraciones tratan del mismo tema y cómo de similar lo tratan aunque tengan diferentes palabras. También tiene en cuenta la lógica implícita detrás de cada oración. Esta se usa en el entailment para ver la intención de lo comunicado y el sentido lógico que se le da a una oración en cuanto se lee.
El entailment es la relación lógica entre dos frases, en la que una frase implica necesariamente la verdad de la otra. Si decimos que ‘María compró una bicicleta’ implica que ‘María compró algo’, pero esta última frase no tiene porqué implicar que ‘María compró (necesariamente) una bicicleta’.
Por lo tanto, para llegar a una conclusión, como puede ser ‘Pedro tiene un coche’ la oración ‘Pedro compró un coche nuevo’ está cerca de la primera oración, e incluso la incluye dentro de su significado de manera implícita. Por otro lado, la oración ‘Pedro nunca ha tenido coche’ está mucho más lejos de llegar a la conclusión, tanto por la elección de palabras como por la deducción que se puede sacar de ella.
Diferenciación de sinónimos
Un embedding es capaz de diferenciar tipos de sinónimos según la palabra que sean y el contexto en el que se ubiquen.
Sin embargo, existe una clasificación de sinónimos. Para poner un ejemplo, un sinónimo plano respondería a la idea común y generalmente conocida de sinónimo, como la palabra ‘banco’.
Ahora bien, se puede decir que un sinónimo plano, al darse en una oración o en un contexto determinados, queda limitado solo con el significado que le otorga sentido en esa determinada oración. Por lo tanto, en la frase ‘cliente de banco’ los otros significados no tendrían ningún sentido, igual que en la oración ‘sentado en el banco del parque’ los otros significados tampoco se tendrán en cuenta.
Relaciones semánticas complejas
Algunas palabras y conceptos tienen relación, pero puede ser más distante o más cercana dependiendo, a veces, de su connotación. Por lo tanto, el embedding no solo capta la sinonimia y sus relaciones sino también:
- Hiperonimia: cuando el significado de una palabra está incluido en el significado de otras. Es decir, el significado de ‘animal’ también se encuentra dentro del significado de ‘perro’, ‘gato’ o ‘caballo’, ya que estos también son animales.
- Antónimos: palabras que expresan ideas opuestas. Estas palabras también tienen una clasificación y el embedding es capaz de identificar estos antónimos y relacionarlos. Los graduales, por ejemplo, a pesar de ser contrarios, no son contrarios absolutos. El hecho de que ‘bajo’ sea el contrario de ‘alto’ no hace que se excluyan todos los términos intermedios, si los tiene, como en este caso, que sería ‘mediano’.
- Relaciones de causa-efecto: Este tipo se da en oraciones donde primero se observa una causa y después se describe el efecto que esta causa tiene. ‘Suspendió porque no estudió’ es un ejemplo de una oración donde el verbo principal es la causa del siguiente.
- Asociaciones temáticas: Son las asociaciones que se le atribuyen a una palabra, dentro de un tema determinado, por el uso que tienen o por cómo suenan. Las palabras ‘profesor’, ‘alumno’, ‘examen’, ‘pizarra’ están todas asociadas con el tema ‘colegio’. También se pueden realizar otro tipo de asociaciones; ‘cambio climático’ tiene una relación directa con el clima, pero al darle normalmente una connotación negativa, tiene más relación con ‘emisiones de carbono’ que con ‘clima soleado’.
Coherencia en el tema y el discurso
A pesar de que lo que se esté analizando, ya sea imagen, audio o texto, un embedding es capaz de encontrar y reflejar la similitud de los temas. Es decir, aunque ‘La inversión en energías renovables aumentó’, ‘La energía solar creció en Europa’ y ‘El hidrógeno verde gana terreno en 2025’ son oraciones de textos diferentes, al tratar la misma temática, el embedding lo refleja en el vector que genere.
Abstracción o especificación
El embedding es capaz de representar, entender y relacionar conceptos ya sean abstractos o concretos, y de relacionarlos con otros conceptos. Tendrá en cuenta que un concepto como ‘democracia’ es abstracto y está más relacionado con el término abstracto ‘libertad de expresión’ que con el concepto de ‘código QR’.
Enigmia: pionera en el uso de embeddings
Por lo tanto, un embedding de alta dimensión con más de 1500 elementos, como los utilizados por Enigmia, representa una revolución en el análisis del lenguaje humano. Cada dimensión permite al modelo capturar un eje semántico latente: contexto, rol sintáctico, polaridad, tono, relaciones conceptuales, etc. Esta tecnología convierte el ruido informacional en insights precisos, mediante búsquedas semánticas y mapas conceptuales, ofreciendo una ventaja competitiva decisiva donde cada comentario puede impactar significativamente la reputación corporativa en la era digital.