¿Qué es un LLM o modelo de lenguaje de gran escala?

Un modelo de lenguaje de gran escala (LLM, por sus siglas en inglés) es un tipo de inteligencia artificial entrenado con enormes cantidades de datos textuales para entender, generar y predecir texto de manera coherente. Estos modelos, como GPT, utilizan arquitecturas de redes neuronales (como Transformers) para capturar patrones lingüísticos y contextuales. Son capaces de realizar tareas como traducción, resumen, respuesta a preguntas y generación de contenido. Su «gran escala» se refiere a los millones o billones de parámetros que ajustan durante el entrenamiento, lo que les permite manejar una amplia gama de temas y estilos lingüísticos.

<<Volver al glosario

¿Qué es un LLM o modelo de lenguaje de gran escala?

Artículos relacionados

Ciberseguridad e Inteligencia Artificial: usos y riesgos clave

Extracción de entidades nombradas (NER) paso a paso con spaCy

Análisis de tópicos en grandes volúmenes de texto con LDA