Referencia rápidaTodos los nivelesActualizado 2025
Desde LLM hasta token, RAG y fine-tuning. Todo el vocabulario de la inteligencia artificial explicado de forma clara, sin jerga innecesaria.
A
Agente de IA
AGENT
Sistema de IA que percibe su entorno, toma decisiones y actúa de forma autónoma para lograr objetivos. A diferencia de un chatbot, un agente puede usar herramientas, navegar por internet y ejecutar acciones sin intervención humana constante.
Alucinación
HALLUC.
Cuando un modelo de IA genera información falsa con total confianza. El modelo puede inventar citas, cifras o hechos que parecen reales pero no lo son. Es uno de los desafíos principales de los LLMs actuales.
API
API
Interfaz que permite a aplicaciones externas conectarse y usar un modelo de IA. A través de la API de OpenAI, por ejemplo, cualquier desarrollador puede integrar ChatGPT en su propia app.
Atención (Mecanismo de)
ATTN
Componente central de los transformers que permite al modelo enfocarse en las partes más relevantes del texto de entrada al generar cada palabra. Es la base de por qué los LLMs entienden el contexto.
AutoGPT
Sistema experimental que permite a GPT-4 ejecutar tareas de forma autónoma, encadenando múltiples acciones sin supervisión humana. Uno de los primeros agentes de IA populares.
B
Benchmark
Prueba estandarizada para medir y comparar el rendimiento de diferentes modelos de IA en tareas específicas. MMLU, HumanEval y GSM8K son ejemplos de benchmarks populares.
BERT
BERT
Modelo de lenguaje de Google (2018) que revolucionó el NLP al entender el contexto bidireccional del texto. Predecía palabras faltantes en ambas direcciones de una frase.
Bias (Sesgo)
Tendencias injustas o incorrectas en los modelos de IA, generalmente heredadas de los datos de entrenamiento. Un modelo puede reproducir prejuicios sociales si fue entrenado con datos que los contienen.
C
Chain of Thought
CoT
Técnica de prompting donde se le pide al modelo que razone paso a paso antes de dar una respuesta. Mejora significativamente el rendimiento en problemas matemáticos y de lógica.
ChatGPT
Asistente de IA conversacional desarrollado por OpenAI, basado en los modelos GPT. Es la interfaz más popular para interactuar con LLMs y el catalizador del boom de IA de 2022-2025.
Claude
Asistente de IA desarrollado por Anthropic, diseñado con énfasis especial en seguridad y comportamiento ético. Compite directamente con ChatGPT y destaca en tareas de razonamiento y texto largo.
Contexto (Ventana de)
CTX
La cantidad máxima de texto que un modelo puede "recordar" y procesar en una sola conversación. Se mide en tokens. Los modelos actuales tienen ventanas de contexto de hasta 1 millón de tokens.
D
Deep Learning
Subcampo del Machine Learning que usa redes neuronales con múltiples capas para aprender representaciones complejas de los datos. Es la base de los modelos de visión, voz y lenguaje modernos.
Diffusion Model
Arquitectura usada en modelos de generación de imágenes como Stable Diffusion y DALL-E. Aprende a eliminar ruido progresivamente para generar imágenes a partir de texto.
E
Embedding
Representación numérica de palabras, frases o documentos en un espacio vectorial. Permite a los modelos medir la similitud semántica entre textos. Fundamental para búsqueda semántica y RAG.
Entrenamiento (Training)
Proceso mediante el cual un modelo de IA aprende patrones a partir de datos. Implica ajustar millones o miles de millones de parámetros para minimizar el error en las predicciones.
F
Few-shot Learning
Capacidad de un modelo para aprender una tarea nueva con muy pocos ejemplos en el prompt — a veces solo 2 o 3. Es una de las capacidades más sorprendentes de los LLMs modernos.
Fine-tuning
FT
Proceso de reentrenar un modelo pre-entrenado con datos específicos de un dominio para mejorar su rendimiento en tareas concretas. Más eficiente que entrenar desde cero.
Foundation Model
Modelo de gran escala entrenado en cantidades masivas de datos que puede adaptarse a múltiples tareas distintas. GPT-4, Claude y Gemini son ejemplos de foundation models.
G
Gemini
Familia de modelos de lenguaje de Google DeepMind. Es multimodal desde su diseño (puede procesar texto, imágenes, audio y video) y el principal competidor de GPT-4 y Claude.
GPT
GPT
Generative Pre-trained Transformer. Familia de modelos de OpenAI que revolucionó el NLP. GPT-4 es el modelo más potente de la serie y la base de ChatGPT Plus.
GPU
GPU
Unidad de Procesamiento Gráfico. Aunque fue diseñada para videojuegos, su arquitectura paralela la hace esencial para entrenar modelos de IA. NVIDIA es el fabricante dominante en este mercado.
I
IA Generativa
GenAI
Modelos de IA capaces de crear contenido nuevo — texto, imágenes, audio, video, código — que no existía antes. Se distingue de la IA discriminativa, que solo clasifica o predice.
Inferencia
El proceso de usar un modelo ya entrenado para generar respuestas. Cuando usas ChatGPT, estás haciendo inferencia. Se diferencia del entrenamiento, que es cuando el modelo aprende.
In-context Learning
Capacidad de los LLMs de aprender de ejemplos dentro del prompt sin necesidad de reentrenamiento. Incluye zero-shot, one-shot y few-shot learning.
L
Llama
Familia de modelos de lenguaje open-source de Meta. Al ser de código abierto, cualquiera puede descargarlos, modificarlos y ejecutarlos localmente sin depender de servicios en la nube.
LLM
LLM
Large Language Model. Modelo de lenguaje entrenado con enormes cantidades de texto para entender y generar lenguaje natural. ChatGPT, Claude y Gemini son LLMs.
M
Machine Learning
ML
Rama de la IA donde los sistemas aprenden a partir de datos sin ser programados explícitamente para cada tarea. El modelo mejora con la experiencia.
Multimodal
Capacidad de un modelo para procesar y generar diferentes tipos de datos: texto, imágenes, audio y video. GPT-4o y Gemini son ejemplos de modelos multimodales.
N
NLP
NLP
Natural Language Processing. Rama de la IA dedicada a que las máquinas entiendan y generen lenguaje humano. Los LLMs son el estado del arte actual en NLP.
Red Neuronal
Sistema computacional inspirado en el cerebro humano, compuesto por nodos interconectados que procesan información en capas. Es la arquitectura base del Deep Learning.
P
Parámetros
Los valores numéricos ajustables dentro de un modelo de IA. Más parámetros generalmente implica mayor capacidad, pero también más coste computacional. GPT-4 tiene estimados cientos de miles de millones.
Prompt
La instrucción o pregunta que le das a un modelo de IA. Es el input que determina qué tipo de respuesta genera el modelo. La calidad del prompt determina en gran medida la calidad de la respuesta.
Prompt Engineering
PE
Arte y ciencia de diseñar prompts efectivos para obtener los mejores resultados de un modelo de IA. Incluye técnicas como chain-of-thought, few-shot y role prompting.
R
RAG
RAG
Retrieval-Augmented Generation. Técnica que combina un LLM con una base de datos de conocimiento externa. El modelo busca información relevante antes de responder, reduciendo alucinaciones y permitiendo información actualizada.
RLHF
RLHF
Reinforcement Learning from Human Feedback. Técnica donde humanos evalúan las respuestas del modelo y ese feedback se usa para mejorar su comportamiento. Clave para que ChatGPT sea útil y seguro.
S
Sistema de Recomendación
Algoritmo de IA que predice qué contenido le interesará a un usuario basándose en su comportamiento pasado. TikTok, Netflix y Spotify los usan extensivamente.
SLM
SLM
Small Language Model. Modelos de lenguaje más compactos diseñados para ejecutarse en dispositivos locales o con menos recursos. Phi-3 de Microsoft y Gemma de Google son ejemplos.
T
Temperature
Parámetro que controla la aleatoriedad de las respuestas de un LLM. Temperature 0 da respuestas deterministas y consistentes; temperature alta produce respuestas más creativas e impredecibles.
Token
Unidad básica de texto que procesa un LLM. Puede ser una palabra, parte de una palabra o un signo de puntuación. GPT-4 procesa aproximadamente 1 token cada ¾ de palabra en español.
Transformer
Arquitectura de red neuronal introducida en 2017 que es la base de todos los LLMs modernos. Su mecanismo de atención permite entender relaciones contextuales en el texto de forma eficiente.
V
Vector Database
Base de datos especializada en almacenar y buscar embeddings (representaciones vectoriales) de forma eficiente. Fundamental en arquitecturas RAG. Pinecone, Weaviate y ChromaDB son ejemplos.
Z
Zero-shot Learning
Capacidad de un LLM para resolver tareas sin ningún ejemplo previo en el prompt. El modelo usa solo su conocimiento previo del entrenamiento para responder a instrucciones nuevas.