100 términos de IA explicados en español

Agente de IA

AGENT

Sistema de IA que percibe su entorno, toma decisiones y actúa de forma autónoma para lograr objetivos. A diferencia de un chatbot, un agente puede usar herramientas, navegar por internet y ejecutar acciones sin intervención humana constante.

Alucinación

HALLUC.

Cuando un modelo de IA genera información falsa con total confianza. El modelo puede inventar citas, cifras o hechos que parecen reales pero no lo son. Es uno de los desafíos principales de los LLMs actuales.

API

Interfaz que permite a aplicaciones externas conectarse y usar un modelo de IA. A través de la API de OpenAI, por ejemplo, cualquier desarrollador puede integrar ChatGPT en su propia app.

Atención (Mecanismo de)

ATTN

Componente central de los transformers que permite al modelo enfocarse en las partes más relevantes del texto de entrada al generar cada palabra. Es la base de por qué los LLMs entienden el contexto.

AutoGPT

Sistema experimental que permite a GPT-4 ejecutar tareas de forma autónoma, encadenando múltiples acciones sin supervisión humana. Uno de los primeros agentes de IA populares.

Benchmark

Prueba estandarizada para medir y comparar el rendimiento de diferentes modelos de IA en tareas específicas. MMLU, HumanEval y GSM8K son ejemplos de benchmarks populares.

BERT

Modelo de lenguaje de Google (2018) que revolucionó el NLP al entender el contexto bidireccional del texto. Predecía palabras faltantes en ambas direcciones de una frase.

Bias (Sesgo)

Tendencias injustas o incorrectas en los modelos de IA, generalmente heredadas de los datos de entrenamiento. Un modelo puede reproducir prejuicios sociales si fue entrenado con datos que los contienen.

Chain of Thought

CoT

Técnica de prompting donde se le pide al modelo que razone paso a paso antes de dar una respuesta. Mejora significativamente el rendimiento en problemas matemáticos y de lógica.

ChatGPT

Asistente de IA conversacional desarrollado por OpenAI, basado en los modelos GPT. Es la interfaz más popular para interactuar con LLMs y el catalizador del boom de IA de 2022-2025.

Claude

Asistente de IA desarrollado por Anthropic, diseñado con énfasis especial en seguridad y comportamiento ético. Compite directamente con ChatGPT y destaca en tareas de razonamiento y texto largo.

Contexto (Ventana de)

CTX

La cantidad máxima de texto que un modelo puede "recordar" y procesar en una sola conversación. Se mide en tokens. Los modelos actuales tienen ventanas de contexto de hasta 1 millón de tokens.

Deep Learning

Subcampo del Machine Learning que usa redes neuronales con múltiples capas para aprender representaciones complejas de los datos. Es la base de los modelos de visión, voz y lenguaje modernos.

Diffusion Model

Arquitectura usada en modelos de generación de imágenes como Stable Diffusion y DALL-E. Aprende a eliminar ruido progresivamente para generar imágenes a partir de texto.

Embedding

Representación numérica de palabras, frases o documentos en un espacio vectorial. Permite a los modelos medir la similitud semántica entre textos. Fundamental para búsqueda semántica y RAG.

Entrenamiento (Training)

Proceso mediante el cual un modelo de IA aprende patrones a partir de datos. Implica ajustar millones o miles de millones de parámetros para minimizar el error en las predicciones.

Few-shot Learning

Capacidad de un modelo para aprender una tarea nueva con muy pocos ejemplos en el prompt — a veces solo 2 o 3. Es una de las capacidades más sorprendentes de los LLMs modernos.

Fine-tuning

Proceso de reentrenar un modelo pre-entrenado con datos específicos de un dominio para mejorar su rendimiento en tareas concretas. Más eficiente que entrenar desde cero.

Foundation Model

Modelo de gran escala entrenado en cantidades masivas de datos que puede adaptarse a múltiples tareas distintas. GPT-4, Claude y Gemini son ejemplos de foundation models.

Gemini

Familia de modelos de lenguaje de Google DeepMind. Es multimodal desde su diseño (puede procesar texto, imágenes, audio y video) y el principal competidor de GPT-4 y Claude.

GPT

Generative Pre-trained Transformer. Familia de modelos de OpenAI que revolucionó el NLP. GPT-4 es el modelo más potente de la serie y la base de ChatGPT Plus.

GPU

Unidad de Procesamiento Gráfico. Aunque fue diseñada para videojuegos, su arquitectura paralela la hace esencial para entrenar modelos de IA. NVIDIA es el fabricante dominante en este mercado.

IA Generativa

GenAI

Modelos de IA capaces de crear contenido nuevo — texto, imágenes, audio, video, código — que no existía antes. Se distingue de la IA discriminativa, que solo clasifica o predice.

Inferencia

El proceso de usar un modelo ya entrenado para generar respuestas. Cuando usas ChatGPT, estás haciendo inferencia. Se diferencia del entrenamiento, que es cuando el modelo aprende.

In-context Learning

Capacidad de los LLMs de aprender de ejemplos dentro del prompt sin necesidad de reentrenamiento. Incluye zero-shot, one-shot y few-shot learning.

Llama

Familia de modelos de lenguaje open-source de Meta. Al ser de código abierto, cualquiera puede descargarlos, modificarlos y ejecutarlos localmente sin depender de servicios en la nube.

LLM

Large Language Model. Modelo de lenguaje entrenado con enormes cantidades de texto para entender y generar lenguaje natural. ChatGPT, Claude y Gemini son LLMs.

Machine Learning

Rama de la IA donde los sistemas aprenden a partir de datos sin ser programados explícitamente para cada tarea. El modelo mejora con la experiencia.

Multimodal

Capacidad de un modelo para procesar y generar diferentes tipos de datos: texto, imágenes, audio y video. GPT-4o y Gemini son ejemplos de modelos multimodales.

NLP

Natural Language Processing. Rama de la IA dedicada a que las máquinas entiendan y generen lenguaje humano. Los LLMs son el estado del arte actual en NLP.

Red Neuronal

Sistema computacional inspirado en el cerebro humano, compuesto por nodos interconectados que procesan información en capas. Es la arquitectura base del Deep Learning.

Parámetros

Los valores numéricos ajustables dentro de un modelo de IA. Más parámetros generalmente implica mayor capacidad, pero también más coste computacional. GPT-4 tiene estimados cientos de miles de millones.

Prompt

La instrucción o pregunta que le das a un modelo de IA. Es el input que determina qué tipo de respuesta genera el modelo. La calidad del prompt determina en gran medida la calidad de la respuesta.

Prompt Engineering

Arte y ciencia de diseñar prompts efectivos para obtener los mejores resultados de un modelo de IA. Incluye técnicas como chain-of-thought, few-shot y role prompting.

RAG

Retrieval-Augmented Generation. Técnica que combina un LLM con una base de datos de conocimiento externa. El modelo busca información relevante antes de responder, reduciendo alucinaciones y permitiendo información actualizada.

RLHF

Reinforcement Learning from Human Feedback. Técnica donde humanos evalúan las respuestas del modelo y ese feedback se usa para mejorar su comportamiento. Clave para que ChatGPT sea útil y seguro.

Sistema de Recomendación

Algoritmo de IA que predice qué contenido le interesará a un usuario basándose en su comportamiento pasado. TikTok, Netflix y Spotify los usan extensivamente.

SLM

Small Language Model. Modelos de lenguaje más compactos diseñados para ejecutarse en dispositivos locales o con menos recursos. Phi-3 de Microsoft y Gemma de Google son ejemplos.

Temperature

Parámetro que controla la aleatoriedad de las respuestas de un LLM. Temperature 0 da respuestas deterministas y consistentes; temperature alta produce respuestas más creativas e impredecibles.

Token

Unidad básica de texto que procesa un LLM. Puede ser una palabra, parte de una palabra o un signo de puntuación. GPT-4 procesa aproximadamente 1 token cada ¾ de palabra en español.

Transformer

Arquitectura de red neuronal introducida en 2017 que es la base de todos los LLMs modernos. Su mecanismo de atención permite entender relaciones contextuales en el texto de forma eficiente.

Vector Database

Base de datos especializada en almacenar y buscar embeddings (representaciones vectoriales) de forma eficiente. Fundamental en arquitecturas RAG. Pinecone, Weaviate y ChromaDB son ejemplos.

Zero-shot Learning

Capacidad de un LLM para resolver tareas sin ningún ejemplo previo en el prompt. El modelo usa solo su conocimiento previo del entrenamiento para responder a instrucciones nuevas.