Algoritmo
Conjunto de instrucciones finitas y ordenadas que un sistema sigue para resolver un problema o realizar una tarea. En IA, los algoritmos definen cómo el modelo aprende de los datos y toma decisiones.
Aprendizaje Supervisado
Paradigma de Machine Learning donde el modelo se entrena con datos etiquetados (pares entrada–salida). El algoritmo ajusta sus parámetros minimizando el error entre su predicción y la etiqueta correcta.
Aprendizaje No Supervisado
El modelo descubre patrones y estructuras en datos sin etiquetas previas. Técnicas como clustering (K-Means) y reducción de dimensionalidad (PCA) permiten encontrar agrupaciones y relaciones ocultas.
Deep Learning
Subconjunto del Machine Learning que usa redes neuronales artificiales con múltiples capas ocultas. Capaz de aprender representaciones jerárquicas de datos complejos como imágenes, audio y texto.
LLM (Large Language Model)
Modelo de lenguaje de gran escala entrenado con cantidades masivas de texto. Capaz de generar, resumir, traducir y responder en lenguaje natural. Ejemplos: GPT-4, Claude, Gemini, LLaMA.
Overfitting
Cuando un modelo aprende los datos de entrenamiento "de memoria" en lugar de generalizar patrones. Funciona muy bien en el entrenamiento pero falla con datos nuevos. Se previene con regularización y más datos.
Red Neuronal Artificial
Sistema computacional inspirado en el cerebro humano, compuesto por nodos (neuronas artificiales) organizados en capas. Cada conexión tiene un peso que se ajusta durante el entrenamiento mediante backpropagation.
Sesgo Algorítmico
Error sistemático en las predicciones de un modelo de IA causado por suposiciones incorrectas en el algoritmo o datos de entrenamiento no representativos. Puede perpetuar o amplificar desigualdades existentes.
Transformer
Arquitectura de red neuronal basada en mecanismos de atención, publicada por Google en 2017. Procesa secuencias completas en paralelo (no paso a paso), logrando capturar dependencias de largo rango en texto. Base de los LLMs modernos.
Tokenización
Proceso de dividir texto en unidades más pequeñas (tokens) que el modelo puede procesar. Dependiendo del tokenizador, un token puede ser una palabra, subpalabra o carácter. Los LLMs tienen límites de contexto medidos en tokens.