MÓDULO IA · CONCEPTOS
Conceptos Técnicos de IA
IA Débil vs. Fuerte, Machine Learning, Deep Learning y Procesamiento del Lenguaje Natural explicados con claridad.
IA Débil vs. IA Fuerte
🔧
IA Débil (Narrow AI)
Diseñada para realizar una tarea específica con gran precisión. No posee
comprensión general ni consciencia. Ejemplos: reconocimiento facial,
motores de recomendación de Netflix, asistentes de voz. Es la IA que
existe hoy en producción.
🧠
IA Fuerte (AGI)
Hipotética IA con capacidades cognitivas equivalentes o superiores a las
humanas en cualquier dominio. Podría aprender, razonar y adaptarse
sin instrucción específica. Actualmente no existe; es objeto de debate
filosófico y científico intenso.
Machine Learning vs. Deep Learning
| Aspecto |
Machine Learning (ML) |
Deep Learning (DL) |
| Definición |
Algoritmos que aprenden patrones desde datos sin ser programados explícitamente. |
Subconjunto del ML con redes neuronales profundas (múltiples capas ocultas). |
| Datos requeridos |
Funciona bien con datasets medianos y características definidas manualmente. |
Requiere grandes volúmenes de datos; extrae características automáticamente. |
| Poder de cómputo |
Bajo a moderado; ejecutable en CPU convencional. |
Alto; típicamente requiere GPU o TPU para entrenamiento. |
| Interpretabilidad |
Alta (árboles de decisión, regresión logística son legibles). |
Baja; las redes profundas son "cajas negras". |
| Casos de uso |
Clasificación, regresión, detección de anomalías, clustering. |
Visión computacional, NLP, generación de imágenes, LLMs. |
| Ejemplos |
Random Forest, SVM, K-Means, XGBoost. |
ResNet, GPT-4, DALL·E, Claude, Stable Diffusion. |
Procesamiento del Lenguaje Natural (PLN / NLP)
💬
¿Qué es el PLN?
Rama de la IA que permite a las máquinas comprender, interpretar y generar
lenguaje humano. Combina lingüística computacional con modelos estadísticos
y de aprendizaje profundo para procesar texto y voz.
🏗️
Arquitectura Transformer
Mecanismo de "atención" que permite al modelo considerar el contexto completo
de una secuencia de texto, no solo la palabra anterior. Base de BERT,
GPT, T5 y todos los LLMs modernos.
🔍
Tareas del PLN
Análisis de sentimiento, traducción automática, resumen, extracción de
información, respuesta a preguntas, generación de texto, clasificación
de documentos y reconocimiento de entidades nombradas (NER).
🔒
PLN en Ciberseguridad
Detección de phishing mediante análisis semántico, clasificación de logs
de seguridad, extracción automática de indicadores de compromiso (IoC) y
análisis de código malicioso en reportes de amenazas.
Redes Neuronales Artificiales
Inspiradas en el cerebro biológico, las redes neuronales son el motor del deep learning.
Comprender su estructura es clave para entender cómo funcionan los modelos modernos.
🏗️
Estructura de una Red Neuronal
Compuesta por neuronas artificiales organizadas en capas:
capa de entrada (recibe datos), capas ocultas (procesan información mediante pesos y sesgos),
y capa de salida (produce el resultado). Cada conexión tiene un peso que se ajusta durante el entrenamiento.
⚡
Funciones de Activación
Determinan si una neurona "se activa" o no. ReLU (Rectified Linear Unit) es la más común
en capas ocultas. Sigmoid y Softmax se usan en la salida para probabilidades.
Sin activaciones no lineales, la red solo podría aprender relaciones lineales simples.
🔄
Backpropagation y Gradient Descent
Backpropagation calcula cómo cada peso contribuyó al error.
Gradient Descent ajusta los pesos iterativamente para minimizar la función de pérdida.
Es el algoritmo que permite a la red "aprender" de sus errores.
🧠
Deep Learning: Redes Profundas
Cuando una red tiene muchas capas ocultas (docenas o cientos), se considera "profunda".
Estas arquitecturas pueden aprender representaciones jerárquicas complejas:
desde bordes simples en imágenes hasta conceptos abstractos en texto.
Large Language Models (LLMs)
Los modelos de lenguaje de gran escala han revolucionado el procesamiento del lenguaje natural
y son la base de asistentes como ChatGPT, Claude y Gemini.
📝
Tokens y Contexto
Los LLMs procesan texto dividiéndolo en tokens (palabras, subpalabras o caracteres).
El context window es la cantidad máxima de tokens que el modelo puede procesar
simultáneamente (4K-200K+ en modelos modernos). Esto determina cuánta información puede "recordar"
en una conversación.
🎯
Predicción de Tokens
Un LLM predice el token más probable que sigue dado el contexto previo.
Técnicas como temperature y top-p sampling controlan la creatividad
vs. determinismo de las respuestas. A mayor temperatura, respuestas más diversas e impredecibles.
🔧
Fine-tuning y Prompt Engineering
Fine-tuning adapta un modelo pre-entrenado a tareas específicas con datos propios.
Prompt engineering guía el comportamiento del modelo mediante instrucciones
bien diseñadas, sin necesidad de reentrenar. Técnicas como few-shot learning mejoran resultados.
⚠️
Limitaciones y Alucinaciones
Los LLMs pueden generar información plausible pero incorrecta (alucinaciones).
No tienen conocimiento actualizado post-entrenamiento y carecen de razonamiento causal verdadero.
Siempre requieren supervisión humana en aplicaciones críticas.
IA en la Nube
Los proveedores cloud ofrecen servicios de IA/ML que eliminan la necesidad de gestionar
infraestructura de entrenamiento, democratizando el acceso a modelos sofisticados.
☁️
Amazon SageMaker
Plataforma completa de ML en AWS para entrenar, desplegar y escalar modelos.
Soporta frameworks populares (TensorFlow, PyTorch, Scikit-learn) y ofrece
SageMaker JumpStart con modelos pre-entrenados listos para usar. Integración nativa
con S3, Lambda y otros servicios AWS.
🔵
Google Vertex AI
Suite unificada de Google Cloud para ML. Incluye AutoML (entrenamiento sin código),
Vertex AI Workbench (notebooks Jupyter), y acceso a modelos de foundation como PaLM y Gemini.
Integración con BigQuery para datos analíticos.
🟦
Azure Machine Learning
Servicio de Microsoft para el ciclo completo de ML. Destaca por integración con
herramientas empresariales, MLOps automatizado, y Azure OpenAI Service que proporciona
acceso a modelos GPT con seguridad y compliance empresarial.
🚀
APIs de IA como Servicio
Servicios pre-construidos para casos comunes: Rekognition (visión), Polly (voz),
Translate, Comprehend (NLP) en AWS; Vision AI, Natural Language en Google Cloud;
Computer Vision, Speech Service en Azure. Ideal para integrar IA sin expertise en ML.
Casos de Uso en Ciberseguridad
La IA está transformando la ciberseguridad tanto en defensa como en ataque.
Entender ambos lados es fundamental para proteger sistemas modernos.
🛡️
IDS Inteligente (NIDS)
Sistemas de detección de intrusiones basados en ML analizan patrones de tráfico
de red para identificar comportamientos anómalos sin depender de firmas conocidas.
Detectan zero-days y ataques personalizados que evaden reglas tradicionales.
📜
Análisis de Logs con NLP
Los LLMs procesan millones de logs no estructurados para extraer insights,
correlacionar eventos entre sistemas dispares y generar resúmenes ejecutivos
de incidentes. Reduce el tiempo de análisis de horas a minutos.
🦠
Detección de Malware con ML
Análisis estático de binarios mediante técnicas de deep learning identifica
malware sin ejecutarlo. Redes convolucionales analizan bytes como imágenes;
LSTMs detectan secuencias maliciosas en código polimórfico que muta para evadir firmas.
🎣
Detección de Phishing
Modelos de NLP analizan semántica, estructura y metadatos de correos para detectar
phishing avanzado, incluso cuando no hay URLs maliciosas obvias. Detectan ingeniería
social y suplantación de identidad mediante análisis de lenguaje.
El doble filo: Los atacantes también usan IA para generar
malware polimórfico, phishing hiperrealista con deepfakes, y
ataques de ingeniería social automatizados. Defender requiere entender el arsenal
del adversario. La IA no reemplaza al analista de seguridad: lo potencia.