Capacitación Intensiva en IABanco LAFISE · 2026
Sesión 2 de 3 · Gemini + Google Colab

Ciencia de Datos
con Gemini.

Gemini deja de ser asistente de oficina y se vuelve tu científico de datos: dialogas, él genera el código Python, lo ejecutas en Colab y juntos interpretan. Seis proyectos sobre datos del banco.

Antes de empezar02 / 27
Seis proyectos · ~4 horas

De la reseña al fraude:
datos del banco, razonados con IA.

01

Análisis de Sentimientos Avanzado (ABSA)Sentimiento por aspecto y emociones matizadas sobre reseñas de clientes.

NLP
02

Segmentación y Creación de PersonasClustering K-Means + PCA → arquetipos de cliente accionables.

Clustering
03

Campañas Hiper-PersonalizadasContenido multicanal + medición y optimización con A/B testing.

Marketing
04

Transacciones y Detección de AnomalíasIsolation Forest + generación de hipótesis sobre lo inusual.

Outliers
05

Optimización de Procesos con Six SigmaDMAIC guiado: de un problema a un plan de control.

DMAIC
06

Detección de Fraude con IA Explicable (XAI)XGBoost + SMOTE y explicaciones en lenguaje claro.

XAI
Cómo trabajamos hoy03 / 27
El ciclo de los 5 pasos

Tú diriges la estrategia. Gemini escribe el código.

1

Carga

Subes tu dataset (CSV) a Gemini o a Colab.

2

Dialoga

Le explicas qué quieres analizar, en lenguaje natural.

3

Genera

Gemini produce el código Python completo.

4

Ejecuta

Copias y corres el código en Google Colab.

5

Interpreta

Traes los resultados a Gemini para decidir el siguiente paso.

No necesitas ser programador: necesitas saber qué preguntar. El código es un medio; el criterio de negocio es tuyo.

Setup04 / 27
Tus dos herramientas

Gemini para pensar, Colab para ejecutar.

Gemini · gemini.google.com

Tu copiloto: interpreta el problema, genera código, explica resultados y propone el siguiente análisis. Carga el CSV con el botón "+".

Google Colab · colab.research.google.com

Cuaderno Python gratuito en el navegador, sin instalar nada. Pegas el código de Gemini y lo ejecutas con Shift+Enter.

Regla de datos en banca: trabaja con datasets anonimizados o sintéticos. Nunca subas datos reales de clientes ni PII a cuentas personales; usa el entorno corporativo aprobado.

📂 Datasets de los 6 proyectos — abrir en Drive ↗
Proyecto 0105 / 27
PROYECTO 01 — NLP

Análisis de
Sentimientos Avanzado.

No solo "positivo o negativo": identifica los aspectos que provocan la emoción y las emociones matizadas detrás de cada reseña de cliente.

AprendesPrompts NLP · ABSA · extracción de aspectos
SalidaDataFrame enriquecido + visualizaciones
Proyecto 01 Sentimiento por aspecto06 / 27
Lab
1A

De la emoción general al aspecto.

Herramienta Gemini · pega una reseña real del dataset
Objetivo
Clasificar el sentimiento y luego descomponerlo por aspecto: precio, atención, app, tiempos.
Antes
  1. Carga el dataset y pide a Gemini un script para ver las primeras filas, columnas y nulos.
  2. Copia una reseña y úsala en los prompts.
Prompt 1 · Clasificación

Actúa como experto en NLP. Dada esta reseña, clasifícala como positiva, negativa o neutra y da una puntuación de confianza del 1 al 100: [pega la reseña]

Prompt 2 · Aspectos

Analiza esta reseña y extrae los aspectos clave del producto o servicio que se mencionan. Reseña: [pega la misma reseña]

Proyecto 01 ABSA + automatización07 / 27
Lab
1B

Sentimiento por aspecto, a escala.

Herramienta Gemini → Colab
Prompt 3 · ABSA

Combina los pasos: para cada aspecto identificado, asigna un sentimiento específico. Presenta el resultado en una tabla. Reseña: [pega la reseña]

Prompt 4 · Emociones matizadas

Identifica emociones más específicas como frustración, sorpresa o satisfacción en esta reseña y explica tu razonamiento. Reseña: [pega la reseña]

Automatiza sobre todo el dataset

Genera un script de Python que aplique los prompts anteriores a toda la columna de reseñas. El resultado: un DataFrame con la reseña original, el sentimiento general, los aspectos y el sentimiento por aspecto.

Y luego visualizaPide 3 gráficos con Matplotlib o Seaborn que resuman el análisis (aspectos más mencionados, distribución de sentimiento, emociones).
Proyecto 0208 / 27
PROYECTO 02 — CLUSTERING

Segmentación y
Creación de Personas.

Agrupar clientes con K-Means y, sobre todo, traducir esos grupos en "personas" de marketing accionables con una estrategia por cada una.

AprendesK-Means · PCA · método del codo
SalidaPersonas + estrategia por segmento
Proyecto 02 Modelado09 / 27
Lab
2A

Explorar y agrupar.

Herramienta Gemini → Colab
Objetivo
Entender los datos (EDA) y encontrar el número óptimo de segmentos con el método del codo.
VisualizaSi los datos tienen más de 2 dimensiones, pide reducir con PCA a 2 y graficar los clusters en un scatter plot.
Prompt · EDA

Ya cargué mi dataset de clientes. Genera un script de Python para un EDA: histogramas de las variables numéricas y un mapa de calor de correlaciones.

Prompt · K-Means

Genera el código para aplicar K-Means. Incluye preprocesamiento con StandardScaler y el método del codo para elegir el número óptimo de clusters.

Proyecto 02 De cluster a persona10 / 27
Lab
2B

El número se vuelve persona.

Herramienta Gemini · con las estadísticas de cada cluster
Objetivo
Convertir estadísticas frías en arquetipos con nombre, motivaciones y frustraciones — y una estrategia por cada uno.
Resultado esperadoUna persona por segmento + una táctica de marketing específica para cada una.
Prompt · Crear persona

Actúa como estratega de marketing. Segmenté mis clientes en [X] grupos. Con las características promedio de cada uno, crea una persona detallada (nombre, estilo de vida, motivaciones, frustraciones). Cluster 1: [pega las estadísticas]

Prompt · Estrategia

Basado en las personas que creamos, sugiere una estrategia de marketing específica para cada una.

Proyecto 0311 / 27
PROYECTO 03 — MARKETING

Campañas
Hiper-Personalizadas.

Usar las personas del proyecto anterior para que Gemini genere contenido multicanal, y luego medir la campaña con datos reales para optimizar.

AprendesCopywriting con IA · A/B testing · optimización
SalidaContenido + conclusiones accionables
Proyecto 03 Generación creativa12 / 27
Lab
3A

Una persona, una campaña multicanal.

Herramienta Gemini
Prompt · Brief creativo

Actúa como director creativo. Lanzaremos una campaña para la persona '[Nombre]'. Perfil: [pega la descripción]. Objetivo: [ej. vender producto X]. Tono: [ej. cercano y confiable].

Prompt · Email + A/B

Escribe el texto de un email de marketing con asunto atractivo, cuerpo persuasivo y CTA clara. Dame dos versiones del asunto para un A/B test.

Prompt · Redes y anuncio

Crea 3 publicaciones para Instagram (copy + tipo de imagen + 5 hashtags) y el texto de un anuncio de Google Ads (Título 1, Título 2, Descripción) para esta misma campaña.

Itera"Me gusta la versión 1 del email, pero hazlo más conciso y añade un sentido de urgencia."
Proyecto 03 Medición y optimización13 / 27
Lab
3B

¿Qué versión ganó, y por qué?

Herramienta Gemini → Colab
Prompt · Métricas

Ya cargué los resultados de la campaña. Genera un script de Python para resumir las métricas clave (tasa de apertura, CTR, conversiones).

Prompt · Interpretación

Actúa como analista de marketing digital. Resultados de la campaña: [pega las métricas]. ¿Qué conclusiones sacamos? ¿Qué versión del A/B ganó y por qué?

Prompt · Optimización

El factor [ej. el asunto del email] parece el más influyente. Sugiere 3 ideas para optimizarlo en la próxima campaña, dirigidas a la misma persona, con el razonamiento de cada una.

Cierre del cicloLas conclusiones alimentan la próxima campaña. Marketing basado en datos, no en intuición.
Proyecto 0414 / 27
PROYECTO 04 — OUTLIERS

Transacciones y
Detección de Anomalías.

Más allá del fraude obvio: encontrar anomalías sutiles en el comportamiento de gasto y razonar hipótesis plausibles para cada una.

AprendesIsolation Forest · EDA · generación de hipótesis
SalidaReporte de anomalías + hipótesis
Proyecto 04 Detección15 / 27
Lab
4A

Marcar lo que se sale del patrón.

Herramienta Gemini → Colab
Prompt · Preparar datos

Ya cargué mi dataset de transacciones. Genera un script que verifique los tipos de datos (convierte la fecha si hace falta), resuma las estadísticas de los montos y muestre las categorías de comercio más comunes.

Prompt · Isolation Forest

Genera el código para implementar Isolation Forest en mi dataset. El script debe marcar las transacciones anómalas.

Prompt · Preguntas de negocio

Estoy analizando este dataset de transacciones. Sugiere 5 preguntas de negocio que podría responder y, para cada una, el código de análisis o visualización.

Siguiente pasoEjecuta en Colab y obtén la lista de transacciones marcadas como anómalas para la slide siguiente.
Proyecto 04 Razonamiento16 / 27
Lab
4B

El modelo marca; Gemini explica.

Herramienta Gemini
Objetivo
Una anomalía no es culpa. Generar varias hipótesis (de fraude a cambio de vida) antes de juzgar.
Resultado esperado3 hipótesis plausibles por transacción anómala + un reporte que las resuma.
Prompt · Hipótesis

Mi modelo marcó esta transacción como inusual: [pega los detalles]. El patrón normal del cliente es [descríbelo]. Actúa como analista financiero: genera 3 hipótesis plausibles (desde fraude hasta un cambio de estilo de vida) para explicarla.

Proyecto 0517 / 27
PROYECTO 05 — DMAIC

Optimización con
Six Sigma e IA.

Simular un proyecto de mejora de procesos con Gemini como consultor experto en cada una de las 5 fases del método DMAIC.

AprendesDMAIC · causa raíz · brainstorming asistido
SalidaCharter + plan de control
Proyecto 05 Las 5 fases18 / 27
Gemini como facilitador DMAIC

De un problema difuso a un plan de control.

D

Definir

"Ayúdame a redactar un Project Charter para el problema '[X]', con alcance y objetivos SMART."

M

Medir

"¿Cuáles son los KPIs clave? Genera el código para calcular las métricas de rendimiento actuales."

A

Analizar

"Guíame en un análisis de causa raíz (Ishikawa, 5 Porqués). Facilita el brainstorming de causas."

I

Mejorar

"Genera 5 soluciones posibles y evalúa impacto y facilidad de implementación de cada una."

C

Controlar

"Diseña un plan de control para que la mejora '[solución]' se mantenga en el tiempo."

Cómo se usa

Un prompt por fase. Carga primero el dataset y pide a Gemini definir 3 posibles problemas; elige uno.

Proyecto 0619 / 27
PROYECTO 06 — XAI

Detección de Fraude
con IA Explicable.

Construir un modelo de fraude robusto y, lo más importante, traducir sus decisiones a explicaciones que un analista no técnico pueda accionar.

AprendesXGBoost · SMOTE · IA explicable (XAI)
SalidaModelo + alertas explicadas + dashboard
Proyecto 06 El modelo20 / 27
Lab
6A

Un clasificador para datos desbalanceados.

Herramienta Gemini → Colab
Objetivo
El fraude es raro: por eso usamos SMOTE para balancear y métricas como Recall, no solo exactitud.
Resultado esperadoUn modelo entrenado con su evaluación: Precisión, Recall y curva ROC.
Prompt · Modelo completo

Genera un script de Python completo para detección de fraude: preprocesamiento, manejo del desbalance con SMOTE, entrenamiento de un modelo XGBoost y evaluación con Precisión, Recall y curva ROC.

Proyecto 06 Explicabilidad21 / 27
Lab
6B

Una alerta que el analista entiende.

Herramienta Gemini
Objetivo
Un modelo que dice "fraude" sin explicar es inútil en banca. Traducir el porqué a lenguaje claro.
Y un dashboardPide a Gemini un boceto en HTML/CSS de un panel de alertas, con un botón "Ver explicación" por cada una.
Prompt · Explicación XAI

Mi modelo marcó una transacción como fraudulenta con 95% de probabilidad. Las 3 características más influyentes: Monto=$5,000 (promedio del cliente $50), Hora=3:15 AM, Ubicación=país nuevo. Actúa como sistema de alerta: explica en lenguaje no técnico por qué es sospechosa y qué pasos debe seguir el analista.

Cierre22 / 27
RECAP — SESIÓN 02

Seis proyectos de datos,
sin escribir código desde cero.

NLP

Escuchaste

Sentimiento por aspecto y emociones en las reseñas de tus clientes.

Segmentaste

Clusters convertidos en personas con estrategia, y campañas medidas con A/B.

Protegiste

Anomalías, mejora de procesos DMAIC y fraude explicado en lenguaje claro.

Para llevar23 / 27
El patrón que se repite

Data science conversacional: cuatro movimientos.

  • Explora primero. Pide siempre un EDA antes de modelar: filas, nulos, distribuciones.
  • Pide el código completo. "Genera un script de Python que…" — y ejecútalo en Colab.
  • Trae los resultados de vuelta. Gemini interpreta números, gráficos y métricas.
  • Cierra con negocio. "¿Qué decisión tomo con esto?" — el modelo propone, tú decides.

El mismo ciclo sirve para morosidad, churn, pricing o riesgo. Cambias el dataset y la pregunta; el método es el mismo.

Para llevar Datos24 / 27
No negociable con datos del banco

Modela con datos sintéticos o anonimizados.

  • Nunca PII real en cuentas personales. Anonimiza o usa datos de muestra.
  • Entorno aprobado. Para datos reales, el equipo de datos del banco define dónde y cómo.
  • Valida el código antes de correrlo. La IA puede equivocarse; lee lo que vas a ejecutar.
  • Reproducibilidad. Guarda el cuaderno de Colab: el análisis debe poder repetirse y auditarse.
Lo que viene25 / 27
Próxima parada

Sesión 3 — Multimodalidad Avanzada.

§

Contratos

Análisis de contratos y documentos legales con visión nativa y NotebookLM.

Imagen y Veo

Marketing visual: logos, fotorrealismo, doble exposición y video.

Gems y código

Asistentes a medida (Cumplimiento, Legal, Onboarding) y micro-herramientas.

Para llevar Recursos26 / 27
Enlaces de la sesión

Lo que usaste hoy, en un solo lugar.

  • Gemini. gemini.google.com — carga datasets con el botón "+".
  • Google Colab. colab.research.google.com — ejecuta el código sin instalar nada.
  • Datasets de los 6 proyectos. Carpeta de datasets en Drive — cada proyecto enlaza también al suyo.
  • Hub del workshop. lafise-ia.rizo.ma — las tres sesiones.
Fin de la Sesión 2Banco LAFISE · 2026
Gracias

Ya tienes un científico
de datos a tu lado.

El código dejó de ser la barrera. Lo que te separa de un análisis ahora es la pregunta correcta — y esa la haces tú.