# GLOSSARY — Workmed Diagnóstico

Canonical spellings + common STT misrecognitions observed across sessions.
Append as new terms appear. Apply during transcript cleanup via `apply_glossary.py`.

Language context: **Chilean Spanish**, strong technical/medical vocabulary.

## Companies

| Canonical | Role | Misheard as |
|---|---|---|
| **Workmed** | client organization (occupational-health services) | Warmed, Walmart, Volver, Gourmet, Wordberg, Wolver, WARMED, World Med (when referring to company not lab), WebMed, Word West, Wegman, WordMate, Workmax, Warpe |
| **Emercom** | consulting firm running the diagnostic | ercom, amercum, Mercom, sitio de Emercom→soy de Emercom |

## People (Workmed internal)

| Canonical | Role | Misheard as |
|---|---|---|
| **Pablo Martínez** | subgerente de Operaciones | — |
| **Pamela Lastra** ("Pame") | jefa de Abastecimiento (compras + bodega + administración contrato Codelco) | la pame, la PME, la PAME, la PAH me, pamewon |
| **María Ignacia Sandoval** | jefa Centro Manuel Montt (Santiago), ~45% preocupacional | María Cira, Ignacia, Marín Gascón, Mar y Ignacia |
| **Mónica Pérez** | PMO, lidera iniciativas TI / proyectos | Monreal, Mon, gatita |
| **Max Dollmann** | CEO de Workmed (aprueba inversiones en comité con Ricardo Jorquera) | Max, Marx |
| **Ricardo Jorquera** | Director | Ricardo Zurquiana, Ricardo Torquera, Ricardo Turquiana |
| **Juan Pablo Coustasse** | CFO de Workmed (aprueba OCs entre 1M y 3M) | Custase, Custacer, Custasse |
| **Claudio Jorquera** | Contralor, aprueba OCs sobre 3M | Claudio Jorge |
| **Vicente Rivano** | subgerente UCI / Contraloría | Vicente Ribas |
| **Ignacio Ahumada** | analista, valoriza producción | Ignacio Ignacio, Ignacio Gómez, Ignacio Muñoz (sess 12), "Inés" (sess 12, contextual al cierre de reunión), "Oye Nacio", "Oleg Nacio" (sess 12, vocativo "Oye, Ignacio" mal segmentado) |
| **Ana María Cambón** | directora de calidad | — |
| **Carolina Araya** | CTO Workmed | Carolina, Carolina Raya |
| **Rodrigo Llancao** | Jefe Desarrollo BI y Análisis de Datos en Workmed (trabaja con Carolina Araya; implementó script Python para valorización de producción) | yangkau, Yancow, Yan Ko, "y Anka" (contextual), Llancau, Yancao, Mendoza (sess 7 "Rodrigo Mendoza"), Rodney (sess 12) |
| **Barbarita Lara** (Emercom) | CEO | Berberita Lara, Barberita lera, Verberita, **Margarita** (mishear consistente, todas las sesiones), **Bernardita** (mishear consistente), hermanita (vocativo sess 12) |
| **Roberto Carvajal** (Emercom) | CTO — lleva las preguntas | Roberto (solo) |
| **Data Specialist** (Emercom) | Análisis de datos del diagnóstico | — |
| **Project Engineer** (Emercom) | Apoyo técnico al levantamiento | — |
| **Eduardo González** | Subgerente de Proyectos y Transformación Digital (Workmed). Da acceso a la base de datos / read-replica AWS (sess 12). Apoya a Pablo Martínez en proyectos de integración entre sucursales | — |

### People — TBD (recurrentes en transcripts pero pendientes confirmación de apellido / rol)

- **Patricia Maturana** ("Paty") — jefa de Agendamiento; única autorizada a modificar el módulo de Agendamiento en FlowMed (sess 2). Crítica de incluir en próximas sesiones de profundización.
- **Karina Jara** — subgerenta de Reclutamiento y Selección (creación de usuarios empresa, sess 6).
- **Ninoska, Daniel** — equipo R&S Workmed; revisores de fichas en plataforma interna (sess 6). Apellidos pendientes.
- **Andrea Méndez** — ejecutiva comercial, dueña de cartera (sess 9). Apellido a confirmar.
- **Christian Urbina** — encargado de infraestructura (servidor on-premise Manuel Montt + relación con proveedor legacy de FlowMed).
- **Felipe** — referencia esporádica (sess 5, sess 8). Apellido / rol pendientes.
- **Lola** — citada por Vicente Rivano como parte de su línea de reporte junto a Maxi (Dollmann) y Ricardo (Jorquera) en sess 8. Posible CFO/COO; apellido + rol pendientes.
- **Juan Pablo San Martín** — apoya documentación (sess 3 Agendamiento). Rol pendiente.

### Hypothetical example names used in audio (NO sustituir)

- **Carolina Cecilia Reyes Espinoza** (sess 3 L32) — nombre ficticio que María Ignacia usa para ilustrar el concepto MPI (mismo RUT, distintas empresas). NO es persona real. Confirmado por usuario 2026-04-25.

## Client organizations mentioned

- **Fluor Salfa** — major mining-sector client of Workmed (Chilean joint venture). STT hears "Fluor Salpa", "FluorSalpa", "Fluorsalpa". Loose references to just "Fluor" in the audio refer to the same company.
- **BHP** (aka **BHP Billiton**, misheard as "BHP Coll Boon")
- **MEL** — Minera Escondida Limitada (BHP), faena minera referenciada como destino frecuente de contratistas. Misheard as "Mel a", "Mel" suelto
- **Anglo American**
- **IST** (Instituto de Seguridad del Trabajo)
- **Ingeniería Alto Sur** — heard as "ingeniería al tosú", "Ingeniería Altozú"
- **ASAP** — cliente con formulario especial (baterías acotadas)
- **AMSA** — Antofagasta Minerals (faena minera; aparece como campo de "faena"). Misheard as "ANSA"
- **Codelco** — Corporación Nacional del Cobre (Chile, estatal). Workmed administra un policlínico en faena Codelco como contrato licitado. Misheard as "coelco", "code", "code con ventanas" (= **Codelco Ventanas**, refinería específica)
- **El Teniente** — división Codelco. Aparece como centro de costo recurrente
- **El Abra** — joint venture Codelco/Freeport. Aparece como centro de costo recurrente
- **Spence** — Minera Spence (BHP, Sierra Gorda). Faena destino frecuente de contratistas Workmed (sess 7)
- **Centinela** — Minera Centinela (AMSA). Aparece en homologación con puntos de corte propios (sess 8)
- **Mercado Libre** — cliente con policlínico dedicado en sus instalaciones
- **Gas Atacama** — empresa energética chilena (filial de Engie). Cliente / faena
- **Manpower / Talent Finder / Line** — empresas de servicios transitorios (staffing); envían trabajadores a evaluaciones preocupacionales como "empresas de glosa"
- **Colbún** — generadora eléctrica chilena, citada como ejemplo de cliente con plataforma de habilitación de contratistas onerosa
- **Syncore** — gran cliente de Workmed; tiene programa propio "Salud Compatible" (ficha de seguimiento por enfermera) y power BI propio para riesgo. Misheard as "5" (Meet, lo confunde con un dígito), "Sincor", "Syncor", "sincorp", "Sincord", "Syncord" (xAI), "Simcorp" (sess 12)

## Labs / partners

Workmed integra con sistemas externos especializados por categoría (RIS / LIS / drug testing). Mapeo proveedor → categoría:

**RIS (Radiology Information System):**
- **Galen** — RIS contratado para imagenología (envío de orden al equipo rayo, almacenamiento de imagen, visualizador certificado)

**LIS (Laboratory Information System) — partners de laboratorio:**
- **Bionet** (Santiago)
- **LaboCenter** (Santiago) — heard as "Lavo Center", "LavoCenter", "LaborCenter", "Labor Center"
- **LabNostic**
- **Blanco** (Calama) — referido en audio como "el laboratorio Blanco"

**Drug testing:**
- **TSCom** — proveedor de drug testing de Workmed. Plataforma integrada con SACMed: la data del test fluye TSCom → SACMed (por eso aparece referenciada como "el SACMed" en flujos de drogas). Misheard as "Tescom" (sess 4)

**Otros proveedores / partners:**
- **Red Salud** (centros acreditados)
- **CEMA** — proveedor electrocardiógrafos / espirometría
- **IMED** — proveedor de insumos de oficina; permite envío directo a sedes (bypass de la bodega central). Misheard as "dime", "dimed", "dinamex", "DIMEX", "Dymex"
- **RobleLabs** — proveedor de validación biométrica (huella + reconocimiento facial) usado en preadmisión + estación de drogas. Misheard as "Roderick", "Roblegas" (sess 1)
- **SignAPIS** — proveedor de firma electrónica usado en preadmisión digital. Misheard as "Signapys", "eDigital" (sess 4 — eDigital era el nombre incorrecto que se le adjudicaba a la empresa)
- **SECCERT** — TBD canónico. Plataforma de onboarding/doc-management para contratistas (sess 8). Spelling pendiente confirmación

## Systems / software

| Canonical | Purpose | Misheard as |
|---|---|---|
| **FlowMed** | SaaS central de Workmed: gestiona intake (agendamiento), processing (operación admisión + atención) y reporting al cliente. Producto core de Workmed = informe de aptitud generado desde aquí. Flujo de datos hacia el HIS: FlowMed → SACMed | flowment, flowmet, Frommer, Flow Med, Flowmer, FlowMyth, FlowNet, Flowman, Florent, FlowMate, flometh, Flowmed (case), Flome, Flok, bare "Flow" en contexto de "sistema", "Florida" / "Flo" en contexto del sistema (no auto-sustituir: "Florida" puede ser un lugar real), flomen, florem, FLOMET, FLOMAX, FlowMint, FlowMe (sin 'd'), FlowMatch, flowmat, "flow bed", "flow net", "flow map", "flow meta", flotamiento (contextual con Secall), Bloom / Blummer (contextual: "X va a buscar estos datos" — ETL automático de FlowMed a Contraloría), gormenghast (sess 12, xAI inventa nombre propio extranjero) |
| **Secall** | empresa proveedora del SaaS FlowMed; AWS-hosted database de Workmed corre bajo Secall | SQL, Sequal, Sea Cal, C cal, Cecal, Seccal, "el seca" (sess 12) |
| **HubSpot** | CRM donde aterrizan los correos de agendamiento (cola "agenda por confirmar") | Haspot, Haspód, Hasp, Has-For, Hasbro, Haspol, Caspurs, Caspott, caspos, hotspot (en este corpus nunca es Wi-Fi), hassbot, "casco" (contextual: "cargar a casco", "casco es la plataforma"), caspote (sess 5), Hadoop (sess 12, xAI sustituye con homófono) |
| **Power BI** | herramienta de visualización donde Ignacio Ahumada arma los dashboards diarios | panel vial / paneles viales (Meet), Power viewer, Bauer VI, Parvya, "para pie" (xAI) |
| **SACMed** | SaaS de ficha clínica electrónica — el HIS contratado por Workmed para sus centros propios. **Almacena los datos clínicos del paciente.** Recibe data de partners integrados (TSCom, RIS Galen, LIS) y de FlowMed (via ETL en módulo Contraloría) | sascmed, Sasmed, ZAGMED, Sagemed, ZagMed (anterior canónico incorrecto), Cesmed, Cesnec |
| **Megafy** | empresa proveedora del SaaS de preadmisión digital (la plataforma corre sobre Appian Cloud) | Megafile, MegaFive, MegaFai, Mega Five, megafive, MedaFit |
| **Appian Cloud** | plataforma SaaS low-code (Megafy construye sobre ella la preadmisión digital) | appiant cloud, appian cloud, Apia, Avian |
| **HIS** | Hospital Information System — categoría de SaaS para gestión clínica de los centros propios. En Workmed el HIS contratado es SACMed | SIC, gci, His, H I S, GIS (mispronunciación recurrente en audio, no solo STT) |
| **RIS** | Radiology Information System — categoría de SaaS para los partners de imagenología (envío de orden al equipo rayo, almacenamiento de la imagen, visualizador certificado) | — |
| **LIS** | Laboratory Information System — categoría de SaaS para los partners de laboratorio (Bionet, LaboCenter, laboratorio propio de Workmed) | — |
| **Softland** | ERP chileno (competencia de Defontana). Citado como espejo arquitectónico de Defontana | Soflan, Softan, Sofland |
| **HL7** | estándar integración salud | h l 7 |
| **FHIR** | estándar de intercambio | — |
| **OneDrive** | repositorio de carpetas físicas digitalizadas | onedrive |
| **EDP** (Estado de Pago) | documento previo a la facturación que se envía al cliente; ciclo de aprobación de ~5 días por iteración antes de emitir factura | LP, EDP (no auto-sustituir "LP": término demasiado corto para regex seguro) |
| **Defontana** | ERP/plataforma donde se gestiona facturación, inventario y existencias (área de finanzas / abastecimiento) | de Fontana, defontana, Desfont, fontanens, Fontana (suelto, contextual), "la fontana" (contextual: cuando se enumera junto a otros sistemas) |
| **SharePoint** | repositorio de archivos de centros acreditados | Sharepoint |
| **Supabase** | backend-as-a-service (Postgres) usado por Rodrigo para mover bases desde Excel | su país, supa base, supabes |
| **Buk** | SaaS chileno de RR.HH. y nómina; usado por área de personas (paralelo a Defontana en finanzas) | Book, HBook, buc |
| **NetSuite** | ERP Oracle; proyecto de implementación fallido en Workmed (citado como contexto histórico en sess 5) | Net Suite, netsuite |
| **n8n** | plataforma de automatización (workflow engine) usada por Rodrigo Llancao en conjunto con Supabase | n ocho n, en ocho en |
| **Streamlit** | framework Python para dashboards / apps internas; usado por Rodrigo Llancao | stream lit, streamlit |
| **Microsoft Forms** | herramienta actual para cuestionarios de Salud Mental y otros formularios | formularios de Microsoft, ms forms |
| **GCP** | Google Cloud Platform — nueva instancia donde reside SACMed entre otros | gcp, ge ce pe |
| **PACS / RIS-PACS** | Picture Archiving and Communication System; almacenamiento de imágenes de imagenología, par natural de RIS (sess 2) | packs, RIS PACS |
| **Wonderlic** | test psicométrico canónico aplicado en evaluaciones psicológicas (sess 6) | wonderlick, wonderly |
| **ODS** | Operational Data Store — proyecto interno de TI para consolidar datos. NO confundir con "Objetivo de Desarrollo Sostenible" (chiste recurrente en sess 2) | O D S, odis |
| **AWS** | Amazon Web Services — Workmed mantiene la read-replica de FlowMed/Secall en AWS RDS (cuenta propia, separada de la cuenta del proveedor). En audio sess 12 aparece como "WBS" (mishear del acrónimo) | w b s, WBS, web s |
| **GenieMD** | Plataforma de EE.UU. para gestión de pacientes crónicos — reemplazará la "ficha salud compatible" actual (sess 1, sess 2). Hoy día está en piloto, sin integración con FlowMed | Jenny MD, jeniemd |
| **Tivendo** | POS / módulo de caja, fabricado por Defontana (parte del ecosistema Defontana). Citado en sess 5 | Divendo, Devendo |
| **subgerencia** | unidad organizativa estándar (subgerente). Recurrente como "subquerencia" por mishear de xAI en sess 5 | subquerencia |

## Domain terms (Chilean Spanish)

- **Ley 16.744** — ley de prevención de riesgos y accidentes del trabajo (original says "16000"; verify 16.744 vs 16.000 in audio)
- **preocupacional** / **ocupacional** — types of occupational-health exam
- **Marina Mercante** — industria/sector (tripulantes navales). Aparece como nombre de batería preocupacional especializada que NO aplica a la mayoría de los clientes mineros de Workmed. Misheard as "Marlene Marcante", "Marina marcante", "marca miren Marina marcante"
- **RUT** — Chilean national ID (audio often says "el root")
- **homologación** — inter-lab normalization of exam criteria
- **Contraloría Médica** — internal unit that emits the final fitness report
- **conductor vehículo liviano** — examen de batería preocupacional para conducción de vehículos livianos. Misheard as "conducto ureteral dilatado" (xAI), "conductor lactaniliar" (Meet)
- **Protocolo PENS** — Protocolo de Evaluación Neurosensorial. Batería compleja (perfil lipídico, hemograma, antropometría, electro, etc.), contrastada con la "batería básica". Misheard as "protocolo Spence" (Meet), "protocolo SPES" (xAI)
- **InDesign** — Adobe InDesign, donde Vicente diagrama el flujo de Contraloría como una "foto". Misheard as "siggy" (Meet), "Visage" (xAI)
- **audiometría** — examen auditivo estándar en baterías preocupacionales. Misheard as "diómetro" (xAI), "biometría" (Meet) — confirmar caso a caso antes de sustituir, porque "biometría" puede ser válida en otros contextos
- **al ojímetro** — Chilean idiom for "by eyeballing it" / imprecisely (no measurement, just gut feel). Misheard as "a logímetro", "a lo Jiménez".
- **peras y manzanas** — modismo "cosas de distinta naturaleza, no comparables". Misheard as "Pere Manzano" (xAI), "Espere manzana" (Meet). NO es nombre de persona.
- **core** — anglicismo usado en sentido de "central / núcleo del problema" (no el sistema "core banking" ni Corea). Misheard como "Corea" (xAI). Contextual: aparece en frases tipo "es core, va a empezar a ver…".
- **viewer** — herramienta/visualizador donde Roberto le mostraba algo al equipo durante la reunión. Misheard como "delivery" (xAI). Contextual: "lo que te mostraba antes en el viewer".
- **cachái** — Chilean filler meaning "do you understand?" / "you know?". Normalize all STT variants (`cachay`, `cachaos`, `cachaé`, `cachaéis`, `cachar`, `cachet`, `caché`, `cachalote`, `catch it`, `Catch AI`, `catcha`, `Cupay`, `achaé`, `chama`, `¿caes?`, `¿estáis?`) to **cachái**.
- **carro de paro** — equipamiento clínico de emergencia (resucitación). Misheard as "carboheparo".
- **DEA** — Desfibrilador Externo Automático. Aparece en plural "parches de DEA" (consumible caro, ~$300k, vida útil corta). En audio: "parches de a", "parches de dea".
- **SUSESO** — Superintendencia de Seguridad Social (Chile, regulador laboral). Junto con IST y la Mutual, autoridades sectoriales que regulan precios de baterías y normativas de salud ocupacional (sess 7).
- **ACHS** — Asociación Chilena de Seguridad (mutualidad). En audio aparece como "sesiones de seguridad" (mishear consistente). Junto con **Mutual de Seguridad** y **IST**, las tres principales mutualidades chilenas.
- **Mutual de Seguridad** — mutualidad chilena (referida como "la Mutual" en audio). Ver ACHS / IST.
- **F30 / F30-1** — certificados de cumplimiento laboral emitidos por la Dirección del Trabajo (Chile). Recurrentes en sess 8 (Abastecimiento) en flujos de onboarding de contratistas.
- **Altura geográfica** — batería preocupacional para trabajadores en faenas mineras de altura. Recurrente en sess 7 (Comercial) junto a Marina Mercante / PENS / etc.
- **Test psicosensométrico** — examen riguroso que evalúa psicomotricidad y reflejos para conducción (canónico Workmed, confirmado por usuario 2026-04-25).
- **MPI** — Maestro de Pacientes (Master Patient Index). Concepto técnico citado en sess 3 (Agendamiento) como objetivo arquitectónico para deduplicar pacientes entre sistemas.
- **UCI** (interna Workmed) — Unidad Centralizada de Informes Sanitarios. Lidera Vicente Rivano. Genera el informe final de la batería. NO confundir con UCI = Unidad de Cuidados Intensivos (no aplica en este corpus).
- **Rectificador** — herramienta web del Servicio de Registro Civil (Chile) usada para validar/rectificar RUTs. Workmed la usaba hasta que les bloquearon el acceso (sess 3).
- **OC** — Orden de Compra. Documento previo al EDP en el ciclo comercial-cliente. Aprobaciones en cascada según monto: Coustasse (CFO) entre 1M–3M; Claudio Jorquera (Contralor) sobre 3M; Max Dollmann + Ricardo Jorquera en comité para inversiones mayores.
- **B2B** — anglicismo *business-to-business*. Aparece en sess 5 (Finanzas) como capacidad/canal que Workmed quiere construir para reemplazar dependencia exclusiva de Power BI. STT lo emite como "vitoí", "bito bit", "B to I" (varias mishears del fonema "be-tu-be" en español).

## Places

- **Santiago**, **Antofagasta**, **Calama**, **Concepción**, **Rancagua**, **Viña (del Mar)**, **Reñaca**
- **Manuel Montt** (sede principal Santiago)

## Domain-vocabulary substitutions (observed in session 1)

These are specific one-off mishears caught during session-1 review, applied via `build_corrected.py`:

| STT renders as | Should be | Notes |
|---|---|---|
| `uniforme de actitud` | `informe de aptitud` | core product term |
| `la Vega` / `una Vega` / `la PDA` | `la pega` / `una pega` | Chilean for "el trabajo" |
| `trasferta` | `está` | contextual mishear |
| `tu saludista` / `saludista` | `un salubrista` | medical-law specialist |
| `centro de Monreal` | `Centro Manuel Montt` | sede principal |
| `ley de streaming` / `ley 16000` | `Ley 16.744` | Chilean occupational-safety law |
| `Workman & C` / `worker` (as company name) | `Workmed` | additional mishears |
| `linaje ahumada` (xAI sess 12) | `Ignacio Ahumada` | confirmado vía Meet original — usado como ejemplo de inconsistencia de datos |
| `Advisar` (xAI sess 12) | `avisar` | typo de xAI |
| `estado de bau` / `estado banco` / `estado vago` / `estado pago` (sin "de") | `estado de pago` | EDP — variantes recurrentes en sess 12 |
| `el RP` / `RP contable` (en contexto de Defontana/Softland) | `el ERP` | xAI corta "ERP" → "RP" en sess 12 |
| `Hadoop` (en contexto CRM/marketing/agendamiento) | `HubSpot` | xAI sustituye con homófono ajeno (sess 12) |
| `Simcorp` | `Syncore` | mishear no listado previamente (sess 12) |
| `Rodney` | `Rodrigo` | xAI segmenta "Rodrigo" como nombre inglés (sess 12) |
| `Oleg Nacio` / `Oye Nacio` | `Oye, Ignacio` | vocativo "Oye, Ignacio" mal segmentado (sess 12) |
| `Margarita` | `Barbarita` | mishear consistente y recurrente de Barbarita Lara (confirmado por usuario 2026-04-25). Aplicar globalmente. Excepción documentada: sess 7 L39 ("Margarita ya no está") — caso ambiguo de uso como nombre genérico/placeholder, requiere confirmación humana antes de aplicar |
| `Bernardita` | `Barbarita` | mishear consistente de Barbarita Lara (confirmado por usuario 2026-04-25) |
| `hermanita` | `Barbarita` | mishear vocativo de Barbarita (sess 12) |
| `Carolina Raya` | `Carolina Araya` | mishear consistente; "Raya" no es apellido en este corpus |
| `Tescom` | `TSCom` | mishear leve, sess 4 |
| `Flowman` | `FlowMed` | mishear no listado |
| `gormenghast` | `FlowMed` | xAI inventa nombre propio extranjero (sess 12) |
| `subquerencia` | `subgerencia` | mishear de "subgerencia" en sess 5 |
| `caspote` | `HubSpot` | mishear leve no listado (sess 5) |
| `MegaFive` (forma cerrada, no separada) | `Megafy` | regex existe pero no cubre la forma cerrada — verificar |
| `Rodrigo Mendoza` | `Rodrigo Llancao` | sess 7 — sustituir solo cuando precede "Mendoza" tras "Rodrigo" |
| `el seca` (en contexto de FlowMed/database) | `Secall` | variante coloquial del nombre del proveedor (sess 12) |
| `ANSA` (cuando contexto es minería/faena) | `AMSA` | mishear de Antofagasta Minerals |
| `vitoí` / `bito bit` / `B to I` | `B2B` | sess 5 — mishears del anglicismo "B2B" pronunciado "be-tu-be" |
| `verando` (en frase "FlowMed me chico, verando") | (eliminar) | sess 6 — palabra hallucinada por xAI; eliminar limpiamente |
| `B2B que él, el BPS, lo lleve` / `Un be to be que el el BBC lo guíe` | `B2B en el que él se logee` | sess 5 L87 — STT no captó "se logee" (loguearse, anglicismo); confirmado por usuario |
| `el tema del arrendamiento` (en contexto sess 5 L87 sobre flujo Agendamiento) | `el tema del agendamiento` | mishear contextual; "arrendamiento" es palabra real, NO aplicar global |
| `Book` (case-sensitive) / `HBook` | `Buk` | confirmado en corpus Workmed; aplicar global con cuidado de mayúscula |
| `los buses ahí con` (sess 5 L55 contextual) | `los Buk ahí con` | mishear contextual de Buk + Defontana |
| `defontanables` / `de Fontaner` | `Defontana` | mishears sess 5 L55 |

## TBD — pendiente confirmación del usuario (no auto-sustituir)

Términos detectados en sesión 12 que NO se sustituyen automáticamente porque requieren validación humana antes de canonicalizar:

- **Ignacio Muñoz** — xAI escribe "aparece Ignacio Muñoz Ignacio" (duplicación), casi seguro **Ignacio Ahumada** del roster. Sustitución contextual aplicada solo al duplicado exacto.

## STT quirks to watch for

- xAI occasionally inserts **English phrases** when the audio is unclear ("I see", "Best friends", "Disney in three hours more", "How to make a film"). Strip or replace on review.
- **xAI hallucinates over silence/pauses** — fills quiet moments with confabulated Spanish content (e.g., sess 5 L96 *"Preciosa. Tina, una pregunta. ¿Qué te ha contado el abuelo con la abuelita? El proceso de ayuno de la pobreza de él"*; loop "Está bien. Está bien. Está bien." en sess 5 L98). Estrategia: comparar con Meet original al mismo timestamp — si Meet tiene contenido coherente, swap; si no, strip y dejar la oración sustantiva.
- **[RESOLVED in `.final.md`] Persistent non-Spanish bleed in session 8** (`Diagnostico-20260423-Abastecimiento-Policlinico`): blocks 005, 006, 010, 014, 016 each contained 1–2 sentences of English/Portuguese in earlier `.corrected.md` output. Verified clean in current `.final.md` (audit 2026-04-25). The `.corrected.md` may still carry the bleed if the chunks weren't re-transcribed.
- **Persistent non-Spanish bleed in session 12** (`Diagnostico-20260423-Proceso-Recaudacion`): heaviest case in the corpus. Untagged English fragments at lines ~38, 51, 52, 134, 156, 163; Portuguese at lines ~50, 165. Plus 4–5 explicit `[REVIEW: xAI emitió contenido no-español]` markers (lines ~35, 102, 127, 149, 156, 163). Per the Language invariant, requires re-running the affected chunks with `language=es` + retries — NOT manual translation in `.final.md`.
- "Uds." emitted as abbreviation instead of "ustedes" — normalize to full word for readability.
- Numbers/dates: with `format=true` (ITN) numeric values come out as digits, which is usually what we want.
- "caché / cachái / cacháis" (Chilean filler) often renders as "cachay" or "¿caes?"; preserve as "cachái" for consistency.
