Cargando
Preparando la información solicitada…
Cargando
Preparando la información solicitada…
La IA no es mejor que los datos que la alimentan. Auditoría de calidad de datos con criterios verificables: linaje, versionado, titularidad y métricas objetivas. El dato sin trazabilidad es riesgo, no activo.

«La IA no es mejor que los datos que la alimentan. Sin linaje verificable, no hay auditoría posible.»Fernando Arrieta — Data Governance Auditor
Las organizaciones invierten en modelos, infraestructura y talento — pero no en la calidad de los datos que alimentan todo lo anterior. El resultado: IA con apariencia de precisión construida sobre datos que nadie verificó.
Sesgo no detectado. Datos de entrenamiento que no representan las poblaciones donde opera el modelo. El resultado parece objetivo, pero está sesgado desde la fuente.
Linaje inexistente. No se sabe de dónde viene el dato, cómo se transformó ni quién validó su calidad. Sin linaje, no hay auditoría posible ni reproducibilidad.
Titularidad difusa. Nadie es responsable de la calidad del dato. No hay data stewards, no hay acuerdos de nivel de servicio, no hay métricas de cobertura ni de frescura.
Seis dimensiones que todo programa de calidad de datos debe medir con evidencia.
Los datos reflejan correctamente la realidad que representan. Se verifica contra fuentes de verdad y se mide la tasa de error.
Todos los campos necesarios están presentes. Se evalúa el porcentaje de nulos, la cobertura de categorías y la representatividad temporal.
Los mismos datos producen los mismos resultados en distintas fuentes y sistemas. Se verifica la reconciliación entre bases y procesos de transformación.
Se puede rastrear cada dato desde su origen hasta su uso en el modelo: fuente, transformaciones, validaciones y versión.
Los datos reflejan el estado actual del mundo. Se evalúa la frescura, la frecuencia de actualización y el desfase temporal.
Los datos representan adecuadamente las poblaciones y contextos donde el modelo operará. Detección de sesgo de selección y subrepresentación.
Inventario de conjuntos de datos. Catálogo de todos los conjuntos de datos involucrados en sistemas de IA: fuente, formato, frecuencia, volumen, responsable.
Mapa de linaje. Trazabilidad visual de cada dataset: origen → transformaciones → destino (modelo). Incluye puntos de validación y versiones.
Tablero de calidad. Medición objetiva de cada dimensión de calidad por conjunto de datos: exactitud, completitud, consistencia, frescura, representatividad.
Análisis de sesgo. Evaluación de representatividad y detección de sesgos en datos de entrenamiento, con impacto documentado en resultados del modelo.
Hoja de ruta de mejora. Plan priorizado de acciones correctivas, asignación de titularidad y definición de acuerdos de nivel de servicio para calidad de datos.
Es la capacidad de demostrar que los datos usados para entrenar, validar y operar sistemas de IA cumplen criterios verificables de exactitud, completitud, actualidad, consistencia y representatividad. Sin datos de calidad auditable, los resultados de IA no son confiables.
ISO/IEC 42001 exige que las organizaciones gestionen los datos como recurso del sistema de IA. Esto incluye recolección, preparación, etiquetado, almacenamiento y ciclo de vida. La calidad de datos es un requisito implícito en todo el estándar.
Es la trazabilidad completa del dato desde su origen hasta su uso en un modelo de IA: de dónde viene, cómo se transformó, quién lo validó, qué versión se usó y cuándo. Sin linaje, no hay reproducibilidad ni auditoría posible.
Con métricas objetivas: porcentaje de campos nulos, consistencia entre fuentes, frescura del dato, representatividad de poblaciones, presencia de sesgo y cobertura temporal. No con opiniones subjetivas.
Un modelo de IA entrenado con datos sesgados produce resultados sesgados — con apariencia de objetividad algorítmica. La auditoría de calidad de datos incluye análisis de sesgo y representatividad como controles obligatorios.
Si su organización necesita evaluar la calidad de datos para IA o cumplimiento regulatorio, este es el canal para analizar alcance y metodología. Todas las consultas se gestionan bajo confidencialidad.
Los servicios de consultoría e implementación descritos en este sitio se brindan de manera independiente. La auditoría de certificación y la decisión de certificar son responsabilidad exclusiva de los organismos certificadores acreditados. Conforme a ISO/IEC 17021-1 §5.2, aplican restricciones de imparcialidad y períodos de enfriamiento.