Período de Comentarios Públicos Abierto Hasta el septiembre 13, 2026

Marco de Gobernanza Upstream

Un estándar estructural para la gobernanza de la IA en las capas de entrenamiento, ajuste fino y despliegue

Resumen Ejecutivo

El Problema

Los programas de gobernanza de la IA suelen limitarse a los resultados de los sistemas que ya se han construido, mediante procesos en los que la gobernanza no ha intervenido, codificando supuestos que la gobernanza nunca estuvo en condiciones de examinar.

Las decisiones que determinan lo que un sistema de IA aprende, lo que se le entrena para reconocer, para qué se optimiza su producción y cuya existencia sus datos de entrenamiento fueron construidos para ver claramente: estas decisiones se toman en las capas de entrenamiento y ajuste fino, antes de que el modelo exista. Para cuando se establece un programa de gobernanza, esas decisiones son infraestructura. No se pueden deshacer auditando los resultados o documentando las decisiones de despliegue.

Esta brecha de alcance —la gobernanza definida como la gestión de las consecuencias en lugar de la autorización de las decisiones— es lo que aborda el Marco de Gobernanza Upstream.

El Modelo de Tres Capas

El marco organiza la gobernanza upstream a través de tres capas donde se toman decisiones trascendentales de IA:

La capa de entrenamiento es donde un modelo adquiere su comprensión del mundo. La curación de conjuntos de datos, el diseño de categorías, los objetivos de optimización y la revisión representativa son decisiones de gobernanza que se toman aquí. Para las organizaciones que despliegan modelos de proveedores, esta capa está controlada por el proveedor. El marco establece lo que las organizaciones pueden exigir a los proveedores que divulguen y de lo que deben rendir cuentas.
La capa de ajuste fino abarca cada decisión que toma una organización sobre cómo se configura, adapta o amplía un modelo base de un proveedor para su uso organizacional. Incluye la selección de datos propios, la configuración del comportamiento, la configuración de la recuperación y cualquier mecanismo que dé forma al comportamiento del modelo. Estas son decisiones de gobernanza.
La capa de despliegue es donde la organización decide qué sistema de IA desplegar, con qué fines y bajo qué condiciones. La selección de proveedores, la autorización de casos de uso y el alcance del despliegue son decisiones de gobernanza que se toman aquí. Para las organizaciones que no entrenan ni ajustan sus propios modelos, aquí es donde comienza la gobernanza upstream.

El marco no sustituye a los programas de gobernanza de la capa de despliegue ni a los estándares existentes. Gobierna la capa que esos programas asumen que alguien ya gestionó.

Contenido del Marco

El marco consta de cuatro componentes:

1. El Modelo de Dominios de Tres Capas define los dominios de gobernanza presentes en cada capa, las decisiones específicas que constituyen decisiones de gobernanza dentro de cada dominio, los controles estructurales requeridos y los indicadores de ausencia de gobernanza.
2. Los Estándares de Transparencia de Proveedores definen lo que las organizaciones tienen derecho a exigir a los proveedores en el momento de la selección y durante toda la relación con el proveedor. Operacionalizan la obligación de gobernanza que existe en la capa de despliegue para las organizaciones que no pueden acceder directamente a las decisiones de entrenamiento del proveedor. No exigen que los proveedores den acceso directo a los datos de entrenamiento. Exigen que los proveedores divulguen lo que pueden divulgar y acepten la responsabilidad de lo que no pueden.
3. El Protocolo de Gobernanza del Ajuste Fino define lo que las organizaciones deben gobernar cuando utilizan datos propios para el ajuste fino. Cubre los requisitos de procedencia de los datos, los estándares de documentación del consentimiento, el proceso de revisión de categorías y los requisitos de auditoría continua.
4. La Rúbrica de Evaluación de Madurez es el instrumento de diagnóstico que traduce el marco en una evaluación organizacional. Califica la madurez de la gobernanza en los doce dominios del modelo de tres capas, produce un perfil de madurez capa por capa e identifica las brechas de gobernanza de mayor prioridad.

Relación de este Marco con los Estándares Existentes

El NIST AI Risk Management Framework opera principalmente en las capas de despliegue y resultados. El marco de gobernanza upstream opera en la capa previa a la intervención del NIST AI RMF. Los dos marcos son compatibles y complementarios.

Los requisitos de documentación técnica de la EU AI Act para sistemas de alto riesgo incluyen la gobernanza de los datos de entrenamiento y los requisitos de evaluación de sesgos en las capas de entrenamiento y ajuste fino. El marco de gobernanza upstream proporciona la arquitectura de gobernanza a partir de la cual se produce la documentación conforme.

La norma ISO 42001 establece los requisitos del sistema de gestión de la IA a nivel organizacional. El marco de gobernanza upstream especifica el contenido operativo que un sistema de gestión ISO 42001 debe cubrir en la capa upstream.

Licencias

El Marco de Gobernanza Upstream se publica bajo la licencia Creative Commons Attribution 4.0 International (CC BY 4.0). Cualquier organización puede adoptar, adaptar y construir sobre él para cualquier propósito, incluidos los fines comerciales, con atribución. Consulte la parte 4 para conocer todos los requisitos de atribución.

Introducción al Marco

Discuss this section

Alcance

El Marco de Gobernanza Upstream define la gobernanza como la autorización estructural de las decisiones antes de que se tomen, en el momento en que aún pueden cambiarse.

Este marco gobierna las decisiones que preceden al despliegue del modelo. No gobierna la respuesta a incidentes, el monitoreo del modelo o la auditoría de resultados. Este marco está diseñado para operar antes de esas funciones, no en lugar de ellas.

Este marco no exige que las organizaciones accedan a los datos de entrenamiento del proveedor. Los estándares de transparencia de proveedores definidos en este marco requieren que los proveedores divulguen lo que pueden divulgar y acepten la responsabilidad de lo que no pueden. La obligación de gobernanza que tiene la organización es exigir esa rendición de cuentas, no realizar la gobernanza del proveedor por ellos.

Este marco no sustituye al NIST AI RMF, la Ley de IA de la UE o ISO 42001. Opera en la capa que esos marcos asumen que ya ha sido gobernada.

Cómo Usar Este Marco

El marco está organizado en cuatro partes. El Modelo de Dominios de Tres Capas define los dominios de gobernanza, las decisiones de gobernanza, los controles estructurales requeridos y los indicadores de ausencia en cada una de las tres capas. Esta es la especificación contra la cual se mide el programa de gobernanza de una organización.

Los Estándares de Transparencia de Proveedores definen qué exigir a los proveedores al momento de la selección y durante toda la relación. El Protocolo de Gobernanza del Ajuste Fino define qué gobernar cuando se utilizan datos propios para el ajuste fino.

La Rúbrica de Evaluación de Madurez califica la madurez de la gobernanza en los doce dominios e identifica las brechas de gobernanza prioritarias.

La sección de Mapeo de Estándares define el mapeo de estándares, las licencias y los términos de versionamiento.

Se proporcionan documentos de apoyo en tres apéndices: el Apéndice A contiene orientación de campo para el Registro de Procedencia de Datos, el Apéndice B contiene orientación de campo para el Registro de Documentación de Consentimiento y el Apéndice C contiene definiciones relevantes. Los formularios del Registro de Procedencia de Datos, el Registro de Documentación de Consentimiento y el Registro de Aceptación de Riesgo Residual están disponibles como documentos independientes en kindredlabsfoundation.org.

Convenciones

Los siguientes términos tienen significados definidos a lo largo de este documento:

Must (Debe) denota un requisito vinculante. Una organización que implemente este marco está obligada a cumplir con cada declaración "must".

Should (Debería) denota una práctica recomendada. Se permite desviarse de una declaración "should" cuando la organización documenta su razonamiento.

May (Puede) denota una opción permitida. No se implica preferencia ni requisito.

Modelo de Dominios de Tres Capas

El modelo de dominios define lo que significa la gobernanza en cada una de las tres capas donde se toman decisiones trascendentales de IA. Todos los componentes posteriores se construyen sobre las especificaciones establecidas aquí.

Para cada una de las tres capas de gobernanza, esta parte define los dominios de gobernanza presentes en esa capa, las decisiones específicas que constituyen decisiones de gobernanza dentro de cada dominio, los controles estructurales requeridos y los indicadores de ausencia de gobernanza.

Un programa de gobernanza doctrinal expresa valores y principios sin crear mecanismos para hacerlos cumplir. Un programa de gobernanza estructural crea autoridad nombrada, procesos formales, requisitos de documentación y consecuencias definidas para el incumplimiento. Este marco requiere una gobernanza estructural en cada capa.

Entrenamiento

Discuss this section

Definición

La capa de entrenamiento abarca cada decisión tomada sobre los datos de los que aprende un modelo, lo que se le entrena para reconocer o predecir, y cómo se estructura su proceso de aprendizaje. La gobernanza en esta capa precede a la existencia del modelo y no puede aplicarse retroactivamente.

Dominios de Gobernanza

Dominio 1.1: Curación de Conjuntos de Datos

Las decisiones que gobiernan qué datos entran en el corpus de entrenamiento. Incluye la selección de fuentes, los criterios de inclusión y exclusión, las decisiones de limpieza y filtrado de datos, y el manejo de brechas en la representación.

Decisiones de gobernanza en este dominio:

Qué fuentes son elegibles para la inclusión y sobre qué base
Qué criterios determinan si una fuente de datos es representativa
Quién revisa las decisiones de inclusión y exclusión y con qué autoridad
Qué base de consentimiento se requiere para los datos sobre poblaciones identificables
Qué brechas representativas son aceptables y quién decide la aceptabilidad
Cómo se documentan y revisan las decisiones de limpieza de datos

Dominio 1.2: Diseño de Categorías

Las decisiones que gobiernan qué se entrena al sistema para reconocer, clasificar o predecir. Las decisiones de diseño de categorías determinan qué distinciones aprende a hacer el modelo, qué resultados aprende a predecir y qué límites trata como fijos. Estas son decisiones de gobernanza con consecuencias para cada población a la que el sistema afecta posteriormente.

Decisiones de gobernanza en este dominio:

Qué categorías trata el proceso de entrenamiento como fijas frente a contextuales
Quién tiene autoridad para definir o desafiar los límites de las categorías
Qué proceso de revisión existe antes de que se codifiquen las categorías
Cómo se manejan las categorías disputadas o políticamente significativas
Qué sucede cuando el límite de una categoría produce resultados discriminatorios
Cómo se documentan las decisiones de categorías para futuras auditorías

Dominio 1.3: Arquitectura de Entrenamiento

Las decisiones que gobiernan cómo aprende el sistema: para qué se optimiza, por qué se le penaliza y qué compensaciones (trade-offs) se integran en el proceso de aprendizaje. La gobernanza en este dominio requiere que los objetivos de optimización se declaren, justifiquen y revisen antes de que comience el entrenamiento.

Decisiones de gobernanza en este dominio:

Para qué se optimiza el modelo y quién autorizó ese objetivo
Qué compensaciones entre precisión, equidad y rendimiento son aceptables
Quién revisa el objetivo de optimización antes de que comience el entrenamiento
Cómo se autorizan y documentan los cambios en los objetivos de entrenamiento
Qué criterios de evaluación determinan si el entrenamiento está completo
Quién tiene autoridad para detener o reiniciar el entrenamiento basado en los resultados de la evaluación

Dominio 1.4: Revisión Representativa

El proceso estructurado mediante el cual se evalúa la suficiencia representativa del corpus de entrenamiento y del diseño de categorías antes de proceder con el entrenamiento. La revisión representativa requiere una autoridad nombrada para evaluar, antes de que comience el entrenamiento, qué poblaciones representa adecuadamente el dato de entrenamiento y cuáles no.

Decisiones de gobernanza en este dominio:

Quién realiza la revisión representativa y qué autoridad ostenta
Qué poblaciones o comunidades requieren una evaluación explícita de representación
Qué estándar determina una representación adecuada
Qué remediación se requiere cuando la representación es inadecuada
Si los hallazgos de la revisión pueden detener el entrenamiento y bajo qué condiciones
Cómo se documentan y conservan los hallazgos de la revisión

Controles Estructurales Requeridos

Para que la gobernanza en esta capa sea estructural en lugar de doctrinal, deben existir los siguientes controles como procesos formales con autoridad nombrada, requisitos de documentación y consecuencias definidas para el incumplimiento:

Una puerta de revisión previa al entrenamiento: no se procede con el entrenamiento sin una aprobación documentada en los cuatro dominios
Autoridad nombrada para cada dominio: un rol o cuerpo específico con alcance definido y poder de ejecución
Un registro de procedencia del conjunto de datos: documentación de la fuente, base de consentimiento y evaluación representativa para cada conjunto de datos
Un registro de decisiones de categorías: documentación de cada decisión de definición de categoría, justificación y autoridad que aprueba
Una autorización de objetivos de entrenamiento: aprobación formal de los objetivos de optimización antes de que comience el entrenamiento, acompañada de un análisis de compensaciones que documente qué se despriorizó entre objetivos en competencia y la base de gobernanza para esa decisión
Un informe de revisión representativa: hallazgos, el estándar o criterios específicos aplicados para determinar la suficiencia, remediación tomada y brechas residuales reconocidas antes de que proceda el entrenamiento

Indicadores de Ausencia de Gobernanza

Una organización no está gobernada en esta capa cuando:

Los datos de entrenamiento son seleccionados por el equipo técnico sin un proceso de revisión formal
Los límites de las categorías son definidos por los arquitectos del modelo sin la participación de la gobernanza
Los objetivos de optimización son establecidos por el liderazgo de producto o técnico sin una revisión documentada
No existe una autoridad nombrada para la suficiencia representativa
La procedencia de los conjuntos de datos se rastrea solo para el cumplimiento legal, no para la gobernanza
No existe una puerta previa al entrenamiento: el entrenamiento procede sin una aprobación documentada de gobernanza

Ajuste Fino (Fine-Tuning)

Discuss this section

Definición

La capa de ajuste fino abarca cada decisión que toma una organización sobre cómo se configura, adapta o amplía un modelo base de un proveedor para su uso organizacional. Incluye decisiones sobre de qué datos propios aprende el modelo, qué cambios de comportamiento está introduciendo la organización, cómo se configura la recuperación y cómo se diseña y autoriza cualquier mecanismo que dé forma al comportamiento del modelo. Estas son decisiones de gobernanza.

La gobernanza del ajuste fino tiene dos momentos upstream distintos: qué supuestos ya conlleva el modelo base del proveedor en el proceso de ajuste fino, y qué están añadiendo o reforzando en esos supuestos las propias decisiones de configuración de la organización. Ambos requieren gobernanza.

La capa de ajuste fino, tal como se define aquí, se extiende más allá de la modificación de los pesos del modelo. La ingeniería de prompts aplicada sistemáticamente a escala, la configuración de herramientas de agentes, el diseño del sistema de memoria y los clasificadores de políticas dan forma al comportamiento del modelo de maneras que conllevan las mismas obligaciones de gobernanza que el ajuste fino directo. Cualquier mecanismo a través del cual una organización configura cómo se comporta el modelo entra dentro del alcance de esta capa.

Dominios de Gobernanza

Dominio 2.1: Selección de Datos Propios

Las decisiones que gobiernan qué datos organizacionales entran en el proceso de ajuste fino. Este es el dominio donde los propios datos de la organización sobre sus empleados, clientes, usuarios u operaciones se convierten en material de entrenamiento. Las decisiones de selección de datos determinan sobre qué se entrena al modelo, los datos de quién se incluyen y qué base de consentimiento cubre ese uso.

Decisiones de gobernanza en este dominio:

Qué categorías de datos propios son elegibles para el uso en ajuste fino
Qué base de consentimiento se requiere para cada categoría de datos y cómo se documenta
Quién revisa las decisiones de selección de datos y con qué autoridad
Qué datos sobre empleados, clientes o usuarios requieren una revisión elevada
Cómo se identifica y maneja el dato que refleja un sesgo organizacional histórico
Qué documentación se requiere antes de que los datos propios entren en el ajuste fino

Dominio 2.2: Objetivos de Ajuste Fino

Las decisiones que gobiernan qué cambios de comportamiento está introduciendo la organización a través del ajuste fino. Los objetivos de ajuste fino definen qué hará el modelo de manera diferente después del entrenamiento de lo que hacía antes. Estos objetivos codifican prioridades organizacionales, supuestos sobre los usuarios y juicios sobre lo que constituye un resultado correcto.

Decisiones de gobernanza en este dominio:

Qué está diseñado a cambiar el ajuste fino en el comportamiento del modelo y quién autorizó ese objetivo
Qué supuestos sobre usuarios o casos de uso se integran en el objetivo de ajuste fino
Quién revisa los objetivos de ajuste fino antes de que comience el entrenamiento
Cómo se identifican y resuelven los conflictos entre los objetivos de ajuste fino y el comportamiento del modelo base
Qué criterios de evaluación determinan si el ajuste fino ha logrado su objetivo
Cómo se documentan las decisiones de los objetivos de ajuste fino para futuras auditorías

Dominio 2.3: Alcance de la Personalización

Las decisiones que gobiernan hasta dónde llega la personalización de la organización: qué comportamientos está modificando la organización, qué restricciones está añadiendo o eliminando, y cuáles son los límites de la personalización autorizada. El alcance de la personalización define la diferencia entre lo que hace el modelo del proveedor y lo que hace la versión de la organización. Esa diferencia es responsabilidad total de la gobernanza de la organización.

Decisiones de gobernanza en este dominio:

Qué comportamientos está autorizada la organización a modificar y quién establece esa autorización
Qué restricciones del modelo base se le permite relajar a la organización
Qué nuevas restricciones está añadiendo la organización y sobre qué base
Cómo se revisan las decisiones de personalización antes del despliegue
Qué sucede cuando la personalización produce un comportamiento inesperado en producción
Cómo se documenta el límite entre la responsabilidad del proveedor y la responsabilidad organizacional

Dominio 2.4: Configuración de RAG

Las decisiones que gobiernan qué contenido puede recuperar y usar un modelo en el momento de la inferencia. La configuración de RAG determina qué fuentes están autorizadas para la recuperación, qué trata el modelo como fidedigno y cómo se pondera el contenido recuperado frente al conocimiento entrenado. Estas decisiones dan forma a cada resultado que produce el modelo en un despliegue habilitado para RAG.

Decisiones de gobernanza en este dominio:

Qué fuentes están autorizadas para la recuperación y sobre qué base
Quién revisa el corpus de recuperación y con qué frecuencia
Cómo se identifica y remedia el contenido obsoleto, incorrecto o sesgado en el corpus de recuperación
Qué autoridad existe para añadir o eliminar fuentes de la configuración de recuperación
Cómo se autorizan y documentan los cambios en la configuración de recuperación
Qué proceso de evaluación confirma que la recuperación está produciendo resultados apropiados

Controles Estructurales Requeridos

Una puerta de revisión previa al ajuste fino: no comienza ningún ajuste fino sin una revisión documentada en los cuatro dominios
Autoridad nombrada para la gobernanza del ajuste fino con poder para aprobar, pausar o detener
Un registro de datos de ajuste fino: documentación de cada conjunto de datos, incluyendo categoría, base de consentimiento, limitaciones representativas y autoridad de aprobación
Una autorización de objetivos de ajuste fino: aprobación formal antes de que comience el entrenamiento
Un documento de límites del alcance de la personalización: definición explícita de lo que la organización ha y no ha modificado, mantenido como un documento vivo
Un registro de gobernanza del corpus RAG: documentación del contenido del corpus, autorización y fecha de revisión. Un cambio material —definido como cualquier adición o eliminación de categorías de fuentes, cambio en la lógica de ponderación de la recuperación o modificación del alcance de la autorización— requiere una nueva revisión de gobernanza antes de que se despliegue el cambio
Un registro de supuestos del modelo base: evaluación documentada de los supuestos del modelo del proveedor antes del ajuste fino

Indicadores de Ausencia de Gobernanza

Una organización no está gobernada en esta capa cuando:

Los datos de ajuste fino son seleccionados por el equipo técnico o de producto sin una revisión formal
Los objetivos de ajuste fino no están sujetos a una revisión de gobernanza antes de que comience el ajuste fino
No existe un inventario de qué datos propios se han utilizado en el ajuste fino
La organización no puede responder qué base de consentimiento cubre su corpus de ajuste fino
La configuración de RAG se trata como una decisión de infraestructura sin revisión de gobernanza
Las decisiones de personalización no se documentan por separado de la arquitectura general del sistema
La función de gobernanza no tiene visibilidad de las decisiones o actividades de ajuste fino

Despliegue

Discuss this section

Definición

La capa de despliegue abarca las decisiones que toma una organización sobre qué sistema de IA desplegar, con qué fines y bajo qué condiciones. Incluye la selección de proveedores, la autorización de casos de uso, el alcance del despliegue y la definición de los límites de responsabilidad. Para las organizaciones que no entrenan ni ajustan sus propios modelos, aquí es donde comienza la gobernanza upstream.

Dominios de Gobernanza

Dominio 3.1: Selección de Proveedores

Las decisiones que gobiernan qué sistema de IA adopta la organización. La selección de proveedores determina qué supuestos, datos de entrenamiento, diseño de categorías y objetivos de optimización llegan ya codificados en el sistema que la organización desplegará. La evaluación de gobernanza de los proveedores incluye para qué fue construido el sistema para optimizar, qué fue diseñado a representar su dato de entrenamiento y qué responsabilidad estructural acepta el proveedor por sus decisiones upstream.

Decisiones de gobernanza en este dominio:

Qué criterios de gobernanza se incluyen en la evaluación de proveedores junto con la capacidad y el costo
Qué divulgaciones del proveedor se requieren antes de que proceda la selección
Quién en la función de gobernanza tiene un rol formal en las decisiones de selección de proveedores
Qué documentación publicada se requiere: tarjetas de modelo (model cards), tarjetas de sistema, evaluaciones de sesgo, auditorías de terceros
Cuál es la posición del proveedor sobre los fallos downstream que se originan en las decisiones de entrenamiento
Cómo se documentan las decisiones de selección de proveedores, incluyendo los criterios de gobernanza aplicados y los hallazgos

Dominio 3.2: Autorización de Casos de Uso

Las decisiones que gobiernan qué problemas está autorizado a resolver un sistema, para quién y bajo qué condiciones. La autorización de casos de uso define qué se le permite y no se le permite hacer al sistema, a qué poblaciones está autorizado a afectar y qué proceso gobierna la expansión del uso autorizado a lo largo del tiempo.

Decisiones de gobernanza en este dominio:

Qué proceso existe para autorizar formalmente cada caso de uso antes del despliegue
Quién tiene autoridad para autorizar un caso de uso y qué criterios aplica
Qué poblaciones se ven afectadas por cada caso de uso y qué revisión elevada desencadena eso
Qué casos de uso están explícitamente prohibidos y cómo se hace cumplir esa prohibición
Cómo se monitorea la deriva del caso de uso (use case creep) y cómo se reincorpora al proceso de autorización
Cómo se documentan y revisan las decisiones de autorización de casos de uso

Dominio 3.3: Alcance del Despliegue

Las decisiones que gobiernan cómo se despliega el sistema: a qué puede acceder, qué acciones está autorizado a tomar, qué supervisión humana se requiere y dónde están los límites de su autoridad. El alcance del despliegue define la envolvente operativa del sistema. La gobernanza en este dominio requiere que la envolvente esté definida explícitamente y se revise en un ciclo regular.

Decisiones de gobernanza en este dominio:

A qué datos y sistemas está autorizado a acceder el modelo desplegado
Qué acciones está autorizado a tomar el modelo frente a recomendar
Dónde se requiere la revisión humana antes de que se actúe sobre el resultado del modelo
Cuál es la ruta de escalada cuando el modelo produce un resultado inesperado o de alto riesgo
Cómo se autorizan y documentan los cambios en el alcance del despliegue
Qué monitoreo existe y quién revisa los resultados del monitoreo con qué autoridad

Dominio 3.4: Límites de Responsabilidad

Las decisiones que gobiernan quién es responsable de qué cuando un sistema de IA produce un resultado perjudicial o inesperado. Los límites de responsabilidad definen la línea entre la responsabilidad del proveedor y la responsabilidad organizacional, entre la función de gobernanza y la función técnica, y entre la organización y las personas a las que su sistema de IA afecta.

Decisiones de gobernanza en este dominio:

De qué acepta la responsabilidad la organización que el proveedor no cubre
De qué es responsable la función de gobernanza frente a la función técnica
Qué proceso de remediación existe para las personas perjudicadas por las decisiones de despliegue
Cómo se investigan los fallos y en qué capa se evalúa la causa raíz
Qué desencadena una escalada de la gobernanza del despliegue a la revisión upstream
Cómo se documentan y comunican internamente las decisiones de responsabilidad

Controles Estructurales Requeridos

Un cuadro de mando (scorecard) de gobernanza de proveedores: criterios de evaluación formales que incluyan requisitos de gobernanza upstream
Un registro de autorización de casos de uso: inventario mantenido de cada caso de uso autorizado, autoridad que aprueba, poblaciones afectadas y calendario de revisión
Un documento de alcance del despliegue: definición explícita de acceso, autoridad de acción y requisitos de supervisión humana, revisado en un ciclo definido
Asignaciones de responsabilidad nombradas para cada dominio de gobernanza del despliegue
Un protocolo de escalada de fallos: desencadenantes y procesos definidos para escalar un fallo de despliegue a una revisión upstream
Un archivo de divulgación del proveedor: registro mantenido de las divulgaciones del proveedor, actualizado en cada renovación de contrato
Un Registro de Aceptación de Riesgo Residual: requerido cuando un proveedor rechaza uno o más requisitos de divulgación o responsabilidad de los Estándares de Transparencia de Proveedores, documentando la brecha específica, el riesgo de gobernanza aceptado y la autoridad nombrada que aprueba la decisión de proceder

Indicadores de Ausencia de Gobernanza

Una organización no está gobernada en esta capa cuando:

La selección de proveedores es realizada por adquisiciones y producto sin una participación formal de la gobernanza
No existe un proceso de autorización de casos de uso: los sistemas se despliegan sin una revisión formal de gobernanza
La función de gobernanza no puede producir un inventario de los sistemas de IA desplegados y sus propósitos
La responsabilidad por los fallos de la IA se asigna después del hecho en lugar de definirse antes del despliegue
El alcance del despliegue no está definido explícitamente ni sujeto a revisión de gobernanza
Las divulgaciones de los proveedores no son revisadas por la función de gobernanza al momento de la selección o renovación
Los fallos se investigan en la capa de resultados sin ningún mecanismo para escalar a una revisión upstream

Integración de Capas

Discuss this section

Propósito

Las tres capas no operan de forma independiente. Las decisiones tomadas en la capa de entrenamiento crean condiciones que la gobernanza del ajuste fino debe tener en cuenta. Las decisiones tomadas en el ajuste fino crean condiciones que la gobernanza del despliegue debe tener en cuenta. Las decisiones de los proveedores tomadas fuera del control directo de la organización crean obligaciones de gobernanza que la organización debe cumplir de todos modos. Esta sección define los puntos de entrega (handoff) entre capas, la superficie de decisión del proveedor y la estructura temporal que rige cuándo debe gobernarse cada capa en relación con las demás.

Puntos de Entrega (Handoff) entre Capas

Del Entrenamiento al Ajuste Fino

Lo que la capa de entrenamiento codifica llega a la capa de ajuste fino como los supuestos del modelo base. Esto tiene dos implicaciones de gobernanza.

Primero, el programa de gobernanza del ajuste fino debe tener en cuenta lo que está heredando. El registro de supuestos del modelo base definido en la Capa 2 es el mecanismo para esto. Antes de que comience el ajuste fino, la organización debe documentar lo que sabe y lo que no sabe sobre los supuestos ya codificados en el modelo que está adaptando.

Segundo, el ajuste fino puede reforzar, corregir o agravar los supuestos de la capa de entrenamiento. Un objetivo de ajuste fino diseñado sin la evaluación de los supuestos del modelo base puede profundizar una brecha representativa que la organización no introdujo. La puerta de revisión previa al ajuste fino debe incluir una evaluación explícita de los supuestos del modelo base en relación con el objetivo de ajuste fino propuesto.

Requisito de gobernanza de la entrega (handoff): el registro de supuestos del modelo base debe completarse y revisarse antes de que se autorice cualquier objetivo de ajuste fino.

Del Ajuste Fino al Despliegue

Lo que produce la capa de ajuste fino llega a la capa de despliegue como el modelo personalizado que la organización desplegará. El programa de gobernanza del despliegue debe tener un conocimiento documentado de qué ajuste fino se ha realizado y qué se diseñó a cambiar antes de que proceda la autorización del caso de uso.

El documento de límites del alcance de la personalización definido en la Capa 2 es el artefacto de entrega principal. Debe estar a disposición de la función de gobernanza del despliegue antes de que proceda la autorización del caso de uso. El proceso de autorización del caso de uso debe incluir una evaluación explícita de si el caso de uso propuesto entra dentro del alcance apropiado del comportamiento personalizado del sistema.

Requisito de gobernanza de la entrega (handoff): el documento de límites del alcance de la personalización debe estar actualizado y ser revisado por la función de gobernanza del despliegue antes de la autorización del caso de uso para cualquier sistema con ajuste fino.

Del Despliegue de Regreso a Upstream

La entrega no solo funciona hacia adelante. Los fallos en el despliegue conllevan información de diagnóstico sobre las decisiones upstream. Un sistema que produce resultados discriminatorios en producción puede reflejar supuestos codificados en la capa de entrenamiento o de ajuste fino. El marco requiere una ruta de escalada definida desde el fallo del despliegue de regreso a la revisión upstream.

El protocolo de escalada de fallos definido en la Capa 3 es el mecanismo. Debe definir desencadenantes específicos que muevan la investigación de la gobernanza del despliegue a la gobernanza del ajuste fino o a la gobernanza del entrenamiento.

Requisito de gobernanza de la entrega (handoff): cada investigación de fallo de despliegue debe incluir una determinación explícita de si el fallo indica un supuesto de la capa de ajuste fino o de entrenamiento. Esa determinación debe documentarse independientemente de si sigue la escalada.

Superficie de Decisión del Proveedor

Las organizaciones que despliegan modelos de proveedores no controlan directamente la capa de entrenamiento. Esto crea una obligación de gobernanza que funciona de manera diferente a las obligaciones de gobernanza interna definidas en las Capas 1 y 2.

La superficie de decisión del proveedor es el conjunto de decisiones upstream que el proveedor ha tomado y que dan forma al comportamiento del sistema que la organización despliega. Incluye sobre qué se entrenó el modelo, qué categorías fue entrenado a reconocer, para qué se optimizó su producción y qué brechas representativas existen en sus datos de entrenamiento.

La organización no puede gobernar estas decisiones directamente. Puede exigir que el proveedor rinda cuentas por ellas. Esa rendición de cuentas opera a través de tres mecanismos:

Requisitos de divulgación en la selección: el proveedor debe proporcionar documentación de las fuentes de datos de entrenamiento, las limitaciones conocidas, los hallazgos de la evaluación de sesgo y los objetivos de optimización como condición para la selección. Este es el cuadro de mando (scorecard) de gobernanza de proveedores definido en la Capa 3.
Responsabilidad contractual: el proveedor debe aceptar una responsabilidad definida por los fallos que se originen en las decisiones de entrenamiento, incluyendo un proceso definido para investigar si un fallo de despliegue tiene una causa en la capa de entrenamiento.
Obligaciones de transparencia continuas: el proveedor debe divulgar los cambios materiales en el modelo que afecten a los supuestos en los que la organización confió al momento de la selección. Las actualizaciones del modelo que alteren el comportamiento de las categorías, las características representativas o los objetivos de optimización son eventos de gobernanza que requieren la revisión de la organización.

Cuando un proveedor se niega a cumplir con uno o más de los requisitos de divulgación o responsabilidad definidos en los Estándares de Transparencia de Proveedores, la organización no debe proceder como si el requisito no se aplicara. La función de gobernanza debe producir un Registro de Aceptación de Riesgo Residual que documente qué requisitos rechazó el proveedor, qué riesgo de gobernanza crea eso y la decisión afirmativa de la autoridad nombrada de proceder a pesar de ese riesgo. Proceder sin un Registro de Aceptación de Riesgo Residual completado es un fallo de gobernanza en el Dominio 3.1.

Los Estándares de Transparencia de Proveedores operacionalizan estos tres mecanismos en el lenguaje de los contratos y en los requisitos de adquisiciones.

El Registro de Aceptación de Riesgo Residual está disponible como un formulario independiente en kindredlabsfoundation.org. El registro debe documentar: el requisito específico de los Estándares de Transparencia de Proveedores que el proveedor rechazó, el riesgo de gobernanza que crea la brecha, cualquier control compensatorio que la organización esté implementando y la aprobación afirmativa de la autoridad nombrada sobre la decisión de proceder. El registro debe completarse antes de que proceda el despliegue y conservarse como un registro de gobernanza.

Estructura Temporal

La gobernanza upstream se define por su lógica temporal. Las decisiones que requieren gobernanza deben gobernarse antes de que comience la siguiente capa.

La secuencia temporal requerida es:

La gobernanza de la capa de entrenamiento debe estar completa antes de que comience el entrenamiento. La curación de conjuntos de datos revisada, las categorías aprobadas, los objetivos de optimización autorizados, la revisión representativa completada y documentada. Si alguno de estos está incompleto, el entrenamiento no procede.
La gobernanza de la capa de ajuste fino debe estar completa antes de que comience el ajuste fino. Los supuestos del modelo base registrados, los datos propios revisados, los objetivos de ajuste fino autorizados, el alcance de la personalización definido. El documento de límites del alcance de la personalización debe reflejar el estado actual del modelo antes de que el ajuste fino le añada contenido.
La gobernanza de la capa de ajuste fino debe estar completa antes de que comience el ajuste fino. Los supuestos del modelo base registrados, los datos propios revisados, los objetivos de ajuste fino autorizados, el alcance de la personalización definido. El documento de límites del alcance de la personalización debe reflejar el estado actual del modelo antes de que el ajuste fino le añada contenido.

La finalización de la gobernanza de cada capa es una puerta formal con autoridad para detener lo que sigue si no se cumplen los requisitos. La documentación posterior al despliegue no satisface el requisito de gobernanza.

La estructura temporal también define cuándo se vuelve a activar la gobernanza después del despliegue inicial. Los cambios en el ajuste fino requieren que el proceso de gobernanza del ajuste fino se ejecute de nuevo antes de que se despliegue el modelo actualizado. Las expansiones de los casos de uso requieren una nueva autorización de casos de uso antes de que la expansión se ponga en marcha. Las actualizaciones de los modelos de los proveedores que cambien materialmente el comportamiento del modelo base requieren que el registro de supuestos del modelo base se actualice antes de que el modelo actualizado se despliegue en producción.

Estándares de Transparencia de Proveedores

Propósito

Los Estándares de Transparencia de Proveedores definen lo que las organizaciones que despliegan sistemas de IA de proveedores tienen derecho a exigir, lo que los proveedores están obligados a divulgar y qué estructuras de rendición de cuentas deben existir como condiciones de la relación con el proveedor. Estos estándares operacionalizan la obligación de gobernanza que existe en la capa de despliegue para las organizaciones que no controlan directamente la capa de entrenamiento.

Los estándares se organizan en cuatro componentes: requisitos de divulgación en la selección, obligaciones de transparencia continua, estructuras de rendición de cuentas contractuales y criterios de evaluación de proveedores.

Estos estándares no exigen que los proveedores den acceso directo a los datos de entrenamiento. Exigen que los proveedores divulguen lo que pueden divulgar y acepten la responsabilidad de lo que no pueden.

Requisitos de Divulgación en la Selección

Discuss this section

Antes de que una organización seleccione un sistema de IA de un proveedor para su despliegue, el proveedor debe proporcionar documentación suficiente para que la función de gobernanza de la organización evalúe qué decisiones upstream se han tomado y cuáles son sus implicaciones de gobernanza. La organización no puede autorizar casos de uso para un sistema cuyas decisiones upstream no pueda caracterizar.

1.1 Documentación de los Datos de Entrenamiento

El proveedor debe proporcionar una descripción escrita del corpus de entrenamiento que incluya: las categorías de fuentes de datos utilizadas, el rango de fechas de los datos de entrenamiento, el alcance geográfico y demográfico de los datos, y los criterios utilizados para incluir o excluir fuentes de datos. La descripción no necesita identificar fuentes patentadas, pero debe ser suficiente para que la organización evalúe el alcance representativo.

1.2 Limitaciones Conocidas y Hallazgos de Sesgo

El proveedor debe divulgar todas las limitaciones conocidas del sistema, incluidos los hallazgos de evaluación de sesgos publicados e internos, las poblaciones o casos de uso para los cuales el sistema ha demostrado una precisión o confiabilidad reducidas, y cualquier caso de uso que el proveedor explícitamente no recomiende. Esta divulgación debe incluir hallazgos de auditorías de terceros cuando existan.

1.3 Objetivos de Optimización

El proveedor debe describir para qué se optimizó la producción del sistema, qué compensaciones se hicieron entre objetivos en competencia durante el entrenamiento y qué trata el sistema como una salida correcta. Esta descripción debe ser suficiente para que la organización evalúe si el objetivo de optimización es adecuado para sus casos de uso previstos.

1.4 Arquitectura de Categorías

El proveedor debe divulgar qué categorías está entrenado el sistema para reconocer, clasificar o predecir, y debe identificar cualquier categoría que haya sido tratada como fija durante el entrenamiento. Cuando las categorías involucren características, comportamientos o identidades humanas, el proveedor debe describir la base sobre la cual se definieron esas categorías.

1.5 Documentación de Gobernanza

El proveedor debe proporcionar documentación de su propio proceso de gobernanza interna para el sistema que se está desplegando, incluyendo:

qué proceso de revisión gobernó la selección de datos de entrenamiento,
qué autoridad existía para desafiar o detener el entrenamiento,
y si se realizó alguna revisión independiente del entrenamiento del sistema.

Obligaciones de Transparencia Continua

Discuss this section

Los supuestos en los que confía la organización cuando autoriza casos de uso se basan en el sistema tal como existía en el momento de la selección. Cuando el proveedor cambia el sistema materialmente, las evaluaciones de gobernanza de la organización pueden dejar de ser válidas. Las obligaciones de transparencia continua aseguran que la organización sea informada cuando ocurran cambios materiales.

2.1 Actualizaciones Materiales del Modelo

El proveedor debe notificar a la organización con antelación sobre cualquier actualización del modelo que altere materialmente el comportamiento del sistema, la arquitectura de categorías, los objetivos de optimización o las limitaciones conocidas. La notificación debe ocurrir antes de que la actualización se despliegue en la instancia de la organización y debe incluir una descripción suficiente para que la organización evalúe si sus autorizaciones de casos de uso existentes siguen siendo válidas.

2.2 Nuevos Hallazgos de Sesgo o Limitaciones

El proveedor debe divulgar cualquier nuevo hallazgo de evaluación de sesgos, descubrimientos de limitaciones o resultados de auditorías de terceros que afecten al sistema que la organización está desplegando, dentro de un período definido desde que el proveedor tenga conocimiento de ellos. La función de gobernanza de la organización debe ser notificada directamente, no a través de notas generales de lanzamiento del producto.

2.3 Cambios en los Datos de Entrenamiento

Cuando el proveedor reentrena o actualiza significativamente el corpus de entrenamiento del modelo, el proveedor debe divulgar la naturaleza del cambio y sus implicaciones de gobernanza. Se debe dar a la organización tiempo e información suficientes para actualizar su registro de supuestos del modelo base antes de que se despliegue el modelo reentrenado.

2.4 Divulgación de Incidentes

El proveedor debe divulgar cualquier incidente material que involucre al sistema que la organización está desplegando, incluidos los incidentes en otras organizaciones clientes donde el modo de falla sea relevante para los casos de uso de la organización. La divulgación del incidente debe incluir la evaluación del proveedor sobre si el incidente se originó en una decisión de la capa de entrenamiento.

Estructuras de Rendición de Cuentas Contractuales

Discuss this section

Las siguientes disposiciones contractuales dan fuerza estructural a los requisitos de divulgación. Definen las consecuencias de la falta de divulgación, asignan la responsabilidad de las fallas en la capa de entrenamiento y crean una ruta de escalada desde las fallas de despliegue hasta la rendición de cuentas del proveedor.

3.1 Responsabilidad de la Capa de Entrenamiento

El proveedor debe aceptar la responsabilidad contractual por las fallas que se originen en las decisiones de entrenamiento que tomó el proveedor. Esta responsabilidad no se transfiere a la organización simplemente porque la organización desplegó el sistema. El contrato debe definir un proceso para determinar si una falla de despliegue tiene una causa en la capa de entrenamiento y debe asignar al proveedor la responsabilidad de la remediación donde se establezca la causalidad en la capa de entrenamiento.

3.2 Recurso por Incumplimiento de Divulgación

El contrato debe definir un recurso específico para el incumplimiento del proveedor de realizar las divulgaciones requeridas, incluyendo la falta de divulgación de las limitaciones conocidas en la selección, la falta de notificación de actualizaciones materiales del modelo y la falta de divulgación de nuevos hallazgos de sesgo. El recurso debe ser suficiente para incentivar el cumplimiento, no meramente reconocer el incumplimiento.

3.3 Derechos de Auditoría

La organización debe conservar el derecho de encargar una auditoría independiente de terceros del sistema del proveedor a intervalos definidos o ante activadores definidos. El proveedor debe cooperar con dichas auditorías dentro del alcance y el plazo definidos. Los derechos de auditoría deben sobrevivir a la renovación del contrato y no deben estar condicionados a tarifas adicionales más allá de los costos razonables del alcance.

3.4 Proceso de Escalada Upstream

El contrato debe definir un proceso formal de escalada mediante el cual la organización puede exigir al proveedor que investigue si una falla de despliegue se origina en una decisión de la capa de entrenamiento. El proveedor debe responder dentro de un plazo definido, debe realizar la investigación a su propio costo cuando la causalidad en la capa de entrenamiento sea plausible, y debe proporcionar a la organización hallazgos suficientes para actualizar su documentación de gobernanza.

3.5 Representación de Gobernanza

El proveedor debe representar que las divulgaciones realizadas en la selección son precisas y completas según el leal saber y entender del proveedor, que no se ha retenido ninguna información material relevante para la evaluación de gobernanza de la organización, y que el proceso de gobernanza interna del proveedor para el sistema es el descrito. La tergiversación de estos asuntos debe constituir un incumplimiento material.

Criterios de Evaluación de Proveedores

Discuss this section

La tarjeta de puntuación de gobernanza del proveedor es el instrumento que las organizaciones utilizan para aplicar estos estándares en la etapa de selección. Traduce los requisitos de divulgación y las estructuras de rendición de cuentas en un marco de evaluación que la función de gobernanza aplica durante la selección del proveedor.

4.1 Calidad de la Divulgación

¿Proporciona la documentación del proveedor para cada divulgación requerida información suficiente para una evaluación de gobernanza, o satisface la forma de la divulgación sin la sustancia?

Criterios de evaluación:

Exhaustividad de la descripción de los datos de entrenamiento
Especificidad de la divulgación de limitaciones conocidas
Adecuación de la descripción del objetivo de optimización
Granularidad de la divulgación de la arquitectura de categorías
Evidencia del proceso de gobernanza interna

4.2 Evidencia del Proceso de Gobernanza

¿Proporciona el proveedor evidencia creíble de que las decisiones de gobernanza upstream se tomaron a través de un proceso estructurado?

Criterios de evaluación:

Evidencia del proceso de revisión pre-entrenamiento
Existencia de hallazgos de auditoría de terceros
Metodología de evaluación de sesgos estructurada
Autoridad de gobernanza nombrada para las decisiones de entrenamiento

4.3 Aceptación de la Rendición de Cuentas

¿Está el proveedor dispuesto a aceptar las estructuras de rendición de cuentas contractuales requeridas por estos estándares?

Criterios de evaluación:

Disposición a aceptar la disposición de responsabilidad de la capa de entrenamiento
Disposición a definir el recurso por incumplimiento de divulgación
Aceptación de los derechos de auditoría
Disposición a definir el proceso de escalada upstream

4.4 Historial de Transparencia Continua

Para los proveedores con despliegues existentes, ¿cuál es el historial del proveedor sobre las obligaciones de transparencia continua?

Criterios de evaluación:

Historial documentado de divulgación proactiva
Capacidad de respuesta a las consultas de la función de gobernanza
Calidad de la divulgación de incidentes donde estos han ocurrido

Protocolo de Gobernanza de Fine-Tuning

Propósito

El Protocolo de Gobernanza de Fine-Tuning define lo que las organizaciones deben gobernar cuando utilizan datos patentados para realizar el ajuste fino (fine-tuning) de un modelo base de un proveedor. Cubre a todas las organizaciones que van más allá del despliegue de un modelo de proveedor tal cual: aquellas que realizan fine-tuning con datos de empleados, datos de clientes, datos de comportamiento, datos operativos o cualquier otra fuente de datos patentada. También cubre a las organizaciones que utilizan la generación aumentada por recuperación (RAG) a escala, donde el corpus de recuperación funciona como un mecanismo de fine-tuning continuo.

El principio subyacente que rige este protocolo es que no se pueden utilizar datos para dar forma al comportamiento del modelo sin una procedencia documentada, una base de consentimiento y una revisión de gobernanza.

El protocolo se organiza en cuatro componentes: requisitos de procedencia de los datos, estándares de documentación del consentimiento, proceso de revisión de categorías y requisitos de auditoría continua.

Requisitos de Procedencia de los Datos

Discuss this section

La gobernanza de la procedencia de los datos establece de dónde vinieron los datos, qué contienen y para qué se recolectaron originalmente, antes de que la organización determine si son apropiados para su uso en el fine-tuning. Se requiere documentación de procedencia para cada conjunto de datos que entre en el proceso de fine-tuning. La cuestión de gobernanza no es solo si la organización tiene el derecho de usar los datos, sino si el uso de estos datos para este propósito está dentro del alcance de los objetivos de fine-tuning autorizados.

Consulte el Apéndice A: Plantilla de Registro de Procedencia de Datos para las instrucciones del formulario de implementación de este componente.

1.1 Identificación de la Fuente

El origen del conjunto de datos debe estar documentado: qué sistema, proceso o actividad lo generó, qué período de tiempo cubre y qué población refleja. Para los datos generados por procesos organizacionales, la documentación debe identificar si el proceso que generó los datos estuvo sujeto a sesgos o tratos diferenciales que se reproducirían en el corpus de fine-tuning.

1.2 Propósito de la Recolección Original

El propósito para el cual se recolectaron los datos originalmente debe documentarse y evaluarse para verificar su compatibilidad con el uso en el fine-tuning. El registro de procedencia debe evaluar si las personas cuyos datos son estos tenían conocimiento de que podrían ser utilizados para el entrenamiento de modelos de IA.

1.3 Alcance Representativo

El registro de procedencia debe documentar qué poblaciones, comportamientos o condiciones reflejan los datos y cuáles no. Un conjunto de datos generado por procesos organizacionales refleja la historia de la organización, incluidos los patrones históricos de acceso, oportunidad y trato. Esos patrones deben evaluarse como parte de la revisión de procedencia.

1.4 Problemas de Calidad de Datos Conocidos

Cualquier problema de calidad conocido debe documentarse: brechas, anomalías, períodos de recolección de datos no confiables y condiciones bajo las cuales los datos pueden no reflejar con precisión la población que pretenden representar. La evaluación de gobernanza debe incluir si las limitaciones conocidas producirían una tergiversación sistemática cuando se codifiquen mediante el fine-tuning.

1.5 Historial de Uso Previo

Cuando el conjunto de datos se haya utilizado en un fine-tuning o desarrollo de modelos previos, ese historial debe documentarse. El fine-tuning acumulativo sobre el mismo conjunto de datos puede agravar los supuestos representativos a través de las generaciones de modelos. El registro de procedencia debe reflejar el historial de uso previo para que la revisión de gobernanza pueda evaluar el efecto acumulativo.

VendorTransparency_Selection_1_5_Item1
VendorTransparency_Selection_1_5_Item2
VendorTransparency_Selection_1_5_Item3

Discuss this section

La documentación del consentimiento establece la base sobre la cual la organización está autorizada a utilizar datos sobre personas identificables para fines de fine-tuning. Esto es distinto de la cuestión legal de si la organización tiene términos de servicio que permitan un uso amplio de los datos. La cuestión de gobernanza es si las personas cuyos datos se utilizan para el fine-tuning fueron informadas de manera significativa de que sus datos se utilizarían para este propósito y si tuvieron una oportunidad significativa de oponerse. Tanto la base legal como la base de gobernanza deben documentarse.

Consulte el Apéndice B: Plantilla de Documentación de Consentimiento para las instrucciones del formulario de implementación de este componente.

2.1 Clasificación de la Base de Consentimiento

Cada conjunto de datos que ingrese al fine-tuning debe clasificarse por base de consentimiento. Se aplican cuatro clasificaciones:

Consentimiento explícito: las personas cuyos datos están incluidos fueron informadas específicamente de que sus datos se utilizarían para el entrenamiento o fine-tuning de IA y aceptaron afirmativamente.

Consentimiento general informado: las personas cuyos datos están incluidos fueron informadas de que sus datos podrían utilizarse para fines que incluyen el desarrollo de IA, en términos lo suficientemente específicos como para que el fine-tuning de IA fuera un uso razonablemente previsible.

Consentimiento organizacional implícito: los datos se generaron dentro de una relación de empleo o servicio donde el uso para el desarrollo de IA se divulgó como una práctica organizacional en el momento en que se estableció la relación.

Sin base de consentimiento documentada: los datos se están utilizando sin una base documentada para el conocimiento de este uso por parte de los individuos. Esta clasificación no prohíbe automáticamente el uso. Desencadena una revisión elevada. La función de gobernanza debe tomar una decisión afirmativa de que el uso es apropiado a pesar de la ausencia de una base de consentimiento documentada, y esa decisión debe registrarse.

2.2 Documentación de la Base de Consentimiento

Para cada conjunto de datos, se debe identificar y conservar la documentación que establece la base del consentimiento:

el lenguaje específico de los términos de servicio,
la disposición del acuerdo de empleo,
el aviso de privacidad,
u otro instrumento que establezca la base.

Cuando no exista tal documento, la ausencia debe registrarse y se debe iniciar el proceso de revisión elevada.

2.3 Evaluación del Alcance del Consentimiento

La base de consentimiento documentada debe evaluarse frente al uso específico de fine-tuning. La evaluación debe determinar si una persona razonable que proporcionó este consentimiento entendería que cubre este uso específico.

2.4 Obligaciones de Retiro y Eliminación

La documentación del consentimiento debe abordar qué sucede cuando un individuo retira su consentimiento o solicita la eliminación de sus datos. El protocolo debe definir:

si el retiro de la fuente de datos original requiere la eliminación del corpus de fine-tuning,
cuál es el proceso para eliminar datos de un corpus de fine-tuning que ya ha sido utilizado,
y cuál es la obligación de la organización hacia las personas cuyos datos ya han dado forma a un modelo desplegado.

Proceso de Revisión de Categorías

Discuss this section

La revisión de categorías examina lo que el fine-tuning le está enseñando al modelo a reconocer, distinguir o predecir. Los objetivos del fine-tuning codifican supuestos sobre qué distinciones importan y cómo hacerlas. La revisión de categorías es el proceso de gobernanza que garantiza que esos supuestos se identifiquen y autoricen explícitamente antes de que comience el fine-tuning.

3.1 Inventario de Categorías

Antes de que comience el fine-tuning, la función de gobernanza debe producir un inventario de las categorías que el objetivo del fine-tuning reforzará o introducirá. Una categoría en este contexto es cualquier distinción que el modelo esté siendo entrenado para hacer:

entre empleados de alto y bajo rendimiento,
entre clientes de alto y bajo riesgo,
entre solicitantes calificados y no calificados.

El inventario debe nombrar cada categoría explícitamente. Las categorías sin nombre no pueden ser revisadas.

3.2 Evaluación del Origen de la Categoría

Para cada categoría del inventario, la revisión debe evaluar de dónde provino la categoría. Tres orígenes requieren un tratamiento de gobernanza diferente:

Categorías heredadas del proveedor: distinciones que el modelo base ya hace y que el fine-tuning reforzará. Estas requieren una evaluación de si el diseño de categorías del proveedor es apropiado para el caso de uso y la población de la organización.
Categorías derivadas de datos: distinciones que surgen de patrones en los datos de fine-tuning en lugar de un diseño explícito. Estas requieren una revisión cuidadosa porque pueden codificar patrones organizacionales históricos que no formaban parte del objetivo de fine-tuning declarado.
Categorías diseñadas explícitamente: distinciones que la organización ha elegido deliberadamente incorporar en el objetivo de fine-tuning. Estas requieren la justificación de gobernanza más clara y la autorización más explícita.

3.3 Protocolo de Categoría Cuestionada

Cualquier categoría que involucre características, comportamientos, identidades humanas o evaluaciones del valor o la capacidad humana es una categoría cuestionada y requiere una revisión elevada. La revisión elevada debe incluir:

Una autoridad designada que apruebe la inclusión de la categoría
Una justificación documentada de por qué la distinción es apropiada para el caso de uso
Una evaluación de los resultados diferenciales entre poblaciones protegidas o vulnerables
Un cronograma de revisión definido para la reevaluación después del despliegue

3.4 Autorización de Categorías

Ningún fine-tuning puede proceder hasta que cada categoría del inventario haya sido revisada y autorizada por la autoridad de gobernanza designada. La autorización debe registrarse: quién autorizó cada categoría, sobre qué base y qué condiciones o requisitos de revisión se adjuntan a la autorización. La autorización de categoría no es permanente. Debe renovarse cuando cambie el objetivo del fine-tuning, cuando el corpus de datos cambie materialmente o en el cronograma de revisión definido.

Requisitos de Auditoría Continua

Discuss this section

Propósito

La gobernanza del fine-tuning no termina cuando se completa el ajuste fino. El modelo que produjo el fine-tuning continúa operando sobre la base de lo que aprendió. Los requisitos de auditoría continua garantizan que la organización mantenga la visibilidad de lo que produjeron sus decisiones de fine-tuning y conserve la capacidad de identificar cuándo se necesita una corrección.

4.1 Inventario de Fine-Tuning

La organización debe mantener un inventario actualizado de todos los fine-tuning que se hayan aplicado a los modelos en despliegue activo. El inventario debe incluir: qué fine-tuning se aplicó, cuándo, utilizando qué datos, para qué objetivo, bajo qué autorización y a qué versión del modelo base se aplicó. Este inventario es el registro organizacional de qué datos patentados han dado forma a qué modelos desplegados.

4.2 Ciclo de Auditoría

Los datos de fine-tuning y las autorizaciones de categorías para cada modelo desplegado deben revisarse en un ciclo definido, que no exceda los doce meses. La revisión debe evaluar: si el corpus de datos sigue siendo representativo de la población a la que el modelo sirve actualmente, si han surgido nuevos problemas de calidad o hallazgos de sesgo, si la base de consentimiento para cualquier dato en el corpus ha cambiado y si las autorizaciones de categorías siguen siendo apropiadas dado el rendimiento del modelo en el despliegue.

4.3 Desencadenantes de Revisión Fuera de Ciclo

Los siguientes eventos deben desencadenar una revisión fuera de ciclo, independientemente de en qué parte de su cronograma de auditoría se encuentre la organización:

Una falla de despliegue dirigida a la capa de fine-tuning
Un cambio material en la población a la que sirve el modelo
Un cambio significativo en los procesos organizacionales que generaron los datos de fine-tuning
Un desarrollo legal o regulatorio que afecte la base de consentimiento para los datos en el corpus
Un hallazgo del proveedor con respecto al modelo base que pueda interactuar con las decisiones de fine-tuning de la organización

4.4 Protocolo de Corrección

Cuando una auditoría identifica una falla de gobernanza en el fine-tuning, el protocolo de corrección debe definir: qué pasos inmediatos se requieren para limitar el daño del modelo desplegado mientras se realiza la corrección, cuál es el proceso para corregir el corpus u objetivo del fine-tuning, qué autoridad debe autorizar el fine-tuning corregido antes de que se despliegue y qué documentación se requiere para cerrar el hallazgo de gobernanza.

4.5 Cese y Retiro

El fine-tuning aplicado a un modelo que se retira del despliegue no deja automáticamente de ser una preocupación de gobernanza. La organización debe documentar:

qué sucedió con el modelo con fine-tuning al momento del retiro,
si el corpus de fine-tuning o cualquier derivado permanece en los sistemas organizacionales,
y si algún modelo desplegado posteriormente heredó supuestos del fine-tuning del modelo retirado.

El registro de gobernanza para los modelos retirados debe conservarse durante un período definido.

Rúbrica de Evaluación de Madurez

Propósito

La Rúbrica de Evaluación de Madurez es el instrumento de diagnóstico que traduce el marco en una evaluación organizacional. Califica la madurez de la gobernanza en cada dominio definido en el Modelo de Dominio de Tres Capas, identifica brechas específicas y produce un perfil de madurez capa por capa.

La rúbrica se construye a partir de la ausencia de indicadores de gobernanza definidos en cada capa, los controles estructurales requeridos en cada capa y los requisitos de traspaso definidos en la sección de Integración de Capas.

La rúbrica está diseñada para dos usos: autoevaluación con orientación facilitada y compromiso de arquitectura de gobernanza.

Las preguntas están redactadas para que sean legibles para las funciones de gobernanza y cumplimiento sin requerir experiencia técnica para responderlas.

Niveles de Madurez

Discuss this section

Nivel 0: Ausente

No existe una estructura de gobernanza en este dominio. Las decisiones dentro de este dominio se toman sin ninguna revisión formal, documentación o autoridad designada.

Nivel 1: Naciente

Existe conciencia de la necesidad de gobernanza, pero no se ha establecido ningún proceso formal ni documentación. La gobernanza en este dominio ocurre de manera informal o inconsistente, dependiendo del juicio individual más que de la estructura organizacional.

Nivel 2: En Desarrollo

Existe un proceso formal pero es incompleto, se aplica de manera inconsistente o carece de uno o más elementos estructurales requeridos. La documentación existe pero puede estar incompleta. Existe una autoridad designada pero puede carecer de poder de ejecución. La estructura de gobernanza está presente en esquema pero no en pleno funcionamiento.

Nivel 3: Estructural

La gobernanza está integrada en los procesos de toma de decisiones con autoridad designada, requisitos de documentación completos, consecuencias definidas por incumplimiento y un ciclo de revisión funcional. La estructura de gobernanza opera independientemente de las personas que ocupan actualmente los roles de gobernanza. Sobreviviría a un cambio de personal.

Arquitectura de Calificación

Discuss this section

Cada dominio se califica de 0 a 3 según los niveles de madurez anteriores. La calificación refleja el elemento estructural más débil presente, no un promedio. Un dominio con un proceso definido pero sin autoridad designada califica con 1, no con 2, porque la ausencia de autoridad designada significa que el proceso no se puede ejecutar.

Los dominios se agrupan por capa. Las calificaciones de capa son el promedio de las calificaciones de dominio dentro de esa capa, redondeadas hacia abajo. El perfil de madurez general no es una única calificación agregada. Es un perfil capa por capa que muestra dónde la gobernanza es más fuerte y dónde las brechas son más consecuentes.

Nota sobre ponderación: Las brechas de la Capa 1 (Entrenamiento) y la Capa 2 (Fine-Tuning) conllevan mayores consecuencias de gobernanza que las brechas de la Capa 3 (Despliegue) porque son menos recuperables. Una decisión de despliegue se puede revertir. Una decisión de entrenamiento que codificó un supuesto estructural en un modelo desplegado no se puede deshacer sin volver a entrenar. La rúbrica no pondera numéricamente por capa, pero la narrativa del diagnóstico debe reflejar esta asimetría.

Instrumento de Evaluación

Discuss this section

El instrumento está organizado por capa y dominio. Para cada dominio, el evaluador hace las siguientes preguntas en orden. La primera pregunta respondida con "no" determina la calificación del dominio. Si todas las preguntas se responden con "sí", el dominio califica con el Nivel 3.

Entrenamiento

Las organizaciones que no entrenan sus propios modelos califican los dominios de la Capa 1 según lo que saben o pueden exigir que revele su proveedor. El registro de supuestos del modelo base en la Capa 2 es el mecanismo para documentar las evaluaciones de dominio dependientes del proveedor.

Dominio 1.1: Curación del Conjunto de Datos

Verificación de nivel 0:

¿Existe algún proceso de revisión formal para la selección de datos de entrenamiento?

No = Nivel 0

Verificación de nivel 1:

¿Existe una conciencia documentada dentro de la función de gobernanza de que las decisiones de curación del conjunto de datos son decisiones de gobernanza?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para la curación del conjunto de datos que incluya la participación de la función de gobernanza?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso formal incluye todo lo siguiente:

autoridad de revisión designada,
criterios de inclusión y exclusión documentados,
documentación de la base de consentimiento para cada fuente de datos,
evaluación del alcance de representación,
y un punto de control previo al entrenamiento que pueda detener el entrenamiento si la revisión está incompleta?

No = Nivel 2 | Sí = Nivel 3

Dominio 1.2: Diseño de Categorías

Verificación de nivel 0:

¿Tiene la función de gobernanza alguna participación en las decisiones sobre los límites de las categorías antes de que se codifiquen?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza conciencia de que el diseño de categorías es una decisión de gobernanza, incluso sin un proceso formal para influir en ella?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para las decisiones de diseño de categorías que incluya la participación de la función de gobernanza antes de que se codifiquen las categorías?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un inventario de categorías producido antes de que comience el entrenamiento,
autoridad designada para aprobar categorías cuestionadas,
justificación documentada para cada decisión de categoría,
y un proceso definido para cuestionar los límites de las categorías después del despliegue?

No = Nivel 2 | Sí = Nivel 3

Dominio 1.3: Arquitectura de Entrenamiento

Verificación de nivel 0:

¿Existe alguna revisión de gobernanza documentada para los objetivos de optimización antes de que comience el entrenamiento?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza visibilidad de las decisiones de arquitectura de entrenamiento incluso sin autoridad formal sobre ellas?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para los objetivos de optimización que incluya la aprobación de la gobernanza antes de que comience el entrenamiento?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un documento de autorización de objetivos de entrenamiento,
autoridad designada para la aprobación,
criterios de evaluación definidos para la finalización del entrenamiento,
y autoridad para detener o reiniciar el entrenamiento basándose en los hallazgos de gobernanza?

No = Nivel 2 | Sí = Nivel 3

Dominio 1.4: Revisión de Representación

Verificación de nivel 0:

¿Existe una autoridad designada o un proceso formal para evaluar la idoneidad de la representación antes del entrenamiento?

No = Nivel 0

Verificación de nivel 1:

¿Se considera informalmente la idoneidad de la representación durante la selección de datos de entrenamiento, incluso sin un proceso estructurado?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso estructurado de revisión de la representación que evalúe el corpus de entrenamiento frente a criterios definidos de cobertura de población antes de que proceda el entrenamiento?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

una autoridad de revisión designada con poder para detener el entrenamiento,
estándares definidos para una representación adecuada,
un proceso de remediación documentado para las brechas identificadas,
y un informe de revisión de representación conservado como registro de gobernanza?

No = Nivel 2 | Sí = Nivel 3

Fine-Tuning

Las organizaciones que no realizan el fine-tuning de sus propios modelos pero utilizan RAG a escala deben evaluar el Dominio 2.4 frente a su gobernanza de configuración de RAG y calificar los dominios restantes como No Aplicable con documentación de por qué.

Dominio 2.1: Selección de Datos Propietarios

Verificación de nivel 0:

¿Tiene la función de gobernanza alguna participación en las decisiones de selección de datos de fine-tuning?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza conciencia de que la selección de datos propietarios para el fine-tuning es una decisión de gobernanza?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para la selección de datos de fine-tuning que incluya la participación de la función de gobernanza?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un registro de datos de fine-tuning para cada conjunto de datos,
base de consentimiento documentada para cada categoría de datos,
autoridad de revisión designada,
revisión elevada para datos de empleados o clientes,
y un punto de control previo al fine-tuning?

No = Nivel 2 | Sí = Nivel 3

Dominio 2.2: Objetivos de Fine-Tuning

Verificación de nivel 0:

¿Están los objetivos de fine-tuning sujetos a alguna participación o revisión de la función de gobernanza antes de que comience el fine-tuning?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza visibilidad de los objetivos de fine-tuning incluso sin autoridad formal sobre ellos?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para los objetivos de fine-tuning que requiera la aprobación de la gobernanza antes de que comience el fine-tuning?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un documento de autorización de objetivos de fine-tuning,
autoridad de aprobación designada,
evaluación documentada de los supuestos codificados en el objetivo,
criterios de evaluación definidos,
y un proceso para documentar las decisiones de los objetivos para futuras auditorías?

No = Nivel 2 | Sí = Nivel 3

Dominio 2.3: Alcance de la Personalización

Verificación de nivel 0:

¿Existe algún registro específico de gobernanza para las decisiones de personalización, independiente de la documentación general de la arquitectura del sistema?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza conciencia de que las decisiones sobre el alcance de la personalización son decisiones de gobernanza, incluso sin un proceso de revisión formal?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso formal para revisar y documentar las decisiones de personalización antes del despliegue?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un documento de límites del alcance de la personalización mantenido como un registro vivo,
autoridad designada para autorizar las decisiones de personalización,
un proceso definido para revisar las personalizaciones que relajan las restricciones del modelo base,
y la entrega del documento de límites a la función de gobernanza del despliegue?

No = Nivel 2 | Sí = Nivel 3

Dominio 2.4: Configuración de RAG

Verificación de nivel 0:

¿Está la configuración de RAG sujeta a alguna revisión de gobernanza?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza conciencia de que la configuración de RAG es una decisión de gobernanza?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión formal para la autorización del corpus de RAG y los cambios de configuración?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un registro de gobernanza del corpus de RAG, autoridad designada para la autorización de la fuente,
un ciclo de revisión definido para el contenido del corpus,
un proceso para identificar y eliminar contenido obsoleto o sesgado,
y un proceso de evaluación para la calidad de la salida de la recuperación?

No = Nivel 2 | Sí = Nivel 3

Despliegue

Dominio 3.1: Selección de Proveedores

Verificación de nivel 0:

¿Tiene la función de gobernanza alguna participación formal en las decisiones de selección de proveedores?

No = Nivel 0

Verificación de nivel 1:

¿Tiene la función de gobernanza una aportación informal en la selección de proveedores incluso sin un proceso formal o criterios definidos?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de revisión de gobernanza formal para la selección de proveedores que incluya la participación de la función de gobernanza y criterios de gobernanza definidos?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un cuadro de mando de gobernanza de proveedores aplicado en la selección,
revelaciones requeridas como condición de selección,
aprobación de la función de gobernanza antes de que se finalice la selección,
un archivo de revelación del proveedor mantenido como registro de gobernanza,
y una revisión definida en la renovación del contrato?

No = Nivel 2 | Sí = Nivel 3

Dominio 3.2: Autorización de Casos de Uso

Verificación de nivel 0:

¿Existe un proceso formal para autorizar los casos de uso antes del despliegue?

No = Nivel 0

Verificación de nivel 1:

¿Se produce una consideración informal de la idoneidad del caso de uso antes del despliegue incluso sin un proceso de autorización estructurado?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso de autorización de casos de uso formal que requiera una revisión de gobernanza antes de que un caso de uso entre en producción?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un registro de autorización de casos de uso,
autoridad designada para las decisiones de autorización,
criterios definidos incluyendo la evaluación del impacto en la población,
una lista de casos de uso explícitamente prohibidos con mecanismo de ejecución,
y un proceso para identificar y revisar la expansión no autorizada del caso de uso (use case creep)?

No = Nivel 2 | Sí = Nivel 3

Dominio 3.3: Alcance del Despliegue

Verificación de nivel 0:

¿Existe una revisión de gobernanza formal del alcance del despliegue que cubra el acceso, la autoridad de acción y los requisitos de supervisión humana?

No = Nivel 0

Verificación de nivel 1:

¿Se produce una consideración informal del alcance del despliegue incluso sin un proceso formal o una definición de alcance documentada?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe un proceso formal para definir y revisar el alcance del despliegue antes de que un sistema entre en producción?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿El proceso incluye todo lo siguiente:

un documento de alcance de despliegue,
autoridad designada para las decisiones de alcance,
requisitos de revisión humana definidos para salidas de alto riesgo,
un proceso para autorizar cambios en el alcance,
y un proceso de revisión de monitoreo con autoridad definida?

No = Nivel 2 | Sí = Nivel 3

Dominio 3.4: Límites de Rendición de Cuentas

Verificación de nivel 0:

¿Existe una estructura de rendición de cuentas predefinida para manejar las fallas de IA antes de que ocurran?

No = Nivel 0

Verificación de nivel 1:

¿Existe un entendimiento informal de la rendición de cuentas dentro de la función de gobernanza incluso sin asignaciones documentadas?

No = Nivel 0 | Sí = Nivel 1

Verificación de nivel 2:

¿Existe una estructura de rendición de cuentas documentada que defina la responsabilidad de la función de gobernanza frente a la función técnica antes de que ocurra una falla?

No = Nivel 1 | Sí = Nivel 2

Verificación de nivel 3:

¿La estructura incluye todo lo siguiente:

asignaciones de rendición de cuentas designadas para cada dominio de gobernanza del despliegue,
un límite de responsabilidad documentado entre el proveedor y la organización,
un proceso de remediación definido para las personas afectadas,
un protocolo de escalada de fallas con activadores de revisión ascendente,
y un proceso para documentar y aprender de las decisiones de rendición de cuentas?

No = Nivel 2 | Sí = Nivel 3

Formato de Calificación y Salida

Después de completar el instrumento, el evaluador calcula las calificaciones del dominio y produce el perfil de madurez en el siguiente formato:

Capa 1 Entrenamiento: Calificaciones de dominio para 1.1, 1.2, 1.3, 1.4. Calificación de la capa (promedio, redondeado hacia abajo).
Capa 2 Fine-Tuning: Calificaciones de dominio para 2.1, 2.2, 2.3, 2.4. Calificación de la capa (promedio, redondeado hacia abajo). Anote cualquier dominio calificado como No Aplicable.
Capa 3 Despliegue: Calificaciones de dominio para 3.1, 3.2, 3.3, 3.4. Calificación de la capa (promedio, redondeado hacia abajo).

El perfil se presenta como un resumen capa por capa en lugar de una calificación agregada.

Narrativa de brechas: La salida debe incluir una narrativa de brechas escrita que identifique las dos o tres brechas de gobernanza de mayor prioridad, la capa en la que existe cada brecha, qué decisiones se están tomando sin gobernanza en cada brecha y cuál sería la primera acción de gobernanza en cada brecha.

Protocolo de Revisión de la Rúbrica

Esta rúbrica es la Versión 1.0, construida sobre el modelo de dominio definido en el Modelo de Dominio de Tres Capas. Se revisará a medida que la experiencia de implementación proporcione datos sobre el desempeño de la rúbrica en la práctica.

Activadores de revisión:

Una pregunta de calificación que produce consistentemente respuestas ambiguas en la práctica
Un dominio de gobernanza que las organizaciones reales describen consistentemente en términos que la rúbrica no captura
Una distinción de nivel de madurez que no se sostiene cuando se aplica a programas de gobernanza reales
Cualquier brecha sistemática entre las calificaciones de la rúbrica y la calidad de gobernanza observada en la narrativa de brechas

El proceso de revisión: documentar el activador, proponer el cambio específico de la pregunta o de la descripción del nivel, aplicar la revisión propuesta a los datos de compromisos anteriores para evaluar si produce un resultado más preciso y actualizar la rúbrica con un incremento de versión y un registro de cambios.

Mapeo de Estándares, Licenciamiento y Versiones

Discuss this section

Mapeo de Estándares

Propósito

El mapeo de estándares define cómo se relaciona el Upstream Governance Framework con los estándares de gobernanza de IA existentes. Identifica dónde los marcos son complementarios, dónde se superponen y dónde abordan problemas de gobernanza distintos.

NIST AI Risk Management Framework

El NIST AI RMF organiza la gobernanza de la IA en torno a cuatro funciones: Gobernar, Mapear, Medir y Gestionar. Es un marco de gestión de riesgos aplicado a la IA. Su función de Gobernar aborda los roles y responsabilidades organizacionales. Su función de Mapear aborda el contexto del sistema de IA y la identificación de riesgos. Su función de Medir aborda el análisis y la evaluación de riesgos. Su función de Gestionar aborda la respuesta y recuperación de riesgos.

Relación con el marco de gobernanza upstream: el NIST AI RMF opera principalmente en la capa de despliegue y en la capa de salida. Su función de Mapear toca la capa upstream al identificar el contexto del sistema de IA, pero no define los requisitos de gobernanza para las decisiones que crearon ese contexto. El Upstream Governance Framework opera en la capa previa a la participación del NIST AI RMF.

Compatibilidad: el Upstream Governance Framework está diseñado para ser compatible con el NIST AI RMF. Los registros de gobernanza y los requisitos de documentación definidos en el marco upstream proporcionan información para las funciones de Mapear y Medir del NIST AI RMF. Las organizaciones que están alineadas con el NIST AI RMF pueden adoptar el Upstream Governance Framework sin reemplazar ni entrar en conflicto con su alineación existente.

EU AI Act

La EU AI Act establece requisitos basados en el riesgo para los sistemas de IA desplegados en la Unión Europea, aplicando los requisitos más estrictos a los sistemas de IA de alto riesgo. Requiere evaluaciones de conformidad, documentación técnica, supervisión humana, transparencia y seguimiento post-comercialización para los sistemas de alto riesgo.

Relación con el marco de gobernanza upstream: los requisitos de documentación técnica de la EU AI Act para sistemas de alto riesgo incluyen requisitos para la gobernanza de datos de entrenamiento, la calidad de los datos y la evaluación de sesgos. Estos requisitos operan en la capa de entrenamiento y la capa de ajuste fino. El Upstream Governance Framework proporciona una arquitectura de gobernanza estructurada para cumplir con estos requisitos. Las organizaciones sujetas a la EU AI Act que implementen el Upstream Governance Framework tendrán documentación de gobernanza que respalde sus obligaciones de cumplimiento con la Ley.

Compatibilidad: los requisitos de documentación del Upstream Governance Framework para la procedencia de los conjuntos de datos, la revisión de categorías y la autorización de los objetivos de entrenamiento respaldan directamente los requisitos de documentación técnica de la EU AI Act para sistemas de alto riesgo. El marco no reemplaza el cumplimiento de la Ley, sino que proporciona la estructura de gobernanza a partir de la cual se produce la documentación conforme.

ISO 42001

ISO 42001 es el estándar internacional para sistemas de gestión de IA. Sigue la estructura de sistemas de gestión ISO familiar de ISO 9001 e ISO 27001: establecimiento de contexto, liderazgo, planificación, soporte, operación, evaluación del desempeño y mejora. Aborda la gobernanza de la IA a nivel del sistema de gestión organizacional.

Relación con el marco de gobernanza upstream: ISO 42001 establece requisitos de sistema de gestión para el desarrollo y uso responsable de la IA. Aborda la gobernanza a nivel de política y sistema de gestión en lugar de especificar requisitos de gobernanza para decisiones upstream particulares. El Upstream Governance Framework especifica cuáles son las decisiones de gobernanza en cada capa y qué controles estructurales se requieren. Opera a nivel de decisión y proceso donde ISO 42001 opera a nivel de sistema de gestión.

Compatibilidad: el Upstream Governance Framework está diseñado para operar dentro de un sistema de gestión ISO 42001. Los dominios de gobernanza, los controles estructurales y los requisitos de documentación definidos en el marco upstream son el contenido operativo que rige un sistema de gestión de IA ISO 42001. Las organizaciones que implementan ISO 42001 pueden usar el Upstream Governance Framework para especificar qué debe cubrir su sistema de gestión en la capa upstream.

Licenciamiento y Atribución

Licencia

El Upstream Governance Framework se publica bajo Creative Commons Atribución 4.0 Internacional (CC BY 4.0).

Bajo esta licencia, cualquier persona u organización puede usar, compartir, adaptar y construir sobre el marco para cualquier propósito, incluidos propósitos comerciales, siempre que se otorgue la atribución como se especifica a continuación.

Atribución Requerida

Todo uso del marco, incluyendo la adaptación, incorporación en otros documentos y adopción organizacional, debe incluir la siguiente atribución:

Este trabajo se basa en el Upstream Governance Framework desarrollado por Kindred Labs Foundation, publicado bajo CC BY 4.0. El marco original está disponible en kindredlabsfoundation.org.

Para las adaptaciones que alteren materialmente el contenido del marco, la atribución debe indicar adicionalmente:

Esta es una adaptación del marco original. El original no ha sido revisado ni respaldado por Kindred Labs Foundation.

Lo que la Atribución no Permite

La atribución no constituye respaldo. Las organizaciones que adopten o adapten el marco no pueden representar que Kindred Labs Foundation ha evaluado, certificado o respaldado su programa de gobernanza. La adopción del marco no constituye una certificación contra él. La certificación es una función separada y distinta de la adopción de un estándar abierto.

Lenguaje de Conformidad y Adopción

Las organizaciones que implementen este marco pueden usar los siguientes términos definidos para describir su estado de adopción. El uso de estos términos conlleva el significado definido aquí. Ninguna otra declaración de conformidad está autorizada por este marco.

Alineación Autodeclarada: La organización ha revisado el marco, ha aplicado la Maturity Assessment Rubric y está implementando estructuras de gobernanza contra el modelo de dominio del marco. La organización realiza esta determinación internamente sin revisión externa.

Evaluación de Madurez Independiente: La organización ha contratado a un evaluador independiente para administrar la Maturity Assessment Rubric y producir un perfil de madurez. La evaluación se realizó contra la Versión [X.X] del marco. Una evaluación de madurez independiente no constituye una certificación.

Conformidad Certificada: Las organizaciones pueden solicitar certificación formal a través del Programa de Certificación de Kindred Labs Foundation. Consulte la sección Programa de Certificación para conocer los requisitos de elegibilidad, niveles y vigencia.

Las organizaciones no pueden representar que Kindred Labs Foundation ha revisado, aprobado o respaldado su programa de gobernanza sobre la base de cualquier estado de adopción. La adopción del marco y la certificación contra él son funciones distintas.

Versiones del Documento

El marco publicado es la Versión 1.0. El número de versión aparece en la portada, en el encabezado y en el lenguaje de atribución. Todas las versiones posteriores siguen el versionado semántico: incrementos de versión mayor para cambios estructurales en el modelo de dominio o los niveles de madurez, incrementos de versión menor para adiciones a los protocolos o revisiones de la rúbrica, incrementos de parche para correcciones editoriales.

Se mantiene un registro de cambios de versión como un documento público en kindredlabsfoundation.org junto con el marco. Cada entrada del registro registra qué cambió, por qué y qué provocó el cambio.

Ubicación de la Publicación

El marco se publica en kindredlabsfoundation.org como un documento de descarga gratuita. El resumen ejecutivo está disponible por separado. El registro de cambios de versión se mantiene como un documento público independiente. El marco no tiene muros de pago, no está restringido ni limitado a usuarios registrados.

Acerca de Kindred Labs Foundation

Kindred Labs Foundation es una organización de investigación y gobernanza de IA. La Fundación desarrolla arquitectura de gobernanza, realiza investigaciones originales y publica estándares abiertos para la gobernanza de IA.

Programa de Certificación

Discuss this section

Propósito

La certificación es una determinación formal realizada por Kindred Labs Foundation de que el programa de gobernanza de una organización cumple con los requisitos de este marco a partir de una fecha de evaluación definida. La certificación es distinta de la Alineación Auto-Atestada y la Evaluación de Madurez Independiente, que se definen en la sección de Licencias y Atribución. Ninguno de esos estados de adopción constituye certificación.

Los detalles operativos del programa de certificación, incluido el programa de evaluadores acreditados, tarifas, proceso de presentación y apelaciones, se definen en el documento del Programa de Certificación de Kindred Labs Foundation publicado en kindredlabsfoundation.org.

Instrumentos de Evaluación

La certificación se evalúa con hasta cuatro instrumentos según el perfil de implementación de IA de la organización:

Rúbrica de Evaluación de Madurez — obligatoria para todas las organizaciones. El instrumento de puntuación principal en las tres capas y los doce dominios.
Registro de Procedencia de Datos — obligatorio para todas las organizaciones que realizan ajuste fino con datos propietarios. Un registro por conjunto de datos en el corpus de ajuste fino.
Registro de Documentación de Consentimiento — obligatorio para todas las organizaciones cuyos datos de ajuste fino incluyen datos personales o datos provenientes de personas identificables.
Registro de Aceptación de Riesgo Residual — obligatorio para todas las organizaciones con riesgos residuales documentados que no han sido completamente mitigados.

El evaluador acreditado determina qué instrumentos aplican según el perfil de implementación de la organización al inicio de la evaluación. Una organización no puede determinar por sí misma que un instrumento requerido no aplica.

Vía de Certificación

La certificación está disponible a través de una única vía: Evaluador Acreditado. Un evaluador acreditado es un profesional independiente autorizado por Kindred Labs Foundation para administrar la Rúbrica de Evaluación de Madurez y todos los instrumentos aplicables en nombre de una organización que busca certificación. El evaluador realiza la evaluación de forma independiente de la organización evaluada.

Niveles de Certificación

La certificación se otorga en uno de tres niveles según las puntuaciones de madurez producidas por la Rúbrica de Evaluación de Madurez. Todos los niveles están sujetos a las mismas condiciones de descalificación. El nivel otorgado refleja la madurez de gobernanza de la organización en el momento de la evaluación; no implica que se requieran niveles más altos ni que los niveles más bajos representen una gobernanza inadecuada.

Descalificación Automática

Cualquier dominio que obtenga Nivel 0 o Nivel 1 en la Rúbrica de Evaluación de Madurez resulta en la denegación automática de la certificación, independientemente de las puntuaciones en otros dominios y del nivel solicitado. Un solo dominio reprobado descalifica toda la presentación. No hay promediación ni compensación entre dominios.

Nivel Fundación

Todos los dominios deben obtener Nivel 2 o superior. Las tres capas deben promediar al menos Nivel 2. Ningún dominio puede obtener Nivel 0 o Nivel 1.

La certificación de Nivel Fundación indica que la organización ha implementado estructuras de gobernanza documentadas en todos los dominios requeridos y opera por encima del umbral mínimo en cada capa.

Nivel Avanzado

Todos los dominios deben obtener Nivel 2 o superior. Dos de las tres capas deben promediar Nivel 3. Una capa puede promediar Nivel 2. Ningún dominio puede obtener Nivel 0 o Nivel 1.

La certificación de Nivel Avanzado indica que la organización ha alcanzado plena madurez de gobernanza en dos capas y opera a un nivel documentado y estructurado en la tercera.

Nivel Maduro

Todos los dominios deben obtener Nivel 3. Las tres capas deben promediar Nivel 3. Ningún dominio puede obtener por debajo de Nivel 3.

La certificación de Nivel Maduro es la designación más alta disponible bajo este marco. Indica que la organización ha alcanzado plena madurez de gobernanza en todas las capas y todos los dominios.

Vigencia de la Certificación

La certificación es válida por un año a partir de la fecha de certificación, a menos que se cumpla una condición de caducidad antes de esa fecha. Las organizaciones certificadas se incluyen en el registro público de certificación en kindredlabsfoundation.org.

Condiciones de Caducidad

La certificación caduca inmediatamente ante cualquiera de los siguientes eventos:

La organización implementa un nuevo sistema de IA no cubierto por la certificación existente.
La organización realiza ajuste fino en un sistema cubierto utilizando datos no gobernados bajo los Registros de Procedencia de Datos y Registros de Documentación de Consentimiento existentes de la organización en el momento de la certificación.
El proveedor de un sistema cubierto realiza una actualización material del modelo según se define en los Estándares de Transparencia del Proveedor, y la organización no ha actualizado su registro de suposiciones del modelo base y las autorizaciones de casos de uso antes de continuar con la implementación.
La organización amplía los casos de uso de un sistema cubierto más allá de los autorizados en la documentación de certificación existente.
Se identifica una falla de gobernanza en cualquier dominio cubierto y no se ha resuelto a través del protocolo de corrección definido en el Protocolo de Gobernanza de Ajuste Fino.

Las organizaciones certificadas tienen la obligación afirmativa de notificar a Kindred Labs Foundation dentro de los 30 días de cualquier evento de caducidad. La organización no puede representarse como certificada durante el período de caducidad. No informar voluntariamente un evento de caducidad conocido es motivo de descalificación permanente del programa de certificación.

Lenguaje de Conformidad para Organizaciones Certificadas

Las organizaciones con certificación activa pueden usar los siguientes términos definidos para describir su estado de certificación. El uso de estos términos conlleva el significado definido aquí.

Certificación Fundación. La organización ha sido evaluada por un evaluador acreditado y se le ha otorgado la certificación de Nivel Fundación bajo la Versión [X.X] del Marco de Gobernanza Upstream. La certificación es válida hasta [fecha].

Certificación Avanzada. La organización ha sido evaluada por un evaluador acreditado y se le ha otorgado la certificación de Nivel Avanzado bajo la Versión [X.X] del Marco de Gobernanza Upstream. La certificación es válida hasta [fecha].

Certificación Madura. La organización ha sido evaluada por un evaluador acreditado y se le ha otorgado la certificación de Nivel Maduro bajo la Versión [X.X] del Marco de Gobernanza Upstream. La certificación es válida hasta [fecha].

Las organizaciones no pueden representar una certificación caducada, denegada o vencida como activa. Las organizaciones no pueden representar un nivel inferior como un nivel superior.

Apéndice A: Registro de Procedencia de Datos

Discuss this section

Este apéndice proporciona orientación sobre los campos para el Registro de Procedencia de Datos. El formulario está disponible como un documento independiente en kindredlabsfoundation.org. Debe haber un registro completado en archivo para cada conjunto de datos que ingrese al proceso de ajuste fino antes de que este pueda comenzar. Complete un registro por conjunto de datos.

Campos de encabezado del registro

ID del Registro: un identificador único asignado a este registro en el momento de su creación, incluyendo la fecha de creación. Los ID de los registros deben conservarse en el inventario de ajuste fino definido en el Protocolo de Gobernanza de Ajuste Fino, Componente 4.

Modelo: el nombre y la versión del modelo con el que está asociado este conjunto de datos.

Preparado por: el nombre y cargo de la persona que completa este registro.

Revisado por: el nombre y cargo de la autoridad de gobernanza que revisa y aprueba este registro.

Sección 1: Identificación de la Fuente

Nombre de la fuente de datos: el nombre del conjunto de datos o de la fuente de datos tal como se identifica en los sistemas de la organización.

Sistema o proceso generador: el sistema, la aplicación o el proceso organizacional que produjo estos datos. Se debe proporcionar suficiente detalle para que un revisor no familiarizado con el sistema entienda qué es y qué produce.

Rango de fechas: las fechas de inicio y fin de los datos incluidos en este conjunto de datos.

Sesgo conocido en el proceso generador: una evaluación de si el proceso que generó estos datos estuvo sujeto a trato diferencial, sesgo histórico o condiciones que representarían sistemáticamente de forma excesiva o insuficiente a cualquier población. Si la respuesta es afirmativa o se desconoce, debe describirse la naturaleza del sesgo o la incertidumbre. Este campo requiere una evaluación afirmativa, no una suposición predeterminada de que no existe sesgo.

Sección 2: Propósito de la Recolección Original

¿Para qué se recolectaron originalmente estos datos?: el propósito declarado en el momento de la recolección, tal como está documentado en el sistema de registro, en el aviso de privacidad o en la documentación de gobernanza de datos.

¿Es el propósito de la recolección original compatible con el uso de ajuste fino?: una evaluación de si el uso de estos datos para el ajuste fino entra en el ámbito del propósito para el que fueron recolectados. Cuando la compatibilidad sea incierta, el registro debe remitirse a una revisión elevada. La evaluación debe incluir una explicación escrita de la base para la determinación de la compatibilidad.

Conocimiento individual: una evaluación de si las personas cuyos datos se incluyen tenían conocimiento en el momento de la recolección de que sus datos podrían utilizarse para el entrenamiento de modelos de IA. Sí, No o Desconocido. Si la respuesta es No o Desconocido, debe anotarse en el registro de documentación de consentimiento de este conjunto de datos.

Sección 3: Alcance de la Representación

Poblaciones representadas: las poblaciones, comunidades o grupos reflejados en este conjunto de datos. Este campo requiere especificidad: una descripción suficiente para que un revisor evalúe si el conjunto de datos es apropiado para el uso de ajuste fino previsto.

Poblaciones subrepresentadas: las poblaciones, comunidades o grupos que están ausentes o subrepresentados en relación con la población a la que el modelo afectará posteriormente. Si no se identifica ninguna, debe documentarse la base de esa determinación.

Patrones históricos: una evaluación de si estos datos reflejan patrones organizativos históricos de acceso, oportunidad o trato diferencial que se reproducirían mediante el ajuste fino. En caso afirmativo o si se desconoce, los patrones deben ser descritos.

Evaluación de la adecuación de la representación: una determinación de si el alcance de la representación del conjunto de datos es adecuado para el uso de ajuste fino previsto. Hay tres determinaciones disponibles:

Adecuado,
Requiere Remediación
o Requiere Revisión Elevada.

Una determinación de Requiere Remediación debe ir acompañada de una descripción de la remediación aplicada. Una determinación de Requiere Revisión Elevada remite el registro a la sección de Revisión Elevada.

Sección 4: Calidad de los Datos

Brechas o anomalías conocidas: documentación de cualquier brecha conocida en la cobertura de datos, anomalías en la recolección de datos o períodos durante los cuales la recolección de datos fue poco fiable. Si no se conoce ninguna, esa determinación debe declararse afirmativamente.

Condiciones de falta de fiabilidad: documentación de cualquier condición bajo la cual estos datos puedan no reflejar con precisión la población que pretenden representar: variaciones estacionales, interrupciones del sistema, cambios en las prácticas organizativas u otros factores que afecten a la integridad de los datos.

Evaluación de la calidad: una determinación de si la calidad de los datos es suficiente para fines de gobernanza. Hay tres determinaciones disponibles:

Adecuado para Fines de Gobernanza,
Requiere Divulgación en el Registro de Ajuste Fino
o Requiere Remediación.

Una determinación de calidad de Requiere Divulgación significa que la limitación debe documentarse en el registro de datos de ajuste fino y evaluarse como parte de la autorización del objetivo de ajuste fino.

Sección 5: Historial de Uso Previo

Uso previo de ajuste fino: una determinación de si este conjunto de datos se ha utilizado en un ajuste fino o desarrollo de modelo previo. Este campo requiere una determinación afirmativa; "que nosotros sepamos" no es suficiente si no se ha comprobado ningún registro.

Descripción del uso previo: si existe un uso previo, deben documentarse los modelos con los que se utilizó el conjunto de datos, las fechas de ese uso y los objetivos de ajuste fino que respaldó.

Evaluación del efecto acumulativo: una evaluación de si los usos anteriores crean supuestos de representación compuestos que requieran la atención de la gobernanza en el uso actual. En caso afirmativo o si se desconoce, debe describirse la naturaleza del efecto compuesto.

Revisión Elevada

La sección de Revisión Elevada se activa cuando la Sección 2 (Propósito de la Recolección Original) o la Sección 3 (Alcance de la Representación) produce una determinación de Requiere Revisión Elevada. La revisión elevada debe ser realizada por una autoridad de gobernanza designada por encima de la función de revisión estándar.

Autoridad de revisión elevada: el nombre y cargo de la autoridad de gobernanza que realiza la revisión.

Remitido desde: identificación de qué sección activó la revisión elevada.

Decisión:

Aprobado,
Aprobado con Condiciones
o No Aprobado.

Una decisión de No Aprobado significa que este conjunto de datos no puede entrar en el proceso de ajuste fino. Una decisión de Aprobado con Condiciones debe incluir una descripción de las condiciones que se adjuntan a la aprobación.

Justificación: la base de la decisión de la revisión elevada, suficiente para que un futuro auditor comprenda por qué la decisión fue apropiada dado el hallazgo que la activó.

Aprobación

Condiciones de aprobación: cualquier condición, limitación o requisito de revisión continua adjunto a la aprobación de este registro. Si no hay ninguno, debe indicarse.

Fecha de la próxima revisión: la fecha en la que este registro debe ser revisado de nuevo. Se requiere una revisión en el intervalo definido en el ciclo de auditoría de ajuste fino o antes si se cumple un activador fuera de ciclo.

Firma de la autoridad de gobernanza: firma, nombre, cargo y fecha de la autoridad de gobernanza que aprueba.

Apéndice B: Plantilla de Documentación de Consentimiento

Discuss this section

Este apéndice proporciona orientación sobre los campos para el Registro de Documentación de Consentimiento. El formulario está disponible como un documento independiente en kindredlabsfoundation.org. Debe haber un registro completado en archivo para cada conjunto de datos que ingrese al proceso de ajuste fino antes de que este pueda comenzar. Complete un registro por conjunto de datos. Se requiere un registro separado para cada base de consentimiento distinta dentro de un conjunto de datos cuando este combina datos de múltiples contextos de consentimiento.

Campos de encabezado del registro

ID del Registro: un identificador único asignado a este registro en el momento de su creación, incluyendo la fecha de creación.

ID del Registro de Procedencia de Datos: el ID del Registro de Procedencia de Datos correspondiente a este conjunto de datos. Estos registros deben cruzarse y conservarse juntos.

Modelo: el nombre y la versión del modelo con el que está asociado este conjunto de datos.

Preparado por: el nombre y cargo de la persona que completa este registro.

Revisado por: el nombre y cargo de la autoridad de gobernanza que revisa este registro.

Fecha de revisión: la fecha en la que la autoridad de gobernanza revisó y aprobó este registro.

Sección 1: Clasificación de la Base de Consentimiento

Base de consentimiento: la clasificación que se aplica a este conjunto de datos. Se definen cuatro clasificaciones en el Protocolo de Gobernanza de Ajuste Fino, Componente 2:

Consentimiento explícito — las personas fueron informadas específicamente de que sus datos se utilizarían para el entrenamiento o ajuste fino de IA y dieron su acuerdo afirmativo.
Consentimiento general informado — las personas fueron informadas de que sus datos podrían utilizarse para fines que incluyen el desarrollo de IA, en términos suficientemente específicos como para que el ajuste fino de IA fuera un uso razonablemente previsible.
Consentimiento organizativo implícito — los datos fueron generados en el marco de una relación laboral o de servicio en la que el uso para el desarrollo de IA fue divulgado como práctica organizativa en el momento en que se estableció la relación.
Sin base de consentimiento documentada — los datos se utilizan sin una base documentada de conocimiento individual sobre este uso. Esta clasificación no prohíbe el uso, pero activa una revisión elevada.

Justificación de la clasificación: la base de la clasificación aplicada, suficiente para que un revisor evalúe si la clasificación es apropiada.

Sección 2: Documentación de la Base de Consentimiento

Instrumento que establece el consentimiento: el documento específico que establece la base de consentimiento: los términos de la prestación del servicio, la cláusula del acuerdo de empleo, el aviso de privacidad u otro instrumento. El documento debe identificarse por nombre y versión o fecha.

Ubicación del documento: dónde se conserva el instrumento dentro de los sistemas de la organización.

Disposición relevante: el lenguaje específico dentro del instrumento que establece la base del consentimiento. La disposición debe citarse o describirse con suficiente especificidad para que un revisor evalúe su alcance.

Documento ausente: si no existe ningún instrumento, la ausencia debe registrarse aquí y completarse la sección de revisión elevada. Un documento ausente no se traduce por defecto en ninguna clasificación de base de consentimiento: requiere una decisión de gobernanza afirmativa.

Sección 3: Evaluación del Alcance del Consentimiento

Uso específico de ajuste fino: una descripción precisa de para qué se utilizarán estos datos para entrenar al modelo. Las descripciones vagas de los objetivos de ajuste fino no son suficientes para una evaluación del alcance del consentimiento.

Evaluación del alcance: una determinación de si una persona razonable que proporcionó el consentimiento documentado entendería que cubre este uso específico. Hay tres determinaciones disponibles: Sí, No o Incierto. Una determinación de No o Incierto remite el registro a la sección de Revisión Elevada.

Justificación de la evaluación del alcance: la base de la determinación del alcance, incluyendo cualquier factor que respalde o complique la evaluación.

Brecha de alcance: si el consentimiento no cubre claramente este uso, debe describirse la naturaleza de la brecha. Este campo es obligatorio cuando la evaluación del alcance es No o Incierto.

Sección 4: Revisión Elevada

La sección de Revisión Elevada se activa cuando la Sección 1 produce una clasificación de Sin Base de Consentimiento Documentada, o cuando la Sección 3 produce una evaluación de alcance de No o Incierto.

Autoridad de revisión elevada: el nombre y cargo de la autoridad de gobernanza que realiza la revisión.

Fecha de la revisión elevada: la fecha en la que se realizó la revisión elevada.

Remitido desde: identificación de qué sección activó la revisión elevada: la Sección 1 (Clasificación de la Base de Consentimiento) o la Sección 3 (Evaluación del Alcance del Consentimiento).

Decisión: Aprobado para su Uso, Aprobado con Condiciones o No Aprobado. Una decisión de No Aprobado significa que este conjunto de datos no puede entrar en el proceso de ajuste fino. Una decisión de Aprobado con Condiciones debe incluir una descripción de las condiciones que se adjuntan a la aprobación.

Justificación de la decisión: la base de la decisión de la revisión elevada, incluyendo por qué el uso es apropiado a pesar de la brecha de consentimiento o por qué no lo es.

Condiciones de aprobación: cualquier condición, limitación o salvaguardia requerida como condición de aprobación. Obligatorio cuando la decisión es Aprobado con Condiciones.

Sección 5: Obligaciones de Retiro y Eliminación

Proceso de retiro: el proceso definido para gestionar el retiro del consentimiento individual después de que los datos hayan sido incluidos en el ajuste fino. Este proceso debe definirse antes de que el conjunto de datos entre en el ajuste fino, no después de recibir una solicitud de retiro.

Eliminación del corpus: si los datos individuales pueden eliminarse del corpus de ajuste fino y el proceso para hacerlo. Si la eliminación no es técnicamente factible, deben documentarse las limitaciones y sus implicaciones de gobernanza.

Obligación para modelos ya entrenados: la obligación definida de la organización hacia las personas cuyos datos ya han dado forma a un modelo desplegado en el momento en que se recibe una solicitud de retiro o eliminación.

Proceso de solicitud de eliminación: el proceso mediante el cual se reciben, evalúan y actúan las solicitudes individuales de eliminación de datos en el corpus de ajuste fino.

Aprobación

Condiciones de aprobación: cualquier condición, limitación u obligación continua adjunta a la aprobación de este registro. Si no hay ninguna, debe indicarse.

Fecha de la próxima revisión: la fecha en la que este registro debe ser revisado de nuevo.

Firma de la autoridad de gobernanza: firma, nombre, cargo y fecha de la autoridad de gobernanza que aprueba.

Apéndice C: Definiciones

Discuss this section

Modelo base Un modelo de IA fundamental producido por un proveedor mediante el entrenamiento a gran escala con datos externos. El modelo base llega al entorno de una organización con supuestos, diseños de categorías y objetivos de optimización ya codificados. Las organizaciones que no entrenan sus propios modelos heredan estas decisiones en el momento de la selección del proveedor.

Registro de supuestos del modelo base Un registro de gobernanza que documenta los supuestos, las limitaciones conocidas y las características de representación del modelo base de un proveedor, tal como se evaluaron antes del ajuste fino o del despliegue. Obligatorio bajo este marco antes de que comience el ajuste fino. El registro garantiza que la organización ha dado cuenta formalmente de sobre qué está construyendo antes de empezar a construir.

Base de consentimiento El fundamento legal y ético sobre el cual se recolectan, conservan y utilizan los datos sobre personas identificables. Bajo este marco, se requiere una base de consentimiento documentada para cualquier dato que entre en el proceso de entrenamiento o ajuste fino. La clasificación de la base de consentimiento incluye el consentimiento explícito, el consentimiento general informado, el consentimiento organizativo implícito y la ausencia de una base de consentimiento documentada. Consulte el Apéndice B para la Plantilla de Documentación de Consentimiento.

Categoría cuestionada Una clasificación, etiqueta o objetivo predictivo que codifica una definición de identidad, comportamiento o condición humana que no es universalmente aceptada, está sujeta a disputas políticas o sociales, o tiene un potencial documentado de aplicación discriminatoria. Las categorías cuestionadas requieren una autoridad designada para su aprobación y una justificación documentada bajo el Dominio 1.2 (Diseño de Categorías).

Capa de despliegue La capa de gobernanza en la que una organización decide qué sistema de IA desplegar, para qué fines y bajo qué condiciones. Abarca la selección de proveedores, la autorización de casos de uso, el alcance del despliegue y la definición de los límites de responsabilidad. Para las organizaciones que no entrenan ni ajustan sus propios modelos, aquí es donde comienza la gobernanza upstream.

Gobernanza doctrinal Un programa de gobernanza que opera a través de la expresión de valores, principios y políticas sin crear los mecanismos estructurales necesarios para hacerlos cumplir. Un programa doctrinal puede producir documentación, convocar juntas de revisión y publicar compromisos. No crea una autoridad designada, puertas formales ni consecuencias definidas por el incumplimiento. Este marco requiere gobernanza estructural, no gobernanza doctrinal, en cada capa.

Revisión elevada Una revisión de gobernanza reforzada que se requiere cuando un conjunto de datos, un caso de uso o una decisión de despliegue involucra a poblaciones con características protegidas, cuando la base del consentimiento está ausente o es incierta, o cuando el potencial de daño es materialmente superior al de referencia. La revisión elevada requiere una autoridad designada por encima de la función de revisión estándar y una justificación documentada de la decisión alcanzada.

Ajuste fino (Fine-tuning) El proceso mediante el cual una organización adapta el modelo base de un proveedor utilizando datos o configuración propios para producir un comportamiento diferente al que exhibe el modelo base. Tal como se define en este marco, el ajuste fino abarca la modificación de pesos, la ingeniería de prompts aplicada sistemáticamente a escala, la configuración de herramientas de agentes, el diseño del sistema de memoria, la configuración de RAG y los clasificadores de políticas. Cualquier mecanismo a través del cual una organización configure cómo se comporta el modelo entra dentro de esta definición.

Capa de ajuste fino La capa de gobernanza que abarca cada decisión que toma una organización sobre cómo se configura, adapta o amplía el modelo base de un proveedor para uso organizativo. La capa de ajuste fino está totalmente bajo el control de la organización. Consulte la definición de la Capa 2 en el Modelo de Dominio de Tres Capas.

Decisión de gobernanza Una decisión que determina qué aprende un sistema de IA, qué se le entrena para reconocer, qué se le optimiza para producir o qué se le autoriza a hacer. Las decisiones de gobernanza requieren una autoridad designada, una justificación documentada y una revisión formal antes de ser tomadas.

Puerta de gobernanza Un punto de control formal en el que ninguna acción posterior puede proceder sin la firma documentada de la autoridad de gobernanza designada. Este marco requiere una puerta previa al entrenamiento en la Capa 1, una puerta previa al ajuste fino en la Capa 2 y una puerta de autorización de casos de uso en la Capa 3. Una puerta de gobernanza es estructural: crea una parada obligatoria.

Registro de gobernanza Un documento producido como un resultado requerido de un proceso de gobernanza, conservado como evidencia de que se tomó una decisión de gobernanza con una autoridad designada y una justificación documentada. Los registros de gobernanza bajo este marco incluyen registros de procedencia de conjuntos de datos, documentación de consentimiento, autorizaciones de objetivos de entrenamiento, documentos de límites de alcance de personalización, archivos de divulgación de proveedores y registros de autorización de casos de uso.

Actualización material del modelo Un cambio en un sistema de IA desplegado lo suficientemente sustancial como para requerir la re-ejecución de una o más puertas de gobernanza. Incluye cambios en los datos de entrenamiento, en el corpus de ajuste fino, en los objetivos de optimización, en el corpus de recuperación, en el alcance de la personalización o en la configuración del despliegue que podrían alterar el comportamiento del modelo de formas que la revisión de gobernanza original no evaluó. Las organizaciones deben definir de antemano qué constituye una actualización material del modelo y qué revisión de gobernanza activa.

Autoridad designada Un cargo, individuo o cuerpo de gobernanza específico con la responsabilidad formalmente asignada sobre un dominio de gobernanza y el poder de aprobar, pausar o detener las decisiones dentro de ese dominio. La ausencia de una autoridad designada es un indicador de gobernanza doctrinal en lugar de estructural.

Objetivo de optimización La especificación formal de lo que un sistema de IA está entrenado para maximizar, minimizar o producir. Los objetivos de optimización codifican juicios organizacionales sobre qué constituye un resultado correcto y qué compensaciones entre precisión, equidad y rendimiento son aceptables. Bajo este marco, los objetivos de optimización son decisiones de gobernanza que requieren una autorización formal antes de que comience el entrenamiento.

Clasificador de políticas Un modelo o sistema de reglas aplicado en el momento de la inferencia para evaluar, filtrar o modificar los resultados del modelo frente a políticas de comportamiento definidas. Los clasificadores de políticas dan forma al comportamiento del modelo y entran dentro de la capa de ajuste fino tal como se define en este marco, con las mismas obligaciones de gobernanza que el entrenamiento directo del modelo.

Adecuación de la representación El estándar mediante el cual se determina que el corpus de entrenamiento o los datos de ajuste fino incluyen una representación suficiente, precisa y no distorsionada de las poblaciones con las que el modelo se encontrará posteriormente. La adecuación de la representación es una determinación de gobernanza, no estadística. Requiere una autoridad de revisión designada con estándares definidos y el poder de detener el entrenamiento cuando no se cumplan dichos estándares.

Registro de Aceptación de Riesgo Residual Un registro de gobernanza producido cuando un proveedor se niega a cumplir con uno o más de los requisitos de divulgación o responsabilidad definidos en los Estándares de Transparencia del Proveedor. El registro documenta qué requisitos se rechazaron, el riesgo de gobernanza creado por la brecha y la decisión afirmativa de la autoridad designada para proceder a pesar de ese riesgo. Se requiere un Registro de Aceptación de Riesgo Residual antes de que el despliegue pueda proceder con un proveedor que no cumple.

Generación aumentada por recuperación (RAG) Una arquitectura de despliegue en la que los resultados de un modelo se ven influidos en el momento de la inferencia por el contenido recuperado de un corpus externo. La configuración de RAG determina qué fuentes trata el modelo como autorizadas y cómo se pondera el contenido recuperado. Las decisiones de configuración de RAG son decisiones de gobernanza bajo el Dominio 2.4 de este marco.

Gobernanza estructural Un programa de gobernanza que opera a través de una autoridad designada, procesos formales, requisitos de documentación y consecuencias definidas por el incumplimiento. La gobernanza estructural crea mecanismos que hacen cumplir los requisitos de gobernanza independientemente de los individuos que ocupan actualmente los cargos de gobernanza. Sobreviviría a un cambio de personal. Este marco requiere gobernanza estructural en cada capa.

Capa de entrenamiento La capa de gobernanza en la que un modelo aprende de los datos: qué se le entrena para reconocer o predecir, y cómo se estructura su proceso de aprendizaje. Abarca la curación de conjuntos de datos, el diseño de categorías, la arquitectura de entrenamiento y la revisión de la representación. La gobernanza en esta capa precede a la existencia del modelo y no puede aplicarse retroactivamente. Consulte la definición de la Capa 1 en el Modelo de Dominio de Tres Capas.

Gobernanza upstream Gobernanza de las decisiones que determinan lo que aprende un sistema de IA, para qué se le entrena a reconocer y para qué se le optimiza a producir, ejercida antes de que esas decisiones se incorporen a un sistema desplegado. La gobernanza upstream opera en las capas de entrenamiento, ajuste fino y despliegue.

Revisión upstream Una investigación formal que se activa cuando un fallo en el despliegue, un hallazgo de auditoría o una escalada de gobernanza indica que la causa raíz de un problema puede originarse en la capa de entrenamiento o de ajuste fino en lugar de en la capa de despliegue. La revisión upstream requiere una autoridad designada para llevar a cabo la investigación y un protocolo documentado para lo que constituye un hallazgo y qué remediación se requiere.

Expansión del caso de uso (Use case creep) La expansión de la aplicación de un sistema de IA más allá de los límites de su caso de uso autorizado original, sin una reautorización formal. La expansión del caso de uso es un fallo de gobernanza en el Dominio 3.2 (Autorización del Caso de Uso). Este marco requiere un proceso definido para supervisar la expansión de los casos de uso y devolver los usos no autorizados al proceso de autorización.

Cuenta y Configuración

Idioma

Cuenta

Marco de Gobernanza Upstream

Resumen Ejecutivo

El Problema

El Modelo de Tres Capas

Contenido del Marco

Relación de este Marco con los Estándares Existentes

Licencias

Introducción al Marco

Alcance

Cómo Usar Este Marco

Convenciones

Modelo de Dominios de Tres Capas

Entrenamiento

Definición

Dominios de Gobernanza

Controles Estructurales Requeridos

Indicadores de Ausencia de Gobernanza

Ajuste Fino (Fine-Tuning)

Definición

Dominios de Gobernanza

Controles Estructurales Requeridos

Indicadores de Ausencia de Gobernanza

Despliegue

Definición

Dominios de Gobernanza

Controles Estructurales Requeridos

Indicadores de Ausencia de Gobernanza

Integración de Capas

Propósito

Puntos de Entrega (Handoff) entre Capas

Estándares de Transparencia de Proveedores

Propósito

Requisitos de Divulgación en la Selección

1.1 Documentación de los Datos de Entrenamiento

1.2 Limitaciones Conocidas y Hallazgos de Sesgo

1.3 Objetivos de Optimización

1.4 Arquitectura de Categorías

1.5 Documentación de Gobernanza

Obligaciones de Transparencia Continua

2.1 Actualizaciones Materiales del Modelo

2.2 Nuevos Hallazgos de Sesgo o Limitaciones

2.3 Cambios en los Datos de Entrenamiento

2.4 Divulgación de Incidentes

Estructuras de Rendición de Cuentas Contractuales

3.1 Responsabilidad de la Capa de Entrenamiento

3.2 Recurso por Incumplimiento de Divulgación

3.3 Derechos de Auditoría

3.4 Proceso de Escalada Upstream

3.5 Representación de Gobernanza

Criterios de Evaluación de Proveedores

4.1 Calidad de la Divulgación

4.2 Evidencia del Proceso de Gobernanza

4.3 Aceptación de la Rendición de Cuentas

4.4 Historial de Transparencia Continua

Protocolo de Gobernanza de Fine-Tuning

Propósito

Requisitos de Procedencia de los Datos

1.1 Identificación de la Fuente

1.2 Propósito de la Recolección Original

1.3 Alcance Representativo

1.4 Problemas de Calidad de Datos Conocidos

1.5 Historial de Uso Previo

Estándares de Documentación del Consentimiento

2.1 Clasificación de la Base de Consentimiento

2.2 Documentación de la Base de Consentimiento

2.3 Evaluación del Alcance del Consentimiento

2.4 Obligaciones de Retiro y Eliminación

Proceso de Revisión de Categorías

3.1 Inventario de Categorías

3.2 Evaluación del Origen de la Categoría

3.3 Protocolo de Categoría Cuestionada

3.4 Autorización de Categorías

Requisitos de Auditoría Continua

Propósito

4.1 Inventario de Fine-Tuning

4.2 Ciclo de Auditoría

4.3 Desencadenantes de Revisión Fuera de Ciclo