Redacción, desidentificación y anonimización, New Data
September 24, 2024 | 8 minutes read
Proteger los datos identificativos
Casi todas las empresas se enfrentan al manejo de una enorme cantidad de datos sobre sus consumidores para poder hacer negocios. En la actualidad, también existe una legislación sobre privacidad que las empresas deben cumplir para mantener y respetar la privacidad de sus consumidores. Existen normativas sobre cómo gestionar la información de identificación personal o IPI.
Dos políticas públicas que se han promulgado son el Reglamento General de Privacidad de Datos (GDPR) y la Ley de Privacidad del Consumidor de California (CCPA). Aunque estas normativas puedan parecer localizadas en su nombre, se aplican a escala mundial. Si su empresa quiere hacer negocios con consumidores de la UE o California, independientemente de dónde esté ubicada, debe cumplirla.
¿Qué se entiende exactamente por IPI? Datos personales, información personal o IIP puede ser cualquier información relativa a la identidad de una persona. IIP” es una abreviatura muy utilizada en Estados Unidos. Sin embargo, puede ser una definición incompleta. Las iniciales son sustitutivos frecuentes de cuatro variantes comunes de palabras. Puede basarse en personal o personalmente e identificable o identificativo. Todas estas formas tienen distintas definiciones legales según el estado o jurisdicción en que se utilice. Otras leyes sobre privacidad de datos son más completas. El RGPD incluye el término datos personales, y su ámbito de aplicación es mucho más amplio.
El Instituto Nacional de Normas y Tecnología (NIST) intenta establecer una definición estándar de lo que se consideran datos personales. Según su interpretación de la IIP, ésta incluye “cualquier información sobre una persona que conserve un organismo, incluyendo (1) cualquier información que pueda utilizarse para distinguir o rastrear la identidad de una persona, como el nombre, el número de la seguridad social, la fecha y el lugar de nacimiento, el apellido de soltera de la madre o los registros biométricos; y (2) cualquier otra información vinculada o vinculable a una persona, como información médica, educativa, financiera y laboral”.
Un ejemplo de cómo puede haber cierta confusión es la dirección IP de una persona. En Estados Unidos, la dirección IP de una persona no se clasifica como IIP por sí sola, sino que se considera una forma de datos de IIP vinculados. En otros países, incluida la UE, la dirección IP de una persona se considera parte de su IIP.
La IIP puede aplicarse a cualquier tipo de datos, principalmente a aquellos que son únicos o que incluso están vinculados con otros datos para identificar a una sola persona. Esto puede incluir nombres, números de la seguridad social, direcciones, números de teléfono, datos de tarjetas de crédito e incluso direcciones IP en algunos casos. Cualquier dato que pueda utilizarse para rastrear la identidad de una sola persona puede clasificarse como IIP.
Para salvaguardar este tipo de datos, es responsabilidad del organismo, ya sea una pequeña empresa, una gran empresa o incluso una entidad gubernamental, proteger la información de abusos o violaciones de sus sistemas de datos. La forma de hacerlo es mediante la redacción, anonimización o desidentificación de los datos. Una vez que los datos se han utilizado o han llegado al final de su vida útil, deben destruirse.
¿Qué es la anonimización?
Como empresa que maneja una gran variedad de datos, es bueno comprender la gama de opciones disponibles para proteger los datos. Esta comprensión ayuda a tomar una decisión informada sobre la mejor solución a adoptar. La anonimización es una de esas opciones.
Cuando una empresa desea sanear sus datos para protegerlos, la anonimización es un método que describe la eliminación de datos. Cuando se anonimiza un conjunto de datos, como los historiales médicos de varios pacientes con fines de estudio, se describe la eliminación de toda la IIP del conjunto de datos antes de su uso o distribución para proteger la privacidad de la persona.
Las anonimizaciones de datos se han definido como un “proceso mediante el cual los datos personales se alteran de forma irreversible, de modo que el interesado ya no pueda ser identificado directa o indirectamente, ni por el responsable del tratamiento por sí solo ni en colaboración con ninguna otra parte”. Con este método, los datos restantes pueden compartirse o dispersarse a otros organismos para su uso.
Cuando se trata de historiales médicos o sanitarios, la información eliminada del conjunto de datos puede ser un nombre, una dirección, una fecha de nacimiento, un número de teléfono u otros datos que puedan utilizarse para identificar a un paciente concreto.
Los datos anonimizados conllevan cierto riesgo. Siempre existe la posibilidad de que, con dos o más conjuntos de datos, esa información se desanonimice al cotejar conjuntos de datos similares. El uso de la generalización y la perturbación son dos métodos populares de anonimización. Se denomina seudonimización al proceso de crear dos conjuntos de datos en los que los datos quedan oscurecidos, pero que, al combinarse posteriormente, pueden definir a un único individuo.
¿Cómo funciona la desidentificación?
La desidentificación de conjuntos de datos es el proceso mediante el cual se elimina la información personal de los datos, pero se dejan intactos los datos restantes. Dado que los datos residuales no se modifican, se convierten en un objetivo fácil para la seudonimización. Es una forma más débil de anonimización y, a menos que la información se conserve internamente y no se distribuya, no garantiza la privacidad de los datos personales.
La anonimización es un proceso complicado y necesita de alguien familiarizado con los datos y el cifrado para manejarlo adecuadamente. Como ves, si tienes dos conjuntos de datos que han sido desidentificados, fusionarlos permitiría descubrir a quién pertenecía la información.
Conceptos básicos de la redacción
La redacción es un proceso de eliminación total de los datos para poder compartirlos, distribuirlos o publicarlos. Los datos restantes no deben revelar, por decisión propia, la identidad de la información personal al titular del conjunto de datos.
A menudo, cuando se mira un documento redactado, hay partes bloqueadas con recuadros negros que cubren los datos que deberían estar oscurecidos. Ha sido un error fatal para las empresas incluir información con recuadros negros pensando que esto era lo mismo que la redacción, sólo para descubrir más tarde que los metadatos todavía contenían la información y han sido expuestos públicamente. Este tipo de error puede costar valiosos negocios y la confianza de los consumidores.
¿Qué significa todo esto? El término redactar se define como “editar o preparar para publicar”. La idea en sí puede parecer sencilla, pero puede ser increíblemente difícil de llevar a cabo. Además, la forma en que se hace y quién lo hace antes de que la empresa pueda distribuir los datos también puede tener un impacto en la seguridad.
El uso interno de una aplicación de redacción como la que ofrece CaseGuard y la gestión de la redacción dentro de la propia empresa reducen este riesgo. Un proveedor profesional de servicios de redacción que comprenda y siga la redacción para cumplir los requisitos legislativos también es una opción. CaseGuard también ofrece servicios de redacción que exceden los estándares de la industria. CaseGuard puede manejar discretamente sus datos de manera profesional, realizar servicios de redacción y devolver los archivos redactados.
La redacción requiere habilidad. Tampoco se trata simplemente de apretar el botón de borrar. Para redactar correctamente un documento, un vídeo o un conjunto de datos de audio, la persona o empresa encargada de la redacción debe conocer a fondo la legislación sobre privacidad y su impacto en el trabajo que se está realizando. Cada conjunto de datos es único, y saber qué campos son significativos para el proceso de redacción requiere una comprensión no sólo de la ley, sino también de cómo podría reutilizarse para reformar los datos.
Si no se gestiona correctamente y se omiten campos o cuadros de imagen específicos, puede tener graves consecuencias, ya que las fuerzas del orden utilizan la redacción de sus vídeos de cámaras corporales antes de su publicación. Si una persona detenida es declarada inocente y se omiten fotogramas del vídeo, alguien puede determinar su identidad. Esta información puede ser mal manejada o incluso utilizada de forma discriminatoria, por ejemplo, costándole a la persona su empleo u otros beneficios.
¿Qué método es mejor?
Dejando a un lado la desidentificación, los dos mejores métodos son la redacción y la anonimización. Es mejor que un profesional de la privacidad trabaje con la empresa para determinar cuál es el mejor método y qué datos deben eliminarse. Un profesional de la privacidad puede ayudar a una empresa a comprender los datos, de dónde proceden, cómo se utilizan, quién maneja los datos y, al final, cómo se destruyen. Establecer un proceso empresarial a través de un profesional de la privacidad es probablemente la mejor opción para todos.
En cuanto a los distintos niveles de privacidad exigidos por las numerosas leyes diferentes, puede convertirse en una lucha intentar ajustarse a todos ellos. El mejor consejo es que su profesional de la privacidad encuentre el nivel de seguridad más alto para cada tipo de datos para el que se ha creado la legislación. Si su empresa hace siempre más de lo exigido, hay menos posibilidades de que se produzcan violaciones de datos, pérdida de datos y, en definitiva, pérdida de confianza de los consumidores.