Anonimización de datos, privacidad y seguridad empresarial
December 13, 2024 | 5 minutes read
A medida que los datos personales se han convertido en un bien valioso tanto para las empresas como para los consumidores, muchas personas se preocupan por las formas en que su información puede protegerse del acceso y la divulgación no autorizados. En este sentido, la anonimización de datos es un método que puede utilizarse para salvaguardar la información personal, ya que la técnica consiste en alterar los datos de modo que no puedan utilizarse para identificar a una persona concreta. Más concretamente, Google define el proceso como “una técnica de procesamiento de datos que elimina o modifica la información de identificación personal; el resultado son datos anónimos que no pueden asociarse a ninguna persona”. También es un componente fundamental del compromiso de Google con la privacidad”.
Para ilustrar la aplicabilidad de la anonimización de datos a gran escala, la Oficina del Censo de Estados Unidos lleva muchos años utilizando la privacidad diferencial para ayudar a proteger los datos demográficos de los ciudadanos estadounidenses. Posteriormente, la privacidad diferencial es una forma de anonimización de datos que “permite a los investigadores y analistas de bases de datos disponer de una facilidad para obtener la información útil de las bases de datos, que contienen información personal de las personas, sin divulgar la identificación personal sobre los individuos”. Para ello, existen muchas otras técnicas que pueden utilizarse para anonimizar datos personales.
Enmascaramiento de datos
Una de las principales técnicas que pueden utilizarse para anonimizar datos personales es el proceso de enmascaramiento de datos. El enmascaramiento de datos crea una versión falsa, aunque aparentemente realista, de los datos de una empresa u organización, ocultando los datos legítimos tras el velo de valores alterados de dicha información. Por ejemplo, las empresas que deseen proteger su información personal mediante el enmascaramiento de datos podrían utilizar símbolos y caracteres como asteriscos o letras como y y x como marcadores de posición de los números y letras legítimos que pueden estar presentes en el conjunto de datos real. Alternativamente, una empresa también podría aleatorizar ciertas formas de datos personales, como nombres y números de cuenta, en un esfuerzo por frustrar a los ciberdelincuentes.
Seudonimización
Por otro lado, la seudonimización es otra técnica que puede utilizarse para anonimizar la información personal. La seudonimización funciona para sustituir la información personal identificable por información ficticia que “mantiene la integridad referencial y la precisión estadística, permitiendo así que los procesos empresariales, los sistemas de desarrollo y prueba, los programas de formación y los análisis funcionen con normalidad.” Además, la seudonimización es ideal para las empresas que necesitan proteger sus datos personales y, al mismo tiempo, utilizar dicha información para otros fines, como formación, almacenamiento de datos y prueba de productos y servicios, entre otros. Un ejemplo común de seudonimización es la sustitución de un nombre legítimo por un nombre de marcador de posición, como John Doe.
Datos sintéticos
Por el contrario, un tercer método que una organización puede utilizar para anonimizar la información personal es la creación de datos sintéticos. Al igual que el enmascaramiento de datos y la seudonimización, una empresa puede utilizar datos sintéticos para combatir a los piratas informáticos y a los malos actores que puedan estar intentando robar su información personal. Sin embargo, el uso de datos sintéticos para proteger información empresarial legítima difiere de estas otras técnicas en que los datos en cuestión se crean artificialmente mediante el uso de un algoritmo que genera datos automáticamente. Para ello, se entrenará a un algoritmo para que genere datos falsos tras ser entrenado en una base de datos que contenga la información personal real de una organización.
Inconvenientes de la anonimización de datos
A pesar de las muchas ventajas de la anonimización de datos en relación con la protección de la información personal, ningún método de anonimización de datos es completamente infalible. Dicho esto, muchos investigadores de seguridad, además de los ciberdelincuentes que atacan las bases de datos de empresas y organizaciones, han demostrado que los datos anonimizados pueden ser efectivamente desanonimizados. Como afirma la destacada empresa de servicios de marketing basados en datos TechTarget, “la desanonimización es una estrategia de minería de datos en la que los datos anónimos se cruzan con otras fuentes de datos para volver a identificar la fuente de datos anónima”.
Por esta razón, aunque la anonimización de datos puede ser sin duda una herramienta útil en determinadas situaciones, las empresas que buscan un medio infalible para salvaguardar sus datos deben buscar métodos más permanentes para ofuscar dichos datos. Desde métodos de eliminación de datos como la redacción hasta técnicas de conversión de datos como el cifrado, una empresa que busque dar a sus clientes la completa seguridad de que sus datos personales seguirán siendo confidenciales en todo momento tendrá invariablemente que impedir que otros accedan a dichos datos por completo.
En 2021 se produjo el mayor número de filtraciones de datos en un año natural de toda la historia, por lo que las empresas de todo el mundo siguen buscando nuevas formas de proteger su información personal. Debido a este hecho, muchas empresas han comenzado a utilizar el proceso de anonimización de datos para lograr estos objetivos, ya que varios métodos de anonimización de datos han sido apoyados por la legislación de privacidad en todo el mundo, incluyendo el Reglamento General de Protección de Datos (GDPR) de la UE. Como resultado, aunque la anonimización de datos ya es una práctica común para muchas empresas, seguramente será aún más habitual en un futuro próximo.