¿Qué significa la privacidad para la Oficina del Censo?
November 22, 2024 | 7 minutes read
¿Qué es la privacidad diferencial?
Según la Oficina del Censo, la agencia protege su privacidad y sus respuestas “empleando una técnica llamada privacidad diferencial.” ¿Qué es la privacidad diferencial? ¿Cómo protege los datos identificativos si la información se comparte o se divulga? La privacidad diferencial es un sistema que permite a empresas, gobiernos y organizaciones compartir la información contenida en un conjunto de datos mediante descripciones, sin dar la fecha exacta.
A menudo esta información se pone en dos conjuntos de datos que son equivalentes en los datos globales, pero los datos contienen algunos datos de sustitución que ayudan a proteger al individuo. Esto también impide a las empresas combinar varios conjuntos de datos para dar marcha atrás y utilizar algoritmos informáticos para determinar a quién pertenecen los datos.
Los fundamentos de la privacidad diferencial son que si las sustituciones son lo suficientemente pequeñas, los resultados de los datos consultados no pueden proporcionar detalles sobre un individuo concreto, pero la información sigue siendo relevante. Los datos pueden ser estudiados por organismos sanitarios y de otro tipo para saber más sobre la sociedad, la salud, etc. Por privacidad diferencial entienden “que la privacidad de una persona no puede verse comprometida por una publicación estadística si sus datos no están en la base de datos”.
Como la privacidad diferencial fue desarrollada inicialmente por criptógrafos, ambas cosas suelen estar relacionadas. Se sabe que organismos gubernamentales, como la Oficina del Censo, utilizan algoritmos de privacidad diferencial para publicar datos demográficos. Esto se hace publicando agregados estadísticos, que dan pistas sobre el comportamiento de los usuarios sin ceder ninguna información identificativa.
¿Qué es un algoritmo diferencial?
Aunque suene complicado, cualquier algoritmo se considera diferencialmente privado si el resultado observado no puede relacionarse con la fuente individual que se utilizó en el cálculo. Se cree que los algoritmos diferencialmente privados son resistentes a los ataques de identificación y reidentificación.
¿Qué es la nueva herramienta de privacidad?
Dieciséis estados están actualmente implicados en un pleito con la Oficina del Censo para reducir la privacidad de los datos de los ciudadanos estadounidenses. Mientras los estadounidenses de todo el mundo claman por una mayor protección de la intimidad, existen preocupaciones obvias relacionadas con la forma en que la información privada y pertinente se salvaguarda del consumo público.
La demanda comenzó cuando el estado de Alabama acusó a la Oficina del Censo de utilizar una nueva herramienta de privacidad conocida como “privacidad diferencial”. El concepto de privacidad diferencial consiste en proteger los datos contenidos en una base de datos. Esto significa que la Oficina del Censo utiliza todos los medios disponibles para proteger su privacidad frente a empresas que podrían manipularla y hacer un mal uso de ella.
En 2006, los científicos de datos Cynthia Dwork, Frank McSherry, Kobbi Nissim y Adam D. Smith presentaron sus estudios y conceptos de privacidad diferencial en un artículo científico. El artículo detallaba la idea de “ruido” que se añade a una base de datos para proteger los puntos de datos individuales. El ruido, o minúsculos ajustes matemáticos, se utiliza para alterar los datos tan levemente que puedan utilizarse en estudios, negocios o salud. El objetivo de utilizar ruido es que generalizar los datos o dar a conocer los resultados de unas pocas consultas puede exponer los datos al público.
La reidentificación es una de las razones por las que la Oficina del Censo optaría por aplicar la privacidad diferencial. La reidentificación funciona cuando una empresa o entidad intenta averiguar la información privada de una base de datos concreta. Utilizan algoritmos inteligentes y fuentes de datos adicionales para averiguarla, cotejando puntos de datos correspondientes de múltiples bases de datos. A través de estos medios se pueden encontrar datos privados.
¿Qué significa para usted la privacidad del censo?
Dado que la Oficina del Censo contiene la información privada de cientos de millones de ciudadanos estadounidenses, es imprescindible que estos datos se recopilen y protejan de la manera más eficaz posible. Por consiguiente, las preguntas típicas de un formulario del censo pedirán a los ciudadanos detalles sobre su:
- Raza.
- Edad.
- Sexo.
- Si es de origen hispano.
- Detalles sobre quién vive con usted.
- Tipo de vivienda.
Aunque las estadísticas del Censo se recopilan con el pretexto de documentar los cambios demográficos constantes de la población estadounidense, los cambios en la forma de recopilar, almacenar y difundir esta información al público sin duda plantearán interrogantes. Por ejemplo, dado que los datos del Censo son imprescindibles para el panorama político estadounidense, es muy importante que todas las personas que viven dentro de un bloque de votantes concreto estén representadas y contabilizadas con exactitud en todo momento. El concepto de privacidad diferencial plantea interrogantes sobre los procesos que la Oficina del Censo utiliza para recopilar datos a ojos de algunos ciudadanos estadounidenses.
¿Quién se opone?
La premisa de la demanda del estado de Alabama contra la Oficina del Censo es que el uso de la privacidad diferencial deja margen para que los indocumentados corrompan y manipulen las cifras demográficas. A su vez, el estado de Alabama sostiene que la documentación incorrecta socava su poder político en el país, ya que los votos electorales y los escaños en el Congreso se delegan en función de la población de cada estado. Aunque Alabama fue el primer estado en plantear su preocupación por las prácticas de la Oficina del Censo, otros quince estados también han presentado sus respectivas demandas, entre ellos:
- Alaska.
- Arkansas.
- Florida.
- Kentucky.
- Luisiana.
- Maine.
- Mississippi.
- Montana.
- Nebraska.
- Nuevo México.
- Ohio.
- Oklahoma.
- Carolina del Sur.
- Texas.
- Utah.
- Virginia Occidental.
El problema fundamental planteado en la demanda por los dieciséis estados es que, dado que la privacidad diferencial crea información falsa por diseño, impide a los estados acceder a información de ámbito municipal crucial para desempeñar sus funciones esenciales de gobierno. Además, es probable que el impacto distorsionador de la privacidad diferencial recaiga con mayor dureza sobre algunas de las poblaciones más vulnerables, como las personas que viven en zonas rurales y los grupos étnicos minoritarios.
Por ello, muchos grupos de derechos civiles de la comunidad afroamericana han expresado su preocupación por el uso de la privacidad diferencial. Dado que EE.UU. no tiene una sólida historia de tolerancia racial ni mucho menos de aceptación, es comprensible que los cambios en el sistema de la Oficina del Censo alarmen a los líderes de la comunidad negra. Dado que las minorías ya se encuentran en desventaja numérica en lo que respecta al poder político, la falta de datos precisos hace cada vez más difícil que estos grupos formen una mayoría en una comunidad o distrito determinados. Estos grupos de derechos civiles se preguntan si la aplicación de la privacidad diferencial podría diluir o incluso anular su poder político local.
Aunque California aún no se ha unido a la demanda, funcionarios del estado han planteado sus preocupaciones a la administración actual. Aunque han mostrado cierta reserva a la hora de unirse a la demanda, son uno de los muchos estados en los que los legisladores han empezado a cuestionar la forma en que la Oficina del Censo recopila los datos. La principal preocupación es el impacto que esto podría tener en la capacidad de un estado para garantizar la legitimidad de los resultados de las votaciones en todas las elecciones. Aunque actualmente hay dieciséis estados implicados en la demanda, veintisiete se enfrentan a plazos relacionados con la redistribución política de distritos.
Estos estados buscan métodos alternativos para extraer los datos requeridos e incluso han llegado a reescribir las leyes relativas a los plazos de redistribución de distritos. Aunque la privacidad diferencial pueda parecer una herramienta menor en el arsenal que emplea la Oficina del Censo para rastrear la ciudadanía estadounidense, no cabe duda de que ha suscitado un debate nacional sobre la importancia de la privacidad personal y las mejores formas de mantenerla.