marzo 29, 2024

NIST utiliza técnicas de privacidad diferencial de crowdsourcing para conjuntos de datos de seguridad pública

El Instituto Nacional de Estándares y Tecnología (NIST) lanza el Desafío del mapa temporal de privacidad diferencial. Se trata de una serie de concursos, con premios en efectivo adjuntos, cuyo objetivo es recopilar nuevas formas de manejar la información de identificación personal (PII) en conjuntos de datos de seguridad pública.

El problema es que, si bien los datos ricos y detallados son valiosos para los investigadores y para la construcción de modelos de inteligencia artificial, en este caso, en las áreas de planificación de contingencias y epidemiología, plantean preguntas serias y potencialmente peligrosas sobre la privacidad y derechos de datos. Aunque los conjuntos de datos se mantienen bajo un bloqueo y bloqueo proverbial, los atacantes pueden, basándose en algunos puntos de datos, volver a inferir información confidencial sobre las personas.

La solución es anonimizar los datos para que sigan siendo útiles sin comprometer la privacidad de las personas. NIST ya tiene un estándar claro para lo que eso significa. En parte, y en pocas palabras, dice que “la desidentificación elimina la información de identificación de un conjunto de datos para que los datos individuales no se puedan vincular a individuos específicos”.

El objetivo del desafío es encontrar mejores formas de hacer esto con una técnica llamada privacidad diferencial. La privacidad diferencial esencialmente introduce suficiente ruido en los conjuntos de datos para garantizar la privacidad. Se usa ampliamente en productos de compañías como Google, Apple y Nvidia, y los legisladores se apoyan en él para informar su política de privacidad de datos.

En particular, el desafío se centra en los datos de mapas de tiempo, que contienen información temporal y espacial. El aviso para el concurso NIST dice: “Las agencias de seguridad pública recopilan datos extensos que contienen información temporal, geográfica y potencialmente identificable personalmente”. Por ejemplo, una llamada al 911 revelaría el nombre, la edad, el sexo, la dirección, los síntomas o la situación de una persona y más. “Los datos del mapa de tiempo son de particular interés para la comunidad de seguridad pública”, dice la invitación.

El Desafío del mapa temporal de privacidad diferencial se basa en desafíos de privacidad diferencial anteriores similares del NIST, uno centrado en datos sintéticos y otro destinado a desarrollar la técnica de manera más general.

NIST ofrece un total de $ 276,000 en premios en efectivo en tres categorías. La porción de Better Meter Stick tiene $ 29,000 para voces que miden la calidad de algoritmos diferencialmente privados. Hay un total de $ 147,000 disponible para aquellos que logran el mejor equilibrio entre la utilidad de los datos y la retención de la privacidad. Y el ala de la competencia que premia la usabilidad del código fuente para los esfuerzos de código abierto tiene $ 100,000 disponibles.

El desafío está abierto al registro desde ahora hasta el 5 de enero de 2021. Las agencias no federales asociadas para el desafío incluyen DrivenData, HeroX y Knexus Research. Los ganadores se darán a conocer el 4 de febrero de 2021.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *