Actualmente estoy escribiendo un algoritmo para privacidad diferencial usando el mecanismo de Laplace.
Lamentablemente no tengo antecedentes en estadísticas, por lo tanto, muchos términos son desconocidos para mí. Así que ahora estoy tropezando con el término: ruido de Laplace . Para que un conjunto de datos diferencial sea privado, todos los documentos solo hablan de agregar ruido de Laplace de acuerdo con la distribución de Laplace a los valores de la función.
(k es el valor privado diferencial, f el valor devuelto por la función de evaluación e Y el ruido de Laplace)
¿Significa esto que creo variables aleatorias de la distribución de Laplace de acuerdo con esta función que tengo de wikipedia https://en.wikipedia.org/wiki/Laplace_distribution ?
ACTUALIZACIÓN: tracé hasta 100 variables aleatorias extraídas de la función anterior, pero esto no me da una distribución de Laplace (ni siquiera cerca). Pero creo que debería modelar una distribución de Laplace.
ACTUALIZACIÓN2:
Esas son las definiciones que tengo:
(El mecanismo de Laplace). Dada cualquier función , el mecanismo de Laplace se define como: donde Y son iid variables aleatorias extraídas de
Tanto como:
Para generar Y (X), una opción común es usar una distribución de Laplace con media cero y parámetro de escala Δ (f) / ε
Respuestas:
Tienes razón, agregar ruido de Laplace significa que a tu variable agregas la variable que sigue a la distribución de Laplace . Hay varias razones por las que se llama ruido . Primero, piense en el procesamiento de la señal, donde el mensaje se envía a través de algún canal y debido a la naturaleza imperfecta del canal, la señal recibida es ruidosa, por lo que debe aislar la señal del ruido. En segundo lugar, en criptografía también hablamos sobre ruido pseudoaleatorio y la privacidad diferencial está relacionada con la criptografía. Tercero, en estadística y aprendizaje automático también podemos hablar sobre ruido estadístico , los modelos estadísticos incluyen términos de ruido o error, etc. (incluso hay un libro sobre pronosticar nombresX Y Señal y el ruido de Nate Silver). Por eso, utilizamos el ruido como sinónimo más preciso de aleatoriedad ambigua .
En cuanto a la generación aleatoria, hay varias formas de dibujar valores aleatorios después de la distribución de Laplace, por ejemplo:
En las siguientes gráficas, puede ver la distribución de muestras extraídas utilizando cada una de las funciones con la densidad de Laplace (línea roja).105 5
Para simplificar los ejemplos, uso la distribución estándar de Laplace con escala = 1, pero puede cambiar fácilmente los resultados multiplicando los resultados usando diferentes factores de escala.
fuente
La distribución exponencial de Laplace o doble cae exponencialmente a la izquierda y derecha alrededor de alguna media. Es básicamente el exponencial reflejado al otro lado.
Si desea la probabilidad, use la probabilidad de la exponencial y agregue un abs () al valor observado. La probabilidad logarítmica es simplemente el abs () de los residuos, multiplicado por la tasa de la exponencial.
Para muestrear, lo más fácil es dibujar de -1,1 y multiplicar con un dibujo de la distribución exponencial, que está disponible en la mayoría de los lenguajes de programación. Alternativamente, como se señaló anteriormente, también encontrará implementaciones directas de Laplace, pero puede requerir un poco más de búsqueda.
fuente