code: Added functions for HUE

2021-09-29 19:56:59 +02:00
parent dd3cff7b30
commit 2aeb1149e5
1 changed files with 104 additions and 0 deletions
--- a/code/lib/lmdk_bgt.py
+++ b/code/lib/lmdk_bgt.py
@ -398,6 +398,61 @@ def adaptive_cont(seq, lmdks, epsilon, inc_rt, dec_rt):
  return rls_data, bgts, skipped
 def adaptive_cons(seq, lmdks, epsilon, inc_rt, dec_rt):
  '''
    Adaptive budget allocation.
    Parameters:
      seq - The point sequence.
      lmdks - The landmarks.
      epsilon - The available privacy budget.
      inc_rt - Sampling rate increase rate.
      dec_rt - Sampling rate decrease rate.
    Returns:
      rls_data - The perturbed data.
      bgts - The privacy budget allocation.
      skipped - The number of skipped releases.
  '''
  # Uniform budget allocation
  bgts = uniform(seq, lmdks, epsilon)
  # Released
  rls_data = [None]*len(seq)
  # The sampling rate
  samp_rt = 1
  # Track landmarks
  lmdk_cur = 0
  # Track skipped releases
  skipped = 0
  for i, p in enumerate(seq):
    # Check if current point is a landmark
    is_landmark = any((lmdks[:]==p).all(1))
    if is_landmark:
      lmdk_cur += 1
    if lmdk_lib.should_sample(samp_rt) or i == 0:
      # Add noise to original data
      o = lmdk_lib.add_laplace_noise(p[1], 1, bgts[i])
      rls_data[i] = [p[0], o]
      # Adjust sampling rate
      if i > 0:
        if abs(rls_data[i - 1][1] - o) < 1/bgts[i]:
          # Decrease
          samp_rt -= samp_rt*dec_rt
        else:
          # Increase
          samp_rt += (1 - samp_rt)*inc_rt
    else:
      skipped += 1
      # Skip current release and approximate with previous
      rls_data[i] = rls_data[i - 1]
      if is_landmark:
        # Allocate the current budget to the following releases uniformly
        for j in range(i + 1, len(seq)):
          bgts[j] += bgts[i]/(len(lmdks) - lmdk_cur + 1)
      # No budget was spent
      bgts[i] = 0
  return rls_data, bgts, skipped
 def skip(seq, lmdks, epsilon):
  '''
    Skip landmarks.
@ -459,6 +514,36 @@ def skip_cont(seq, lmdks, epsilon):
  return rls_data, bgts
 def skip_cons(seq, lmdks, epsilon):
  '''
    Skip landmarks.
    Parameters:
      seq - The point sequence.
      lmdks - The landmarks.
      epsilon - The available privacy budget.
    Returns:
      rls_data - The perturbed data.
      bgts - The privacy budget allocation.
  '''
  # Event-level budget allocation
  bgts = np.array(len(seq)*[epsilon])
  # Released
  rls_data = [None]*len(seq)
  for i, p in enumerate(seq):
    # Check if current point is a landmark
    is_landmark = any((lmdks[:]==p).all(1))
    # Add noise
    o = [p[0], lmdk_lib.add_laplace_noise(p[1], 1, bgts[i])]
    if is_landmark:
      if i > 0:
        # Approximate with previous
        o = rls_data[i - 1]
      bgts[i] = 0
    rls_data[i] = o
  return rls_data, bgts
 def sample(seq, lmdks, epsilon):
  '''
    Publish randomly.
@ -642,6 +727,18 @@ def uniform_cont(seq, lmdks, epsilon):
  return rls_data, bgts
 def uniform_cons(seq, lmdks, epsilon):
  # Released
  rls_data = [None]*len(seq)
  # Budgets
  bgts = uniform(seq, lmdks, epsilon)
  for i, p in enumerate(seq):
    is_landmark = any((lmdks[:]==p).all(1))
    # [timestamp, perturbed consumption]
    rls_data[i] = [p[0], lmdk_lib.add_laplace_noise(p[1], 1, bgts[i])]
  return rls_data, bgts
 def utility_analysis(seq, lmdks, o, epsilon):
  '''
    Analyze the utility.
@ -688,3 +785,10 @@ def mae_cont(o):
    if p[0] != p[1]:
      mae += 1/len(o)
  return mae
 def mae_cons(seq, o):
  mae = 0
  for i, p in enumerate(seq):
    mae += abs(p[1] - o[i][1])/len(seq)
  return mae