基于深度学习的轨迹隐私保护 刘忆宁 桂林电子科技大学 计算机与信息安全学院 计算机与信息安全学院简介  网络空间安全一级学科博士点;  计算机科学与技术、软件工程、网络空间安 全一级学科硕士点;拥有计算机技术、软件 工程 2 个工程硕士点。  拥有计算机科学与技术、软件工程、物联网 工程、信息安全、信息对抗技术、智能科学 与技术等 6 个本科专业。 研究背景 研究现状 基于深度学习的轨迹隐私保护 下一步研究内容 A 目 录 研究背景 大数据时代轨迹隐私泄露危机 户外运动健身 这些地图 APP 可 700 元买到大 能 隐私泄露危害多 追踪应用 量用户轨迹隐 正“偷窥”你的隐私 网络监管成难题 私 大数据时代轨迹隐私泄露危机 Strava 是一款户 外运动健身追踪应 用,该应用程序使 用 手 机 的 GPS 追 踪用户何时何地进 行锻炼,并通过分 享进行社交,可以 轻易泄漏军事基地 的位置和人员信息 。 在叙利亚、阿富汗等地,使用这款应用的几乎都是外国军人。军事基地的位置被用户活 动标记出来,放大后可以看到士兵们清晰的慢跑路线。 美国内华达州 51 区空军基地也存在用户运动的记录。 大数据时代轨迹隐私泄露危机 这些地图 APP 可能正“偷窥”你的隐私 去年 7 月 18 日,上海市消保 委 通 报 2018 地 图 类 手 机 App 涉及个人信息权限评测 结果。 实测中,各 App 敏感权限数 量各不相同。安卓系统中, 腾讯地图获取敏感权限数量 最少,只有 7 个;百度地图 获取敏感权限最多,为 14 个。 另有搜狗地图、高德地图、 图吧导航获取敏感权限的数 量分别为 10 个、 11 个、 13 个。 大数据时代轨迹隐私泄露危机 700 元就买到了轨迹隐私 南都周刊的记者 暗访黑灰产业链 上服务商,记者 在经过同事允许 后,进行实验。 结果花 700 元就 买到了同事“身份 证轨迹”,包括乘 机、开房、上网 吧等 11 项记录 B 目 录 研究现状 IoT 终端轨迹隐私保 护 轨迹抑制方案 K- 匿名方案: 将能唯一识别用户的 有选择的发布原始数据,不发送 属性泛化,使真实轨 那些能够暴露用户隐私的信息, 迹不能与其它轨迹相 以此来达到保护用户真实轨迹的 区分 目的。 差分隐私方案 假轨迹方案: 通过添加随机噪声扰动敏感数 为每条真实轨迹产生 据,在使某些数据失真的同时 一定的假轨迹来降低 保持其统计的性质。 真轨迹暴露的机率 其它方案 IoT 终端轨迹隐私保 护 假轨迹方案相对于其他方案的优势 只能截取 k 条无法 假轨迹方案 分辨真伪的轨迹 智能移动终端 TTP (可信第三 LBS (基于位置 信息未处 方) 的服务)提供商 理,无法 K 难以实现 - 匿名方案 防御信道 ,潜在的用户轨 端截取 轨迹抑制方案 迹隐私窃取者 差分隐私方案 IoT 终端轨迹隐私保护(假轨迹 法) H. Kido, Y. Yanagisawa, and T. Satoh, “An anonymous communication technique using dummies for location based Kido 等人首先提出虚拟轨道的基本概念 services,” in Proceedings of the 2nd International Conference on Pervasive Services (ICPS ’05), pp. 88 97, IEEE Press, Santorini, 。 Greece, July 2005. P.-R. Lei, W.-C. Peng, I.-J. Su , and C.-P. Chang, “Dummy- 提出了在旋转后获得的轨迹上增加交 Based schemes for protecting movement trajectories ,” Journal 叉点来增加虚拟轨迹的数量 of Information Science and Engineering,vol.28,no.2,pp.335– 350,2012. X. Wu and G. Sun, “A novel dummy-based mechanism to protect privacy on trajectories,” in Proceedings of the IEEE International Conference on 通过添加扰动生成虚假轨迹 Data Mining Workshop (ICDMW’14), pp. 1120–1125, Shenzhen, China, December 2014. R. Kato, M. Iwata, T. Hara et al., “A dummy-based anonymization method based on user trajectory with pauses,” in Proceedings of the 假设用户的移动是已知的并提 20th ACM International Conference on Advances in Geographic 出了一种基于虚拟匿名的方法 Information Systems (AGIS ’12), pp. 249–258, ACM, New York, NY, USA, 2012. IoT 终端轨迹隐私保护(假轨迹 法) B. Niu, Q. Li, X. Zhu, G. Cao, and H.Li. Achieving k-anonymity in privacy-aware location-based services. INFOCOM’14, pp. 考虑每个位置发送请求的概率,提出一 754–762, IEEE, Toronto, Canada, April-May 2014. 种基于背景信息的假轨迹生成算法 R. Kato, M. Iwata, T. Hara, Y. Arase, X. Xie, and S. Nishio,“User 在网格模式下生成用户周围的假位 location anonymization method for wide distribution of 置点 dummies,” in Database and Expert Systems Applications. LNCS, vol. 8056, pp. 259–273, Springer, Berlin Heidelberg, 2013. 考虑了用户所处区域的背景信 李凤华 , 张翠 , 牛犇 . 高效的轨迹隐私保护方案 . 通信学报 , 2015, 36(12). 息、用户行动模式和轨迹相似 性等特征 , 构建假轨迹 提出了一种基于时空关联性的 雷凯跃 , 李兴华 , 刘海 , et al. 轨迹发布中基于时空关联 性的假轨迹隐私保护方案 . 通信学报 , 2016(12):156-164. 假轨迹隐私保护方案 传统假轨迹生成方案存在的问题 未考虑背景地 A B 传统数学建模 A B 图信息或背景 方法未能完全 地图建模过于 对轨迹的信息 复杂 建模 D C D 未考虑人类移 C 生成的假轨迹 动模式 的时空分布与 真实轨迹不符 C 目 录 基于深度学习的 轨迹隐私保护 基于深度学习的假轨迹鉴别器 数据集搜集 1 轨迹数据预处理 2 神经网络模型 假轨迹识别框架 3 4 实验及结果分析 改进的假轨迹 5 6 生成方案 数据集( GeoLife GPS Trajectories ) 实验数据来自微软 GeoLift 项目 , 从 2007 年 4 月到 2012 年 8 月收集了 182 个用户的轨迹数据。这些数据包含了一系列以时间为序的点,每一个 点包含经纬度、海拔等信息。包含了 17621 个轨迹,总距离 120 多万公 里,总时间 48000 多小时。 工作 时间为序 120 多万公 里 购物 182 个 经纬度 位置轨迹 48000 多 旅游 用户 17621 个 户外活动 轨迹 小时 轨迹 远足 骑自行车 轨迹数据预处理 球面坐标平面化 A Step 1 Step 5 相对坐标 B E 矩阵化 X,Y Step 2 Step 4 相对偏移角 (roa) Step D 相对长度 C 3 (rl) 神经网络模型 RNN RNN 不仅考虑前一时 刻的输入 , 而且赋予 了网络对前面的内容 的一种记忆功 CNN 能 . CNN RNN CNN 是一类包含卷 积计算且具有深度 结构的前馈神经网 络 , 是深度学习的 代表算法之一。 基于 CNN 的假轨迹鉴别器 分别将轨迹特征 ft(roa,rl) 和 rt(X,Y) 投入到卷积 神经网络中,经过左右 两 个 神 经 网 络 得 到 softmax1 和 softmax2 ,再 将这两 个值乘以权重相加,得 到的值做交叉熵的操作 得到损失值,最后根据 损失值做梯度下降更新 权重 W 和 b ,重复迭代 最终完成网络的训练 基于 LSTM 的假轨迹鉴别 器 将 轨 迹 点 的 特 征 表 示 TP ( roa,rl,X,Y )以时间序列 分别投入到神将网络中, 得出的值 Hn 经由一个全连 接层再经 softmax 操作的到 分类概率。如果是训练过 程,则将分类概率做交叉 熵操作得到损失值,做梯 度下降以更新 W 和 b 假轨迹识别框架 将一条长轨迹段 分割为等长的若 干轨迹段,每一 个轨迹段都投入 神经网络鉴别器 中鉴别,若一条 长轨迹分为 n 段 ,共有 k 段识别 为 真 , 若 k/n>threshold , 则判别该长轨迹 为真,否则为假 实验及结果分析——基于 CNN 的鉴别器 假轨迹生成算法生成轨迹的识别率 (roa , rl) 和 (X , Y) 的权值对识别率 的影响 实验表明,对于算法生成的轨迹,基于 实验表明,当 (roa,rl)

pptx文档 深度学习隐私保护

专业资料 > 经营营销 > 销售/营销 > 文档预览
38 页 0 下载 15 浏览 0 评论 0 收藏 3.0分
温馨提示:如果当前文档出现乱码或未能正常浏览,请先下载原文档进行浏览。
深度学习隐私保护 第 1 页 深度学习隐私保护 第 2 页 深度学习隐私保护 第 3 页 深度学习隐私保护 第 4 页 深度学习隐私保护 第 5 页
下载文档到电脑,方便使用
还有 33 页可预览,继续阅读
本文档由 饿了么2019-10-06 23:14:46上传分享
给文档打分
您好可以输入 255 个字符
策划大学的官方网址是?( 答案:cehuadaxue.com )
评论列表
  • 暂时还没有评论,期待您的金玉良言