基于语法推导的溯源依赖关系路径模式挖掘算法

doi:10.16511/j.cnki.qhdxxb.2017.26.019

摘要
图/表
参考文献
相关文章
Metrics

全文: PDF(1205 KB)
输出: BibTeX | EndNote (RIS)

摘要溯源依赖关系路径模式是基于溯源数据的云数据服务安全策略的重要基础。该文阐述了依赖关系路径模式挖掘的重要意义，提出一种对数据溯源图进行预处理的线性排序算法，使利用自动机模型对溯源数据进行语法推导及解析成为可能；给出了基于自动机语法推导及解析的依赖关系路径间相似度的定义和计算方法；提出一种通用的依赖关系路径模式挖掘算法，在降低领域先验知识要求的前提下，支持溯源规则的自动学习。通过实例研究，验证了该算法在现实应用中的可行性。

	服务

	把本文推荐给朋友
	加入引用管理器
	E-mail Alert
	RSS

	作者相关文章
	裴继升
	叶晓俊

关键词 ：数据溯源, 依赖关系路径模式, 自动机, 聚类, 溯源规则学习

Abstract：Provenance dependency path patterns are the foundations of many provenance based cloud data security measures. This article analyzes the importance of provenance dependency path pattern mining in provenance based security system with a linearization algorithm for provenance graphs that enables grammar induction and parsing of provenance data using automata models. A similarity measurement method is given for dependency paths based on grammar parsing with a dependency path pattern mining algorithm to reduce reliance on the domain knowledge and support automatic provenance rule learning. The feasibility and effectiveness of the approach are demonstrated by experiments.

Key words： data provenance dependency path pattern automata clustering provenance based rule mining

收稿日期: 2016-07-01 出版日期: 2017-06-15

ZTFLH:

TP309.2

通讯作者: 叶晓俊,教授,E-mail:yexj@tsinghua.edu.cn E-mail: yexj@tsinghua.edu.cn

引用本文:

裴继升, 叶晓俊. 基于语法推导的溯源依赖关系路径模式挖掘算法[J]. 清华大学学报（自然科学版）, 2017, 57(6): 561-568.
PEI Jisheng, YE Xiaojun. Provenance dependency path pattern mining algorithm based on grammar induction. Journal of Tsinghua University(Science and Technology), 2017, 57(6): 561-568.

链接本文:

http://jst.tsinghuajournals.com/CN/10.16511/j.cnki.qhdxxb.2017.26.019 或 http://jst.tsinghuajournals.com/CN/Y2017/V57/I6/561

表１　基本概念定义

图１　溯源依赖关系路径模式挖掘算法基本流程

图２　溯源数据线性排列算法

图３　溯源数据语法推导与解析

图４　溯源数据语法推导及语法解析算法

图５　溯源依赖关系路径模式挖掘算法

图６　目标系统对应自动机模型推导结果

表２　挖掘得到的溯源依赖关系路径模式

表３　溯源规则学习决策表

[1]	Park J, Nguyen D, Sandhu R. A provenance-based access control model[C]//Privacy, Security and Trust (PST), 2012 Tenth Annual International Conference on. Paris, France:IEEE, 2012:137-144.
[2]	Sun L, Park J, Sandhu R. Engineering access control policies for provenance-aware systems[C]//Proceedings of the 3rd ACM conference on data and application security and privacy. San Antonio, CA USA:ACM, 2013:285-292.
[3]	Nguyen D, Park J, Sandhu R. Dependency path patterns as the foundation of access control in provenance-aware systems[C]//4th USENIX Workshop on the Theory and Practice of Provenance. Boston, MA USA:USENIX Association, 2012:4.
[4]	Nguyen D, Park J, Sandhu R. A provenance-based access control model for dynamic separation of duties[C]//Privacy, Security and Trust (PST), 2013 Eleventh Annual International Conference on. Tarragona, Spain:IEEE, 2013:247-256.
[5]	李斌, 王艺霏, 裴继升, 等. 基于溯源数据的业务流程合规性检测[J]. 清华大学学报(自然科学版), 2013, 53(12):1768-1776. LI Bin, WANG Yifei, PEI Jisheng, et al. Business process compliance checking based on provenance data[J]. J Tsinghua Univ (Sci & Tech), 2013, 53(12):1768-1776. (in Chinese)
[6]	Muniswamy-Reddy K K, Macko P, Seltzer M I. Provenance for the cloud[C]//8th USENIX Conference on File and Storage Technologies. San Jose, CA USA:USENIX Association, 2010:14-15.
[7]	Groth P, Moreau L. PROV-Overview:An Overview of The PROV Family of Documents[R]. Southampton, UK:W3C, 2013.
[8]	叶先一, 张福基. 偏序集上的一种拓扑排序[J]. 数学研究, 2005, 28(4):440-443. YE Xianyi, ZHANG Fuji. A topological sorting in partial order set[J]. Journal of Mathematical Study, 2005, 28(4):440-443. (in Chinese)
[9]	Carrasco R C, Oncina J. Learning stochastic regular grammars by means of a state merging method[M]//Grammatical Inference and Applications. Berlin Heidelberg:Springer, 1994:139-152.
[10]	Bergmann R, Müller G, Wittkowsky D. Workflow clustering using semantic similarity measures[M]//KI 2013:Advances in Artificial Intelligence. Berlin Heidelberg:Springer, 2013:13-24.
[11]	Margo D W, Smogor R. Using provenance to extract semantic file attributes[C]//4th USENIX Workshop on the Theory and Practice of Provenance. San Jose, CA, USA:USENIX Association, 2010:7-7.
[12]	Chen P, Plale B, Aktas M S. Temporal representation for mining scientific data provenance[J]. Future Generation Computer Systems, 2014, 36:363-378.

[1]	赵兴旺, 侯哲栋, 姚凯旋, 梁吉业. 基于注意力机制的两阶段融合多视图图聚类[J]. 清华大学学报（自然科学版）, 2024, 64(1): 1-12.
[2]	王立平, 史慧杰, 王冬. 面向智能制造的微服务聚类与选择方法[J]. 清华大学学报（自然科学版）, 2024, 64(1): 109-116.
[3]	姜文宇, 王飞, 苏国锋, 乔禹铭, 李鑫, 权威. 基于元胞自动机的以火灭火动态建模方法[J]. 清华大学学报（自然科学版）, 2023, 63(6): 926-933.
[4]	杜雨霁, 付明, 端木维可, 侯龙飞, 李静. 基于FAHP-ICV的燃气管网风险评估方法[J]. 清华大学学报（自然科学版）, 2023, 63(6): 941-950.
[5]	李聪健, 高航, 刘奕. 基于数值模拟和机器学习的风场快速重构方法[J]. 清华大学学报（自然科学版）, 2023, 63(6): 882-887.
[6]	熊谦, 唐文哲, 王忠静. 雄安新区水资源一体化管理要素分析与体系构建[J]. 清华大学学报（自然科学版）, 2023, 63(2): 255-263.
[7]	孙浩博, 杨开明, 朱煜, 鲁森. 基于密度聚类的磁悬浮平面电机模态参数估计[J]. 清华大学学报（自然科学版）, 2023, 63(1): 33-43.
[8]	朱唯一, 张雪芹, 顾春华. 基于EDLATrust算法的社交网络信息泄露节点概率预测[J]. 清华大学学报（自然科学版）, 2022, 62(2): 355-366.
[9]	郁湧, 王莹港, 罗正国, 杨燕, 王鑫锴, 高涛, 于倩. 基于聚类系数和节点中心性的链路预测算法[J]. 清华大学学报（自然科学版）, 2022, 62(1): 98-104.
[10]	肖熙, 徐晨. 基于声学状态似然值得分模型及监督状态模型的语音识别特征融合算法[J]. 清华大学学报（自然科学版）, 2019, 59(6): 476-481.
[11]	张继文, 宋立滨, 许君杰, 石循磊, 刘莉. 仿人足球机器人的非预定义足球检测算法[J]. 清华大学学报（自然科学版）, 2019, 59(4): 298-305.
[12]	骆歆远, 陈欣, 寿黎但, 陈珂, 吴妍静. 面向室内空间的语义轨迹提取框架[J]. 清华大学学报（自然科学版）, 2019, 59(3): 186-193.
[13]	李子浩, 田向亮, 黎忠文, 周炜, 周志杰, 钟茂华. 基于客流规律的地铁车站客流风险分析[J]. 清华大学学报（自然科学版）, 2019, 59(10): 854-860.
[14]	马锐, 高浩然, 窦伯文, 王夏菁, 胡昌振. 基于改进GN算法的程序控制流图划分方法[J]. 清华大学学报（自然科学版）, 2019, 59(1): 15-22.
[15]	索明亮, 周鼎, 安若铭, 李顺利. 邻域密度网格聚类算法及应用[J]. 清华大学学报（自然科学版）, 2018, 58(8): 732-739.

Viewed

Full text

Abstract

Cited

Shared

Discussed