南京大学学报(自然科学版)
南京大學學報(自然科學版)
남경대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY(NATURAL SCIENCES)
2014年
1期
86-94
,共9页
徐健锋%张远健%Zhou Duanning%Li Dan%李宇
徐健鋒%張遠健%Zhou Duanning%Li Dan%李宇
서건봉%장원건%Zhou Duanning%Li Dan%리우
时间序列%粒计算%不确定性%聚 类
時間序列%粒計算%不確定性%聚 類
시간서렬%립계산%불학정성%취 류
time-series%granular computing%uncertain%clustering
在多粒度时间序列研究中不确定性问题是时间序列数据挖掘研究中的重要课题。时间序列时序粒度本身的不稳定是一种广泛存在现象,也是时间序列数据挖掘困难的一个重要原因,然而这种情况却较少文献进行过讨论。对于这个问题首先建立了多粒度时间序列的基础数据模型及相关时序粒度的定义。其次对时间粒度不确定性现象的不同成因进行了讨论,并建立相应的不确定性时间序列数据模型。最后基于上述理论和粒计算的思想,多粒度时间序列的最优粒度获取和不确定性粒度时序粒度的基本稳定策略分别进行了研究和讨论。由于聚类分析是时间序列数据挖掘中的最重要的理论研究和应用基础之一,不确定性多粒度时间序列数据的聚类成为一个典型的时间序列数据挖掘难题。一个引入稳定粒度策略的聚类算法框架被提出来解决这类不确定性时间序列数据的聚类问题。最后一个典型的具有不稳定粒度时间序列特点的重症监护病房生理指标数据集和病人存活率预测实验被应用于验证上述理论。实验结果表明在时间序列数据挖掘中选择不同的时间属性粒度对于数据挖掘的效果符合粒计算的计算规律,同时选择了粒度稳定性处理策略聚类算法的实验能够获得更好的预测效果。
在多粒度時間序列研究中不確定性問題是時間序列數據挖掘研究中的重要課題。時間序列時序粒度本身的不穩定是一種廣汎存在現象,也是時間序列數據挖掘睏難的一箇重要原因,然而這種情況卻較少文獻進行過討論。對于這箇問題首先建立瞭多粒度時間序列的基礎數據模型及相關時序粒度的定義。其次對時間粒度不確定性現象的不同成因進行瞭討論,併建立相應的不確定性時間序列數據模型。最後基于上述理論和粒計算的思想,多粒度時間序列的最優粒度穫取和不確定性粒度時序粒度的基本穩定策略分彆進行瞭研究和討論。由于聚類分析是時間序列數據挖掘中的最重要的理論研究和應用基礎之一,不確定性多粒度時間序列數據的聚類成為一箇典型的時間序列數據挖掘難題。一箇引入穩定粒度策略的聚類算法框架被提齣來解決這類不確定性時間序列數據的聚類問題。最後一箇典型的具有不穩定粒度時間序列特點的重癥鑑護病房生理指標數據集和病人存活率預測實驗被應用于驗證上述理論。實驗結果錶明在時間序列數據挖掘中選擇不同的時間屬性粒度對于數據挖掘的效果符閤粒計算的計算規律,同時選擇瞭粒度穩定性處理策略聚類算法的實驗能夠穫得更好的預測效果。
재다립도시간서렬연구중불학정성문제시시간서렬수거알굴연구중적중요과제。시간서렬시서립도본신적불은정시일충엄범존재현상,야시시간서렬수거알굴곤난적일개중요원인,연이저충정황각교소문헌진행과토론。대우저개문제수선건립료다립도시간서렬적기출수거모형급상관시서립도적정의。기차대시간립도불학정성현상적불동성인진행료토론,병건립상응적불학정성시간서렬수거모형。최후기우상술이론화립계산적사상,다립도시간서렬적최우립도획취화불학정성립도시서립도적기본은정책략분별진행료연구화토론。유우취류분석시시간서렬수거알굴중적최중요적이론연구화응용기출지일,불학정성다립도시간서렬수거적취류성위일개전형적시간서렬수거알굴난제。일개인입은정립도책략적취류산법광가피제출래해결저류불학정성시간서렬수거적취류문제。최후일개전형적구유불은정립도시간서렬특점적중증감호병방생리지표수거집화병인존활솔예측실험피응용우험증상술이론。실험결과표명재시간서렬수거알굴중선택불동적시간속성립도대우수거알굴적효과부합립계산적계산규률,동시선택료립도은정성처리책략취류산법적실험능구획득경호적예측효과。
Uncertainty is a major and important property in the study of time series data mining under the background of multi-granular research.It is found that the instability of temporal granularity itself is a widespread phenomenon, but due to the variability of granularity,it is a non-trivial task to develop feasible solutions.As a result,few papers report efficient idea for this problem.To describe it systematically,a basic model of the uncertain multi-granularity time series with related basic definition is proposed initially.Based on the above theory,the reason of uncertain time series granularity is analyzed,and a strategy of stabling time granularity algorithm is then proposed.Finally,an optimal strategy of granularity selection for multi-granularity time series and a tactic for decreasing the variability of uncertain granularity are studied and discussed respectively.Uncertain multi-granularity time series data clustering requires cluster analysis since it is a fundamental job for further process such as prediction and analysis in time-series data,but due to the complexity,it becomes a special challenging.We introduce a stable temporal granularity clustering algorithm framework to solve the uncertain time series data clustering problem.An Intensive Care Unit Survival prediction experiment with the property of uncertainty in temporal granularity is conducted to verify the above theory.Results show that different choices of time granularity produces different outcome which is in line with the computational law of granular computing,and stable strategy for granularity can achieve satisfied prediction.