河北科技大学学报
河北科技大學學報
하북과기대학학보
JOURNAL OF THE HEBEI UNIVERSITY OF SCIENCE AND ECHNOLOGY
2014年
1期
91-102
,共12页
信息可视化%可视化技术%人机交互%数据挖掘
信息可視化%可視化技術%人機交互%數據挖掘
신식가시화%가시화기술%인궤교호%수거알굴
information visualization%visualization technology%human-machine interaction%data mining
信息可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式.可视化应用非常广泛,主要涉及领域:数据挖掘可视化、网络数据可视化、社交可视化、交通可视化、文本可视化、生物医药可视化等等.根据CARD可视化模型可以将信息可视化的过程分为以下几个阶段:数据预处理;绘制;显示和交互.根据SHNEIDERMAN的分类,信息可视化的数据分为以下几类:一维数据、二维数据、三维数据、多维数据、时态数据、层次数据和网络数据.其中针对后4种数据的可视化是当前研究的热点.多维数据可视化方法主要包括基于几何的方法、图标方法和动画方法等.基于几何的可视化方式中最经典的就是“平行坐标系”方法.平行坐标系(parallel coordinates)使用平行的竖直轴线来代表维度,通过在轴上刻划多维数据的数值并用折线相连某一数据项在所有轴上的坐标点展示多维数据.平行坐标系方法能够简洁、快速地展示多维数据,发展出很多改进技术.但是当数据集的规模变得非常大时,密集的折线会引起“视觉混淆”(visual clutter),处理方法包括维度重排、交互方法、聚类、过滤、动画等.其他基于几何的方法包括Radviz方法使用圆形坐标系展示可视化结果;散点图矩阵(scatter plot matrix)将多维数据中的各个维度两两组合绘制成一系列的按规律排列的散点图.基于图标的可视化方法用具备可视特征的几何形状如大小、长度、形状、颜色等刻划数据,代表性的方法包括星绘法和Chernoff面法等.动画方法用于可视化中可被用来提高交互性和理解程度,其缺点包括可能分散注意力、引起用户的误解、产生“图表垃圾”等.时间序列数据是指具有时间属性的数据集,针对时间序列数据的可视化方法如下:线形图、堆积图、动画、地平线图、时间线.层次数据具有等级或层级关系.层次数据的可视化方法主要包括节点链接图和树图2种方式.其中树图(treemap)由一系列的嵌套环、块来展示层次数据.为了能展示更多的节点内容,一些基于“焦点+上下文”技术的交互方法被开发出来.包括“鱼眼”技术、几何变形、语义缩放、远离焦点的节点聚类技术等.网络数据具有网状结构.自动布局算法是网络数据可视化的核心,目前主要有以下3类:一是力导向布局(force-directed layout);二是分层布局(hierarchical layout);三是网格布局(grid layout).当数据节点的连接很多时,容易产生边交叉现象,导致视觉混淆.解决边交叉现象的集束边(edge bundle)技术可以分为以下几类:力导向的集束边技术、层次集束边技术、基于几何的边聚类技术、多层凝聚集束边技术和基于网格的方法等.其他研究热点包括图形的视觉因素研究、自适应可视化研究、可视化效果的评估等.视觉因素对于可视化效果的影响,如位置、长度、面积、形状、色彩等影响已经引起很多研究者的注意.色彩是视觉因素的重要组成部分,研究主要集中在颜色选择的原则和交互系统中.这些原则基于数据类型、类的数量、认知约束等.自适应可视化可以提高信息可视化的适应性.研究成果分为以下几类:自适应可视化展示、自适应资源模型、自适应用户模型.自适应可视化展示是指根据用户的特征自动为用户提供多种展示类型,自动选择可视化内容及布局的形式,自动调整可视化的元素等.自适应资源模型反映了对硬件和软件的利用以提高可视化性能.自适应用户模型通过显示用户模型的内容并让用户能够编辑,从而让用户能够控制模型的内容.当前关于信息可视化评价的研究较少,少量研究也没有提出直接和通用的可视化的评估方式,需要对信息可视化评价的理论基础、方法和应用做深入的研究.可视化技术与应用还应该继续向以下4个方面努力:直观化、关联化、艺术化、交互化.信息可视化技术的发展方向是协同(collaboration)、分析过程(analytics)、计算(computational)和意会(sense-making).未来研究方向可以包括以下几个内容.信息可视化和数据挖掘的紧密结合.为提高处理海量数据时的速度和效率和解决视觉混淆现象;必须运用数据挖掘的公式和算法,对数据分析的过程及结果进行可视化展现.协同可视化.协同可视化领域的研究方向可以包括可视化接口设计、基于Web的可视化协同平台开发、协同可视化工作的视图设计、协同可视化中的工作流管理及协同可视化技术的应用等.更多领域的应用技术开发.包括统计可视化:需要研究使用几何、动画、图像等工具对数据统计的过程和结果进行加工和处理的技术;新闻可视化:对新闻内容进行抓取、清洗和提取和可视化展示;社交网络可视化:可视化方式显示社交网络的数据,对社交网络中节点、关系及时空数据的集成展示.搜索日志可视化:针对在使用搜索引擎时产生的海量搜索日志,可视化的展现用户的搜索行为、关系和模式等.
信息可視化是可視化技術在非空間數據領域的應用,可以增彊數據呈現效果,讓用戶以直觀交互的方式實現對數據的觀察和瀏覽,從而髮現數據中隱藏的特徵、關繫和模式.可視化應用非常廣汎,主要涉及領域:數據挖掘可視化、網絡數據可視化、社交可視化、交通可視化、文本可視化、生物醫藥可視化等等.根據CARD可視化模型可以將信息可視化的過程分為以下幾箇階段:數據預處理;繪製;顯示和交互.根據SHNEIDERMAN的分類,信息可視化的數據分為以下幾類:一維數據、二維數據、三維數據、多維數據、時態數據、層次數據和網絡數據.其中針對後4種數據的可視化是噹前研究的熱點.多維數據可視化方法主要包括基于幾何的方法、圖標方法和動畫方法等.基于幾何的可視化方式中最經典的就是“平行坐標繫”方法.平行坐標繫(parallel coordinates)使用平行的豎直軸線來代錶維度,通過在軸上刻劃多維數據的數值併用摺線相連某一數據項在所有軸上的坐標點展示多維數據.平行坐標繫方法能夠簡潔、快速地展示多維數據,髮展齣很多改進技術.但是噹數據集的規模變得非常大時,密集的摺線會引起“視覺混淆”(visual clutter),處理方法包括維度重排、交互方法、聚類、過濾、動畫等.其他基于幾何的方法包括Radviz方法使用圓形坐標繫展示可視化結果;散點圖矩陣(scatter plot matrix)將多維數據中的各箇維度兩兩組閤繪製成一繫列的按規律排列的散點圖.基于圖標的可視化方法用具備可視特徵的幾何形狀如大小、長度、形狀、顏色等刻劃數據,代錶性的方法包括星繪法和Chernoff麵法等.動畫方法用于可視化中可被用來提高交互性和理解程度,其缺點包括可能分散註意力、引起用戶的誤解、產生“圖錶垃圾”等.時間序列數據是指具有時間屬性的數據集,針對時間序列數據的可視化方法如下:線形圖、堆積圖、動畫、地平線圖、時間線.層次數據具有等級或層級關繫.層次數據的可視化方法主要包括節點鏈接圖和樹圖2種方式.其中樹圖(treemap)由一繫列的嵌套環、塊來展示層次數據.為瞭能展示更多的節點內容,一些基于“焦點+上下文”技術的交互方法被開髮齣來.包括“魚眼”技術、幾何變形、語義縮放、遠離焦點的節點聚類技術等.網絡數據具有網狀結構.自動佈跼算法是網絡數據可視化的覈心,目前主要有以下3類:一是力導嚮佈跼(force-directed layout);二是分層佈跼(hierarchical layout);三是網格佈跼(grid layout).噹數據節點的連接很多時,容易產生邊交扠現象,導緻視覺混淆.解決邊交扠現象的集束邊(edge bundle)技術可以分為以下幾類:力導嚮的集束邊技術、層次集束邊技術、基于幾何的邊聚類技術、多層凝聚集束邊技術和基于網格的方法等.其他研究熱點包括圖形的視覺因素研究、自適應可視化研究、可視化效果的評估等.視覺因素對于可視化效果的影響,如位置、長度、麵積、形狀、色綵等影響已經引起很多研究者的註意.色綵是視覺因素的重要組成部分,研究主要集中在顏色選擇的原則和交互繫統中.這些原則基于數據類型、類的數量、認知約束等.自適應可視化可以提高信息可視化的適應性.研究成果分為以下幾類:自適應可視化展示、自適應資源模型、自適應用戶模型.自適應可視化展示是指根據用戶的特徵自動為用戶提供多種展示類型,自動選擇可視化內容及佈跼的形式,自動調整可視化的元素等.自適應資源模型反映瞭對硬件和軟件的利用以提高可視化性能.自適應用戶模型通過顯示用戶模型的內容併讓用戶能夠編輯,從而讓用戶能夠控製模型的內容.噹前關于信息可視化評價的研究較少,少量研究也沒有提齣直接和通用的可視化的評估方式,需要對信息可視化評價的理論基礎、方法和應用做深入的研究.可視化技術與應用還應該繼續嚮以下4箇方麵努力:直觀化、關聯化、藝術化、交互化.信息可視化技術的髮展方嚮是協同(collaboration)、分析過程(analytics)、計算(computational)和意會(sense-making).未來研究方嚮可以包括以下幾箇內容.信息可視化和數據挖掘的緊密結閤.為提高處理海量數據時的速度和效率和解決視覺混淆現象;必鬚運用數據挖掘的公式和算法,對數據分析的過程及結果進行可視化展現.協同可視化.協同可視化領域的研究方嚮可以包括可視化接口設計、基于Web的可視化協同平檯開髮、協同可視化工作的視圖設計、協同可視化中的工作流管理及協同可視化技術的應用等.更多領域的應用技術開髮.包括統計可視化:需要研究使用幾何、動畫、圖像等工具對數據統計的過程和結果進行加工和處理的技術;新聞可視化:對新聞內容進行抓取、清洗和提取和可視化展示;社交網絡可視化:可視化方式顯示社交網絡的數據,對社交網絡中節點、關繫及時空數據的集成展示.搜索日誌可視化:針對在使用搜索引擎時產生的海量搜索日誌,可視化的展現用戶的搜索行為、關繫和模式等.
신식가시화시가시화기술재비공간수거영역적응용,가이증강수거정현효과,양용호이직관교호적방식실현대수거적관찰화류람,종이발현수거중은장적특정、관계화모식.가시화응용비상엄범,주요섭급영역:수거알굴가시화、망락수거가시화、사교가시화、교통가시화、문본가시화、생물의약가시화등등.근거CARD가시화모형가이장신식가시화적과정분위이하궤개계단:수거예처리;회제;현시화교호.근거SHNEIDERMAN적분류,신식가시화적수거분위이하궤류:일유수거、이유수거、삼유수거、다유수거、시태수거、층차수거화망락수거.기중침대후4충수거적가시화시당전연구적열점.다유수거가시화방법주요포괄기우궤하적방법、도표방법화동화방법등.기우궤하적가시화방식중최경전적취시“평행좌표계”방법.평행좌표계(parallel coordinates)사용평행적수직축선래대표유도,통과재축상각화다유수거적수치병용절선상련모일수거항재소유축상적좌표점전시다유수거.평행좌표계방법능구간길、쾌속지전시다유수거,발전출흔다개진기술.단시당수거집적규모변득비상대시,밀집적절선회인기“시각혼효”(visual clutter),처리방법포괄유도중배、교호방법、취류、과려、동화등.기타기우궤하적방법포괄Radviz방법사용원형좌표계전시가시화결과;산점도구진(scatter plot matrix)장다유수거중적각개유도량량조합회제성일계렬적안규률배렬적산점도.기우도표적가시화방법용구비가시특정적궤하형상여대소、장도、형상、안색등각화수거,대표성적방법포괄성회법화Chernoff면법등.동화방법용우가시화중가피용래제고교호성화리해정도,기결점포괄가능분산주의력、인기용호적오해、산생“도표랄급”등.시간서렬수거시지구유시간속성적수거집,침대시간서렬수거적가시화방법여하:선형도、퇴적도、동화、지평선도、시간선.층차수거구유등급혹층급관계.층차수거적가시화방법주요포괄절점련접도화수도2충방식.기중수도(treemap)유일계렬적감투배、괴래전시층차수거.위료능전시경다적절점내용,일사기우“초점+상하문”기술적교호방법피개발출래.포괄“어안”기술、궤하변형、어의축방、원리초점적절점취류기술등.망락수거구유망상결구.자동포국산법시망락수거가시화적핵심,목전주요유이하3류:일시력도향포국(force-directed layout);이시분층포국(hierarchical layout);삼시망격포국(grid layout).당수거절점적련접흔다시,용역산생변교차현상,도치시각혼효.해결변교차현상적집속변(edge bundle)기술가이분위이하궤류:력도향적집속변기술、층차집속변기술、기우궤하적변취류기술、다층응취집속변기술화기우망격적방법등.기타연구열점포괄도형적시각인소연구、자괄응가시화연구、가시화효과적평고등.시각인소대우가시화효과적영향,여위치、장도、면적、형상、색채등영향이경인기흔다연구자적주의.색채시시각인소적중요조성부분,연구주요집중재안색선택적원칙화교호계통중.저사원칙기우수거류형、류적수량、인지약속등.자괄응가시화가이제고신식가시화적괄응성.연구성과분위이하궤류:자괄응가시화전시、자괄응자원모형、자괄응용호모형.자괄응가시화전시시지근거용호적특정자동위용호제공다충전시류형,자동선택가시화내용급포국적형식,자동조정가시화적원소등.자괄응자원모형반영료대경건화연건적이용이제고가시화성능.자괄응용호모형통과현시용호모형적내용병양용호능구편집,종이양용호능구공제모형적내용.당전관우신식가시화평개적연구교소,소량연구야몰유제출직접화통용적가시화적평고방식,수요대신식가시화평개적이론기출、방법화응용주심입적연구.가시화기술여응용환응해계속향이하4개방면노력:직관화、관련화、예술화、교호화.신식가시화기술적발전방향시협동(collaboration)、분석과정(analytics)、계산(computational)화의회(sense-making).미래연구방향가이포괄이하궤개내용.신식가시화화수거알굴적긴밀결합.위제고처리해량수거시적속도화효솔화해결시각혼효현상;필수운용수거알굴적공식화산법,대수거분석적과정급결과진행가시화전현.협동가시화.협동가시화영역적연구방향가이포괄가시화접구설계、기우Web적가시화협동평태개발、협동가시화공작적시도설계、협동가시화중적공작류관리급협동가시화기술적응용등.경다영역적응용기술개발.포괄통계가시화:수요연구사용궤하、동화、도상등공구대수거통계적과정화결과진행가공화처리적기술;신문가시화:대신문내용진행조취、청세화제취화가시화전시;사교망락가시화:가시화방식현시사교망락적수거,대사교망락중절점、관계급시공수거적집성전시.수색일지가시화:침대재사용수색인경시산생적해량수색일지,가시화적전현용호적수색행위、관계화모식등.