信息技术
信息技術
신식기술
Information Technology
2015年
9期
191-195
,共5页
词典管理%词间关系%相似度%MS-k-means算法%SOA模式
詞典管理%詞間關繫%相似度%MS-k-means算法%SOA模式
사전관리%사간관계%상사도%MS-k-means산법%SOA모식
dictionary management%word relation%similarity%MS-k-means algorithm%SOA model
词典系统是自然语言处理领域较为基础,但又很重要的数据来源.其质量的好坏,会影响上层的分词技术和语义的标注工作.对词间关系的语义分析,能够使得自然语言处理智能化.因此文中针对词典系统提出了分层次管理模式,以行业为父节点,称为行业类别,语义相近的词语集合作为其子节点,称为词语类别集合,其包括子代表词,简称词,同义词等词语类型的词语.将这种词间关系设计成一个词间关系模型,这对多重语义的词语也起到了有效的管理.由于词典系统大都是手工录入,有一定的局限性,因此在K-means的基础上,设计了MS-k-means算法,对词语类别分类得到有效地提高,同时对词语的标注也得到较大的改善.
詞典繫統是自然語言處理領域較為基礎,但又很重要的數據來源.其質量的好壞,會影響上層的分詞技術和語義的標註工作.對詞間關繫的語義分析,能夠使得自然語言處理智能化.因此文中針對詞典繫統提齣瞭分層次管理模式,以行業為父節點,稱為行業類彆,語義相近的詞語集閤作為其子節點,稱為詞語類彆集閤,其包括子代錶詞,簡稱詞,同義詞等詞語類型的詞語.將這種詞間關繫設計成一箇詞間關繫模型,這對多重語義的詞語也起到瞭有效的管理.由于詞典繫統大都是手工錄入,有一定的跼限性,因此在K-means的基礎上,設計瞭MS-k-means算法,對詞語類彆分類得到有效地提高,同時對詞語的標註也得到較大的改善.
사전계통시자연어언처리영역교위기출,단우흔중요적수거래원.기질량적호배,회영향상층적분사기술화어의적표주공작.대사간관계적어의분석,능구사득자연어언처리지능화.인차문중침대사전계통제출료분층차관리모식,이행업위부절점,칭위행업유별,어의상근적사어집합작위기자절점,칭위사어유별집합,기포괄자대표사,간칭사,동의사등사어류형적사어.장저충사간관계설계성일개사간관계모형,저대다중어의적사어야기도료유효적관리.유우사전계통대도시수공록입,유일정적국한성,인차재K-means적기출상,설계료MS-k-means산법,대사어유별분류득도유효지제고,동시대사어적표주야득도교대적개선.