技术与市场(上半月)
技術與市場(上半月)
기술여시장(상반월)
TECHNOLOGY AND MARKET
2007年
4期
37-38
,共2页
吴昊%潘无名%王硕%杨博
吳昊%潘無名%王碩%楊博
오호%반무명%왕석%양박
分词%B-树%二分查找
分詞%B-樹%二分查找
분사%B-수%이분사조
中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素.本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度.
中文自動分詞技術是許多中文智能領域尤其是中文信息的數據淨化和數據挖掘的基礎技術,而分詞詞典又是影響到中文自動分詞的重要因素.本文針對中文地阯數據淨化和挖掘的具體需要提齣瞭一種新的詞典機製,即基于首字HASH,逐字二分和變型B-樹的詞典,從而明顯提高瞭對短詞的處理速度.
중문자동분사기술시허다중문지능영역우기시중문신식적수거정화화수거알굴적기출기술,이분사사전우시영향도중문자동분사적중요인소.본문침대중문지지수거정화화알굴적구체수요제출료일충신적사전궤제,즉기우수자HASH,축자이분화변형B-수적사전,종이명현제고료대단사적처리속도.