现代电子技术
現代電子技術
현대전자기술
MODERN ELECTRONICS TECHNIQUE
2007年
22期
64-66
,共3页
王文林%席临平%高进龙%彭小梅
王文林%席臨平%高進龍%彭小梅
왕문림%석림평%고진룡%팽소매
自适应%词频统计%关系场%固定搭配%重复频度
自適應%詞頻統計%關繫場%固定搭配%重複頻度
자괄응%사빈통계%관계장%고정탑배%중복빈도
首次提出自适应词额统计算法,该算法突破传统的思维模式,排除了在词频统计中预先设定庞大词库、对不同文章建立统一标准的复杂性,而以目标文章为基础,根据每篇文章的主题,动态生成切合该目标文章的统计标准,从而提高词频统计的效率;其基本原理是以文章为独立单位,确定一个关系场,在场中,从主标题出发,以关系微量为基本元素,以文章整体即关系场为计算区间,进行迭代累加,以组成文中各种固定组合,并对其进行记录与分析,将重复一定次数的固定组合上升为词,该词的集合即为本算法所求;最终以软件实现该算法思想,并进行了百篇文章的统计试验;实验结果表明,该算法具有一定的准确性、稳定性,提高了效率.
首次提齣自適應詞額統計算法,該算法突破傳統的思維模式,排除瞭在詞頻統計中預先設定龐大詞庫、對不同文章建立統一標準的複雜性,而以目標文章為基礎,根據每篇文章的主題,動態生成切閤該目標文章的統計標準,從而提高詞頻統計的效率;其基本原理是以文章為獨立單位,確定一箇關繫場,在場中,從主標題齣髮,以關繫微量為基本元素,以文章整體即關繫場為計算區間,進行迭代纍加,以組成文中各種固定組閤,併對其進行記錄與分析,將重複一定次數的固定組閤上升為詞,該詞的集閤即為本算法所求;最終以軟件實現該算法思想,併進行瞭百篇文章的統計試驗;實驗結果錶明,該算法具有一定的準確性、穩定性,提高瞭效率.
수차제출자괄응사액통계산법,해산법돌파전통적사유모식,배제료재사빈통계중예선설정방대사고、대불동문장건립통일표준적복잡성,이이목표문장위기출,근거매편문장적주제,동태생성절합해목표문장적통계표준,종이제고사빈통계적효솔;기기본원리시이문장위독립단위,학정일개관계장,재장중,종주표제출발,이관계미량위기본원소,이문장정체즉관계장위계산구간,진행질대루가,이조성문중각충고정조합,병대기진행기록여분석,장중복일정차수적고정조합상승위사,해사적집합즉위본산법소구;최종이연건실현해산법사상,병진행료백편문장적통계시험;실험결과표명,해산법구유일정적준학성、은정성,제고료효솔.