苏州市职业大学学报
囌州市職業大學學報
소주시직업대학학보
JOURNAL OF SUZHOU VOCATIONAL UNIVERSITY
2013年
4期
11-13
,共3页
多词表达%敏感特征%“一X就Y”格式
多詞錶達%敏感特徵%“一X就Y”格式
다사표체%민감특정%“일X취Y”격식
multiword expression%sensitive feature%"yi(一) X jiu(就) Y"structure
主要研究如何选择和动态使用各自的敏感特征来抽取“一X就Y”结构的MWEs.分析了多词表达研究的现状,参考汉语言学相关专家的研究对“一X就Y”格式进行大致分类,针对该格式采用分词的方法提取特征集,并在训练集中按类别进行敏感特征的选择.
主要研究如何選擇和動態使用各自的敏感特徵來抽取“一X就Y”結構的MWEs.分析瞭多詞錶達研究的現狀,參攷漢語言學相關專傢的研究對“一X就Y”格式進行大緻分類,針對該格式採用分詞的方法提取特徵集,併在訓練集中按類彆進行敏感特徵的選擇.
주요연구여하선택화동태사용각자적민감특정래추취“일X취Y”결구적MWEs.분석료다사표체연구적현상,삼고한어언학상관전가적연구대“일X취Y”격식진행대치분류,침대해격식채용분사적방법제취특정집,병재훈련집중안유별진행민감특정적선택.
The NLP community has increasingly become aware of the problems that multiword expressions (MWEs) pose.This paper studies how to select and use their sensitive features to extract "yi(一) X jiu(就) Y"Structure in MWE.It analyses the status of MWE studies,and then broadly classifies the structure according to Chinese linguistic experts' studies.A feature set is extracted by segmentation.Finally, sensitive features are selected in the training set according to different categories.