中国生物医学工程学报
中國生物醫學工程學報
중국생물의학공정학보
CHINESE JOURNAL OF BIOMEDICAL ENGINEERING
2010年
5期
710-716
,共7页
周小甲%李昊旻%段会龙%吕旭东
週小甲%李昊旻%段會龍%呂旭東
주소갑%리호민%단회룡%려욱동
信息提取%时间关系%条件随机场%医学语言处理
信息提取%時間關繫%條件隨機場%醫學語言處理
신식제취%시간관계%조건수궤장%의학어언처리
从临床病历文本中自动提取医学问题的相关时间属性可以服务于诸如临床决策支持、数字化临床路径等多种医疗信息应用,因此在医学语言处理领域,面向病历文本的时间信息自动提取研究在国际上已开展多年,而中文环境下的相关研究仍属空白.本研究提出了一种基于条件随机场(CRF)的时问关系自动提取算法实现了中文医学病历文本中面向医学问题的时间属性自动提取.该机器学习方法以经过医学问题和时间信息语义标注的病历文本为训练内容,时间关系结果标注采用以医学问题为中心的模式,即仅提取所关心医学问题的时间属性.在此方法框架下通过实验,重点分析了不同的CRF学习模板对于时间关系提取的影响,实验以63份实际病历作为实验文本,以多次交叉验证的方式获得不同学习模板情况下时间关系自动提取准确率的平均值,通过分析实验数据总结了CRF学习模板设计的一般规律,实验中最佳模板情况下时间关系提取正确率可达86.94%,这些结果将为后续研究提供基础.
從臨床病歷文本中自動提取醫學問題的相關時間屬性可以服務于諸如臨床決策支持、數字化臨床路徑等多種醫療信息應用,因此在醫學語言處理領域,麵嚮病歷文本的時間信息自動提取研究在國際上已開展多年,而中文環境下的相關研究仍屬空白.本研究提齣瞭一種基于條件隨機場(CRF)的時問關繫自動提取算法實現瞭中文醫學病歷文本中麵嚮醫學問題的時間屬性自動提取.該機器學習方法以經過醫學問題和時間信息語義標註的病歷文本為訓練內容,時間關繫結果標註採用以醫學問題為中心的模式,即僅提取所關心醫學問題的時間屬性.在此方法框架下通過實驗,重點分析瞭不同的CRF學習模闆對于時間關繫提取的影響,實驗以63份實際病歷作為實驗文本,以多次交扠驗證的方式穫得不同學習模闆情況下時間關繫自動提取準確率的平均值,通過分析實驗數據總結瞭CRF學習模闆設計的一般規律,實驗中最佳模闆情況下時間關繫提取正確率可達86.94%,這些結果將為後續研究提供基礎.
종림상병력문본중자동제취의학문제적상관시간속성가이복무우제여림상결책지지、수자화림상로경등다충의료신식응용,인차재의학어언처리영역,면향병력문본적시간신식자동제취연구재국제상이개전다년,이중문배경하적상관연구잉속공백.본연구제출료일충기우조건수궤장(CRF)적시문관계자동제취산법실현료중문의학병력문본중면향의학문제적시간속성자동제취.해궤기학습방법이경과의학문제화시간신식어의표주적병력문본위훈련내용,시간관계결과표주채용이의학문제위중심적모식,즉부제취소관심의학문제적시간속성.재차방법광가하통과실험,중점분석료불동적CRF학습모판대우시간관계제취적영향,실험이63빈실제병력작위실험문본,이다차교차험증적방식획득불동학습모판정황하시간관계자동제취준학솔적평균치,통과분석실험수거총결료CRF학습모판설계적일반규률,실험중최가모판정황하시간관계제취정학솔가체86.94%,저사결과장위후속연구제공기출.