情报学报
情報學報
정보학보
2011年
10期
1028-1036
,共9页
互联网搜索数据%预处理%先行关键词%指数时差关系判定
互聯網搜索數據%預處理%先行關鍵詞%指數時差關繫判定
호련망수색수거%예처리%선행관건사%지수시차관계판정
互联网搜索数据与社会经济行为的相关性已被多篇文献所证实,然而对于这项研究的基础工作--数据预处理,目前尚缺乏系统的方法.本文提出一套完整的搜索数据预处理流程,包括搜索关键词的选择、时差关系判定、关键词指数合成等步骤,并对各关键步骤给出了处理方法及标准.通过该方法可以得到稳定且高拟合度的先行关键词指数.本文以股票市场中上证指数为研究对象,实证检验得出,合成后的先行关键词指数与上证指数的拟合优度高达0 979.Granger检验证实了对上证指数具有显著的预测能力,回归结果显示关键词指数每变动1个百分点,后一期的上证指数将同方向变动0 518个百分点.
互聯網搜索數據與社會經濟行為的相關性已被多篇文獻所證實,然而對于這項研究的基礎工作--數據預處理,目前尚缺乏繫統的方法.本文提齣一套完整的搜索數據預處理流程,包括搜索關鍵詞的選擇、時差關繫判定、關鍵詞指數閤成等步驟,併對各關鍵步驟給齣瞭處理方法及標準.通過該方法可以得到穩定且高擬閤度的先行關鍵詞指數.本文以股票市場中上證指數為研究對象,實證檢驗得齣,閤成後的先行關鍵詞指數與上證指數的擬閤優度高達0 979.Granger檢驗證實瞭對上證指數具有顯著的預測能力,迴歸結果顯示關鍵詞指數每變動1箇百分點,後一期的上證指數將同方嚮變動0 518箇百分點.
호련망수색수거여사회경제행위적상관성이피다편문헌소증실,연이대우저항연구적기출공작--수거예처리,목전상결핍계통적방법.본문제출일투완정적수색수거예처리류정,포괄수색관건사적선택、시차관계판정、관건사지수합성등보취,병대각관건보취급출료처리방법급표준.통과해방법가이득도은정차고의합도적선행관건사지수.본문이고표시장중상증지수위연구대상,실증검험득출,합성후적선행관건사지수여상증지수적의합우도고체0 979.Granger검험증실료대상증지수구유현저적예측능력,회귀결과현시관건사지수매변동1개백분점,후일기적상증지수장동방향변동0 518개백분점.