计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2009年
12期
208-211
,共4页
IE缓存%图片获取%多线程%线程同步%事件
IE緩存%圖片穫取%多線程%線程同步%事件
IE완존%도편획취%다선정%선정동보%사건
当前基于网页的抓取技术只是简单地获取整个页面的HTML文件并抽取所需的文本信息,而对于其它MIME对象,如图片,特别是通过ASP、JSP或Servlet等服务器端组件查询后返回的图片对象,则很难获取.为了解决这个问题,提出了一种基于Internet Explorer缓存的Web图片获取方法:在VisualC++中采用多线程技术构造一个浏览器对象,将选定的样本图片页面在浏览器对象中打开,然后在IE缓存中搜索并获取所需的Web图片,最后将它存入Oracle数据库中分析使用.这种方法的优点是能够方便、快捷的获取任何来源形式的Web图片对象.
噹前基于網頁的抓取技術隻是簡單地穫取整箇頁麵的HTML文件併抽取所需的文本信息,而對于其它MIME對象,如圖片,特彆是通過ASP、JSP或Servlet等服務器耑組件查詢後返迴的圖片對象,則很難穫取.為瞭解決這箇問題,提齣瞭一種基于Internet Explorer緩存的Web圖片穫取方法:在VisualC++中採用多線程技術構造一箇瀏覽器對象,將選定的樣本圖片頁麵在瀏覽器對象中打開,然後在IE緩存中搜索併穫取所需的Web圖片,最後將它存入Oracle數據庫中分析使用.這種方法的優點是能夠方便、快捷的穫取任何來源形式的Web圖片對象.
당전기우망혈적조취기술지시간단지획취정개혈면적HTML문건병추취소수적문본신식,이대우기타MIME대상,여도편,특별시통과ASP、JSP혹Servlet등복무기단조건사순후반회적도편대상,칙흔난획취.위료해결저개문제,제출료일충기우Internet Explorer완존적Web도편획취방법:재VisualC++중채용다선정기술구조일개류람기대상,장선정적양본도편혈면재류람기대상중타개,연후재IE완존중수색병획취소수적Web도편,최후장타존입Oracle수거고중분석사용.저충방법적우점시능구방편、쾌첩적획취임하래원형식적Web도편대상.