seraphyの日記

日記というよりは過去を振り返るときのための単なる備忘録

2006-11-24から1日間の記事一覧

MSHTMLを使ってHTMLを解析してみる*3

c++

URLを指定してHTMLを読み込みドキュメントツリーを見るテスト #include "stdafx.h" #include <mshtml.h> class CMSHTMLParserTest : public CAtlExeModuleT<CMSHTMLParserTest> { public: HRESULT PreMessageLoop(int nShowCmd) throw() { HRESULT hr = CAtlExeModuleT<CMSHTMLParserTest>::PreMessageLoop(nS</cmshtmlparsertest></cmshtmlparsertest></mshtml.h>…

HTMLParserを使ってみる(HTMLParser)*2

用意するもの HTML Parser htmllexer.jar htmlparser.jar URLを指定してHTMLを読み込みドキュメントツリーを見るテスト package jp.seraphyware.htmlparsertest; import java.net.URL; import java.net.URLConnection; import org.htmlparser.Node; import o…

HTMLParserを使ってみる(CyberNekoHTML)*1

用意するもの NekoHTML nekohtml.jar xerces2j xercesImpl.jar URLを指定してHTMLを読み込みドキュメントツリーを見るテスト package jp.seraphyware.htmlparsertest; import java.io.InputStream; import java.net.URL; import java.net.URLConnection; imp…