豚吐露@wiki
SGMLReader
最終更新:
Bot(ページ名リンク)
-
view
SgmlReader
SgmlReader
https://www.nuget.org/packages/SgmlReader/
https://www.nuget.org/packages/SgmlReader/
HTMLをXML化するライブラリ。スクレイピングに役立つ。
~ install ~
[ツール]-[NuGet パッケージ マネージャー]-[ソリューションの NuGet パッケージの管理]を選択。
左のリストから『オンライン』を選択し、右上の『オンライン の検索』欄へ『SgmlReader』と入力すると、真ん中の検索結果一覧に『SgmlReader』ってのが出てくるハズ。
それを選択して、『インストール』ボタンを押下するだけ。
この時、『SgmlReader』を使うpjを指定するチェックリストが出てくるので、使いたいpjにだけチェックを入れたら良い。
[ツール]-[NuGet パッケージ マネージャー]-[ソリューションの NuGet パッケージの管理]を選択。
左のリストから『オンライン』を選択し、右上の『オンライン の検索』欄へ『SgmlReader』と入力すると、真ん中の検索結果一覧に『SgmlReader』ってのが出てくるハズ。
それを選択して、『インストール』ボタンを押下するだけ。
この時、『SgmlReader』を使うpjを指定するチェックリストが出てくるので、使いたいpjにだけチェックを入れたら良い。
Href以外は省略しても良いかな?
Hrefに取得対象のURI文字列格納して、newするだけ。勝手にHTMLファイルもnetから取得してくれるっぽぃ。
Hrefに取得対象のURI文字列格納して、newするだけ。勝手にHTMLファイルもnetから取得してくれるっぽぃ。
- XDocument xdoc;
- Href = url,
- DocType = "HTML",
- WhitespaceHandling = WhitespaceHandling.All,
- CaseFolding = CaseFolding.ToLower,
- IgnoreDtd = true
- })
- {
- xdoc = XDocument.Load(sgml);
- }
更新日: 2014年12月22日 (月) 20時46分52秒