函式庫 - HtmlAgilityPack

[函式庫] HtmlAgilityPack

HtmlAgilityPack 是 C# 中用來解析 HTML 的一種套件,因為工作需要所以載來用用

安裝

  • 專案 > 參考 ( 右鍵 ) > 管理 Nuget 套件

    • Visual Studio 的套件都能在這裡搜尋安裝
  • 若是要用其他來源的套件可以在這裡新增

    • 工具 > 選項 > NuGet 封裝管理員 > 套件來源

基本用法

  • 載入 HTML

    1
    2
    HtmlDocument DocData = new HtmlDocument();
    DocData.LoadHtml(html);
  • 獲取節點內容

    1
    fontText = DocData.DocumentNode.SelectSingleNode(@"/html/body/font[1]").InnerText;
    • 節點後數字代表第 n 個此節點,n 從 1 開始
  • 獲取節點屬性內容

    1
    ImagePath = DocData.DocumentNode.SelectSingleNode(@"/html/body/img").Attributes["src"].Value;

關於更多 HtmlAgilityPack 的細節可以參考文檔 : HtmlAgilityPack 官網

tags: 函式庫 C# HtmlAgilityPack
Author: Kenny Li
Link: https://kennyliblog.nctu.me/2020/12/19/HtmlAgilityPack/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.