2014年4月10日 星期四

[C#] 擷取網頁 HTMLagailityPack


  1. using System;
  2. using System.Collections.Generic;
  3. using System.Linq;
  4. using System.Text;
  5.  
  6. using HtmlAgilityPack;
  7.  
  8. namespace agilitypack
  9. {
  10.     class Program
  11.     {
  12.         static void Main(string[] args)
  13.         {
  14.             HtmlWeb webClient = new HtmlWeb();
  15.             HtmlDocument doc = webClient.Load("http://msdn.microsoft.com/zh-tw/ee787055.aspx");
  16.  
  17.             HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("/html/body/div/div[2]/div/div/div[4]/div/div/h2[5]");
  18.  
  19.             foreach (HtmlNode node in nodes)
  20.             {
  21.                 Console.WriteLine(node.InnerText.Trim());
  22.             }
  23.  
  24.             doc = null;
  25.             nodes = null;
  26.             webClient = null;
  27.  
  28.             Console.WriteLine("Completed.");
  29.             Console.ReadLine();
  30.         }
  31.     }
  32. }

沒有留言:

張貼留言