-
AngleSharp :在 C# 中轻松解析和操作 HTML/XML 文档
- 网站名称:AngleSharp :在 C# 中轻松解析和操作 HTML/XML 文档
- 网站分类:技术文章
- 收录时间:2025-08-04 22:26
- 网站地址:
“AngleSharp :在 C# 中轻松解析和操作 HTML/XML 文档” 网站介绍
AngleSharp 是一个 C# 库,主要用于解析和操作 HTML 和 XML 文档,类似于浏览器的 DOM 操作。允许你在 C# 中使用类似浏览器的方式处理网页数据,进行网页抓取、数据提取和处理等任务。
安装
第一步,老规矩,先安装
Install-Package AngleSharp
使用
解析 HTML 文档
using AngleSharp.Html.Parser;
var html = @"<html><body><h1>Hello, World!</h1></body></html>";
// 创建 HTML 解析器
var parser = new HtmlParser();
var document = parser.ParseDocument(html);
// 查找 <h1> 元素
var h1 = document.QuerySelector("h1");
// 输出 <h1> 中的文本
Console.WriteLine(h1.TextContent); // Output: Hello, World!
解析并抓取网页
// 创建 HttpClient 来抓取网页
using AngleSharp.Html.Parser;
using var httpClient = new HttpClient();
var html = await httpClient.GetStringAsync("https://www.hunji.xyz/");
// 创建 HTML 解析器
var parser = new HtmlParser();
var document = parser.ParseDocument(html);
// 查找页面中的标题
var title = document.QuerySelector("title");
// 输出页面标题
Console.WriteLine(title.TextContent);
DOM 操作
选择器和查询
var h1 = document.QuerySelector("h1"); // 获取第一个 <h1> 元素
var allLinks = document.QuerySelectorAll("a"); // 获取所有 <a> 标签
获取元素属性
var firstLink = document.QuerySelector("a");
var href = firstLink.GetAttribute("href");
Console.WriteLine(href); // 输出链接地址
修改元素
var heading = document.QuerySelector("h1");
heading.TextContent = "New Heading"; // 修改文本内容
heading.SetAttribute("class", "new-class"); // 修改 class 属性
遍历节点
var links = document.QuerySelectorAll("a");
foreach (var link in links)
{
Console.WriteLine(link.GetAttribute("href"));
}
4异步操作
using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using System;
using System.Net.Http;
using System.Threading.Tasks;
class Program
{
static async Task Main()
{
// 使用异步抓取网页内容
using var client = new HttpClient();
var html = await httpClient.GetStringAsync("https://www.hunji.xyz/");
// 使用 HTML 解析器解析网页
var parser = new HtmlParser();
var document = await parser.ParseDocumentAsync(html);
// 操作 DOM
var h1 = document.QuerySelector("h1");
Console.WriteLine(h1.TextContent);
}
}
5. 实战:抓取网页中的所有链接
using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using System;
using System.Net.Http;
using System.Threading.Tasks;
class Program
{
static async Task Main()
{
// 获取网页
using var httpClient = new HttpClient();
var html = await httpClient.GetStringAsync("https://www.hunji.xyz/");
// 创建解析器
var parser = new HtmlParser();
var document = await parser.ParseDocumentAsync(html);
// 获取所有的链接
var links = document.QuerySelectorAll("a");
// 输出所有链接
foreach (var link in links)
{
var href = link.GetAttribute("href");
Console.WriteLine(href);
}
}
}
总结
AngleSharp 是一个强大的工具,可以帮助你在 C# 中进行 HTML 和 XML 的解析和操作。它对于网页抓取、数据提取等任务非常有用。通过提供类似浏览器的 DOM 操作接口,它能使你更容易地处理和操作网页内容。
更多相关网站
- 我为什么用hono作为web框架?(在web应用开发中为什么要使用框架)
- 我的AI绘画工作流,3步后期处理(ai绘图工具的使用方法)
- 如何生成高质量二次元或真人女友壁纸的提示词
- AI绘画,零基础入门教程,超级简单
- C#WinForm调用Yolov8Net实现自动识别
- AI绘图学习记录-文生图片分享249(ai制图初学入门)
- Winform应用界面开发技术特点图解
- 使用PocketFlowSharp创建一个Human_Evaluation示例
- Net第三章 OpenCVSharp实操——图片去水印
- C#上位机开发入门(7)-通信(下)(c#上位机前景)
- C#上位机开发入门(8)-轮询(c#编写上位机)
- Midjourney高阶关键词指南|实测可用
- C#使用 OpenCvSharp 计算每个轮廓面积的指南
- 超火的机器视觉OpenCVSharp学习笔记3——图像形态学处理
- 设计百科:利用PS滤镜及图层样式制作超酷的褐色岩石字
- C#开发者必看:如何让PDF批量处理效率提升10倍?
- Windows系统下使用c sharp实现文本合成语音并播放
- itextsharp去掉PDF加密(加密的pdf去掉密码)
- 最近发表
- 标签列表
-
- mydisktest_v298 (35)
- sql 日期比较 (33)
- document.appendchild (35)
- 头像打包下载 (35)
- 二调符号库 (23)
- acmecadconverter_8.52绿色版 (25)
- 梦幻诛仙表情包 (36)
- 魔兽模型 (23)
- java面试宝典2019pdf (26)
- disk++ (30)
- 加密与解密第四版pdf (29)
- iteye (26)
- centos7.4下载 (32)
- intouch2014r2sp1永久授权 (33)
- usb2.0-serial驱动下载 (24)
- jdk1.8.0_191下载 (27)
- axure9注册码 (30)
- virtualdrivemaster (26)
- 数据结构c语言版严蔚敏pdf (25)
- 兔兔工程量计算软件下载 (27)
- 代码整洁之道 pdf (26)
- ccproxy破解版 (31)
- aida64模板 (28)
- engine=innodb (33)
- shiro jwt (28)