PHP利用DOM 扩展来匹配网页里面的a链接-红穆笔记

要匹配网页中的所有链接（a 标签），可以使用 PHP 的 DOM 扩展库来解析 HTML 文档并提取链接。下面是一个示例代码：

// 从指定的 URL 加载 HTML 页面
$html = file_get_contents('http://www.example.com/');

// 创建 DOM 对象并加载 HTML 页面
$dom = new DOMDocument;
$dom->loadHTML($html);

// 找到所有的 a 标签
$links = $dom->getElementsByTagName('a');

// 循环遍历所有的链接，并输出它们的 href 属性值
foreach ($links as $link) {
  $href = $link->getAttribute('href');
  echo $href . "<br>";
}

在这个示例中，file_get_contents() 函数用于从指定 URL 加载 HTML 页面。然后，我们创建了一个 DOM 对象并使用 loadHTML() 方法加载 HTML 页面。getElementsByTagName() 方法用于找到所有的 a 标签，并将它们存储在 $links 变量中。最后，我们循环遍历所有的链接，并使用 getAttribute() 方法获取每个链接的 href 属性值。

你也可以使用正则表达式来匹配链接，但这通常不是最好的选择，因为 HTML 有许多变化和不规则的情况，导致正则表达式难以编写和维护。因此，最好使用 DOM 解析器来处理 HTML 文档。

文章版权归作者所有，未经允许请勿转载。

THE END