2


0

Curl / PHPを使用してHTMLデータを抽出する

PHPには次のコードがあります

$ch = curl_init("http://blog.com");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$output = curl_exec($ch);
curl_close($ch);
echo $output;

間にコードのブロックをインポートしようとしています

そして、「このコードを抽出する最良の方法を知りたいです。

2 Answer


6


DOMが最善の方法です。 詳細なドキュメントは次のとおりです。http://php.net/manual/en/book.dom.php


1


curlを使用すると、$ outputは文字列になるため、それを使用してDOMを作成します。

$ html = str_get_html($ content);

よりも、コンテンツを取得します。

$ content = $ html→ find( '#content');