2


1

このクローラーをphpで記述する方法は?
  • phpスクリプト*を作成する必要があります。

アイデアは非常に簡単です。

ブログ投稿のリンクをこのphpスクリプトに送信すると、ウェブページがクロールされ、*タイトルページの最初の画像*がサーバーに保存されます。

このクローラーに使用する必要のある* PHP関数*

4 Answer


6


PHP Simple HTML DOM Parserを使用します

// Create DOM from URL
$html = file_get_html('http://www.example.com/');

// Find all images
$images = array();
foreach($html->find('img') as $element) {
       $images[] = $element->src;
}

現在、 `$ images`配列には、指定されたWebページの画像リンクがあります。 これで、目的の画像をデータベースに保存できます。


2


HTMLパーサー:http://www.jonasjohn.de/lab/htmlsql.htm[HTMLSQL]

機能:外部のhtmlファイル、httpまたはftpリンクを取得し、コンテンツを解析できます。


1


まあ、あなたはかなりの数の関数を使用する必要があります:)

しかし、私はあなたが具体的に画像を見つけることを求めていると仮定し、http://simplehtmldom.sourceforge.net/ [Simple HTML DOM Parser]のようなDOMパーサーを使用し、次にカールして最初のimg要素のsrc。


1


http://www.php.net/manual/en/function.file-get-contents.php [file_get_contents()]と正規表現を使用して、最初の画像タグの `src`属性を抽出します。

この場合、http://www.php.net/manual/en/book.curl.php [CURL]またはHTMLパーサーは過剰に見えますが、チェックしてみてください。