1


0

だから私はdiggで見られる機能性を最もよく再現する方法についてのアイデアを探しています。 基本的には、あなたが興味のあるページのURLを送信し、次にdiggでDOMをクロールしてすべてのIMGタグを見つけ(おそらく特定の高さ/幅より上のいくつかを選択するだけ)、それからそれらからサムネイルを作成してあなたはあなたの提出物を代表したいと思います。

いろいろなことが進行中ですが、私は主に投稿されたページから画像を取得するための最良の方法に興味があります。

3 Answer


1


あなたがウェブページを解析しようと試みることができる間、HTMLはあなたが何かに近いけれども不完全で最もよいであろうそのような混乱をすることができます。

  1. 画像タグの参照のように見えるものすべてを抽出します。

  2. URLを取得してみてください

  3. 画像が戻ってきたかどうかを確認

src = "…​"の内容を探してキャプチャするだけで、そこにたどり着きます。 相対を処理するための基本的な操作 絶対的な画像参照とあなたはそこにいます。

明らかに、第三者からWebアセットをオンデマンドで取得するときには、悪用されないように注意する必要があります。


0


私はcURLの正規表現を提案します。


0


また、http://simplehtmldom.sourceforge.net / [PHP Simple HTML DOM Parser]を使用することもできます。これは、すべての画像タグを検索するのに役立ちます。