1


0

スクリーンスクレイピング用のクローラーの作成

スクリーンスクレイピング用のクローラーを作成したい

私が欲しいのは、http://globaltrips.lastminute.com/trips/hotellist/list?startIndex = 0&checkInDate = 2010-12-25&checkOutDate = 2010-12-のように、特定のホテルの価格をウェブサイトから取得することです。 26&hotelMaxReturnPerPage = 25&guestCounts = 1&ad_dest = LON&guestCodes = ADULT&configId = S72722479&city = London&numRooms = 1&serviceTag = LMN0&ad_country = GB&channel = HotelWebUI [website]

e.g. 上記のURLには、ホテルとその価格のリストがあります。 * the beaufort *の価格を取得したい

これを達成する方法をアドバイスしてください。

2 Answer


2


htmlアジリティパックなどのHTML解析ライブラリを使用して、htmlをより使いやすいモデルに解析し、モデルをナビゲートして、興味のあるHTMLのビットを見つけます。


0


cURLなどのツールを使用してHTMLをダウンロードし、http://en.wikipedia.org/wiki/XPath [XPath]を使用して、関心のあるタグを選択します。 Firebugを使用して、XPathを判別します。