世界100カ国以上、690万以上の回転住宅用IPにアクセス可能
平均成功率
カスタマーサポート
対象国
Scrapyでは、リクエストごとにプロキシをローテーションさせることができるため、クロールを遅くすることなく、IPレート制限やスクレイピング防止防御を回避しやすくなります。
地域固有のプロキシを持つScrapyは、地域のコンテンツをテストし、国際価格を収集し、地域の競合他社を追跡することができます。
IPv6プロキシは、Scrapyに巨大なIP範囲へのアクセスを与え、典型的なIPv4の希少性の問題なしに、大量の並列スクレイピングを可能にする。
ダウンローダミドルウェアを追加または変更します: クラス ProxyMiddleware: def process_request(self, request, spider): request.meta['proxy'] = 'http://ip:port' DOWNLOADER_MIDDLEWARESでアクティベートする。
HTTP Basic Auth ヘッダを手動で追加する: import base64 class ProxyAuthMiddleware: def process_request(self, request, spider): request.meta['proxy'] = 'http://ip:port' user_pass = base64.b64encode(b'user:pass').decode('utf-8') request.headers['Proxy-Authorization'] = '基本' + user_pass
プロキシリストを使い、リクエスト毎にプロキシを割り当てる: インポートランダム クラス RotateProxyMiddleware: def __init__(self, proxies): self.proxies = proxies クラスメソッド def from_crawler(cls, crawler): return cls(proxies=crawler.settings.getlist('PROXY_LIST')) def process_request(self, request, spider): request.meta['proxy'] = random.choice(self.proxies)
ほとんどのご質問にはお答えしました。
ただし、PySocksがインストールされている必要があります。request.meta['proxy']でプロキシをsocks5://ip:portに設定します。
ミドルウェアにロジックを設定し、スパイダーやドメインをマッチさせ、条件付きで異なるプロキシを割り当てることができます。
ネイティブではない。マルチホップのプロキシには、ProxyChainsのような外部トンネリングツールを使うか、Scrapyの外部でカスタムVPNルーティングを行ってください。
はい。HttpErrorMiddlewareを使用するか、response.statusコードをチェックして、タイムアウト、禁止、リダイレクトを検出します。
ハードコーディングは避けてください。環境変数や暗号化された設定ファイルを使用し、設定やミドルウェアで読み込んでください。
米国
米国
英国
イギリス
ドイツ
フランス
メキシコ
カナダ
イタリア
ブラジル