Indeed には膨大な求人データが集まっています。ある時点で、、、そしてが存在します。
そのデータをスプレッドシート、CRM、あるいは分析ダッシュボードで使いたいなら、実際に動くスクレイパーが必要です。「実際に動く」というのが重要で、Indeed は一般公開されている求人掲示板の中でも、特に強力に保護されているサイトのひとつだからです。
私は Thunderbit と、その前は Automation Anywhere で長年オートメーションツールを作ってきましたが、2026年の Indeed スクレイピングは、基本的な商品カタログをスクレイピングするのとはまったく別物だと断言できます。Cloudflare のチャレンジ、CAPTCHA、IP フィンガープリンティング、そして変動するレート制限により、昨年書かれたスクリプトの半分はもう壊れていても不思議ではありません。各種フォーラムを見ても同じ話が並びます。何か月も動いていたコードが、ある日突然 403 エラーしか返さなくなるのです。
そこで今回は、ノーコード拡張機能、開発者向け API、オープンソースライブラリまで含めた 10 個の Indeed スクレイパーをまとめました。技術レベルも予算も幅広くカバーしています。給与データを Google スプレッドシートに入れたい採用担当者から、求人集約パイプラインを作るデータエンジニアまで、きっと合うツールが見つかるはずです。
Indeed のスクレイピングが最も難しい求人サイトのひとつである理由
ツールの話に入る前に、まず相手の厄介さを理解しておくとよいでしょう。Indeed はスクレイパーにとって親切な対象ではなく、年々さらに手ごわくなっています。
主に 4 層の対ボット対策があります。
- Cloudflare WAF: Indeed のでも、ユーザーが Cloudflare エラーや 403 Forbidden 応答に遭遇する可能性があると認めています。多くのスクレイパーが最初にぶつかる壁です。
- CAPTCHA とチャレンジゲート: 「あなたが人間であることを確認してください」というループが頻繁に発生します。面倒なだけではなく、ツールが解決または回避できなければ、自動化ワークフローそのものが止まります。
- IP とリクエストレート制限: Indeed のでは、トラフィックが 60 秒のローリングウィンドウで管理され、超過すると HTTP 429 が返されます。特にページネーションでこの制限に引っかかりやすくなります。
- JavaScript と Cookie 依存: Indeed は、ブロックされたユーザーに対して。実際のブラウザをレンダリングしない純粋な HTTP リクエスト型スクレイパーは、安定して失敗します。
コミュニティの証拠もかなり率直です。ある Reddit ユーザーは。「403 forbidden エラーがいつも出る。」別のユーザーは。「何か月も動かしていた webscraping コードが止まった。」さらにでは、1ページ目は問題なく読み込めるのに、その後のページが完全に失敗すると説明されています。
他の求人サイトと比べると、Indeed は難易度の中〜高くらいに位置します。では、おおむね中程度の難易度で、1 IP あたり 1 日 200〜500 件が安全な目安とされています。一方、 や LinkedIn は、ログイン制限のためさらに難しい傾向があります。ただし「中程度の難易度」といっても、安価なリクエスト専用スクレイパーや趣味レベルのスクリプトは頻繁に壊れるという意味です。ここでは、多くのサイト以上にツール選びが重要になります。
2026年版 Indeed スクレイパーの選定基準
私はこのリストの各ツールを、Reddit、GitHub の issue、開発者フォーラムで見つけた実際の悩みに直結する 8 つの基準で評価しました。
| 評価基準 | Indeed で重要な理由 |
|---|---|
| Cloudflare / 対ボット回避 | 最多の不満ポイント — 403 ブロックでスクレイパーが壊れるという話が、少なくとも 5 つのフォーラムスレッドで出ています |
| コーディングの必要性 | 非エンジニア(採用担当、HR、アナリスト)は非常に多いのに、ほとんどのスクレイパー記事では軽視されがちです |
| 無料枠 / 無料オプション | 無料または低コストの選択肢が必要だという言及が 4 件あり、有料ツールは「高すぎる」と言われていました |
| 出力形式 | ユーザーは生の JSON ではなく、Sheets、Excel、Airtable で使えるデータを求めています。手作業で変換したくないのです |
| プロキシ / IP ローテーション | 3 件の言及あり。あるユーザーの言葉を借りれば、プロキシなしで Indeed をスクレイピングするのは「悪い考え」です |
| セットアップのしやすさ | Python スクレイパーは「頭が混乱する」との声がありました |
| 保守性 / 信頼性 | Indeed は変化が速く、メンテナンスされていないツールをすぐに使い物にならなくします |
| 1,000件あたりのコスト | 競合記事の価格表は曖昧なので、比較しやすいようにコストを統一して算出しました |
このリストが他と違う点のひとつは、ノーコード、ローコード、API、オープンソースを意図的に全部入れていることです。見つけた他の「最強 Indeed スクレイパー」系の記事は、ほとんど API ベースの選択肢しか扱っていませんでした。
そのせいで、ターミナルを触らずに求人データをスプレッドシートで見たいだけの人たちが、かなり取り残されています。
自分のスキルレベルに合う Indeed スクレイパーはどれ?
10 個のツールを読む前に、自分がどのカテゴリに入るか確認しておきましょう。時間の節約になります。
| あなたのスキルレベル | 最適なアプローチ | 検討候補 |
|---|---|---|
| コーディング経験なし | Chrome 拡張機能または設定 UI | Thunderbit、Apify(設定 UI) |
| 基本的な Python / スクリプト | ライブラリ + プロキシ、またはシンプルな API | JobSpy、ScraperAPI、Decodo |
| 開発者 / データエンジニア | フル API 連携 | Bright Data、Oxylabs、ZenRows、ScrapingBee、Scrapingdog |
50 件の求人情報の給与データが欲しい採用担当者に、月額 500 ドルのエンタープライズ向けプロキシネットワークは必要ありません。逆に、商用の求人集約サービスを作る人が無料の Chrome 拡張機能だけに頼るのもおすすめできません。ツールをスキルと用途に合わせることが、半分は勝負を決めます。
1. Thunderbit — 非技術者向けの最適な Indeed スクレイパー
は私とチームが作ったツールなので、そこは最初に明言しておきます。ただ、これを最初に置いたのは贔屓だからではありません。対ボット対策、サブページの詳細取得、そしてスプレッドシートへの直接エクスポートまで、コードを一行も書かずにこなせる本物のノーコード Indeed スクレイパーは、私が見た限り Thunderbit だけだからです。
使い方はとても簡単です。をインストールし、Indeed の検索結果ページを開き、AI で項目を提案 をクリックします。すると AI がページを読み取り、求人タイトル、会社名、給与、所在地、URL などの列を提案します。提案された項目を確認して スクレイプ を押し、エクスポートするだけです。インストールからスプレッドシートにデータが入るまで、全体で約 2 分です。
Indeed で Thunderbit が特に便利な理由は次のとおりです。
- サブページのスクレイピング: 検索結果ページを起点にして、各求人詳細ページを自動で巡回し、全文の説明、応募条件、福利厚生、掲載メタデータを追加できます。競合採用の分析では、一覧の断片だけでなく全体像を取れるこの機能がとても重要です。
- ブラウザモード + クラウドモード: ブラウザモードは、自分のログイン済み Chrome セッションからスクレイピングします(地域別の検索結果に便利です)。クラウドモードは Thunderbit のホスト基盤で、ローテーション IP とブロック回避ロジックを使います。公開対象なら一度に 50 ページ まで取得できます。
- 内蔵の対ボット処理: クラウドモードが Cloudflare のチャレンジや CAPTCHA を自動処理します。プロキシ設定も CAPTCHA 解決サービスの設定も不要です。
- 無料のメール / 電話番号抽出機能: 企業ページから雇用主の連絡先データを直接取得できます。採用リード獲得に役立ちます。
- 直接エクスポート: 、、、 に、すべて無料で出力できます。JSON を CSV に変換するスクリプトは不要です。
はあらかじめ用意されているので、必要なければ項目設定を手動で行う必要もありません。
料金: Thunderbit の無料プランには 月 6 ページ が含まれ、無料トライアルでは 10 ページ 使えます。有料プランはクレジット制で、1 クレジット = 1 出力行です。Starter 料金ではおおむね 1,000 行あたり 30 ドル、上位プランほど単価は下がります。エクスポート自体はどのプランでも完全無料です。。
長所: コーディング不要、スプレッドシートへ直接出力、サブページの詳細取得、ブラウザ + クラウドモード、セットアップが非常に速い
短所: クレジット制の課金は、非常に大量のクロール(1日 10,000 件以上)ではやや不利。Indeed 専用の独立ベンチマークはまだ少ない
おすすめ: スプレッドシートで Indeed データが欲しい採用担当者、HR チーム、ビジネスアナリスト。コード不要で使えます。
2. Bright Data — エンタープライズ規模のプロジェクトに最適な Indeed スクレイパー
はこの分野の大手です。巨大なプロキシネットワーク(195 か国にまたがる )、専用 CAPTCHA 解決、ブラウザフィンガープリンティング、JavaScript レンダリング、そして Indeed 専用の と を組み合わせています。
- 主な機能: Cloudflare 回避のための Web Unlocker、地域指定スクレイピング、構造化データ配信(JSON、CSV、NDJSON)、クラウドストレージ連携、Indeed 専用データ商品
- 対ボット対応: 業界トップクラス。 では、平均応答時間 7.45 秒 で全体成功率 95.99% という結果が示されています
- 料金: 従量課金は web scraping で から。Indeed データセットは (最低注文 50 ドル)から。試用クレジットはありますが、公開の無料枠はありません。
おすすめ: 給与ベンチマーク、労働市場調査、商用の求人集約のために、毎日何千件もの Indeed ページをスクレイピングするデータチーム。特に、コストよりも稼働率と地理的カバレッジが重要な場合に向いています。
3. Apify Indeed Scraper — ローコードユーザーに最適な Indeed スクレイパー
は市場の中間層に位置します。Thunderbit ほど初心者向けではありませんが、設定 UI から事前構築済みの「Actor」を実行できるので、生の API よりは簡単です。最も人気のある Indeed Actor()は、54件のレビューで 5点満点中 4.0、総ユーザー数 2万人 ほどで、価格はおおむね 求人 1,000 件あたり 3 ドル からです。
- 主な機能: 設定ベースの UI(検索キーワード、場所、ページ数を指定)、 内蔵、、柔軟な出力(JSON、CSV、Excel、XML、HTML、RSS、JSONL)
- 対ボット対応: 使う Actor とプロキシ設定次第です。公開 issue では、Indeed 実行時にブロックされたり、結果が不完全になったりする例が見られます。
- 料金: には 5 ドル分のプラットフォームクレジットが含まれますが、Indeed ではすぐに消費されやすいです。
おすすめ: ダッシュボードからスケジューリングと構造化出力を使いたい、ある程度技術のわかるユーザー。スクレイピングコードをゼロから書く必要はありません。
4. ScraperAPI — 予算を抑えたい開発者向けの最適な Indeed スクレイパー API
は、開発者向け API の中でも特にわかりやすい部類です。URL を送るだけで、 をサービス側に任せ、HTML もしくは構造化出力を受け取れます。 では 99.99% の成功率 と 平均 1〜3 秒 の応答時間をうたっていますが、これはベンダー公表値です。
- 主な機能: シンプルな REST API、内蔵プロキシローテーション、自動再試行、複数の(HTML、JSON、テキスト、Markdown、CSV ワークフロー)
- 料金: Hobby プランは ですが、保護対象リクエストは 1 件あたり を消費することがあります。Indeed のような保護サイトでの実効コストは、初期料金ベースでおおよそ 1,000 保護リクエストあたり 4.90 ドル です。無料枠は 5,000 試用クレジット。
- 注意点: リクエストの半分が失敗すると(Indeed では起こり得ます)、実効コストは倍になります。
おすすめ: エンタープライズ価格ではなく、きれいな API ドキュメントと予測しやすい統合性を重視する開発者。
5. Scrapingdog — Indeed スクレイピングで最安級の API
は価格のわかりやすさで競争しています。プランは 20万クレジットで 40 ドル から始まり(約 )、開始時に 1,000 無料クレジット が付与されます。
- 主な機能: 対ボットサイト向けの 、Indeed 向けの解析済み JSON 出力、再試行ロジック(1リクエスト最大 60 秒)、成功リクエストのみ課金
- 料金上の注意: Stealth mode は 1 リクエストあたり 10 クレジット かかるため、Lite 料金での保護サイト実質コストは 1,000 保護リクエストあたり約 2.00 ドル に近くなります。それでも多くの競合よりは安いです。
- 性能メモ: では Bright Data や ScraperAPI よりばらつきが大きいため、本格展開前に十分な検証が必要です。
では、Python でのセットアップ手順が説明されています。
おすすめ: とにかく 1 リクエストあたりのコストを最小化したい、予算重視の開発者。安定性の検証は自分で行える人向けです。
6. ZenRows — 対ボットの信頼性に強い最適な Indeed スクレイパー API
は、スクレイピング市場の中でも「まず対ボット対策」を前面に出した代表的なサービスになっています。具体的には、、フィンガープリンティング回避、プレミアムローテーションプロキシを明示的に打ち出しています。 では、CSV、単一 JSON ファイル、または URL ごとに 1 つの JSON ファイルとして出力でき、一般的な生 API 製品よりビジネス用途に向いています。
- 主な機能: JS レンダリング付きの保護サイトスクレイピング、各リクエストに組み込まれた対ボット回避、構造化出力オプション
- 料金: Developer プランでは、通常結果は ですが、保護対象結果は まで上がります。無料トライアルは、通常 1,000件 + 保護 40件で 14日間有効です。
- ベンダー公表値: 保護サイトでの平均成功率は です。
1 リクエストあたりのコストは高く見えますが、Cloudflare を手作業でデバッグするのに何時間も使うことを考えれば、十分に比較対象になります。
おすすめ: エンタープライズ級の大規模スタックに移行せずに、対ボット耐性を最優先したい開発者。
7. ScrapingBee — ステルスプロキシモードが強い最適な Indeed スクレイパー API
は、開発者の作業フローがブロック解除性能と同じくらい重要なときに強みを発揮します。ヘッドレスブラウザ、ローテーションプロキシ、専用の Cloudflare 対策、(CSS/XPath セレクタや AI 補助抽出)、複数のレスポンス形式:JSON、HTML、Markdown、CSV、NDJSON をサポートしています。
- 主な機能: ステルスプロキシモード、JS レンダリング、構造化された 、AI 補助パース
- 料金: Freelance プランは (1,000 クレジットあたり 0.196 ドル)ですが、JS + プレミアムプロキシのリクエストは 1 件 25 クレジット かかり、初期料金ではおおよそ 1,000 件あたり 4.90 ドル になります。無料枠は 1,000 コール。
- ベンチマーク傾向: の傾向値では、全体成功率 77.98%、平均 10.32 秒 です。
おすすめ: 洗練された API 体験を重視し、後処理を減らすために組み込み抽出ルールを使いたい開発者。
8. Oxylabs — 大規模プロキシ基盤に最適な Indeed スクレイパー
は、すでに本格的なプロキシとブロック解除の基盤が必要だと分かっているチーム向けに、このリストに入れるべき存在です。 と は、CAPTCHA 回避、JS レンダリング、フィンガープリンティング軽減、再試行、そして 195 か国にまたがる を使った広範な地域指定に対応しています。
- 主な機能: AI ベースのデータ解析、複数形式出力(JSON、HTML、PNG、Markdown)、クラウド配信オプション
- 料金: 一般対象は、Web Scraper API の初期料金で JS なしなら 、JS ありで から。Web Unblocker はトラフィック課金です。無料枠は最大 2,000件。
- 補足: Oxylabs は、他社のように「Indeed スクレイパー」としてきれいにパッケージ化してはいません。 を理解し、Web Scraper API(解析済みデータ)と Web Unblocker(生アクセス)を使い分ける必要があります。
- ベンチマーク傾向: の傾向値では、全体成功率 83.89%、平均 12.75 秒 です。
おすすめ: すでにプロキシ基盤に投資しているエンタープライズチーム、または本格的な規模で地域ターゲティングが必要な人。
9. JobSpy (python-jobspy) — 無料で使える最強のオープンソース Indeed スクレイパー
は、まだ十分に活発で会話に挙げる価値のあるオープンソースの選択肢です。GitHub リポジトリには 、 があり、Indeed、LinkedIn、Glassdoor、ZipRecruiter、Google Jobs、Bayt、Bdjobs に対応しています。出力先は pandas DataFrame と CSV です。
- 主な機能: 1 つのスクリプトで複数求人サイトをスクレイピング、DataFrame / CSV 出力、完全無料、活発なコミュニティ
- 対ボット対応: 最小限です。内蔵のプロキシローテーションも CAPTCHA 解決もありません。すべて自分で対応する必要があります。 には、Indeed のブロックや動作不良の報告が頻繁にあります。
- 料金: 無料(オープンソース)。ただし、プロキシ費用とデバッグ時間は無料ではありません。
「無料」に隠れたコスト
ここははっきり書いておく価値があります。ドルでは無料でも、時間まで無料とは限りません。JobSpy を使うなら、Cloudflare ブロックのデバッグ、プロキシローテーションの設定、Indeed のレイアウト変更後の修正に、かなりの時間を取られる覚悟が必要です。この手の作業が好きな Python 開発者にとっては、十分に見合う選択です。一方、単に 200 件の求人をスプレッドシートに入れたい採用担当者にとっては、かなり割に合いません。
おすすめ: 複数求人サイトのスクレイピングを楽しめて、定期的なメンテナンスも苦にならない Python 開発者。
10. Decodo(旧 Smartproxy) — プロキシ重視ユーザーに最適な Indeed スクレイパー
(旧 Smartproxy)は、単なるプロキシ販売ではなく、より広いスクレイピングプラットフォームとして自らを位置付けています。公開ページでは 、、そして Web Scraping API で 毎秒 200 リクエスト までのスループットをうたっています。
- 主な機能: ローテーション式の住宅用プロキシ、JS レンダリングと CAPTCHA 処理に対応した 、複数の連携方法
- 出力形式: HTML、JSON、CSV、PNG、XHR、Markdown
- 料金: 無料のスタータープランには約 が含まれており、テスト用途としてはかなり太っ腹です。有料プランはエントリー API 料金でおおよそ 1,000 件あたり 0.50 ドル から始まります。
おすすめ: スループットとリクエスト種別で考えるチーム。Thunderbit より初心者向けではなく、ZenRows ほど Indeed 向けの即戦力でもありませんが、プロキシに慣れたユーザーにはよい中間地点です。
最適な Indeed スクレイパー比較表
| ツール | タイプ | コーディング必要 | 対ボット対応 | 無料枠 | 出力オプション | 1,000件/リクエストあたりのコスト | おすすめ対象 |
|---|---|---|---|---|---|---|---|
| Thunderbit | Chrome 拡張機能 | なし(2クリック) | 内蔵(クラウド + ブラウザ) | 月 6 ページ無料 | CSV、Excel、Sheets、Airtable、Notion、JSON | 約 30 ドル/1,000 行(Starter) | 採用担当、HR、非技術者 |
| Bright Data | エンタープライズ API + データセット | 低〜高 | CAPTCHA 解決、4億以上の IP | 試用クレジット | JSON、CSV、NDJSON、API、クラウド | 約 2.50 ドル/1,000 レコード(従量課金) | エンタープライズチーム |
| Apify | Actor マーケットプレイス | 低(設定 UI) | Actor 次第 | 5ドル分のプラットフォームクレジット | JSON、CSV、Excel、XML、RSS、JSONL | 約 3ドル/1,000 件 | ローコードユーザー |
| ScraperAPI | API | 必要 | プロキシローテーション、JS レンダリング | 5K 試用クレジット | HTML、JSON、テキスト、Markdown | 約 4.90 ドル/1,000 保護件 | 予算重視の開発者 |
| Scrapingdog | API | 必要 | Stealth mode、CAPTCHA | 1K クレジット | JSON、HTML、Markdown、CSV | 約 2.00 ドル/1,000 保護件 | 低コスト API 利用 |
| ZenRows | API + ノーコードスクレイパー | 低〜高 | WAF 回避、CAPTCHA 回避 | 1,000 通常 + 40 保護 | CSV、JSON、HTML、Markdown | 約 6.90 ドル/1,000 保護件 | 対ボット信頼性 |
| ScrapingBee | API | 必要 | ステルスプロキシ、JS レンダリング | 1,000 コール | JSON、HTML、Markdown、CSV、NDJSON | 約 4.90 ドル/1,000 保護件 | 開発者の利便性 |
| Oxylabs | エンタープライズ API + unblocker | 必要 | CAPTCHA 回避、1億7,700万以上の IP | 2,000件 | JSON、HTML、PNG、Markdown | 約 2.15〜2.35 ドル/1,000 件 | 大規模プロキシ基盤 |
| JobSpy | Python ライブラリ | 必要(Python) | 自前対応(最小限) | 完全無料 | DataFrame、CSV、Excel | 0 ドル(+ プロキシ費用) | Python 開発者 |
| Decodo | API + プロキシ | 低〜高 | JS レンダリング、CAPTCHA 処理 | 2K リクエスト | HTML、JSON、CSV、PNG、Markdown | 約 0.50 ドル/1,000 件(初期) | プロキシ優先チーム |
対ボット評価表: 実際に動く Indeed スクレイパーはどれ?
| ツール | Cloudflare 回避 | CAPTCHA 対応 | IP ローテーション | 信頼性評価 |
|---|---|---|---|---|
| Thunderbit(クラウドモード) | ✅ 内蔵 | ✅ 自動処理 | ✅ クラウド IP | ⭐⭐⭐⭐ |
| Bright Data | ✅ 高度 | ✅ CAPTCHA ソルバー | ✅ 4億以上の IP | ⭐⭐⭐⭐⭐ |
| Apify | ⚠️ Actor 次第 | ⚠️ Actor 次第 | ⚠️ アドオン | ⭐⭐⭐ |
| ScraperAPI | ✅ プロキシローテーション | ✅ 自動再試行 | ✅ 内蔵 | ⭐⭐⭐⭐ |
| Scrapingdog | ✅ Stealth mode | ✅ CAPTCHA 解決 | ✅ 内蔵 | ⭐⭐⭐ |
| ZenRows | ✅ WAF 回避 | ✅ CAPTCHA 回避 | ✅ プレミアムプロキシ | ⭐⭐⭐⭐½ |
| ScrapingBee | ✅ ステルスプロキシ | ✅ Cloudflare 対策機能 | ✅ 内蔵 | ⭐⭐⭐⭐ |
| Oxylabs | ✅ 高度 | ✅ CAPTCHA 回避 | ✅ 1億7,700万以上の IP | ⭐⭐⭐⭐½ |
| JobSpy | ⚠️ 頻繁に壊れる | ❌ 手動 | ❌ 自前対応 | ⭐⭐ |
| Decodo | ✅ JS レンダリング | ✅ CAPTCHA 処理 | ✅ 1億2,500万以上の IP | ⭐⭐⭐⭐ |
これらの評価は、ベンダー文書、コミュニティの証拠、ベンチマークの傾向値を組み合わせた実用的な編集判断であり、ラボ認証済みの測定ではありません。
無料版 vs 有料版の Indeed スクレイパー: 実際に何が得られるのか
フォーラムで最も混乱が多いのがここです。「無料」といっても、ツールによって意味が大きく異なります。
This paragraph contains content that cannot be parsed and has been skipped.
重要なポイントはこうです。JobSpy のような Python ライブラリでの「無料」は、ドルでは無料でも、時間は高くつくということです。Cloudflare ブロック、プロキシ設定、レイアウト変更後の修正に何時間もかかります。一方、Thunderbit のようなツールの「無料枠」は、小規模用途なら時間もお金も両方無料です。この差は本当に大きく、オープンソースのスクレイパーにかかる保守コストを、非開発者は過小評価しがちだと思います。
求人検索を超えて: チームが Indeed スクレイパーを使う 5 つの方法
多くの人は、Indeed のスクレイピングは求職者向けだけだと思っています。しかし実際は違います。Indeed Hiring Lab の経済学者 Chris Glynn は、 と述べています。そしてそのデータは、次の仕事を探すこと以上にビジネス価値があります。
NBER の論文では、給与の透明性ルールによって求人票内の給与開示が約 増えたことが示されており、求人サイトから給与を抽出する価値は数年前よりも大きくなっています。一方で、 しか労働市場データを使ってタレント戦略を設計しておらず、 では、平均的な組織が現在 3 種類 の給与データソースを使っているとされています。
This paragraph contains content that cannot be parsed and has been skipped.
Thunderbit のサブページ取得は、競合採用分析に特に役立ちます。求人一覧ページをスクレイプしたあと、各求人詳細ページを自動で訪問し、全文説明、応募条件、福利厚生を表に追加できます。設定は不要で、AI が項目マッピングを処理します。
スクレイピングからスプレッドシートへ: Indeed データのエクスポートと活用
競合記事はどれも「データの取り方」までで終わっています。その先の話はほとんどありません。
しかし実際のユーザーは、CSV への書き出し、WordPress への取り込み、使える形式への変換について明確に質問しています。そこが大きな実務上のギャップです。
各ツールのエクスポートフローを比べると、次のようになります。
- CSV / Excel エクスポート: Thunderbit は無料で直接ダウンロードできます。JobSpy は Python で DataFrame → CSV に出力します。API ツールは JSON を返すため、手動またはスクリプトで変換する必要があります。
- Google スプレッドシート連携: Thunderbit はワンクリックでできます。多くの API ツールでは、Sheets に入れるために Zapier か独自スクリプトが必要です。
- Airtable / Notion: Thunderbit は両方にネイティブ対応しています。競合ツールでは、中間ツールか手動インポートが必要です。
- CRM 取り込み: 営業や採用チームが見込み雇用主情報をパイプラインに入れる場合、Thunderbit の構造化出力(会社名、所在地、連絡先情報)はそのまま CRM に取り込めます。API ツールは先に変換が必要です。
非技術者にとって本当に重要なのは、スクレイプ → 整形された表を作成 → 目的のツールにエクスポート、という一連の流れです。スクレイピングエンジンそのものより、こちらの方が価値があります。生の JSON を前にして「で、次は?」と思ったことがあるなら、何を言いたいかきっと分かるはずです。
Indeed スクレイピングの法的・倫理的な注意点
簡単な注意書きです。これは運用上のガイドであり、法的助言ではありません。具体的な状況については弁護士に相談してください。
Indeed のでは、書面による許可なしにボット、スクレイパー、スパイダー、AI システム、あるいはエージェント型 AI を使うことを明確に禁止しています。 も、一般的なクローラーに対して多くの重要パスを制限しています。ただし、Indeed 上のデータ自体は公開アクセス可能で、求人一覧を見るのにログインは不要です。
実務上のおすすめは次のとおりです。
- レート制限を守り、一気に大量取得しないこと。Indeed の 60 秒ローリングウィンドウは実在します。
- ログイン必須や非公開データはスクレイプしないこと。明確な許可がない限り避けてください。
- 公開され、かつ用途に関係のある範囲を超える個人データは集めないこと。
- サーバーに負荷をかけすぎないこと。リクエストを抑制し、ウェブの良い市民でいましょう。
Web スクレイピングをめぐる法的環境は常に変化しています。迷ったら、安全側に倒すのが無難です。
どの Indeed スクレイパーを選ぶべきか?
この 10 個をじっくり調べた結果、私の推奨は 4 つの変数に集約されます。スキルレベル、必要なボリューム、予算、そして最終的にどこへデータを置きたいかです。
- 非技術者(採用担当、HR、オペレーション) → 。Indeed のページから使えるスプレッドシートまで最短です。コード不要、無料エクスポート、サブページ取得あり。
- 予算重視の開発者 → Scrapingdog または ScraperAPI。対ボット対応もそこそこあり、1 リクエストあたりのコストが低いです。
- エンタープライズ / 大規模運用 → Bright Data または Oxylabs。最高レベルのプロキシ基盤、信頼性、地域ターゲティングが強みです。
- 無料でオープンソース → JobSpy。Python が使えて、壊れやすさを許容できるなら。
- ローコードの中間地点 → Apify Indeed Scraper。スケジューリングとデータセット保存ができる設定 UI 付きです。
- 対ボット最優先 → ZenRows。エンタープライズ級ツールを除けば最も強力です。
「最適な」Indeed スクレイパーは、結局のところ、あなたが誰で、何をしたいかで決まります。万能の勝者はありません。ただし、あなたの状況に合う正解はあります。
まずは無料枠を試してから本契約に進むのがおすすめです。多くのツールは、実際の Indeed クエリで動くかどうかを確かめるのに十分な無料利用を提供しています。
そして、ノーコードでの Indeed スクレイピングがどんな感じか見てみたいなら、 をぜひ試してください。検索結果から、きれいに整った構造化スプレッドシートへ驚くほど速く移れるはずです。 や、そもそも についても、ブログで解説しています。視覚的に学びたい方には、 のチュートリアルもあります。
楽しくスクレイピングを。403 エラーが少ないことを願っています。
FAQ
1. コーディングなしで Indeed をスクレイピングできますか?
はい。Thunderbit と Apify はどちらもノーコードまたはローコードの経路を提供しています。Thunderbit は本当に最も簡単なノーコード選択肢で、 として Indeed のページ上で直接動き、スクレイプからエクスポートまでの流れがコードゼロで約 2 分です。
2. Indeed をスクレイピングするのは合法ですか?
Indeed の求人一覧は公開表示されていますが、 では書面による許可なしのスクレイピングを明確に禁止しています。ユーザーは robots.txt、レート制限、適用されるデータプライバシー法を尊重する必要があります。これは法的助言ではありません。具体的な用途については専門家に相談してください。
3. 最も良い無料の Indeed スクレイパーはどれですか?
オープンソースの Python ユーザーなら、 は完全無料ですが、Python スキルと定期的な保守が必要です。ノーコードユーザーなら、(月 6 ページ、無料エクスポート付き)の方が実用的です。スクリプトが不要で、スプレッドシートへの直接出力もできます。
4. Indeed をスクレイピングするとき、Cloudflare はどう対処すればよいですか?
内蔵の対ボット処理があるツールを使ってください。Thunderbit のクラウドモード、、、、 は、いずれも Cloudflare のチャレンジを自動処理します。Indeed の でも、Cloudflare ベースのブロックが現在の体験の一部であることが確認されています。
5. Indeed のスクレイピング結果を Google スプレッドシートや Excel に出力できますか?
Thunderbit は、、、、 への直接エクスポートを無料でサポートしています。Apify は、 を通じて CSV、Excel、JSON への出力をサポートします。多くの API ツール(ScraperAPI、ZenRows、ScrapingBee)は JSON または HTML を返すため、スプレッドシートで使う前に追加変換が必要です。
さらに詳しく知る