米国でウェブスクレイピングは合法? 法律が実際に言っていること

最終更新日 April 29, 2026

数週間前、営業チームの同僚から、よくある質問をされました。「この公開の事業者ディレクトリからリードをスクレイピングしても大丈夫? それとも訴えられる?」というものです。彼は、オープンウェブに眠る見込み客データの“金鉱”を見つけていました。ログインも有料壁もありません。それなのに、ちょっとGoogleで調べただけで、手錠をかけられるかもしれないと本気で思い込んでしまったのです。

こうした不安は、あちこちで見かけます。自動化されたトラフィックは現在、全ウェブトラフィックの約を占め、ウェブスクレイピングソフトウェア市場は2025年の約成長すると予測されています。それでも、ネット上にあふれる法的ガイダンスの大半は、古いか、単純化しすぎているか、あるいは完全に誤っています。2022年のhiQ対LinkedIn事件はどうでしょう? ほとんどの記事が、あたかも「すべてのスクレイピングは合法」と最高裁が判断したかのように扱っています。(先に言っておくと、そうではありませんし、そんな判決でもありませんでした。)

一方で、2024年から2025年にかけては、X(旧Twitter)、Meta、Reddit、Google、そしてAI企業が関わる重要な新事件が次々とルールを書き換えています。ところが、それをきちんと追っている記事はほとんどありません。このガイドでは、2026年時点で米国法がウェブスクレイピングについて実際に何を言っているのかを整理し、神話と現実を切り分け、何ができて何ができないのかを見極めるための実践的な枠組みを示します。

ig_01ef7eecb01f4f920169f063829a4481918da7ee0e1b3f672e_compressed.webp

ウェブスクレイピングとは何か、そしてなぜ企業は気にするのか?

ウェブスクレイピングとは、自動化ソフトウェアを使ってウェブサイトから情報を収集し、スプレッドシートやデータベース、CRMレコードのような構造化データに整理することです。

もう少し正確にいうと、スクレイパーがウェブページにアクセスし、裏側のHTMLを読み取り、価格、名前、住所、製品仕様など、必要なデータだけを抜き出して、きれいな行と列にまとめます。ウェブサイトの情報をExcelに転記する人を雇うようなものですが、ボットなら数時間ではなく数秒で終わります。

ウェブスクレイピングはハッキングではありません。ブラウザで一般の訪問者が見られるのと同じ情報にアクセスしているだけです。

しかも、これは一部の開発者だけが使うニッチな技術でもありません。検索エンジン、価格比較サイト、不動産プラットフォーム、市場調査ダッシュボード、AI搭載ツールは、すべてウェブクロールとスクレイピングに依存しています。Googleを使ったことがある人、航空券比較サイトを見たことがある人、Zillowを閲覧したことがある人は、すでにスクレイピングの恩恵を受けています。

私がよく目にする、企業での代表的な活用例は次のとおりです。

  • リード獲得: 事業者ディレクトリから企業名、Webサイト、役職名、公開連絡先を抽出する。
  • 競合価格モニタリング: ECチームが競合商品のSKU価格、在庫状況、配送情報を追跡する。
  • 不動産インテリジェンス: 公開物件情報、価格、市場動向を集約する。
  • 商品リサーチ: 小売サイトから商品仕様、評価、在庫状況、カテゴリーデータを取得する。
  • 市場インテリジェンス: 求人情報、店舗開設、ニュースシグナル、公開財務データを追跡する。

この手法自体は中立です。法的な判断は、どうやってデータにアクセスしたか、そしてその後に何をするかで決まります。

米国でウェブスクレイピングは合法? 簡潔な答え

米国連邦法には、ウェブスクレイピングを全面的に禁止する法律はありません。公開されているデータのスクレイピングは、一般に許可されています。

ただし、ここが重要ですが、合法かどうかは複数の要素に左右されます。データの種類、アクセス方法、利用規約への同意の有無、個人情報が含まれているか、そしてそのデータをどう使う予定か、がポイントです。

フォーラムやRedditのスレッド、さらには法律系ブログでも混乱の元になっているのは、「違法」と「ウェブサイトの利用規約違反」を同じものとして扱うことです。これはまったく別物です。サイトのルールに違反すると、IPブロックやアカウント停止になるかもしれません。連邦法に違反すると、訴訟、まれなケースでは刑事訴追につながることがあります。とはいえ、スクレイピングによる問題の大半は、民事の範囲に収まります。

この記事の残りでは、主要な法律、画期的な裁判例(2024年と2025年の、ほとんど誰も取り上げていないものも含めて)、そして実際に使える実践的な判断フレームワークを解説します。

「違法」の3種類:刑事、民事、利用規約違反

ウェブスクレイピング法について、最大の誤解をひとつ整理しましょう。「ウェブスクレイピングは違法ですか?」と聞かれたとき、通常はまったく別の3種類のリスクをひとまとめにしてしまっています。これを分けるだけで、話は大きく変わります。

ig_01ef7eecb01f4f920169f064039ff881918c7bf5b1db31fa7f_compressed.webp

責任の種類何が引き金になるか起こり得る結果深刻度
刑事(CFAA)認証の壁の向こうにあるデータへ無権限でアクセスする、不正、認証情報の不正使用連邦訴追、罰金、禁錮🔴 深刻 — ただし通常の業務スクレイピングでは極めてまれ
民事訴訟著作権侵害、動産侵害、不当契約違反、営業秘密の不正取得、プライバシー侵害損害賠償、差止命令、データ削除🟡 大きい
利用規約違反browsewrapまたはclickwrapの利用規約に違反することアカウント停止、IPブロック、差止要求、民事訴訟の可能性🟢 低〜中程度

司法省はで、偽アカウントの作成やサイトルール違反のような通常の利用規約違反だけでは、連邦刑事訴追の根拠としては不十分だと明言しています。これは非常に大きな意味を持ちます。

実務上のポイントはこうです。営業チームが公開の事業者リストをスクレイピングしたり、ECチームが競合価格を監視したりしている場合、問題になるのはほぼ確実に刑事責任ではなく民事上のリスク管理です。だからといってルールを無視してよいわけではありませんが、過度な不安は少し修正してよいでしょう。

ウェブスクレイピングに適用される米国の主要法律

米国でウェブスクレイピングに関係する法的支柱は4つあり、それぞれがパズルの異なる部分を扱っています。

コンピューター不正使用・詐欺防止法(CFAA)

は、もともとコンピュータハッキングを訴追するために作られました。年月を経て、これがスクレイピング訴訟の定番条文となり、たいていはスクレイパーがウェブサイトに「無権限で」アクセスしたという理屈で使われています。

そこに事件が登場します。最高裁は、CFAA上の「許可されたアクセスを超える」とは、ファイル、フォルダ、データベースのようなコンピュータ上の立ち入り禁止領域にアクセスした場合に限られると判断しました。本来見られる情報を単に誤用しただけでは、該当しません。

スクレイピングへの影響は次のとおりです。

  • CFAAリスクが低い: ログイン不要で誰でも見られる公開Webページ。門がないなら、「無権限アクセス」の問題もありません。
  • CFAAリスクが高い: ログインの向こう側にあるデータ、有料壁、アクセス トークン、セッション操作、または取り消されたアクセス権の先にあるデータ。

hiQ対LinkedIn事件(後で詳しく見ます)は、公開データについてこの点を補強しました。ただし、CFAAはパズルの一部にすぎません。

著作権法とDMCA

米国著作権法は、記事、写真、動画、創作的な商品説明のようなオリジナルの表現を保護しますが、。この分野の画期的な判例が最高裁のです。氏名、住所、電話番号のような事実は、それを集めるのにどれだけ手間がかかっていても、著作権の対象にはなりません。

スクレイピングしたデータのリスク区分は次のようになります。

スクレイピング対象著作権リスク理由
価格、商品名、住所、日付、仕様低い事実だから
記事全文、写真、動画、創作的なレビュー高い表現物だから
編集されたデータベース、ランキング、独自の分類体系中〜高選択と配列が保護される場合があるため
有料壁やDRMで保護されたコンテンツ高い著作権に加え、アクセス制御の問題があるため

は、さらにもう一段の層を加えます。技術的保護手段(有料壁、DRM、特定のボット対策など)を回避して著作物にアクセスすることは、たとえ内容自体を一度もコピーしなくても、責任を問われる可能性があります。これは2025〜2026年の訴訟で積極的に争われており、では、GoogleがSearchGuardのボット対策システムの回避によるDMCA違反を主張しています。

フェアユースも重要です。単に再掲載するのではなく、データを分析したり、集約したり、そこから新しい価値を作ったりする変形的利用のほうが、一般に安全です。

契約法:利用規約(browsewrapとclickwrap)

多くのサイトは、利用規約にスクレイピング禁止の文言を入れています。しかし、それが法的に有効かどうかは、あなたがその規約をどう見たかに完全に左右されます。

契約の種類執行可能性スクレイパーにとっての意味
Clickwrap(「同意する」をクリック)強い裁判所は一貫してこれを有効と扱う。スクレイピング禁止条項は民事請求の根拠になり得る。
Sign-in wrap(ログイン付近に通知)事案依存通知がどれだけ目立っていたかによる。
Browsewrap(フッターなどにリンク)弱い実際の通知がなければ、裁判所は慎重。
アカウント/API条項より強いログイン後のスクレイピングやAPI濫用は、はるかに高リスク。

では、Metaが主張したような形では、Metaの利用規約がログアウト状態の公開スクレイピングをカバーしていないと裁判所が判断しました。Bright Dataが、問題となった公開スクレイピングでログイン済みアカウントを使っていたと示されていなかったからです。これは重要な違いです。

実務上のアドバイスとしては、ログインしておらず、「同意する」もクリックしておらず、公開ページのみをスクレイピングしているなら、browsewrapの制限はサイト側があなたに対して強くは主張しにくいです。ただし、スクレイピングの前には必ず利用規約を確認してください。特にアカウントを作成している場合はなおさらです。

米国の州プライバシー法(CCPAなど)

スクレイピングするデータに氏名、メールアドレス、電話番号、位置情報のような個人情報が含まれるなら、州のプライバシー法が適用される可能性があります。そして、その法体系は急速に拡大しています。IAPPは2025年半ばまでにしたと数え、と報告しています。

これらの法律の多くは「公開されている」個人情報に例外を設けていますが、その定義はまちまちです。さらに、収集後の使い方——販売、共有、プロファイリング——によっては、最初の収集が例外でも義務が発生することがあります。

州法施行時期スクレイピングされたPIIを対象に含むかオプトアウト要件制裁の範囲
CCPA/CPRA(カリフォルニア)2020/2023はい販売/共有のオプトアウト。GPCを認識1違反あたり2,663〜7,988ドル(2025年調整)
CPA(コロラド)2023はい2024年7月からユニバーサルオプトアウト/GPC不公正取引法の枠組みに基づく民事制裁
CTDPA(コネチカット)2023はい2025年1月からOOPS/GPC故意の違反1件につき最大5,000ドル
VCDPA(バージニア)2023はいオプトアウト権あり1違反あたり最大7,500ドル
TDPSA(テキサス)2024はい2025年1月からユニバーサルオプトアウト1違反あたり最大7,500ドル
+ 2026年までにさらに8州で成立州により異なる州により異なる州により異なる州により異なる

成立済みの法律がある州には、ユタ、オレゴン、モンタナ、デラウェア、アイオワ、ネブラスカ、ニューハンプシャー、ニュージャージー、テネシー、ミネソタ、メリーランド、インディアナ、ケンタッキー、ロードアイランドが含まれます。アラバマでは、2027年5月1日施行の法律が成立しています。

製品価格、事業者リスト、市場データのような非PIIの事実情報をスクレイピングするビジネスユーザーにとっては、プライバシーリスクはかなり低くなります。のようなツールは、公開ページ(商品データ、事業者ディレクトリ、不動産情報)からの構造化抽出に焦点を当てており、最も低リスクなスクレイピングのカテゴリに合致しています。

画期的なウェブスクレイピング判例:2000年から2026年までの年表

ここが、このテーマに関する多くのガイドが物足りなく感じる部分です。ほとんどの記事はhiQ対LinkedIn(2022年)で止まり、今まさにスクレイピング法を形作っている判決を無視しています。全体の流れは次のとおりです。

事件主要な判断スクレイパーへの影響
eBay対Bidder's Edge2000動産侵害に基づく仮差止命令。クローラーによるサーバー負荷が問題になった⚠️ 大量スクレイピングでサーバーに負荷をかけると民事責任が生じ得る
Facebook対Power Ventures2016送達停止要求後もFacebookのシステムを使ってアクセスを継続し、CFAA責任が認定⚠️ C&Dと認証済み/ゲート付きアクセスの組み合わせは高リスク
Van Buren対米国2021CFAAの「許可されたアクセスを超える」には、立ち入り禁止領域へのアクセスが必要✅ CFAAの射程を大幅に狭めた
hiQ対LinkedIn2022公開データへのアクセスはCFAA違反ではないと判断(仮差止命令、後に和解)✅ 公開データ≠「無権限アクセス」— ただし最終判決ではない
Meta対Bright Data2024ログアウト状態の公開スクレイピングについて、Metaの契約論に基づく要請でBright Dataが略式判決勝訴✅ 同意がないログアウト状態のスクレイピングには規約が及ばない場合がある
X Corp.対Bright Data20245月に多くの請求を棄却。11月の命令でスクレイピング/販売に基づく請求を否定✅ 公開データ複製の請求は弱体化
Compulife対Newman/Rutstein2024-2025保険見積データの大量抽出について営業秘密責任を認定。2025年2月に上告不受理⚠️ 公開されているデータでも、保護されたデータベースになり得る
Reddit対Perplexity/SerpApi/Oxylabs/AWMProxy2025-2026Google検索結果を通じた産業規模の間接スクレイピングを主張⚠️ AI時代の事件はデータ供給網を狙う
Google対SerpApi2025-2026ボット対策回避の疑いをめぐるDMCA §1201請求⚠️ ボット対策システムがDMCA上のアクセス制御に当たるかを試す

流れは明確です。裁判所はCFAAの下で公開データへのアクセスをますます保護していますが、著作権、契約、プライバシー、営業秘密、インフラに関する請求は、それぞれ独立したリスクとして依然有効です。そして、AI学習の波がまったく新しい法的論点を生み出しています。

hiQ対LinkedIn事件は実際には何を判断したのか

これは、ウェブスクレイピング法の中で最も誤解されている事件です。ブログ記事、Redditスレッド、さらには法律要約でさえ、「公開ウェブのスクレイピングは合法」の証拠として引用されているのを見かけます。しかし、話はそんなに単純ではありません。

実際に起きたことは次のとおりです。

hiQが勝ち取ったもの: 第9巡回区控訴裁判所は、hiQによる公開LinkedInプロフィールのスクレイピングをLinkedInがブロックするのを防ぐ仮差止命令(一時的な命令)を維持しました。裁判所は、公開されているデータへのアクセスはCFAA違反ではない可能性が高いと述べました。重要なのは、「可能性が高い」という点です。出典:

hiQが確立しなかったもの:

  • すべての公開Webサイトをスクレイピングする包括的な権利
  • 最終的な本案判断 — 最高裁はVan Buren後に破棄差戻し、第9巡回区が再確認しましたが、その後この事件はし、最終判決は出ていません
  • 報道された和解には、50万ドル、差止命令、データ/ソフトウェアの破棄義務が含まれていたとされています

これがあなたにとって重要な理由: hiQは公開データをスクレイピングする側にとって希望の持てる判断です。プラットフォームが、自分たちが所有していない情報を私的独占にしようとすることに、裁判所が慎重であることを示しています。しかし、法的なお墨付きではありません。著作権、契約、プライバシー、営業秘密などの他の請求は、解決されていませんでした。Van Buren以後、CFAAの状況は明確になりましたが、hiQだけを法的シールドとして頼るのは誤りです。

ここを正しく理解することが、的確なリスク管理と希望的観測を分けます。

これは合法? 実践的な判断フローチャート

ig_01ef7eecb01f4f920169f06460a4f0819194734b5fbc60656e_compressed.webp

スクレイピングの合法性は「グレーゾーン」に感じられます。これは本当によく聞きます。そこで、法理論を重ねる代わりに、実際に使える判断フレームワークを示します。どんなスクレイピング案件でも、次の5つの質問を順に確認してください。

1. データは公開されているか(ログイン不要か)?

  • いいえ → CFAAリスクが高いです。進める前に許可や法的レビューを求めてください。
  • はい → 質問2へ進みます。

2. 技術的障壁(CAPTCHA、IPブロック、レート制限、有料壁)を回避しているか?

  • はい → DMCAおよびCFAAの問題が生じる可能性があります。中止するか、法務にエスカレーションしてください。
  • いいえ → 質問3へ進みます。

3. スクレイピングを禁止するclickwrapの利用規約に同意したか?

  • はい → 民事の契約責任リスクがあります。別ソースから入手できないか検討するか、許可を求めてください。
  • いいえ → 質問4へ進みます。

4. データに個人情報(PII)が含まれるか?

  • はい → CCPAと適用される州のプライバシー法を確認してください。適法な利用目的があり、オプトアウト権を尊重する必要があります。
  • いいえ → 質問5へ進みます。

5. そのデータを何に使うか?

  • 著作物(記事全文、写真、動画)の商用再掲載 → 著作権リスク。
  • 変形的な分析、社内調査、事実データの利用(価格、仕様、一覧情報) → 一般に低リスク。

「公開ページで、回避なし、clickwrapなし、非PII、社内分析用の事実データ」というゾーンに入るなら、それは最も低リスクなカテゴリです。まさにそのようなワークフローのためには設計されています。商品一覧、事業者ディレクトリ、不動産データのような公開Webページから構造化された事実データを抽出し、Excel、Google Sheets、Airtable、Notionにエクスポートして自分たちの分析に使えます。

このフローチャートは保存しておいてください。弁護士の代わりにはなりませんが、不要なパニックはかなり減らしてくれるはずです。

AI学習とウェブスクレイピング:新しい法的フロンティア

ig_01ef7eecb01f4f920169f063bb1014819192c3bf906b778b39_compressed.webp

AIは、スクレイピング法にまったく新しい複雑さを加えました。大規模言語モデル、画像生成AI、その他のAIシステムを学習させるためにデータをスクレイピングすることは、今や主要な法廷闘争の舞台になっています。そして、裁判所はまだ重要な論点を決着させていません。

現状は次のとおりです。

事件状況(2026年)主要争点
NYT対OpenAI/Microsoft継続中。中心的な著作権請求は2025年4月に進行を認められた;開示手続の争点には2,000万件超のChatGPTログが含まれるスクレイピングしたニュース記事での学習はフェアユースか、それとも著作権侵害か?
Bartz対AnthropicAlsup判事は、特定の学習利用はフェアユースだが、海賊版ソースの取得はそうではないと判断。報道された和解額:約15億ドル学習自体は変形的でも、海賊版のソースコピーは別問題。
Thomson Reuters対Rossデラウェア裁判所は、Westlawのヘッドノートを使って競合するリーガルリサーチ製品を作ることに対するフェアユースを否定した直接代替となる製品は、著作権リスクが高い。
Getty対Stability AI英国訴訟では2025年にStabilityが概ね優勢。米国訴訟は係属中画像学習の法はまだ確定していない。

は、重要なニュアンスを補っています。大規模で多様なデータセットでの学習はしばしば変形的と評価され得ますが、海賊版ソースのコピーや、著作権者の市場に直接競合する使い方は、フェアユースの主張がかなり弱くなります。

この記事を読む多くのビジネスユーザーにとっては、違いは明快です。自社の分析や業務運用のためにデータをスクレイピングする(リード獲得、価格監視、市場調査)ことと、AIモデルを学習させて商用化するためにデータをスクレイピングすることは、法的にまったく別の話です。前者は著作権リスクが低く、後者こそ大きな訴訟が起きている領域です。

責任あるデータスクレイピングの方法(ビジネスチーム向けベストプラクティス)

法律の話はこのくらいにして、チームに法的な面倒を増やさずに実際にデータをスクレイピングする方法を見ていきましょう。

公開されているデータだけを対象にする

ログインなしで誰でも見られるデータ、たとえば商品一覧、事業者ディレクトリ、公的記録、価格ページに絞ってください。ログインの向こう側に入った瞬間、リスクは一段上がります。

技術的障壁を回避しない

サイトがCAPTCHA、IPブロック、レート制限、有料壁を使っているなら、それはサインです。これを回避すると、DMCA、CFAA、契約違反の主張につながる可能性があります。本当に重要なデータなら、公式APIやデータ提携の有無を先に探しましょう。

利用規約を確認する

特にアカウントを作成した場合や「同意する」をクリックした場合は重要です。ToSにスクレイピング禁止条項がないか確認してください。スクレイピングが禁止されていて、その規約に同意しているなら、別の入手経路があるかを検討しましょう。

個人データの収集を最小限にする

PII(氏名、メール、電話番号)を集めるなら、適用される州プライバシー法の下で適法な利用目的があるか確認してください。企業名、商品価格、掲載情報のような事実ベースの事業データをスクレイピングするほうが、個人消費者のプロフィールをスクレイピングするより、ずっと低リスクです。

robots.txt とレート制限を尊重する

は、それ自体で法的拘束力を持つわけではありませんが、これを尊重することは誠実さの証明になります。また、サイトのサーバーを叩きすぎないでください。リクエストを間引き、間隔を適切に取り、インフラに損害を与えないようにしましょう。

再掲載ではなく、分析目的で使う

変形的利用——分析、集約、社内調査、競合インテリジェンス——は、他人の記事、画像、レビューをコピーして再掲載するより、はるかに安全です。チーム向けのダッシュボードやスプレッドシートを作るなら、自分のWebサイトでスクレイピング内容を再配信する場合より、ずっと良い立場にあります。

適法なスクレイピングのために設計されたツールを選ぶ

ここで、私たちがで作ってきたものに少し触れます。私たちのは、公開Webページから構造化データを抽出したいビジネスユーザー向けに設計されています。商品一覧、事業者ディレクトリ、不動産データ、リード情報などを、コードを書いたり技術的障壁を回避したりせずに取得できます。AIがページを読み取り、項目を提案し、できます。これは上の判断フローチャートで最も低リスクな分岐、つまり公開ページ、事実データ、ログイン回避なし、のために作られています。

とはいえ、どんなツールを使っても法的リスクがゼロになるわけではありません。何をスクレイピングし、どう使うかの責任は、常にあなたにあります。

ログを残し、停止要求が来たら止める

スクレイピングの活動内容と業務目的を記録してください。送達停止要求書(cease-and-desist)を受け取ったら、止めて法務に相談しましょう。正式な通知を受けた後にスクレイピングを続けると、特にゲート付きシステムが絡む場合、リスクは大きく上がります。

米国におけるウェブスクレイピング合法性の要点

要するに、こうです。

  • 米国連邦法には、ウェブスクレイピングを禁止する法律はありません。 公開されている事実データのスクレイピングは、一般に許可されています。
  • 合法性は、何をスクレイピングするか、どうアクセスするか、どう使うかで決まります。 公開ページ+事実データ+社内分析 = 最低リスク。
  • Van BurenとhiQの後、CFAAの射程は狭まりました が、著作権、契約、プライバシー、営業秘密の請求は独立したリスクとして今も残っています。
  • 通常の業務スクレイピングで刑事責任が問われることはまれです。 ほとんどのリスクは民事上のもの、つまり手錠ではなく訴訟です。
  • hiQ対LinkedInは、何でもスクレイピングしてよいという許可証ではありません。 あれは後に和解した仮差止命令でした。前向きな材料ではありますが、保証ではありません。
  • PIIが関わると州プライバシー法が重要になります が、非PIIデータ(価格、一覧、仕様)が最も低リスクです。
  • AI学習用途は、新しく、まだ決着していない法的フロンティアです。 自社分析のための業務スクレイピングと、商用AIモデル構築のためのスクレイピングは、リスクの性質が違います。
  • ベストプラクティスを守ること — 公開データに限定し、利用規約を尊重し、PIIを避け、障壁を回避せず、責任ある使い方をする — ことで、チームを安全圏に置けます。

必要な注意書きとして、この文章は情報提供を目的としたもので、法的助言ではありません。大規模なスクレイピングを計画している場合や、機微なデータを扱う場合は、資格のある弁護士に相談してください。ただ、公開ディレクトリからリードを取りたい営業マネージャーや、競合価格を監視したいECチームにとっては、法律はあなたが思っているより味方です。

Thunderbitがこの種の公開データ抽出をどれだけ簡単にするか見たいなら——コード不要、回避不要、ワークフローに構造化データを入れるだけです——をご覧いただくか、を入れて、ぜひ試してみてください。

FAQ

1. 2026年の米国でウェブスクレイピングは合法ですか?

はい。米国では、公開されているデータをスクレイピングする限り、一般に合法です。スクレイピング自体を禁止する連邦法はありません。ただし、どうやってスクレイピングするか、どんなデータを集めるか、どう使うかによっては、CFAA、著作権法、契約法、州プライバシー規制の下で法的リスクが生じる可能性があります。最も安全なのは、公開ページに限定し、技術的障壁の回避を避け、個人データ収集を最小限にし、データを直接再掲載するのではなく分析目的で使うことです。

2. ウェブスクレイピングで刑務所に入ることはありますか?

ウェブスクレイピングで刑事訴追されるのは極めてまれで、通常は無権限で認証の壁の向こう側のデータにアクセスする(CFAA違反)か、詐欺を行う必要があります。司法省の2022年CFAA起訴方針では、通常の利用規約違反だけでは刑事訴追の根拠にならないとされています。ウェブスクレイピングの争いの大半は民事問題、つまり訴訟であり、刑事事件ではありません。

3. ウェブサイトの利用規約に違反すると、スクレイピングは違法になりますか?

自動的にそうなるわけではありません。利用規約違反は契約問題であって、刑事犯罪ではありません。スクレイピングを禁止するclickwrap規約に同意している場合、サイト側は民事の契約違反請求を起こせる可能性があります。ただし、フッターにリンクされたbrowsewrap条項は、特にログインも「同意する」のクリックもしていない場合、執行がかなり難しいです。裁判所は複数のスクレイピング事件で、受動的なbrowsewrapの執行に懐疑的でした。

4. 個人データ(メール、電話番号)をスクレイピングするのは米国で合法ですか?

場合によります。CCPA、VCDPA、CPAなど多くの米国州プライバシー法には、公開されている個人情報への例外がありますが、定義や収集後の利用義務は州によって異なります。非個人データ(商品価格、事業者一覧、公的記録)のスクレイピングは、個人消費者のプロフィールをスクレイピングするより、はるかに低リスクです。PIIを大量に集めるなら、適用法を確認し、適法な目的があることを確保してください。

5. hiQ対LinkedInで、すべてのウェブスクレイピングが合法になったのですか?

いいえ。hiQの判断は仮差止命令、つまり勝訴の見込みに基づく一時的命令であって、本案の最終判断ではありませんでした。第9巡回区は、公開データへのアクセスはCFAA違反ではない可能性が高いと述べましたが、この事件は2022年に和解し、最終的な裁判所判断は出ていません。どんなサイトでも自由にスクレイピングしてよいという包括的な許可ではなく、著作権、契約、プライバシー、営業秘密の問題にも触れていません。公開データのスクレイパーには前向きな材料ですが、法的保証ではありません。

さらに学ぶ

Fawad Khan
Fawad Khan
Fawadは文章を書くことを仕事にしていて、正直なところ、かなりそれが好きです。長年にわたって、どんなコピーが人の記憶に残り、どんなコピーが読み飛ばされるのかを探ってきました。マーケティングについて聞けば、何時間でも話し続けます。カルボナーラについて聞けば、もっと長く話します。
目次

Thunderbitを試す

リードや各種データをわずか2クリックで取得。AI搭載。

Thunderbitを入手 無料です
AIでデータを抽出
Google Sheets、Airtable、Notionへ簡単にデータ転送
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week