Je web scraping v USA legální? Co skutečně říká zákon

Před několika týdny se mě kolega z obchodního týmu zeptal na otázku, kterou slýchám pořád dokola: „Můžeme z toho veřejného firemního adresáře vytáhnout leady, nebo nás zažalují?“ Na otevřeném webu našel doslova pokladnici údajů o potenciálních klientech — bez přihlášení, bez paywallu — ale po rychlém googlení nabyl dojmu, že skončí v poutech.

Podobná nervozita je všude. Automatizovaný provoz dnes tvoří zhruba 51 % veškerého webového provozu, trh se softwarem pro web scraping má do roku 2031 vyrůst z přibližně 1,08 miliardy dolarů v roce 2025 na 3,59 miliardy dolarů, a přesto je většina právních rad na internetu zastaralá, příliš zjednodušená nebo prostě úplně mimo. Případ hiQ v. LinkedIn z roku 2022? Téměř každý článek z něj dělá rozhodnutí Nejvyššího soudu, že „veškeré scraping je legální“. (Spoiler: není a nebylo.)

Mezitím zásadní nové spory v letech 2024 a 2025 — týkající se X (dříve Twitter), Meta, Redditu, Googlu a AI společností — aktivně přepisují pravidla, a skoro nikdo se jim nevěnuje. Tento průvodce vysvětluje, co americké právo o web scrapingu skutečně říká v roce 2026, odděluje mýty od reality a dává vám praktický rámec, podle kterého poznáte, co můžete a nemůžete dělat.

ig_01ef7eecb01f4f920169f063829a4481918da7ee0e1b3f672e_compressed.webp

Co je web scraping (a proč se o něj firmy zajímají)?

Web scraping znamená používání automatizovaného softwaru ke sběru informací z webových stránek a jejich převodu do strukturovaných dat — třeba do tabulek, databází nebo CRM záznamů.

Přesněji řečeno, scraper navštěvuje webové stránky, čte jejich HTML a vytahuje konkrétní údaje — ceny, jména, adresy, specifikace produktů, cokoli potřebujete — do přehledných řádků a sloupců. Je to digitální obdoba najmutí někoho, kdo přepisuje informace z webu do Excelu, jen bot to zvládne za vteřiny místo hodin.

Web scraping NENÍ hackování. Přistupuje ke stejným informacím, které by viděl kdokoli v prohlížeči.

A není to žádný okrajový trik pro vývojáře. Vyhledávače, srovnávače cen, realitní platformy, dashboardy pro průzkum trhu i nástroje poháněné AI spoléhají na web crawling a scraping, aby fungovaly. Pokud jste někdy použili Google, kontrolovali agregátor letů nebo procházeli Zillow, těžili jste z web scrapingu.

Nejběžnější firemní případy použití, se kterými se setkávám:

Generování leadů: Exktrakce názvů firem, webů, pracovních pozic nebo veřejných kontaktních údajů z firemních adresářů.
Sledování cen konkurence: Týmy v e-commerce sledují ceny SKU rivalů, dostupnost a informace o dopravě.
Realitní analytika: Sběr veřejných nabídek nemovitostí, cen a trendů na trhu.
Průzkum produktů: Vytahování specifikací, hodnocení, dostupnosti a kategorií z retailových webů.
Market intelligence: Sledování pracovních nabídek, otevírání poboček, mediálních signálů nebo veřejných finančních údajů.

Samotná technika je neutrální. Právní posouzení závisí na tom, jak k datům přistupujete a co s nimi pak děláte.

Je web scraping v USA legální? Krátká odpověď

Na federální úrovni v USA neexistuje žádný zákon, který by web scraping plošně zakazoval. Sběr veřejně dostupných dat je obecně povolený.

Ale — a to je zásadní „ale“ — zákonnost závisí na několika faktorech: na typu dat, způsobu přístupu, tom, zda jste přijali nějaké podmínky užití, zda data obsahují osobní údaje a co s nimi plánujete dělat.

Největší zdroj zmatku ve fórech, vláknech na Redditu i v právních blozích? Lidé zaměňují „nelegální“ za „v rozporu s podmínkami webu“. To jsou velmi odlišné věci. Porušení pravidel webu vám může zablokovat IP adresu nebo účet. Porušení federálního zákona může vést k žalobě, a ve vzácných případech i k trestnímu stíhání. Většina důsledků scrapingu spadá jednoznačně do občanskoprávní roviny.

Zbytek článku rozebírá klíčové zákony, zásadní soudní případy (včetně těch z let 2024 a 2025, o kterých téměř nikdo nepíše) a praktický rozhodovací rámec, který můžete opravdu použít.

Tři typy „nelegálního“: trestní, občanskoprávní a porušení podmínek služby

Je čas vyjasnit největší omyl kolem práva na web scraping. Když se někdo zeptá „je web scraping nelegální?“, většinou hází do jednoho pytle tři úplně odlišné kategorie rizika. Když je oddělíte, změní to celý pohled na věc.

ig_01ef7eecb01f4f920169f064039ff881918c7bf5b1db31fa7f_compressed.webp

Typ odpovědnosti	Co ji spouští	Možný důsledek	Závažnost
Trestní (CFAA)	Přístup k datům za autentizačními bariérami bez oprávnění, podvod, zneužití přihlašovacích údajů	Federální stíhání, pokuty, odnětí svobody	🔴 Vážné — ale u běžného firemního scrapingu extrémně vzácné
Občanskoprávní žaloba	Porušení autorských práv, zásah do movitých věcí, porušení smlouvy, zneužití obchodního tajemství, zásahy do soukromí	Peněžní náhrady, soudní příkaz, smazání dat	🟡 Významné
Porušení podmínek služby	Porušení podmínek služby typu browsewrap nebo clickwrap	Zrušení účtu, blokace IP, výzva k ukončení, případná civilní žaloba	🟢 Nízká až střední

Ministerstvo spravedlnosti USA v politice obvinění podle CFAA z roku 2022 výslovně uvádí, že běžné porušení podmínek služby — třeba vytvoření falešného účtu nebo porušení pravidel webu — samo o sobě nestačí pro federální trestní obvinění. To je zásadní.

Praktický závěr: pokud jste obchodní tým, který sbírá veřejné firemní záznamy, nebo e-commerce tým sledující ceny konkurence, téměř jistě řešíte občanskoprávní rizika, ne trestní odpovědnost. To neznamená, že můžete pravidla ignorovat, ale měli byste si podle toho nastavit míru obav.

Klíčové americké zákony, které se vztahují na web scraping

S web scrapingem v USA se protínají čtyři právní pilíře a každý z nich řeší jinou část problému.

Computer Fraud and Abuse Act (CFAA)

Zákon CFAA (18 U.S.C. § 1030) byl původně napsán pro stíhání počítačového hackingu. Postupem času se stal hlavním zákonem používaným v žalobách na scraping, obvykle s argumentem, že scraper přistupoval k webu „bez oprávnění“.

Pak přišel případ Van Buren v. United States. Nejvyšší soud rozhodl, že osoba „překročí oprávněný přístup“ podle CFAA pouze tehdy, když se dostane do částí počítače — souborů, složek, databází — které jsou jí nepřístupné. Samotné zneužití informací, které jinak smíte vidět, se za to nepovažuje.

Dopady na scraping:

Nižší riziko podle CFAA: Veřejné webové stránky dostupné komukoli bez přihlášení. Žádná brána, žádný problém s „neoprávněným přístupem“.
Vyšší riziko podle CFAA: Data za přihlášením, placenými zdmi, přístupovými tokeny, manipulací se session nebo po odebrání přístupu.

Případ hiQ v. LinkedIn (který níže rozebereme detailně) to pro veřejná data potvrdil. Ale CFAA je jen jedna část celé skládačky.

Autorské právo a DMCA

Americké autorské právo chrání původní tvůrčí vyjádření — články, fotografie, videa, kreativní popisy produktů — ale ne holá fakta. Zásadním precedentem je rozhodnutí Nejvyššího soudu Feist: fakta jako jména, adresy a telefonní čísla nejsou chráněna autorským právem, bez ohledu na to, kolik práce stálo jejich shromáždění.

Úrovně rizika u dat získaných scrapováním:

Co scrapujete	Riziko autorského práva	Proč
Ceny, názvy produktů, adresy, data, specifikace	Nižší	Jde o fakta
Celé články, fotografie, videa, kreativní recenze	Vyšší	Jde o tvůrčí díla
Kurátorované databáze, žebříčky, redakční taxonomie	Střední až vysoké	Může být chráněn výběr a uspořádání
Obsah za paywallem nebo chráněný DRM	Vysoké	Autorská práva + problémy s řízením přístupu

Doložka DMCA proti obcházení ochrany (17 U.S.C. § 1201) přidává další vrstvu: obcházení technických ochranných opatření (paywallů, DRM, některých anti-bot systémů) za účelem přístupu k chráněnému obsahu může zakládat odpovědnost i tehdy, když samotný obsah nikdy nekopírujete. V letech 2025–2026 se to testuje agresivně, včetně případu Google v. SerpApi, kde Google tvrdí porušení DMCA kvůli obcházení jeho anti-bot systému SearchGuard.

Důležitá je i fair use — transformativní užití (analýza, agregace nebo navazování na data, místo pouhého opětovného zveřejnění) je obecně bezpečnější než kopírování a znovupublikování cizího obsahu.

Smluvní právo: podmínky služby (browsewrap vs. clickwrap)

Mnoho webů má v podmínkách služby anti-scraping formulace — ale vymahatelnost závisí výhradně na tom, jak jste se s těmito podmínkami seznámili.

Typ smlouvy	Vymahatelnost	Co to znamená pro scrapery
Clickwrap (kliknete na „Souhlasím“)	Silná	Soudy je důsledně vyžadují. Anti-scraping doložky mohou podpořit občanskoprávní nárok.
Sign-in wrap (upozornění u přihlášení)	Záleží na okolnostech	Závisí na tom, jak výrazné upozornění bylo.
Browsewrap (odkaz v patičce)	Slabší	Soudy jsou skeptické, pokud uživatel neměl skutečné upozornění.
Podmínky účtu/API	Silnější	Scraping po přihlášení nebo zneužití API je mnohem rizikovější.

V případu Meta v. Bright Data (2024) soud rozhodl, že podmínky Meta nepokrývaly veřejný scraping po odhlášení tak, jak Meta tvrdila — a Bright Data nebylo pro daný veřejný scraping prokázáno, že používalo přihlášené účty. To je podstatný rozdíl.

Praktická rada: pokud jste se nikdy nepřihlásili, nikdy neklikli na „Souhlasím“ a scrapujete jen veřejné stránky, je pro web mnohem těžší vůči vám uplatnit browsewrap omezení. Přesto si ale před scrapingem vždy zkontrolujte podmínky služby, zvlášť pokud jste si vytvořili účet.

Státní zákony USA o ochraně soukromí (CCPA a další)

Pokud data, která scrapujete, obsahují osobní údaje — jména, e-maily, telefonní čísla, údaje o poloze — mohou se uplatnit státní zákony o ochraně soukromí. A tahle mozaika se rychle rozšiřuje. IAPP uvedla, že do poloviny roku 2025 bylo přijato 19 komplexních státních zákonů o ochraně soukromí, a MultiState uvádí 20 států s komplexními zákony účinnými v roce 2026.

Většina těchto zákonů obsahuje výjimky pro „veřejně dostupné“ osobní údaje, ale definice se liší. A následné použití — prodej, sdílení nebo profilování na základě těchto dat — může vyvolat povinnosti i tehdy, když samotný sběr spadá pod výjimku.

Státní zákon	Účinnost	Vztahuje se na scrapované osobní údaje?	Požadavek na opt-out	Rozsah sankcí
CCPA/CPRA (Kalifornie)	2020/2023	Ano	Opt-out pro prodej/sdílení; uznává GPC	$2,663–$7,988 za porušení (upraveno pro 2025)
CPA (Colorado)	2023	Ano	Univerzální opt-out/GPC od července 2024	Občanskoprávní sankce podle rámce klamavých obchodních praktik
CTDPA (Connecticut)	2023	Ano	OOPS/GPC od ledna 2025	Až $5,000 za úmyslné porušení
VCDPA (Virginie)	2023	Ano	Právo na opt-out	Až $7,500 za porušení
TDPSA (Texas)	2024	Ano	Univerzální opt-out od ledna 2025	Až $7,500 za porušení
+ dalších 8 přijatých do roku 2026	Různé	Různé	Různé	Různé

Mezi další státy se schválenými zákony patří Utah, Oregon, Montana, Delaware, Iowa, Nebraska, New Hampshire, New Jersey, Tennessee, Minnesota, Maryland, Indiana, Kentucky a Rhode Island. Alabama přijala zákon účinný od 1. května 2027.

Pro firemní uživatele, kteří scrapují ceny produktů, firemní záznamy nebo tržní data — tedy neosobní, faktické informace — je riziko z pohledu ochrany soukromí podstatně nižší. Nástroje jako Thunderbit se zaměřují na strukturovanou extrakci z veřejných stránek (data o produktech, firemní adresáře, nabídky nemovitostí), což spadá do nejnižší rizikové kategorie scrapingu.

Zásadní případy web scrapingu: časová osa 2000–2026

Tady si myslím, že většina průvodců na toto téma selhává. Téměř každý článek skončí u hiQ v. LinkedIn (2022) a ignoruje rozhodnutí, která dnes skutečně formují právo scrapingu. Tady je úplná časová osa:

Případ	Rok	Klíčové rozhodnutí	Dopad na scrapery
eBay v. Bidder's Edge	2000	Předběžný zákaz pro zásah do movitých věcí; záleželo na zátěži crawleru pro servery	⚠️ Scraping ve velkém objemu, který zatěžuje servery, může zakládat občanskoprávní odpovědnost
Facebook v. Power Ventures	2016	Odpovědnost podle CFAA po výzvě k ukončení a pokračování v přístupu přes systémy Facebooku	⚠️ Výzva k ukončení + přihlášený/bráněný přístup = vysoké riziko
Van Buren v. US	2021	„Překročení oprávněného přístupu“ podle CFAA vyžaduje vstup do nepřístupných částí počítače	✅ Výrazně zúžilo rozsah CFAA
hiQ v. LinkedIn	2022	Přístup k veřejným datům není porušením CFAA (předběžný zákaz, později uzavřeno smírem)	✅ Veřejná data ≠ „neoprávněný přístup“ — ale nejde o konečné rozhodnutí
Meta v. Bright Data	2024	Bright Data vyhrálo souhrnný rozsudek v otázce smlouvy u veřejného scrapingu po odhlášení	✅ Podmínky nemusí po odhlášení bindovat scraping bez souhlasu
X Corp. v. Bright Data	2024	V květnu zamítnuta řada nároků; listopadové rozhodnutí zamítlo nároky založené na scrapingu/prodeji	✅ Nároky na kopírování veřejných dat zeslábly
Compulife v. Newman/Rutstein	2024–2025	Odpovědnost za obchodní tajemství při masové extrakci dat o pojistných nabídkách; cert denied v únoru 2025	⚠️ Data viditelná veřejnosti mohou být stále chráněnou databází
Reddit v. Perplexity/SerpApi/Oxylabs/AWMProxy	2025–2026	Tvrdí průmyslově rozsáhlé nepřímé scrapingy přes výsledky Googlu	⚠️ Spory z éry AI míří na datové dodavatelské řetězce
Google v. SerpApi	2025–2026	Nároky podle DMCA §1201 kvůli údajnému obcházení anti-bot ochrany	⚠️ Testuje se, zda anti-bot systémy jsou přístupové kontroly podle DMCA

Trend je jasný: soudy stále více chrání přístup k veřejným datům podle CFAA, ale autorské právo, smlouvy, soukromí, obchodní tajemství a nároky související s infrastrukturou zůstávají zcela samostatnými riziky. A vlna trénování AI vytváří úplně nové právní otázky.

Uvádíme věci na pravou míru: co hiQ v. LinkedIn skutečně rozhodl

Tohle je nejvíc nepochopený případ v celém právu web scrapingu. Viděl jsem ho citovaný v blozích, vláknech na Redditu i právních shrnutích jako důkaz, že „scraping veřejného webu je legální“. Tak jednoduché to není.

Co se skutečně stalo:

Co hiQ rozhodl: Devátý obvod potvrdil předběžný zákaz — dočasné opatření — kterým zabránil LinkedIn blokovat hiQ v scrapování veřejných profilů LinkedInu. Soud uvedl, že přístup k veřejně dostupným datům pravděpodobně neporušuje CFAA. Klíčové slovo: pravděpodobně. Zdroj: hiQ Labs v. LinkedIn, Ninth Circuit.

Co hiQ NEprokázal:

Žádné plošné právo scrapovat jakýkoli veřejný web
Žádné konečné rozhodnutí ve věci samé — Nejvyšší soud po Van Buren zrušil rozhodnutí a vrátil věc k novému projednání, Devátý obvod je znovu potvrdil, a pak byl případ na konci roku 2022 smírně ukončen bez finálního soudního rozhodnutí
Uváděný smír zahrnoval 500 000 dolarů, soudní zákaz a povinnost zničit data/software

Proč je to důležité pro vás: hiQ je pro scrapery veřejných dat povzbudivý. Naznačuje, že soudy jsou opatrné vůči platformám, které si chtějí vytvořit soukromý monopol nad informacemi, jež nevlastní. Ale nejde o právní záruku. Jiné nároky — autorské právo, smlouvy, soukromí, obchodní tajemství — nebyly nikdy vyřešeny. Po Van Buren je prostředí kolem CFAA jasnější, ale spoléhat se jen na hiQ jako na právní štít by byla chyba.

Správné pochopení tohoto rozdílu odděluje informované řízení rizik od zbožného přání.

Můžu to legálně scrapovat? Praktický rozhodovací strom

ig_01ef7eecb01f4f920169f06460a4f0819194734b5fbc60656e_compressed.webp

Zákonnost scrapingu působí jako „šedá zóna“ — slýchám to neustále. Takže místo další právní teorie tady máte rámec, který můžete opravdu použít. Pět otázek pro každý scrapingový projekt:

1. Jsou data veřejně přístupná (není potřeba přihlášení)?

Pokud NE → vyšší riziko podle CFAA. Než budete pokračovat, získejte souhlas nebo právní posouzení.
Pokud ANO → přejděte na otázku 2.

2. Obcházíte nějaké technické bariéry (CAPTCHA, blokace IP, rate limiting, paywally)?

Pokud ANO → možné problémy podle DMCA a CFAA. Zastavte se nebo to eskalujte na právníka.
Pokud NE → přejděte na otázku 3.

3. Souhlasili jste s clickwrap podmínkami služby, které scraping zakazují?

Pokud ANO → riziko občanskoprávní odpovědnosti za porušení smlouvy. Zvažte, zda nejsou data dostupná z jiného zdroje, nebo si vyžádejte souhlas.
Pokud NE → přejděte na otázku 4.

4. Obsahují data osobní údaje (PII)?

Pokud ANO → zkontrolujte CCPA a příslušné státní zákony o ochraně soukromí. Ujistěte se, že máte legální účel použití a respektujete práva na opt-out.
Pokud NE → přejděte na otázku 5.

5. Co s daty uděláte?

Komerční opětovné publikování chráněného obsahu (celé články, fotografie, videa) → riziko autorského práva.
Transformační analýza, interní výzkum nebo práce s faktickými daty (ceny, specifikace, nabídky) → obecně nižší riziko.

Pokud skončíte v zóně „veřejné stránky, bez obcházení bariér, bez clickwrapu, neosobní údaje, faktická data pro interní analýzu“, jste v nejnižší rizikové kategorii. Přesně pro takový workflow je Thunderbit navržený — extrahuje strukturovaná, faktická data z veřejných webových stránek, jako jsou produktové nabídky, firemní adresáře a data o nemovitostech, a pak je exportuje do Excelu, Google Sheets, Airtable nebo Notion pro vaši vlastní analýzu.

Tento rozhodovací strom si uložte. Nenahradí právníka, ale ušetří vám spoustu zbytečného stresu.

AI trénování a web scraping: nová právní fronta

ig_01ef7eecb01f4f920169f063bb1014819192c3bf906b778b39_compressed.webp

AI přidala do práva scrapingu úplně novou vrstvu složitosti. Sběr dat pro trénování velkých jazykových modelů, generátorů obrázků a dalších AI systémů je dnes hlavním právním bojištěm — a soudy zatím klíčové otázky nerozhodly.

Takhle to vypadá nyní:

| Případ | Stav (2026) | Klíčová otázka | |---|---|---|---| | NYT v. OpenAI/Microsoft | Probíhá. Základní nároky z autorského práva mohly pokračovat v dubnu 2025; spory o dokazování zahrnují přes 20 milionů záznamů z ChatGPT. | Představuje trénování na scrapovaných zpravodajských článcích fair use, nebo porušení autorského práva? | | Bartz v. Anthropic | Soudce Alsup rozhodl, že některá trénovací použití jsou fair use, ale získání pirátského zdroje nikoli. Uváděný smír: asi 1,5 miliardy dolarů. | Trénování může být transformační, ale kopírování pirátských zdrojů je samostatný problém. | | Thomson Reuters v. Ross | Soud v Delaware odmítl fair use u použití headnotes z Westlaw pro vytvoření konkurenčního právního produktu. | Přímé náhradní produkty čelí vyššímu riziku autorského práva. | | Getty v. Stability AI | Britský případ v roce 2025 z velké části vyzněl ve prospěch Stability; americký případ stále probíhá. | Právo na trénování obrázků zůstává nevyjasněné. |

Zpráva Úřadu pro autorská práva USA z roku 2025 o AI přidává užitečný kontext: trénování na velkých, pestrých datových sadách může být často transformační, ale kopírování z pirátských zdrojů a použití, která přímo konkurují trhu držitelů práv, mají mnohem slabší argument pro fair use.

Pro většinu firemních uživatelů je rozdíl jednoduchý: scraping dat pro vlastní analýzu nebo provoz firmy (generování leadů, sledování cen, průzkum trhu) je právně úplně jiný svět než scraping dat pro trénování a komercializaci AI modelu. V prvním případě je riziko autorského práva nižší. Ve druhém se odehrávají velké soudní spory.

Jak scrapovat data zodpovědně (best practices pro firemní týmy)

Dost právničiny. Tady je, jak data opravdu scrapovat, aniž byste týmu vytvořili právní problémy.

Držte se veřejně dostupných dat

Soustřeďte se na data, která může vidět kdokoli bez přihlášení — produktové nabídky, firemní adresáře, veřejné záznamy, cenové stránky. Jakmile jste za loginem, vstupujete do rizikovější zóny.

Neobcházejte technické bariéry

Když web používá CAPTCHu, blokace IP, rate limiting nebo paywally, jsou to signály. Jejich obcházení může vyvolat nároky podle DMCA, CFAA nebo smluvního práva. Pokud jsou ta data dost důležitá, hledejte raději oficiální API nebo datové partnerství.

Zkontrolujte podmínky služby

Zvlášť pokud jste si vytvořili účet nebo klikli na „Souhlasím“. Projděte si ToS a hledejte anti-scraping doložky. Pokud podmínky scraping zakazují a vy jste s nimi souhlasili, zvažte, zda nejsou data dostupná z jiného zdroje.

Minimalizujte sběr osobních údajů

Pokud sbíráte PII (jména, e-maily, telefonní čísla), ujistěte se, že máte legální účel podle příslušných státních zákonů o ochraně soukromí. Sběr faktických firemních dat — názvů společností, cen produktů, detailů nabídek — je výrazně méně rizikový než scraping profilů jednotlivých spotřebitelů.

Respektujte robots.txt a rate limity

Robots.txt (RFC 9309) sice sám o sobě není právně závazný, ale jeho respektování ukazuje dobrou víru. A netlučte do serverů webu — omezte rychlost požadavků, používejte rozumné intervaly a nezpůsobujte škodu infrastruktuře.

Používejte data k analýze, ne k opětovnému publikování

Transformační užití — analýza, agregace, interní výzkum, konkurenční intelligence — je mnohem bezpečnější než kopírování a opětovné publikování cizích článků, obrázků nebo recenzí. Pokud pro tým stavíte dashboardy nebo tabulky, jste na tom lépe než když scrapovaný obsah znovu zveřejňujete na vlastním webu.

Vyberte nástroje navržené pro compliant scraping

Tady zmíním to, co jsme v Thunderbit vybudovali. Naše rozšíření AI web scraperu pro Chrome je navržené pro firemní uživatele, kteří chtějí extrahovat strukturovaná data z veřejných webových stránek — produktové nabídky, firemní adresáře, data o nemovitostech, údaje o leadech — bez nutnosti psát kód nebo obcházet technické bariéry. AI přečte stránku, navrhne pole a umožní export do Excelu, Google Sheets, Airtable nebo Notion. Je to postavené pro nejnižší rizikovou větev rozhodovacího stromu výše: veřejné stránky, faktická data, žádné obcházení přihlášení.

To ale neznamená, že vás jakýkoli nástroj zbaví právního rizika. Odpovědnost za to, co scrapujete a jak to používáte, je vždy na vás.

Veďte záznamy a po výzvě k ukončení přestaňte

Dokumentujte svou scrapingovou aktivitu i obchodní účel. Pokud obdržíte výzvu k ukončení, zastavte se a poraďte s právníkem. Pokračování ve scrapingu po formálním upozornění výrazně zvyšuje míru rizika, zvlášť pokud jde o bráněné systémy.

Klíčové závěry o legalitě web scrapingu v USA

Stručně řečeno:

Žádný federální zákon USA web scraping nezakazuje. Sběr veřejně dostupných faktických dat je obecně povolený.
Zákonnost závisí na tom, co scrapujete, jak k tomu přistupujete a co s tím děláte. Veřejné stránky + faktická data + interní analýza = nejnižší riziko.
Rozsah CFAA se po případech Van Buren a hiQ zúžil, ale nároky z autorského práva, smluv, soukromí a obchodního tajemství jsou samostatná rizika, která stále platí.
Trestní odpovědnost je u běžného firemního scrapingu vzácná. Většina rizik je občanskoprávní — žaloby, ne pouta.
hiQ v. LinkedIn není univerzální povolení. Šlo o předběžný zákaz, který byl později vyřešen smírem. Povzbuzující, ale ne záruka.
Státní zákony o ochraně soukromí jsou důležité, když jde o PII, ale neosobní data (ceny, nabídky, specifikace) nesou nejnižší riziko.
Použití dat pro trénování AI je nová a dosud nevyjasněná právní fronta. Firemní scraping pro vlastní analýzu je úplně jiný rizikový profil než scraping pro budování komerčních AI modelů.
Dodržování best practices — veřejná data, respekt k ToS, vyhýbání se PII, žádné obcházení bariér, zodpovědné použití dat — drží váš tým v bezpečné zóně.

Nutné upozornění: tento článek má informační charakter a nepředstavuje právní radu. Pokud plánujete rozsáhlou scrapingovou operaci nebo pracujete s citlivými daty, obraťte se na kvalifikovaného právníka. Ale pro obchodního manažera, který chce jen vytáhnout leady z veřejného adresáře, nebo pro e-commerce tým sledující ceny konkurence? Zákon je na vaší straně víc, než si nejspíš myslíte.

Pokud chcete vidět, jak Thunderbit zjednodušuje podobnou extrakci veřejných dat — bez kódu, bez obcházení, jen strukturovaná data přímo do vašeho workflow — podívejte se na naše rychlé zahájení nebo si stáhněte rozšíření pro Chrome a vyzkoušejte ho sami.

Často kladené otázky

1. Je web scraping v USA v roce 2026 legální?

Ano, web scraping je v USA obecně legální, pokud scrapujete veřejně dostupná data. Neexistuje federální zákon, který by to zakazoval. To ale, jak scrapujete, jaká data sbíráte a jak je používáte, může vytvářet právní riziko podle CFAA, autorského práva, smluvního práva nebo státních předpisů na ochranu soukromí. Nejbezpečnější postup je držet se veřejných stránek, neobcházet technické bariéry, minimalizovat sběr osobních údajů a používat data k analýze, ne k přímému opětovnému publikování.

2. Můžu jít za web scraping do vězení?

Trestní stíhání kvůli web scrapingu je extrémně vzácné a obvykle by vyžadovalo přístup k datům za autentizačními bariérami bez oprávnění (porušení CFAA) nebo podvod. Časová politika DOJ pro CFAA z roku 2022 uvádí, že běžné porušení podmínek služby samo o sobě nestačí k trestnímu stíhání. Většina sporů kolem web scrapingu je občanskoprávní povahy — žaloby, ne trestní řízení.

3. Znamená porušení podmínek služby webu, že je scraping nelegální?

Ne automaticky. Porušení ToS je smluvní problém, ne trestný čin. Pokud jste souhlasili s clickwrap podmínkami, které scraping zakazují, web může uplatnit civilní nárok z porušení smlouvy. Browsewrap podmínky (odkaz v patičce) se ale vynucují mnohem hůř, zvlášť pokud jste se nikdy nepřihlásili nebo neklikli na „Souhlasím“. Soudy byly v řadě scrapingových případů k pasivnímu vynucování browsewrapu skeptické.

4. Je legální scrapovat osobní údaje (e-maily, telefonní čísla) v USA?

Záleží na tom. Mnohé státní zákony USA o ochraně soukromí — včetně CCPA, VCDPA, CPA a dalších — obsahují výjimky pro veřejně dostupné osobní údaje, ale definice i povinnosti při následném použití se liší. Scraping neosobních dat (ceny produktů, firemní záznamy, veřejné evidence) nese mnohem nižší riziko než scraping profilů jednotlivých spotřebitelů. Pokud ve velkém sbíráte PII, zkontrolujte příslušné státní zákony a ujistěte se, že máte legální účel.

5. Udělal hiQ v. LinkedIn z web scrapingu něco legálního pro všechno?

Ne. Rozhodnutí hiQ bylo předběžné opatření — dočasný příkaz založený na pravděpodobnosti úspěchu — nikoli konečné rozhodnutí ve věci samé. Devátý obvod řekl, že přístup k veřejným datům pravděpodobně neporušuje CFAA, ale případ byl v roce 2022 ukončen smírem bez finálního soudního rozhodnutí. Nedává plošné povolení scrapovat jakýkoli web a neřeší nároky z autorského práva, smluv, soukromí ani obchodního tajemství. Pro scrapery veřejných dat je to povzbudivé, ale není to právní záruka.

Zjistěte víc