For nogle måneder siden spurgte en kollega på vores salgsteam mig om noget, jeg har hørt dusinvis af gange: "Hvis jeg scraper konkurrentpriser fra en offentlig hjemmeside, kan jeg så faktisk komme i problemer?" Han havde fundet en oversigt over leverandørkontakter, priserne stod pænt på række, og alt, han ønskede, var et regneark. Tøven var reel — og helt ærligt forståelig.
Storbritannien har ingen enkelt "web scraping-lov". I stedet er det fire overlappende juridiske rammer, der afgør, om en bestemt scraping-aktivitet er lovlig. Derfor er svaret næsten altid "det kommer an på" — men det behøver ikke at være lammende. I denne guide gennemgår jeg, hvad loven faktisk siger, hvordan den gælder i virkelige scenarier, hvordan sanktionerne ser ud, og hvordan du holder dig på den sikre side.
Jeg har brugt meget tid på at researche det her for vores team hos , og jeg vil gerne dele det, jeg har fundet, så du slipper for at samle brikkerne fra fem forskellige advokatblogs og en Reddit-tråd.
Hvad er web-scraping (og hvorfor bruger britiske virksomheder det)?
Web-scraping er brugen af software til automatisk at indsamle data fra websites — og dermed erstatte den tidskrævende proces med at kopiere og indsætte fra websider til et regneark.
Teknikken i sig selv er neutral. Den er hverken i sig selv lovlig eller ulovlig. Det afgørende er, hvad du scraper, hvordan du scraper det, og hvad du gør med dataene bagefter.
Britiske virksomheder bruger scraping til mange lovlige formål:
- Prissammenligning: PriceSpy UK opdaterer for eksempel ved hjælp af automatiseret web-scraping.
- Leadgenerering: Salgsteams henter virksomhedsnavne, e-mails og telefonnumre fra offentlige registre.
- Markedsanalyse: Analytikere overvåger boligannoncer, jobportaler eller konkurrenters produktsortiment.
- Akademisk forskning: Office for National Statistics indsamlede over fra supermarkeders websites mellem 2014 og 2015.
- Træning af AI-modeller: En hurtigt voksende — og juridisk uafklaret — anvendelse.
Tendensen er tydelig. En blandt 500 beslutningstagere (herunder 200 i Storbritannien) viste, at så offentlige webdata som afgørende eller meget vigtige for den globale økonomi, og hentede dem mindst dagligt.
Alligevel sagde , at manglen på klar regulering bekymrede deres organisation. Netop den bekymring er grunden til, at denne artikel findes.
Er web-scraping lovligt i Storbritannien? Det korte svar
Ingen britisk lov forbyder web-scraping direkte. Flere love regulerer dog, hvordan det må gøres, og lovligheden af et konkret projekt afhænger af fire faktorer:

- Hvilke data du scraper (persondata vs. faktuelle/ikke-personlige data)
- Hvordan du får adgang til dem (offentlig side vs. omgåelse af loginvægge eller CAPTCHA’er)
- Hvad websitets vilkår siger (forbyder de automatiseret adgang?)
- Hvordan du bruger dataene bagefter (intern analyse vs. kommercielt videresalg)
Den bedste analogi, jeg har fundet: web-scraping er som fotografering på et offentligt sted. At tage et billede offentligt er ikke automatisk ulovligt — men bestemte motiver, steder, metoder og anvendelser skaber juridisk risiko. Scraping fungerer på samme måde. Offentlig tilgængelighed er relevant, men det er ikke hele historien.
ICO’s seneste GenAI-høring er en af de tydeligste officielle britiske udmeldinger om scraped persondata. Den slog fast, at legitimate interests fortsat er det for træning af generative AI-modeller ved hjælp af web-scrapede persondata — men kun hvis udvikleren består en streng treleddet test. Det er en høj barre, og det viser, hvor alvorligt britiske tilsynsmyndigheder ser på scrapede data.
De fire britiske love, der gælder for web-scraping
Fire overlappende vinkler — ethvert scraping-projekt kan udløse én, to eller alle fire.
UK GDPR og Data Protection Act 2018
Scraper du persondata — navne, e-mails, telefonnumre, IP-adresser, profiler på sociale medier — så gælder UK GDPR. "Offentligt tilgængelig" betyder ikke "fri til brug".
Persondata, der er synlige offentligt, er stadig persondata.
Det mest relevante lovlige grundlag for kommerciel scraping er legitimate interests (artikel 6) — men du kan ikke bare slynge den formulering ud. Du skal:
- Identificere et specifikt, legitimt formål
- Vise, at behandlingen er nødvendig for det formål
- Afveje din interesse mod de registreredes rettigheder, hvis data du indsamler
ICO’s svar på GenAI-høringen er særligt tydeligt: udviklere bør ikke antage, at en bred samfundsmæssig fordel er nok; de bør dokumentere, hvorfor alternativer til scraping ikke er egnede, og de bør bruge gennemsigtighedsmekanismer, der hjælper enkeltpersoner med at forstå og udøve deres rettigheder. Kilde: .
For B2B-leadgenerering gælder den samme logik. Et salgsteam kan støtte sig på legitimate interests til at indsamle offentligt oplyste virksomhedsoplysninger, men det skal stadig dokumentere den legitime interesse, minimere de indsamlede felter, undgå følsomme kategorier af data, give privatlivsinformation hvor det er muligt og respektere frameldinger.
Ophavsret, databaserettigheder og TDM-undtagelsen
Ophavsret beskytter originalt websiteindhold: tekst, billeder, produktbeskrivelser, artikler. Faktuelle datapunkter som priser er normalt mindre ophavsretligt følsomme i sig selv — men kopierer og genudgiver du beskyttet udtryk, er du ude i en krænkelsessituation.
Databaserettigheder betyder mere for scraping, end de fleste tror. Storbritannien bevarede EU-lignende sui generis-databaserettigheder efter Brexit, og udtræk af en "væsentlig del" af en beskyttet database — kuraterede kataloger, produktkataloger, marketplace-oversigter — kan være krænkende, også selv om de enkelte datapunkter er faktuelle.
Text and Data Mining (TDM)-undtagelsen under tillader kopier til tekst- og dataanalyse kun, hvis brugeren har lovlig adgang, og formålet er ikke-kommerciel forskning. Den er snæver. Kommerciel scraping, kommerciel AI-træning og kommercielt videresalg af datasæt er ikke omfattet.
Den britiske regering overvejede at udvide denne undtagelse til AI-træning, men besluttede i sin ikke at indføre reformer, før den er sikker på, at de opfylder målene for skabere, AI-udviklere og den britiske økonomi. Under status quo er der som regel brug for tilladelse til at kopiere beskyttede værker til AI-træning, medmindre en eksisterende undtagelse gælder.
Websitets vilkår og kontraktret
De fleste websites har Terms of Service (ToS), som forbyder eller begrænser automatiseret scraping. Tilgår du sitet, kan du allerede være bundet af disse vilkår — især hvis du klikker dig igennem en acceptskærm (clickwrap). Browsewrap-aftaler (vilkår bag et footer-link) er mere afhængige af de konkrete omstændigheder, men britiske domstole har vist vilje til at håndhæve ToS-begrænsninger på scraping. I tvisten behandlede retten synlige websitevilkår som bindende i en screen-scraping-kontekst.
robots.txt er ikke en lov. Det er et maskinlæsbart signal fra websiteejeren. En typisk fil ser sådan ud:
1User-agent: *
2Disallow: /account/
3Disallow: /checkout/
4Disallow: /private/
5Crawl-delay: 10
At ignorere robots.txt gør ikke automatisk scraping ulovligt, men domstole og ICO betragter det som et bevis på websiteejerens hensigt. At ignorere det øger din juridiske risiko, især hvis det kombineres med brud på ToS eller store mængder forespørgsler.
Computer Misuse Act 1990
Denne lov holder mange vågne om natten — og med god grund. Den skaber straffelovsovertrædelser. Section 1 omhandler uautoriseret adgang til computermateriale (maksimum ). Section 3 omhandler uautoriserede handlinger, der forringer computerdriften (maksimum ).
Risikoen efter CMA er lavest, hvor dataene virkelig er offentlige, og scraperen ikke omgår tekniske barrierer. Risikoen stiger, når du:
- Omgår loginvægge, CAPTCHA’er eller IP-blokeringer
- Bruger stjålne legitimationsoplysninger eller opretter falske konti
- Sender trafikmængder, der forringer målservicen
Storbritannien har ikke skabt en ren amerikansk regel om, at "offentlige data er frit bytte". Det gør britisk rådgivning mere forsigtig: offentlig adgang sænker ganske vist CMA-risikoen væsentligt, men websitevilkår, tekniske kontroller og scraperens kendskab til begrænsninger kan stadig spille en rolle.
"Kan jeg lovligt scrape dette?" — Et hurtigt beslutningsflow
Før du scraper noget som helst, så gå gennem disse fem beslutningspunkter. Ikke juridisk rådgivning — bare en 60-sekunders risikovurdering.
| Beslutningspunkt | Hvis JA | Hvis NEJ |
|---|---|---|
| Er dataene persondata (navne, e-mails osv.)? | UK GDPR gælder. Identificér lovligt grundlag, lav en LIA, minimér felter, planlæg gennemsigtighed. | GDPR-laget gælder måske ikke, men fortsæt til de andre kontroller. |
| Forbyder sidens ToS udtrykkeligt scraping? | Risiko for kontraktbrud. Overvej API, licens eller juridisk gennemgang. | Lavere kontraktrisiko, men tjek robots.txt. |
| Udtrækker du en væsentlig del af en database? | Sui generis-databaserettigheden er sandsynligvis krænket. Overvej licens eller mere begrænset udtræk. | Ophavsret kan stadig gælde for enkelte kopierede elementer. |
| Omgår du login, CAPTCHA eller adgangskontrol? | Potentiel straffelovsovertrædelse efter CMA 1990. Stop og få juridisk gennemgang. | Lavere CMA-risiko, hvis adgangen faktisk er offentlig. |
| Er formålet ikke-kommerciel forskning? | Section 29A TDM-undtagelsen kan gælde, hvis du har lovlig adgang. | Ingen bred britisk kommerciel TDM-sikker havn. Fuld IP- og kontraktanalyse er nødvendig. |
Øv, jeg ville ønske, nogen havde givet mig det her, da jeg først begyndte at researche scraping-compliance for vores team. Det gør juridisk kompleksitet til en struktureret selvevaluering, du kan gennemføre på under et minut.
Virkelige scenarier: Er din konkrete scraping-aktivitet lovlig i Storbritannien?
Abstrakt jura er én ting. Det folk faktisk vil vide er: "Vil mit konkrete projekt føre til problemer?"
Fair nok. Her er fem almindelige britiske scraping-anvendelser med en kort juridisk risikovurdering for hver.
Scraping af produktpriser til sammenligning
En af de mest almindelige — og ofte mindst risikable — forretningsanvendelser. Priser er faktuelle data, og automatiseret prisindsamling er netop sådan, sider som PriceSpy fungerer.
Risikoen forsvinder dog ikke helt. Hvis målsiden forbyder scraping i sine ToS, hvis du kopierer produktbeskrivelser eller billeder, eller hvis du udtrækker en væsentlig del af en kurateret produktdatabase, kan der opstå problemer med kontrakt, ophavsret og databaserettigheder.
Risik niveau: LAV til HØJ
Vigtig compliance-handling: Indsaml kun faktuelle prisfelter, undgå at kopiere produktbeskrivelser ordret, respekter ToS og robots.txt, brug rate limiting, og genudgiv ikke et råt spejl af konkurrentens katalog.
Scraping og videresalg af data kommercielt
Det mest risikofyldte kommercielle scenarie, punktum. Du omsætter en anden parts dataindsats til et produkt til salg — og det kan samtidig aktivere alle fire juridiske søjler.
Risikniveau: HØJ
Vigtig compliance-handling: Juridisk gennemgang er afgørende. Overvej licensaftaler med dataejerne. Hvis produktet indeholder persondata, så tilføj en konsekvensanalyse for databeskyttelse.
Udtræk af virksomheds kontaktoplysninger til leadgenerering
Ethvert salgsteam, jeg har talt med, gør en version af det her: scraper e-mails, telefonnumre og virksomhedsnavne fra oversigter. Hage? Forretningskontaktoplysninger indeholder ofte persondata. En navngiven medarbejders e-mail er persondata, selv om den er offentligt opført.
Risikniveau: MIDDEL
Vigtig compliance-handling: Gennemfør en Legitimate Interests Assessment, indsaml kun kontaktdata til forretning — ikke privatlivsdata — hvor det er muligt, dokumentér dit lovlige grundlag, og tilbyd en frameldingsmulighed. Værktøjer som kan reducere adgangsrisikoen her, fordi kører i brugerens browser — den tilgår kun det, brugeren allerede kan se, uden at omgå adgangskontroller.
Akademisk eller porteføljebaseret dataanalyse
Hvis du laver reel ikke-kommerciel forskning, har du den stærkeste ophavsretslige undtagelsesvej: Section 29A CDPA, forudsat at du har lovlig adgang.
Risikniveau: LAVT (hvis virkelig ikke-kommercielt)
Vigtig compliance-handling: Dokumentér det ikke-kommercielle formål, angiv kilder, anonymisér eller aggregér hvor muligt, og undgå at videredistribuere ophavsretligt beskyttet indhold eller persondata.
Scraping af indhold til træning af AI-modeller
Det er den, alle spørger om i 2026 — og svaret er stadig utilfredsstillende. ICO betragter web-scrapede persondata til træning som højrisiko og usynlig behandling. Den britiske regerings rapport fra 2026 indførte ikke en bred kommerciel TDM-undtagelse.
Risikniveau: MIDDEL til HØJ
Vigtig compliance-handling: Licensering, dokumentation af datas oprindelse, ophavsretsanalyse, filtrering af persondata, dokumentation af lovligt grundlag og tæt overvågning af ændringer i britisk politik.
Oversigtstabel over scenarier
| Scenarie | Vigtigste udløste regler | Risikniveau | Vigtig compliance-handling |
|---|---|---|---|
| Overvågning af produktpriser | ToS, databaserettigheder, ophavsret | Lav–middel | Indsaml faktuelle felter, respekter signaler fra sitet |
| Kommercielt videresalg af data | Alle fire søjler | Høj | Juridisk gennemgang og licens er afgørende |
| B2B-leadgenerering | UK GDPR, ToS | Middel | Lav LIA, minimér persondata |
| Akademisk forskning | Ophavsret (TDM-undtagelse), GDPR hvis persondata | Lav | Hold formålet ikke-kommercielt, genudgiv ikke |
| Træning af AI-modeller | UK GDPR, ophavsret, databaserettigheder | Middel–høj | Licenser data, dokumentér lovligt grundlag, følg politikken |
Storbritannien vs. USA vs. EU: Sådan adskiller web-scraping-lovgivningen sig
Hvis du kun opererer i Storbritannien, kan du springe dette afsnit over. Men de fleste virksomheder, jeg taler med, scraper internationalt — eller scraper i det mindste websites, der hostes i andre jurisdiktioner. Forskellene betyder mere, end man skulle tro.
| Juridisk dimension | 🇬🇧 Storbritannien | 🇺🇸 USA | 🇪🇺 EU |
|---|---|---|---|
| Primær databeskyttelseslov | UK GDPR + DPA 2018 | Ingen føderal pendant (statslige love varierer) | EU GDPR |
| Vigtig præcedens for scraping | Clearview AI (ICO-bøde på £7,5 mio.) | hiQ v LinkedIn (scraping af offentlige data OK, Ninth Circuit — men hiQ blev endeligt forhindret og betalte $500K i endelig samtykkedom) | Ryanair v PR Aviation (CJEU, C-30/14, databaserettigheder) |
| Lov om computeradgang | Computer Misuse Act 1990 | CFAA (indsnævret af Van Buren, 2021) | Varierer efter medlemsstat |
| Ophavsret / TDM-undtagelse | Snæver: kun ikke-kommerciel forskning (Section 29A) | Fair use-doktrin (bredere, fra sag til sag) | DSM-direktivets art. 3 og 4 (bredere TDM-rettigheder med rettighedsforbehold) |
| Databaserettigheder | Ja (beholdt fra EU’s Database Directive) | Ingen tilsvarende føderal ret | Sui generis-ret under Database Directive |
| Håndhævelse af ToS | Kontraktret gælder; browsewrap diskuteres | Blandet: browsewrap er ofte ikke håndhævelig | Varierer; Ryanair styrkede ToS-positionen |
Den praktiske konklusion: Hvis du scraper på tværs af jurisdiktioner, så følg den strengeste gældende lov. USA er mere tilladende med offentlig datatilgang under hiQ, men hiQ er ikke en generel fribillet — hiQ blev til sidst forhindret i at scrape LinkedIn og betalte $500K. EU har en bredere TDM-struktur gennem DSM-direktivet. Storbritannien ligger et sted midt imellem — ingen bred kommerciel TDM-undtagelse, stærke databaserettigheder og en aktiv tilsynsmyndighed.
Sanktioner og håndhævelse: Hvad sker der egentlig, hvis du bliver fanget?

Vage advarsler om "bøder" og "juridiske problemer" hjælper ingen. Her er de faktiske tal.
UK GDPR-bøder
Maksimal sanktion: , alt efter hvad der er størst.
Reelt eksempel: Clearview AI fik en bøde på af ICO i 2022 for at scrape ansigtsbilleder fra britiske sociale medier. First-tier Tribunal omstødte afgørelsen på jurisdiktionsgrundlag, men tillod ICO’s appel og hjemviste sagen. ICO oplyste, at Clearview i december 2025 havde .
Strafferetlige sanktioner efter Computer Misuse Act
- Section 1 (uautoriseret adgang): op til
- Section 3 (uautoriseret forringelse): op til
Straffesager for almindelig scraping af offentlige sider er ekstremt sjældne.
Risikoen ændrer sig dramatisk, når adfærden minder om hacking, misbrug af legitimationsoplysninger, omgåelse af CAPTCHA eller forringelse af tjenesten.
Ophavsret og databaserettigheder
Civilretlige erstatningskrav plus fogedforbud. Strafferetlige sanktioner er mulige ved forsætlig kommerciel krænkelse, men de fleste scraping-tvister kører som civile sager.
Kontraktbrud (ToS)
Civilretlige erstatninger, kontolukning, IP-blokering. Det er normalt den mest almindelige praktiske håndhævelse — og ofte det første, der sker.
Oversigt over sanktioners alvor
| Juridisk ramme | Maksimal sanktion | Sandsynlighed ved typisk business scraping | Reelt eksempel |
|---|---|---|---|
| UK GDPR | £17,5 mio. eller 4 % global omsætning | Middel, hvis persondata i stor skala; lav for ikke-personlige data | Clearview AI-bøde på £7,5 mio. |
| CMA Section 1 | 2 års fængsel | Lav for offentlige sider; højere hvis kontroller omgås | CPS-vejledning om uautoriseret adgang |
| CMA Section 3 | 10 års fængsel | Lav, medmindre trafikken forringer systemer | DDoS-lignende forringelsestilfælde |
| Ophavsret/databaserettigheder | Erstatning og forbud | Middel ved kopiering af beskyttet indhold eller kuraterede databaser | Ryanair- og BHB-lignende sager |
| ToS-brud | Erstatning, kontolukning, blokering | Høj som praktisk håndhævelsesvej | Ryanair screen-scraping-tvister |
Hvordan det rigtige scraping-værktøj reducerer din juridiske risiko
Det værktøj, du vælger, gør ikke ulovlig scraping lovlig. Men det kan fjerne undgåelig risiko.
Efter min erfaring er forskellen mellem et værktøj, der respekterer sitets signaler, og et, der aggressivt omgår alt, ofte forskellen mellem et almindeligt data-projekt og et juridisk hovedpineprojekt.
Respekterer robots.txt og websitets signaler
Et ansvarligt værktøj bør gøre det let at tjekke og respektere robots.txt før scraping. Selvom det ikke er juridisk bindende, bliver overholdelse af robots.txt af domstole og ICO betragtet som et tegn på god tro. Thunderbits råder brugere til at scrape offentligt tilgængelige data og respektere robots.txt og vilkår.
Browser-scraping vs. cloud-scraping
Denne forskel er juridisk vigtig. Browser-scraping tilgår kun det, brugeren kan se i sin autentificerede session — altså i praksis automatisering af det, du ellers selv ville gøre manuelt. Cloud-scraping sender forespørgsler fra servere, hvilket er hurtigere på offentlige sites, men kan se mere ud som "automatiseret adgang" fra sitets perspektiv.
tilbyder begge tilstande. Browser-scraping er velegnet til sites, der kræver login (og reducerer dermed risikoen for "uautoriseret adgang" efter CMA), mens cloud-scraping fungerer godt til offentligt tilgængelige e-handelsider, hvor hastighed er vigtig. Den dobbelte tilgang gør det muligt at matche scrapingmetoden med det enkelte sites juridiske risikoprofil.
Ingen omgåelse af adgangskontrol
Et værktøj, der arbejder i browseren og ikke knækker CAPTCHA’er eller omgår loginvægge, er i sagens natur lavere risiko efter Computer Misuse Act. Thunderbits Chrome-udvidelse fungerer i brugerens browsersession — den tilgår kun det, brugeren allerede kan se.
Gennemsigtig dataeksport (understøtter GDPR-compliance)
Thunderbit eksporterer direkte til Excel, Google Sheets, Airtable eller Notion. Brugeren styrer selv, hvor dataene ender. Det understøtter GDPR-gennemsigtighed og dokumentation af lovligt grundlag: du ved præcis, hvilke data du har indsamlet, og hvor de er sendt hen. Ingen skjult behandling eller dataopbevaring i værktøjet.
Rate limiting og ansvarlig adgang
Aggressive mængder forespørgsler kan udløse CMA Section 3 (uautoriseret forringelse). Rate limiting er ikke kun en teknisk best practice — det er en juridisk sikkerhedsforanstaltning. Ansvarlige værktøjer undgår at overbelaste servere, hvilket reducerer både juridisk risiko og risikoen for at blive IP-blokeret.

En praktisk compliance-checkliste til britisk web-scraping
Gå denne igennem, før du scraper noget som helst:
- Læs målwebsitets Terms of Service og Acceptable Use Policy.
- Tjek robots.txt-filen og dokumentér, om relevante stier er forbudte.
- Afgør, om de data du vil have, er persondata. Hvis ja, identificér dit lovlige grundlag efter UK GDPR.
- Vurder, om du udtrækker en "væsentlig del" af en database.
- Bekræft, at du ikke omgår tekniske adgangskontroller (CAPTCHA’er, login, rate limits).
- Hvis dit formål er ikke-kommerciel forskning, så dokumentér det for at kunne bruge TDM-undtagelsen.
- Brug rate limiting. Overbelast ikke målserveren.
- Dokumentér alt: dit lovlige grundlag, ToS-gennemgang, de datafelter du har indsamlet, eksportdestinationer, opbevaringsperiode.
- Hvis du er i tvivl, så få juridisk rådgivning fra en advokat, der specialiserer sig i databeskyttelse og IP.
Denne checkliste erstatter ikke en advokats vurdering — men den giver dig et solidt udgangspunkt og viser god tro, hvis der senere opstår spørgsmål.
Vigtige pointer
- Web-scraping er ikke ulovligt i Storbritannien — men det er reguleret af fire overlappende juridiske rammer: UK GDPR, ophavsret/databaserettigheder, kontraktret og Computer Misuse Act.
- Lovligheden af enhver scraping afhænger af, hvad du scraper, hvordan du får adgang til det, hvad websitets vilkår siger, og hvad du gør med dataene.
- Scraping af persondata medfører den største compliance-byrde. Legitimate interests er som regel det eneste realistiske lovlige grundlag, og det kræver en dokumenteret afvejningstest.
- Storbritannien har ingen bred kommerciel TDM-undtagelse. Kommerciel AI-træning og videresalg af datasæt er højrisiko uden licens.
- Brug beslutningsflowet og scenarietabellen ovenfor til at vurdere din konkrete situation, før du går i gang.
- Vælg værktøjer, der matcher god compliance-praksis: browserbaseret adgang, ingen CAPTCHA-omgåelse, gennemsigtig dataeksport og rate limiting. er designet med de principper for øje — men compliance-ansvaret ligger altid hos brugeren.
- Når du er i tvivl, så dokumentér din begrundelse og tal med en advokat. Prisen for en juridisk vurdering er næsten altid lavere end prisen for en ICO-undersøgelse.
Ofte stillede spørgsmål
Er det lovligt at scrape offentligt tilgængelige data i Storbritannien?
Som udgangspunkt ja — scraping af offentlige data er mindre risikabelt end scraping af låste eller private data. Men "offentligt tilgængelig" betyder ikke "fri til at bruge, som du vil". UK GDPR kan stadig gælde for offentlige persondata, ophavsret kan gælde for kopieret udtryk, databaserettigheder kan beskytte kuraterede samlinger, og ToS kan begrænse automatiseret adgang.
Må jeg scrape e-mails og telefonnumre fra britiske websites?
Hvis dataene er persondata (hvilket e-mails og telefonnumre typisk er), skal du have et lovligt grundlag efter UK GDPR. Legitimate interests er det mest almindelige grundlag til B2B-leadgenerering, men du skal lave en afvejningstest, minimere de data, du indsamler, og tilbyde en frameldingsmulighed. Scraping af kontaktdata til privat brug (mobilnumre, private e-mails) er langt mere risikabelt end virksomhedsregistre.
Hvad er forskellen på web-scraping og web-crawling efter britisk ret?
Juridisk er der ingen meningsfuld forskel — loven ser på handlingen, ikke på etiketten. Crawling betyder normalt at finde eller indeksere sider; scraping betyder normalt at udtrække strukturerede data. Begge dele indebærer automatiseret adgang til websites og er underlagt de samme juridiske rammer.
Gør robots.txt scraping ulovligt?
Nej. robots.txt er ikke juridisk bindende. Men at ignorere den øger din juridiske risiko, fordi domstole og ICO ser den som et bevis på websiteejerens hensigt. Hvis du ignorerer robots.txt, og sitets ToS også forbyder scraping, lægger du flere risikofaktorer oven i hinanden — og det er en langt sværere position at forsvare.
Kan jeg blive strafferetligt forfulgt for web-scraping i Storbritannien?
Kun hvis du omgår adgangskontrol (CAPTCHA’er, login, IP-blokeringer) eller forårsager skade på et computersystem under . Almindelig scraping af reelt offentlige data i rimelige mængder uden teknisk omgåelse fører ekstremt sjældent til straffesager. Risikoen ændrer sig markant, når adfærden ligner hacking eller bevidst forringelse af en tjeneste.
Læs mere
