TikTok-video's scrapen met Python: 3 methodes + videodownload

TikTok heeft inmiddels zo’n 1,9 miljard maandelijkse actieve gebruikers en makers uploaden naar schatting 23 miljoen video’s per dag. Als je ooit geprobeerd hebt om data uit zelfs maar een klein deel van die stroom te halen, weet je al hoe frustrerend dat kan zijn.

Dit gaat meestal zo: je zoekt op “scrape TikTok videos with Python”, kopieert een fragment uit een tutorial (of laat ChatGPT er één schrijven), voert het uit en krijgt… niets. Lege HTML. Een 403-fout. Of die gevreesde melding “Process finished with exit code 0” zonder enige output. Ik heb precies deze cyclus tientallen keren voorbij zien komen in GitHub-issues en Reddit-threads, en daarom heb ik deze handleiding samengesteld. We behandelen drie Python-methodes die in 2025 echt werken, nemen stap voor stap door hoe je de daadwerkelijke .mp4-videobestanden downloadt (niet alleen metadata — daar blijven vrijwel alle andere tutorials bij steken), en sluiten af met een vergelijkingstabel zodat je de juiste aanpak voor jouw situatie kunt kiezen. Als je helemaal geen Python nodig hebt, laat ik ook no-code alternatieven zien zoals Thunderbit waarmee je dezelfde data in ongeveer twee klikken kunt ophalen.

Wat betekent “TikTok-video’s scrapen” eigenlijk?

Voordat we de code induiken, is het handig om eerst scherp te krijgen wat mensen bedoelen met “TikTok-video’s scrapen” — want die term kan twee totaal verschillende dingen betekenen:

Video-metadata extraheren: Beschrijvingen, hashtags, likes, reacties, shares, weergaven, publicatiedatum en informatie over de maker. Hier richten de meeste tutorials zich op.
De daadwerkelijke videobestanden (.mp4) downloaden: De video zelf opslaan op je computer. Dat is wat de meeste mensen eigenlijk willen als ze “scrape TikTok videos” intypen — en precies het onderdeel dat bijna niemand uitlegt.

Deze gids behandelt beide. Elke methode hieronder kan metadata ophalen en de download-URL’s leveren die je nodig hebt om de .mp4-bestanden op te slaan.

Waarom TikTok-video’s scrapen met Python?

Met ~280 bekeken video’s per gebruiker per dag en TikTok Shop dat wereldwijd meer dan $33 miljard aan advertentie-inkomsten genereert, zijn de zakelijke redenen om TikTok-data te gebruiken behoorlijk groot. Dit zijn de use-cases die ik het vaakst tegenkom:

Use case	Wat je scrapt	Voor wie
Influencer- en marketingonderzoek	Engagementratio’s, volgersaantallen, contentformaten, hashtagprestaties	Marketingteams, bureaus
Contentstrategie	Trendende hashtags, virale videofomaten, postfrequentie	Contentmakers, social media managers
Merkmonitoring	Vermeldingen, campagnebereik, sentiment van het publiek	Merkmanagers, PR-teams
Concurrentieanalyse	Videoprestaties van concurrenten, advertentiecreatives, TikTok Shop-aanbiedingen	E-commerce, productteams
Marktonderzoek	Opkomende trends, gedrag van doelgroepen, productontdekking	Analisten, hedgefondsen, onderzoeksbureaus
Archivering & compliance	Videobestanden voor interne review of dossiervorming	Juridische teams, compliance, bureaus

De commerciële impact is reëel: de Amerikaanse TikTok-advertentie-inkomsten worden in 2026 geraamd op $23,4 miljard, en affiliate creators genereren 82–84% van de omzet in de topcategorieën van TikTok Shop. Werk je in e-commerce of influencer marketing, dan heeft deze data directe financiële waarde.

Waarom je basis Python-code op TikTok faalt

Als je al iets als dit hebt geprobeerd en nergens uitkwam, ben je zeker niet de enige:

import requests
from bs4 import BeautifulSoup

resp = requests.get("https://www.tiktok.com/@someuser")
soup = BeautifulSoup(resp.text, "html.parser")
# ...en dan staat er in de HTML niets bruikbaars

De reden is simpel: TikTok is een van de lastigste platforms om te scrapen. Een simpele requests.get() geeft vooral een lege HTML-schaal terug, omdat de daadwerkelijke content in de browser met JavaScript wordt gerenderd. Daarnaast zet TikTok een agressieve anti-botlaag in, met gedragsdetectie, TLS-fingerprinting, een aangepaste JavaScript-virtual machine die request-handtekeningen genereert, en dynamische CSS-selectors die zonder waarschuwing wijzigen.

Volgens het Imperva 2025 Bad Bot Report was geautomatiseerd verkeer in 2024 voor het eerst groter dan menselijk verkeer — bots zijn inmiddels goed voor 51% van al het internetverkeer. TikTok weet dat en heeft zijn verdediging daarop ingericht.

Hier is een korte diagnose-tabel zodat je kunt inschatten wat er misgaat en direct naar de juiste methode kunt springen:

Symptoom	Waarschijnlijke oorzaak	Methode die dit oplost
Lege HTML / geen data	Content wordt via JS geladen; `requests` kan geen JavaScript uitvoeren	Methode 1 (verborgen JSON) of Methode 3 (Playwright)
403 / toegang geweigerd	Ontbrekende of verkeerde headers; anti-botdetectie	Methode 1 met correcte headers
Het werkt één keer en stopt daarna	Rate limiting / IP-blokkade	Proxy-rotatie (alle methodes)
Login-wall verschijnt	Sessie-/cookievereiste	Methode 3 (browser met opgeslagen sessie)
Code die door ChatGPT is gegenereerd levert niets op	TikTok-structuur is gewijzigd sinds de trainingsdata van het model	Alle 3 methodes (actuele aanpak)

De limiet ligt ruwweg rond 30–60 requests per minuut per IP voordat je soft blocks of CAPTCHA’s gaat zien. Datacenter-IP’s worden binnen minuten gemarkeerd — residentiële of mobiele proxies zijn voor volume eigenlijk onmisbaar.

Overzicht: 3 manieren om TikTok-video’s met Python te scrapen

Hier is de routekaart. Elke methode heeft andere voor- en nadelen, en ik behandel ze alle drie met werkende code:

Verborgen JSON extraheren — Parse de __UNIVERSAL_DATA_FOR_REHYDRATION__-script tag die in TikTok-pagina’s is ingebed. Het snelst, simpelst, geen browser nodig.
TikTok’s interne API — Roep direct het ongedocumenteerde /api/post/item_list/-endpoint aan voor bulkdata met cursor-gebaseerde paginering.
Browserautomatisering met Playwright — Render pagina’s in een headless browser om infinite scroll, dynamische content en login-walls aan te kunnen.

Alle drie de methodes kun je ook gebruiken om de daadwerkelijke .mp4-videobestanden te downloaden — dat bespreek ik in een apart gedeelte na de methodes. Helemaal achteraan staat een volledige vergelijkingstabel zodat je een weloverwogen keuze kunt maken.

Methode 1: TikTok-video’s scrapen met verborgen JSON (geschikt voor beginners)

Dit is de aanpak waarmee ik zou beginnen. TikTok verwerkt op vrijwel elke pagina een enorme JSON-blok in een <script>-tag met de id __UNIVERSAL_DATA_FOR_REHYDRATION__. Dat blok bevat alle profiel- en videodata die de frontend normaal zou renderen — waardoor je het met één HTTP-request kunt ophalen, zonder browser.

Wat je nodig hebt

Python 3.8+
requests (of httpx)
beautifulsoup4 (of parsel)
Correcte headers: User-Agent, Referer, Accept-Language

Installeer de dependencies:

pip install requests beautifulsoup4

Stap voor stap: TikTok-videodata uit de script-tag halen

Stap 1: Stuur een GET-request met realistische browserheaders.

Hier gaat het bij beginners meestal mis. Als je een kale requests.get() zonder headers stuurt, geeft TikTok een 403 of een CAPTCHA-pagina terug. Je hebt minimaal een actuele browser-User-Agent en een Referer-header nodig.

import requests
from bs4 import BeautifulSoup
import json

url = "https://www.tiktok.com/@charlidamelio"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36",
    "Referer": "https://www.tiktok.com/",
    "Accept-Language": "en-US,en;q=0.9",
}

resp = requests.get(url, headers=headers)

Stap 2: Parse de HTML en zoek de hydration script-tag.

soup = BeautifulSoup(resp.text, "html.parser")
script_tag = soup.find("script", id="__UNIVERSAL_DATA_FOR_REHYDRATION__")

Als script_tag None is, heeft TikTok je waarschijnlijk geblokkeerd (controleer de statuscode) of is de tag-id gewijzigd (zeldzaam, maar mogelijk).

Stap 3: Lees de inhoud van de script-tag in als JSON.

data = json.loads(script_tag.string)

Stap 4: Navigeer door de JSON-structuur om videometadata te extraheren.

De structuur zit genest onder __DEFAULT_SCOPE__. Voor een profielpagina van een gebruiker:

user_detail = data["__DEFAULT_SCOPE__"]["webapp.user-detail"]
user_info = user_detail["userInfo"]

# Profielstatistieken
stats = user_info["stats"]
print(f"Volgers: {stats['followerCount']}, Likes: {stats['heartCount']}")

# Videolijst (eerste pagina met video’s)
item_list = user_detail.get("itemList", [])
for video in item_list:
    print(video["desc"])  # Beschrijving
    print(video["stats"]["playCount"])  # Weergaven
    print(video["video"]["playAddr"])  # Download-URL van de video (zonder watermark)
    print(video["video"]["downloadAddr"])  # Download-URL van de video (met watermark)

Stap 5: Extraheer de download-URL’s van de video.

Het veld playAddr levert doorgaans een schonere versie van de video op (vaak zonder TikTok-watermark), terwijl downloadAddr de standaard watermark bevat. Beide zijn directe URL’s naar het .mp4-bestand — maar om ze te downloaden heb je specifieke headers nodig (zie het downloadgedeelte hieronder).

Je hebt nu een lijst met video-objecten, elk met de beschrijving, statistieken, aanmaaktijd, hashtags (in challenges[] en textExtra) en directe video-URL’s.

Beperkingen van de verborgen JSON-methode

Haalt alleen data op van de eerste paginalading — meestal de eerste ~30 video’s op een profiel
Kan geen infinite scroll of paginering aan (er is geen “volgende pagina” om op te vragen)
Als TikTok de script-tag-id of JSON-structuur wijzigt, breekt de parser (dit gebeurt regelmatig — Pydantic-validatie helpt dit vroeg te detecteren)
Het meest geschikt voor: snelle profielscrapes, losse datapunten of situaties waarin je alleen de recentste video’s nodig hebt

Methode 2: TikTok-video’s scrapen via de interne API

De frontend van TikTok laadt niet alle video’s in één keer — tijdens het scrollen doet de site XHR-calls naar interne API-endpoints. De belangrijkste voor gebruikersvideo’s is /api/post/item_list/. Je kunt dit endpoint rechtstreeks vanuit Python aanroepen, waardoor je cursor-gebaseerde paginering krijgt en toegang tot alle video’s op een profiel (niet alleen de eerste pagina).

Hoe je het interne API-endpoint vindt

Open Chrome DevTools op een TikTok-profielpagina, ga naar het Network-tabblad, filter op XHR en scroll omlaag. Je ziet requests naar URL’s zoals:

https://www.tiktok.com/api/post/item_list/?WebIdLastTime=...&aid=1988&count=35&cursor=0&secUid=...

De belangrijkste parameters zijn:

secUid — de unieke ID van het profiel (je kunt die uit de JSON van Methode 1 halen, onder userInfo.user.secUid)
cursor — de pagineringsoffset (begint bij 0, elke response geeft de volgende cursorwaarde terug)
count — aantal items per pagina (meestal 30–35)

Stap voor stap: TikTok’s interne API opvragen met Python

Stap 1: Haal de secUid op van het doelprofiel.

Je kunt die uit de verborgen JSON halen (Methode 1) of uit de HTML van de profielpagina.

Stap 2: Bouw en verstuur de API-request.

import requests
import json

sec_uid = "MS4wLjABAAAA..."  # Uit Methode 1
api_url = "https://www.tiktok.com/api/post/item_list/"
params = {
    "aid": "1988",
    "secUid": sec_uid,
    "count": 35,
    "cursor": 0,
}
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) Gecko/20100101 Firefox/124.0",
    "Referer": "https://www.tiktok.com/",
}

resp = requests.get(api_url, params=params, headers=headers)
data = resp.json()

Stap 3: Parse de response.

Elk item in data["itemList"] bevat dezelfde videostructuur als Methode 1 — desc, stats, video.playAddr, video.downloadAddr, enzovoort.

Stap 4: Loop door alle video’s met paginering.

all_videos = []
cursor = 0
has_more = True

while has_more:
    params["cursor"] = cursor
    resp = requests.get(api_url, params=params, headers=headers)
    data = resp.json()
    
    items = data.get("itemList", [])
    all_videos.extend(items)
    
    has_more = data.get("hasMore", False)
    cursor = data.get("cursor", 0)
    
    print(f"Opgehaald: {len(items)} video's, totaal: {len(all_videos)}, hasMore: {has_more}")

print(f"Totaal aantal gescrapete video's: {len(all_videos)}")

Elke iteratie levert de volgende batch op plus een nieuwe cursor. De loop gaat door totdat hasMore False is.

Beperkingen van de interne API-methode

TikTok wijzigt deze endpoints en vereiste parameters regelmatig — dit is de onderhoudsintensiefste methode. De laatste maanden zijn sommige requests msToken, X-Bogus of andere signature-parameters gaan vereisen die door TikTok’s aangepaste JavaScript VM worden gegenereerd (spoiler: dat exact reproduceren in pure Python is niet triviaal).
Voor bepaalde datatypes kunnen sessiecookies of extra tokens nodig zijn
IP-gebaseerde rate limiting blijft gelden — proxy-rotatie is aan te raden
Als je lege itemList-arrays krijgt, is je msToken waarschijnlijk verlopen (deze roteert in de browser ongeveer elke 10 seconden)
Het meest geschikt voor: bulk-extractie wanneer je alle video’s van een profiel nodig hebt en de eerste-pagina-beperking van Methode 1 niet volstaat

Methode 3: TikTok-video’s scrapen met Playwright (browserautomatisering)

Wanneer de eerste twee methodes vastlopen — loginvereisten, CAPTCHA’s of signature-parameters die je niet kunt nabootsen — is Playwright de uitwijkoptie. Het start een echte (headless) browser, navigeert door TikTok alsof het een menselijke gebruiker is, en kan JavaScript-rendering, infinite scroll en zelfs geauthenticeerde sessies aan.

Playwright instellen voor TikTok-scraping

Installeer Playwright en de browserbinaries:

pip install playwright
playwright install firefox

Ik raad Firefox aan boven Chromium voor TikTok-scraping. Uit tests in de community blijkt consistent betere fingerprint-compatibiliteit met Firefox, en TikTok’s botdetectie is bijzonder streng voor headless browsers op Chromium-basis.

Voor extra stealth kun je Playwright combineren met patchright (een aangepaste Playwright-fork) of Camoufox (Firefox op C++-niveau aangepast voor anti-detectie). In onafhankelijke benchmarks behaalt Camoufox bijna perfecte stealth-scores tegen grote botdetectieservices.

Stap voor stap: TikTok-profielvideo’s scrapen met Playwright

Stap 1: Start een headless Firefox-browser en open het profiel.

import asyncio
from playwright.async_api import async_playwright
import json

async def scrape_tiktok_profile(username):
    async with async_playwright() as p:
        browser = await p.firefox.launch(headless=True)
        context = await browser.new_context(
            user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:124.0) Gecko/20100101 Firefox/124.0",
            viewport={"width": 1280, "height": 720},
        )
        page = await context.new_page()
        
        await page.goto(f"https://www.tiktok.com/@{username}", wait_until="networkidle")

Stap 2: Wacht tot het videorooster geladen is.

        # Wacht tot de video-items zichtbaar zijn
        await page.wait_for_selector('[data-e2e="user-post-item"]', timeout=15000)

Als TikTok een overlay “Something went wrong” toont, moet je mogelijk op een retry-knop klikken:

        retry_btn = page.locator('button:has-text("Retry")')
        if await retry_btn.count() > 0:
            await retry_btn.click()
            await page.wait_for_selector('[data-e2e="user-post-item"]', timeout=15000)

Stap 3: Haal data uit de verborgen JSON op (ook in Playwright).

De meest betrouwbare aanpak blijft om de hydration-JSON op te halen, ook als je een browser gebruikt:

        script_el = page.locator("#__UNIVERSAL_DATA_FOR_REHYDRATION__")
        raw_json = await script_el.inner_text()
        data = json.loads(raw_json)
        
        # Zelfde JSON-navigatie als in Methode 1
        user_detail = data["__DEFAULT_SCOPE__"]["webapp.user-detail"]
        videos = user_detail.get("itemList", [])

Stap 4: Verwerk infinite scroll voor meer video’s.

Als je meer dan de eerste ~30 video’s nodig hebt, scroll dan omlaag en vang extra XHR-responses op:

        all_videos = list(videos)
        
        # Intercepteer API-responses terwijl we scrollen
        api_responses = []
        
        async def capture_response(response):
            if "/api/post/item_list" in response.url:
                try:
                    body = await response.json()
                    api_responses.append(body)
                except:
                    pass
        
        page.on("response", capture_response)
        
        # Scroll omlaag om meer te laden
        for _ in range(5):  # Pas het aantal scrolls aan indien nodig
            await page.evaluate("window.scrollTo(0, document.body.scrollHeight)")
            await asyncio.sleep(2)
        
        # Verzamel video’s uit de onderschepte responses
        for api_resp in api_responses:
            items = api_resp.get("itemList", [])
            all_videos.extend(items)
        
        print(f"Totaal aantal video's: {len(all_videos)}")
        await browser.close()
        return all_videos

# Uitvoeren
videos = asyncio.run(scrape_tiktok_profile("charlidamelio"))

Je hebt nu een lijst met video-objecten uit zowel de eerste paginalading als eventuele extra pagina’s die via scrollen zijn geladen.

Beperkingen van de Playwright-methode

Verreweg de langzaamste methode (volledige pagerendering, netwerk-rondes, scrollvertraging)
Zwaarder voor je systeem — elke browserinstantie gebruikt flink wat geheugen en CPU
Nog steeds gevoelig voor IP-blokkering op schaal — combineer met proxy-rotatie
Het meest geschikt voor: complexe interacties, content achter een login-wall, omgaan met CAPTCHA’s of situaties waarin Methode 1 en 2 worden geblokkeerd

TikTok-video’s (.mp4) downloaden met Python

Dit is het gedeelte dat in vrijwel elke andere TikTok-scrapingtutorial ontbreekt. Metadata extraheren is nuttig, maar de meeste mensen die zoeken op “scrape TikTok videos” willen de daadwerkelijke videobestanden.

TikTok neemt download-URL’s op in het video-object:

playAddr — doorgaans de versie zonder watermark of met een kleinere watermark
downloadAddr — de versie die TikTok bedoeld heeft voor downloaden in de app (inclusief TikTok-watermark)

Beide URL’s zijn tijdgevoelig en verlopen na korte tijd (meestal een paar uur), dus je moet snel downloaden nadat je ze hebt opgehaald.

Stap voor stap: een TikTok-videobestand downloaden

Stap 1: Extraheer de video-URL met een van de drie methodes hierboven.

video_url = video["video"]["playAddr"]  # Versie zonder watermark
# of
video_url = video["video"]["downloadAddr"]  # Met watermark

Stap 2: Stuur een GET-request met de juiste headers.

Dit is de stap waar veel mensen vastlopen. Als je gewoon requests.get(video_url) doet, krijg je een 403. TikTok controleert de Referer-header en verwacht een browserachtige User-Agent.

import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36",
    "Referer": "https://www.tiktok.com/",
}

resp = requests.get(video_url, headers=headers, stream=True)

Stap 3: Schrijf de response weg naar een .mp4-bestand.

Gebruik stream=True en schrijf in blokken — TikTok-video’s kunnen groot zijn, en je wilt niet het hele bestand in het geheugen laden:

video_id = video["id"]
filename = f"tiktok_{video_id}.mp4"

with open(filename, "wb") as f:
    for chunk in resp.iter_content(chunk_size=1024 * 1024):  # Blokken van 1 MB
        if chunk:
            f.write(chunk)

print(f"Gedownload: {filename}")

Je hebt nu een afspeelbaar .mp4-bestand op je lokale machine.

Watermark versus download zonder watermark

TikTok bewaart zowel een versie mét als zonder watermark van elke video. De playAddr-URL geeft vaak een schonere versie terug (de versie die de speler gebruikt), terwijl downloadAddr de TikTok-watermark met de gebruikersnaam van de maker bevat.

Een korte opmerking over de ethiek hier: de watermark is bedoeld om de maker te erkennen. Als je video’s downloadt voor onderzoek, analyse of interne review, is het gebruiken van playAddr doorgaans prima. Als je content opnieuw verspreidt of opnieuw plaatst, levert het verwijderen van naamsvermelding zowel ethische als auteursrechtelijke vragen op. Meer daarover in het juridische gedeelte hieronder.

Voor een robuustere download-pijplijn kun je yt-dlp overwegen — de TikTok-extractor daarvan handelt signatuurberekeningen en URL-resolutie automatisch af, zodat je headers en tokenverloop niet zelf hoeft te beheren.

Welke Python-methode moet je kiezen? Een vergelijking

Hier is de vergelijkingstabel die ik zelf had willen hebben toen ik begon met TikTok-scrapingprojecten:

Criteria	Methode 1: Verborgen JSON	Methode 2: Interne API	Methode 3: Playwright
Moeilijkheidsgraad	Beginner	Gemiddeld	Gemiddeld
Snelheid	Snel (1 request per pagina)	Snel (JSON API)	Traag (volledige pagerendering)
Anti-botbestendigheid	Middel	Laag (endpoints wijzigen)	Hoog (lijkt op een echte browser)
Downloadt video .mp4?	Ja (via `playAddr`)	Ja (URL in response)	Ja (netwerkverkeer onderscheppen)
Ondersteunt infinite scroll	Nee (alleen eerste pagina)	Ja (cursor-paginering)	Ja (scroll simulatie)
Proxy nodig op schaal	Ja	Ja	Ja
Onderhoud nodig	Middel (JSON-structuur wijzigt)	Hoog (endpoints/signatures veranderen vaak)	Laag-middel (browser past zich aan)
Beste voor	Snelle, eenmalige profielscrapes	Bulk-extractie, alle video’s	Content achter login of complexe content

Mijn advies:

Heb je alleen een snelle momentopname van één profiel nodig? Begin met Methode 1. Het kost ongeveer 30 seconden om op te zetten en levert data op in minder dan een seconde per pagina.
Heb je alle video’s van een profiel met paginering nodig? Dan is Methode 2 de juiste keuze, maar houd rekening met onderhoud wanneer TikTok zijn API-parameters aanpast.
Heb je te maken met login-walls, CAPTCHA’s of wil je maximale robuustheid? Gebruik Methode 3 met Playwright. Het is trager en zwaarder, maar TikTok kan het het lastigst blokkeren.

In de praktijk begin ik vaak met Methode 1 en schakel ik pas over naar Methode 2 of 3 als ik tegen beperkingen aanloop. Dat houdt de infrastructuur simpel en de kosten laag.

Geen Python nodig? Scrape TikTok-video’s met no-code tools

Veel mensen die zoeken op “scrape TikTok videos with Python” hebben eigenlijk helemaal geen Python nodig. Ze hebben de data nodig. Als je een marketinganalist bent die videometadata van een paar concurrentieprofielen wil ophalen, of een merkmanager die vermeldingen volgt, dan is een Python-omgeving opzetten met proxy-rotatie en signature-handling waarschijnlijk overkill.

Hier is een eerlijke vergelijking van de opties:

Aanpak	Vaardigheidsniveau	Kosten	Onderhoud	Beste voor
Python (zelf bouwen)	Gemiddeld+	Gratis (+ proxykosten)	Hoog (scripts breken)	Volledige controle, maatwerk-pijplijnen
Thunderbit (Chrome-extensie)	Beginner	Gratis tier beschikbaar	Geen (AI leest de site elke keer opnieuw)	Snel videodata ophalen, export naar Sheets/Excel
Apify TikTok Scraper	Beginner	Betaald (per run)	Laag (onderhouden door Apify)	Bulkautomatisering op schema
TikAPI	Ontwikkelaar	Betaald abonnement	Middel	Apps bouwen bovenop TikTok-data

Hoe Thunderbit TikTok-scraping aanpakt

Thunderbit is de AI-webscraper die we bij Thunderbit hebben gebouwd, en die werkt anders dan traditionele scrapingtools. In plaats van te vertrouwen op vooraf ingestelde CSS-selectors of XPath-regels (die stukgaan zodra TikTok zijn layout aanpast), leest Thunderbit’s AI de pagina telkens opnieuw en stelt relevante kolommen voor — beschrijving, likes, hashtags, video-URL, auteur, enzovoort.

De workflow bestaat echt uit twee klikken:

Open een TikTok-profiel in Chrome, klik op de Thunderbit-extensie en kies “AI Suggest Fields”. Thunderbit scant de pagina en stelt een tabelstructuur voor.
Controleer de voorgestelde kolommen, pas ze indien nodig aan en klik op “Scrape”.

De data exporteert direct naar Google Sheets, Excel, Airtable of Notion. Geen CSS-selectors om te onderhouden, geen code om te debuggen, geen proxyconfiguratie. Voor de marketinganalist die videometadata van een handvol profielen nodig heeft, is dit aantoonbaar sneller dan een Python-omgeving opzetten — en het breekt niet telkens wanneer TikTok zijn frontend bijwerkt (wat volgens community-rapporten om de paar weken gebeurt).

Thunderbit ondersteunt ook subpage scraping — het kan elke individuele videopagina bezoeken om je datatabel te verrijken met extra details zoals volledige commentaantallen, muziekinformatie of videoduur.

Je kunt het gratis proberen via de Thunderbit Chrome-extensie. Meer weten over hoe het werkt? Bekijk ons YouTube-kanaal.

Juridische en ethische richtlijnen voor TikTok-scraping

Geen enkele van de hoogst scorende tutorials over dit onderwerp bespreekt de legaliteit, wat opvallend is gezien het feit dat TikTok actief juridische stappen heeft ondernomen tegen scrapingdiensten. Dit moet je weten.

TikTok’s Servicevoorwaarden (§ 4.1) verbieden expliciet geautomatiseerde toegang. Overtreding van de voorwaarden is contractbreuk, geen strafbaar feit — maar het kan wel leiden tot accountblokkades, IP-blokkades of civiele procedures.

Het juridische landschap is minder streng dan veel mensen denken voor openbare data. Een belangrijk precedent is Meta Platforms v. Bright Data (N.D. Cal., jan. 2024), waarin de rechtbank oordeelde dat het scrapen van publiek toegankelijke data terwijl je bent uitgelogd niet in strijd is met Meta’s Servicevoorwaarden. Meta liet de zaak vallen en zag af van hoger beroep. De eerdere hiQ v. LinkedIn-uitspraak van het Ninth Circuit (na Van Buren opnieuw bevestigd) stelde vast dat het scrapen van publiek toegankelijke data geen schending van de CFAA is — al heeft hiQ uiteindelijk geschikt, $500K betaald en ingestemd met een permanent verbod, wat laat zien dat handhaving van voorwaarden nog steeds hard kan aankomen.

GDPR en CCPA zijn van toepassing als je persoonsgegevens verzamelt van EU- of Californische gebruikers. Openbare posts scrapen is één ding; databases bouwen met persoonlijke informatie van individuele gebruikers is iets heel anders.

Praktische richtlijnen:

Beperk je requests in tempo (bestook TikTok’s servers niet)
Scrape geen privé-accounts of content van minderjarigen
Verspreid auteursrechtelijk beschermde video’s niet commercieel opnieuw
Respecteer robots.txt (TikTok verbiedt de meeste geautomatiseerde crawls)
Video’s downloaden voor eigen onderzoek of analyse is iets anders dan ze opnieuw posten — maak dat onderscheid goed

Disclaimer: Dit is educatieve content, geen juridisch advies. Als je een commercieel product bouwt op basis van gescrapete TikTok-data, raadpleeg dan een jurist.

Afronding: belangrijkste conclusies

TikTok-scraping in 2025 is een bewegend doelwit. De anti-botstack van het platform behoort tot de meest geavanceerde op het web, en naïeve aanpakken (platte requests, door ChatGPT gegenereerde snippets, verouderde tutorials) zullen mislukken. Maar met de juiste methode is het absoluut haalbaar.

Dit zijn de kernpunten:

Methode 1 (verborgen JSON) is het snelst en eenvoudigst — begin hier voor snelle profielscrapes.
Methode 2 (interne API) geeft je paginering en bulktoegang, maar vraagt het meeste onderhoud omdat endpoints en signaturevereisten regelmatig wijzigen.
Methode 3 (Playwright) is het meest robuust tegen anti-botmaatregelen, maar kost snelheid en resources.
Alle drie de methodes kunnen videodownload-URL’s extraheren — en deze gids is de enige die je ook echt laat zien hoe je de .mp4-bestanden met de juiste headers downloadt.
Voor niet-technische gebruikers biedt Thunderbit een echt snellere route naar dezelfde data, zonder code te schrijven of te onderhouden. De AI-aanpak betekent dat het niet stukgaat wanneer TikTok zijn layout aanpast — wat volgens community-rapporten vaker gebeurt dan iedereen lief is.

Als je zonder Python-setup wilt starten, probeer dan de Thunderbit Chrome-extensie — de gratis versie is genoeg om het op een paar profielen te testen en te zien of het in je workflow past. Voor wie wél met Python aan de slag gaat: begin met Methode 1, valideer je data en schaal daarna op.

Wil je dieper duiken in webscraping-technieken? Bekijk dan onze gidsen over hoe je data van elke website scrapt, best practices voor webscraping en scrapen naar Google Sheets.

Veelgestelde vragen

Is het legaal om TikTok-video’s met Python te scrapen?

Het scrapen van publiek toegankelijke data zit juridisch in een grijs gebied, niet in een glashelder verbod. De uitspraak Meta v. Bright Data (2024) ondersteunt de stelling dat het scrapen van openbare data terwijl je bent uitgelogd niet in strijd is met de servicevoorwaarden van het platform. TikTok’s voorwaarden verbieden echter expliciet geautomatiseerde toegang, en GDPR/CCPA-verplichtingen gelden voor persoonsgegevens. Het is niet illegaal in de manier waarop veel mensen vrezen, maar ook zeker niet risicoloos. Raadpleeg een juridisch deskundige voor jouw specifieke situatie.

Wat is de beste Python-library voor TikTok-scraping?

Dat hangt af van je aanpak af. Voor het extraheren van verborgen JSON (Methode 1) heb je genoeg aan requests + beautifulsoup4. Voor interne API-calls (Methode 2) werken requests of httpx. Voor browserautomatisering (Methode 3) is playwright momenteel de standaard — het heeft Selenium inmiddels ingehaald in populariteit voor nieuwe scrapingprojecten, met ~59 miljoen maandelijkse PyPI-downloads tegenover Selenium’s ~53 miljoen. De TikTok-Api wrapper (~6,3K GitHub-stars) is ook het overwegen waard als je een hoger abstractieniveau wilt, al kan die gevoelig zijn voor veranderingen.

Kan ik TikTok-video’s zonder watermark downloaden met Python?

Ja. TikTok’s eigen data bevat een playAddr-URL die doorgaans een versie van de video zonder de standaard watermark-overlay levert. Deze gids laat zien hoe je die URL uit elk van de drie methodes haalt en de .mp4 downloadt met de juiste headers. Het veld downloadAddr bevat daarentegen de watermark.

Waarom geeft mijn TikTok-scraper lege data terug?

De meest voorkomende oorzaak is dat TikTok JavaScript nodig heeft om content te renderen. Een simpele requests.get() haalt alleen de shell-HTML op — de echte data zit óf in een verborgen JSON script-tag (Methode 1) óf wordt dynamisch geladen via JavaScript (Methode 3). Krijg je lege HTML, probeer dan eerst Methode 1. Werkt dat niet, controleer je headers (een ontbrekende Referer is de nummer 1 oorzaak van 403-fouten) of schakel over naar Methode 3 met Playwright.

Hoe voorkom ik dat ik geblokkeerd word bij TikTok-scraping?

Gebruik realistische browserheaders (inclusief User-Agent, Referer en Accept-Language), roteer residentiële of mobiele proxies (datacenter-IP’s worden binnen minuten gemarkeerd), voeg willekeurige vertragingen toe tussen requests (minimaal 1–3 seconden) en probeer niet op extreem hoge volumes te scrapen. Methode 3 (Playwright) biedt de hoogste weerstand tegen blokkades omdat het een echte browsersessie nabootst. Voor serieus volume moet je rekening houden met proxykosten — instap-residentiële proxies kosten bij grote aanbieders ongeveer $2–4 per GB.

Meer leren

Leer hoe je TikTok-video's scrapt met Python