A maioria dos TikTok Scrapers no GitHub está morta — veja o que fazer

Última atualização em April 22, 2026

Uma busca no GitHub por "tiktok scraper" retorna . Cerca de não recebem commits há mais de um ano, e pelo menos .

Se já clonou um repositório popular de TikTok scraper, passou uma hora a lutar com dependências e no fim não obteve qualquer saída, não está sozinho. O TikTok scraper com mais estrelas no GitHub, drawrowfly/tiktok-scraper, ainda tem mais de 5.000 estrelas. Mas o rastreador de issues está cheio de tópicos como e — ambos a relatar saída zero. Nos últimos meses, tenho acompanhado na Thunderbit o estado dos repositórios de TikTok scraping, e o padrão é impossível de ignorar: estas ferramentas partem rapidamente e a maioria nunca é corrigida. Este artigo é o guia prático de sobrevivência que eu gostava de ter encontrado quando comecei a avaliar estes repositórios. Vamos ver o que ainda funciona, o que já morreu, o que fazer em alternativa e como deixar de perder horas com código que já não funciona antes mesmo de o encontrar.

Por que é que a maioria dos TikTok Scrapers no GitHub falha (e continua a falhar)

O TikTok não é um alvo típico de scraping. A superfície web muda constantemente. Ao contrário de uma página estática de produto num e-commerce ou de uma listagem de diretório, o TikTok troca endpoints, atualiza a fingerprint anti-bot, altera métodos de renderização da página e introduz novos requisitos de sessão/token — às vezes poucas semanas depois da última alteração.

Os mantenedores de open source são voluntários. Quando o TikTok lança uma atualização que quebra o caminho de requisição do scraper, o repositório pode ficar inoperacional durante dias, semanas ou para sempre. Isto não é uma crítica aos mantenedores — é uma incompatibilidade estrutural entre uma plataforma muito financiada e que muda depressa, e desenvolvedores não remunerados que têm empregos a tempo inteiro.

Mesmo os melhores repositórios de TikTok scraper vivem numa roda-viva de corrigir-quebrar-corrigir. Se quiser usar um, precisa de uma estratégia para avaliar, diagnosticar problemas e ter sempre um plano B.

As defesas anti-bot do TikTok: com o que está a lidar

  • Limitação de taxa. A do TikTok documenta explicitamente quotas de requisição até para integrações aprovadas. Scrapers não oficiais batem nestes limites muito mais depressa.
  • Bloqueio por cookie e sessão. Repositórios modernos como exigem um ms_token; repositórios mais antigos como mostram tt_webid_v2 nos exemplos; documenta msToken, ttwid, X-Bogus e A_Bogus. O TikTok verifica se o pedido parece vir de uma sessão real de navegação.
  • Fingerprint do navegador. A explica por que razão os sites comparam headers, cookies, assinaturas TLS e atributos do navegador expostos por JavaScript com o tráfego de utilizadores reais. O aborda Canvas, WebGL, WebRTC, fontes e sinais de runtime. A fingerprint é a forma de o TikTok confirmar a identidade do seu navegador — se navegador, cookies, timing e assinatura de rede não coincidirem, o pedido parece falso antes mesmo de qualquer conteúdo ser devolvido.
  • Deteção comportamental. Tópicos no sobre scraping do TikTok referem com frequência que sessões novas do Playwright disparam CAPTCHA. Publicações da comunidade de descrevem cada vez mais deteção baseada no timing das ações e na qualidade da interação, e não apenas na reutilização de IP.
  • Parâmetros de pedido encriptados/assinados. O Evil0ctal documenta X-Bogus e A_Bogus; gists antigos da comunidade giram em torno de assinatura de URL e geração de token. O TikTok espera cada vez mais que os pedidos cheguem com os mesmos "carimbos" que o tráfego do próprio navegador/app carregaria.
  • Fluxos de CAPTCHA e verificação. A existência de e confirma que o CAPTCHA continua a fazer parte da superfície anti-bot.

Por que é que os mantenedores de open source não conseguem acompanhar

O ciclo é quase sempre o mesmo. Um developer cria um TikTok scraper. Ele torna-se viral no GitHub. O TikTok corrige a falha. O mantenedor ou resolve o problema ou segue em frente.

Dois repositórios ilustram isto na perfeição:

  • drawrowfly/tiktok-scraper ainda tem 5.052 estrelas e 889 forks, mas o seu . É exatamente o TikTok scraper com mais estrelas no GitHub e já parece um artefacto histórico: muita visibilidade, muita confiança, manutenção zero neste momento.
  • davidteather/TikTok-Api mostra . O seu mostra manutenção relevante em abril de 2025, julho de 2025, outubro de 2025 e abril de 2026 — incluindo correções para crawling de vídeos de utilizadores e novos controlos de proxy/sessão. Mas mesmo este projeto mais saudável avisa claramente que o TikTok bloqueia pedidos e que os utilizadores podem precisar de proxies, Playwright e lógica personalizada de sessão.

O padrão é simples:

  • Um repositório de TikTok scraper desatualizado provavelmente está morto.
  • Um repositório ativo de TikTok scraper provavelmente continua frágil.
  • A única diferença real é se ainda existe alguém por perto para corrigir as falhas este mês.

Checklist de 60 segundos para verificar a saúde do repositório: como avaliar qualquer TikTok Scraper no GitHub

Antes de clonar qualquer coisa, faça este checklist. Demora menos de um minuto e poupa horas de frustração.

Sinal🟢 Saudável🟡 Arriscado🔴 Morto
Último push relevanteHá menos de 3 mesesEntre 3 e 12 mesesHá 12+ meses
Quantidade de issues abertasBaixa; issues recentes recebem respostaA crescer, com alguma atividade do mantenedorMuitos relatos sem resposta de "quebrado/bloqueado/não funciona"
Queixas recentes de utilizadoresPrincipalmente dúvidas de configuraçãoMistura de dúvidas e falhasRelatos repetidos de "saída zero", "403", "ainda funciona?"
Modelo atual de auth/sessãoCaminho de sessão/cookie documentadoMuito baseado em tokens, mas documentadoDepende de endpoints web antigos, sem orientação atual de auth
Superfície de instalaçãoConfiguração reproduzível e testadaAlguns passos manuaisDependências antigas, sem notas modernas de setup
CI/testesExistem e estão atualizadosExistem, mas a cobertura não é claraSem testes ou actions desatualizadas
Aderência ao âmbito dos dadosCorresponde ao seu caso de uso realSuporta só parte do casoResolve um problema completamente diferente

Como verificar cada sinal em menos de 60 segundos

  1. Data do último push: veja o cabeçalho do repositório no GitHub. Se disser "last pushed 2 years ago", pode parar aí.
  2. Issues abertas: clique no separador Issues. Leia rapidamente os títulos mais recentes. Procure not working, 403, blocked, captcha ou zero output.
  3. Queixas de utilizadores: se as 5 issues abertas mais recentes forem variações de "isto já não funciona", já tem a resposta.
  4. Modelo de auth/sessão: abra o README. Procure orientação atual, como ms_token, setup com Playwright ou notas sobre proxy. Se o README citar endpoints de 2023, siga em frente.
  5. Superfície de instalação: veja se existe ficheiro de requirements, suporte a Docker ou instruções claras de setup. Se o README disser "npm install" e a última versão de Node testada for 14, espere problemas.
  6. CI/testes: verifique o separador Actions. Se os testes estiverem a falhar ou inexistentes, a resolução deixa de ser ciência e passa a adivinhação.
  7. Âmbito dos dados: o repositório descreve mesmo os tipos de dados de que precisa — perfis, metadados de vídeo, comentários, hashtags? Muitos repositórios só fazem download de vídeo, não extraem dados estruturados.

Sinais de alerta que significam "saia fora"

  • O repositório está arquivado.
  • O README diz "no longer maintained".
  • O último commit menciona uma versão da API do TikTok de há 2+ anos.
  • As issues estão inundadas com relatos de "doesn't work" e o mantenedor não responde há meses.
  • O repositório tem muitas estrelas, mas poucos forks ou pull requests recentes.

Dica: pesquise no separador Issues por is:issue is:open "not working" ou is:issue is:open "403". Se os resultados forem muitos e recentes, o repositório provavelmente está quebrado.

Repositórios populares de TikTok Scraper no GitHub: uma verificação honesta do estado (2026)

tiktok_scraper_repo_status_v1_a5c4a7a45c.png

Aqui está o checklist de saúde do repositório aplicado aos repositórios que realmente vai encontrar quando procurar "tiktok scraper" no GitHub:

RepositórioÚltimo PushEstrelasIssues AbertasVereditoObservação
drawrowfly/tiktok-scraper2023-05-195.05258🔴 Morto / apenas referênciaAinda famoso, mas demasiado desatualizado para uso em produção em 2026
davidteather/TikTok-Api2026-04-016.301134🟡 Vivo, mas exige muita manutençãoA opção OSS mais forte; espere Playwright, tokens e, muitas vezes, proxies
scrapfly/scrapfly-scrapers/tiktok-scraper2026-04-21938 (pai)~0 (monorepo)🟡 Vivo, mas não é OSS puroAtual e útil, mas requer chave da API ScrapFly
Evil0ctal/Douyin_TikTok_Download_API2025-10-1217.397135🟡 Vivo, amplo, complexoProjeto multi-plataforma rico em funcionalidades; mais próximo de uma plataforma para utilizadores avançados
naseif/tiktok-scraper2024-07-2610713🟡 ArriscadoRepositório mais pequeno com queixas em aberto sobre fluxo de informação do utilizador e hashtags
loewehancara1rmyv/Tiktok-scraper2026-01-1240🔴 Demasiado novo para confiarRepositório de montra, não validado pela comunidade

drawrowfly/tiktok-scraper

Durante anos, este scraper/downloader em TypeScript foi a resposta padrão para "tiktok scraper github" — cobrindo feeds de utilizadores, tendências, hashtags e música. Em 2026, é melhor tratá-lo como documentação histórica. O , e a fila de issues continua a incluir relatos por resolver de e de 2023–2025. Se está a ler este artigo porque clonou este repositório e não recebeu nada, está em boa companhia.

davidteather/TikTok-Api

O wrapper open source de dados do TikTok mais credível que ainda está vivo em 2026. Está ativo, tem e documenta explicitamente setup com Playwright, uso assíncrono, tratamento de tokens, suporte a proxy e funcionalidades de recuperação de sessão. Mas não é uma ferramenta de "clonar e usar". O próprio README diz que EmptyResponseException normalmente significa que o TikTok está a bloquear o pedido, e o mostra dores recorrentes com ms_token, extração quebrada de comentários, KeyError: 'ItemModule' e falhas específicas de endpoints. Veredito: vivo, útil, apenas para developers e com grande necessidade de manutenção.

Outros repositórios relevantes

  • : atual e tecnicamente relevante, mas o README exige uma SCRAPFLY_KEY. Este é um exemplo de código para uma plataforma de scraping gerida, não uma ferramenta gratuita e independente.
  • : cobre TikTok e Douyin, documenta lógica de assinatura (X-Bogus, A_Bogus, msToken) e suporta comentários, seguidores, playlists e muito mais. É tecnicamente exigente e está cada vez mais misturado com referências a APIs pagas. O rastreador de issues mostra bugs em curso em 2026 relacionados com links de vídeo e endpoints de informação do utilizador. Vivo e cheio de funcionalidades, mas complexo.
  • : mais pequeno, com queixas em aberto. Arriscado para produção.
  • : 4 estrelas, 0 issues, demasiado novo para confiar. O artigo no Medium que o promoveu fê-lo sem grande sentido crítico.

API oficial do TikTok vs. scrapers do GitHub vs. ferramentas no-code: um framework de decisão

tiktok_scraper_decision_framework_v1_590e6b1852.png

A maioria dos artigos concorrentes ignora as rotas oficiais de acesso do TikTok ou salta diretamente de "use GitHub" para "compre o nosso serviço". Aqui vai uma comparação neutra dos três caminhos:

FatorTikTok Research APIScrapers do GitHubFerramentas No-Code (ex.: Thunderbit)
Barreira de acessoÉ necessário pedido académico/empresarial; ~4 semanas para aprovaçãoGit clone + setupInstalação de extensão do navegador
Âmbito dos dadosApenas endpoints aprovados (contas, vídeos, comentários, lojas)Amplo (perfis, vídeos, comentários, hashtags, lojas)Dados visíveis na página (perfis, vídeos, engagement, hashtags)
Carga de manutençãoBaixa (oficial, estável)Alta (os repositórios partem quando o TikTok atualiza)Nenhuma (a IA adapta-se a mudanças no layout)
Risco de banimentoNenhum (autorizado)AltoBaixo (baseado no navegador, imita utilizador real)
CustoGratuita (se aprovada)Gratuito (mas consome tempo)Plano gratuito disponível; planos por créditos a partir de US$ 15/mês
Exige programaçãoSim (Python/R)Sim (Python/Node.js)Não
Melhor paraInvestigadores, académicos, organizações aprovadasDevelopers confortáveis com manutençãoProfissionais de marketing, vendas, operações e pessoas sem perfil técnico

Quando a TikTok Research API faz sentido

A do TikTok é o caminho oficial mais limpo, se se qualificar. Investigadores elegíveis nos podem candidatar-se para estudar conteúdo público e dados de contas. As categorias de dados disponíveis incluem contas, seguidores/seguindo, vídeos curtidos, vídeos fixados, vídeos republicados, conteúdo, comentários e lojas. O expõe campos como video_description, view_count, like_count, comment_count, share_count e campos de comentário como text, reply_count e create_time.

A desvantagem: a elegibilidade é limitada a instituições académicas e investigadores independentes ou de organizações sem fins lucrativos em regiões específicas, além de . Se é uma equipa de growth ou uma agência que precisa de dados operacionais rapidamente, este não é o seu caminho.

O TikTok também oferece uma para anúncios e dados de conteúdo de anunciantes, útil para investigação de transparência, mas não para scraping geral.

Quando um scraper do GitHub ainda faz sentido

Scrapers do GitHub continuam a fazer sentido para developers que precisam de acesso não oficial a dados públicos para além da barreira de aprovação da API oficial e estão dispostos a manter a stack. Isto inclui casos como scraping de grelhas visíveis de perfis, hashtags, comentários, playlists ou metadados de vídeo num pipeline personalizado em que fazer fork do repositório e corrigi-lo é aceitável.

A ressalva honesta: isto não é uma configuração única. Mesmo o repositório mais fiável de 2026, , continua a avisar os utilizadores de que poderão precisar de Playwright, cookies/tokens, proxies e fábricas personalizadas de páginas/sessões.

Quando uma ferramenta no-code como a Thunderbit faz sentido

Não é developer? Ou é developer cansado do ciclo de quebrar e corrigir? Uma ferramenta de IA baseada no navegador é o caminho mais rápido para dados estruturados do TikTok.

Criámos a como um raspador web com IA que funciona como extensão do Chrome. No TikTok, lê qualquer página visível — perfil, vídeo, hashtag, resultados de pesquisa —, sugere colunas através de "AI Suggest Fields" e permite clicar em "Scrape" para extrair dados estruturados. A documenta campos como data de publicação, duração do vídeo, gostos, partilhas, guardados, comentários, visualizações e hashtags. O mostra como recolher miniaturas de publicações, URLs, legendas, handles de criadores e sinais de engagement das páginas de perfil. O cobre URL do vídeo, nome de utilizador do criador, descrição, hora de publicação, visualizações, gostos, comentários, partilhas, som/áudio e URL da imagem de capa.

O scraping de subpáginas permite visitar cada página de vídeo a partir de uma listagem de perfil e enriquecer a tabela com métricas de engagement, legendas e hashtags — útil para profissionais de marketing que montam bases de influenciadores ou fazem auditorias ao conteúdo de concorrentes.

Sem manutenção, sem triagem de instalação, sem configuração anti-banimento. A IA adapta-se automaticamente a mudanças no layout. A exportação para Google Sheets, Excel, Airtable, Notion, CSV ou JSON é gratuita.

Se já perdeu horas com repositórios quebrados no GitHub, esta é uma alternativa legítima — não um pitch forçado de produto.

Triagem de instalação: corrigindo as 5 falhas de configuração mais comuns de TikTok Scraper no GitHub

Falhas de instalação são o terceiro ponto de dor mais citado em fóruns de scraping do TikTok, e nenhum guia grande ajuda realmente a resolvê-las. Eis o que costuma correr mal.

Conflitos de versão do Node.js

Problema: Muitos repositórios mais antigos de TikTok scraper (especialmente drawrowfly/tiktok-scraper) foram feitos para Node.js 14–16. Se estiver a correr Node 20+, npm install pode falhar silenciosamente ou gerar binários incompatíveis.

Correção: Use nvm (Node Version Manager) para instalar e alternar para a versão correta:

1nvm install 16
2nvm use 16
3npm install

Se o repositório não especificar uma versão do Node, verifique o campo engines em package.json ou veja a configuração de CI.

Problemas de dependências em Python e configuração do Playwright

Problema: exige e Playwright com binários específicos do browser. Os utilizadores recebem erros como "browser not found" ou conflitos de dependências.

Correção: Use sempre um ambiente virtual e instale explicitamente os browsers do Playwright:

1python -m venv .venv
2source .venv/bin/activate   # No Windows: .venv\Scripts\activate
3pip install TikTokApi
4python -m playwright install

Se playwright install falhar, verifique no gestor de pacotes do sistema se faltam dependências, como libnss3 no Ubuntu.

Erros de permissões no Linux/Ubuntu

Problema: Executar sudo pip install corrompe o ambiente Python do sistema e gera problemas em cascata de dependências.

Correção: Nunca use sudo pip install. Crie sempre primeiro um ambiente virtual:

1python3 -m venv .venv
2source .venv/bin/activate
3pip install -r requirements.txt

Isto isola as dependências do scraper do Python do sistema.

Problemas de caminho e codificação no Windows

Problema: O CMD do Windows tem problemas de codificação e limites de comprimento de caminho que partem instalações de scraper, especialmente quando o Playwright faz download de binários do browser para diretórios muito aninhados.

Correção: Use WSL (Windows Subsystem for Linux) ou Git Bash em vez do CMD. O WSL dá-lhe um ambiente Linux completo dentro do Windows:

1wsl --install
2# Depois, abra um terminal WSL e siga os passos de setup do Linux

O atalho com Docker: salte totalmente os problemas de dependências

Problema: Tudo o que foi dito acima.

Correção: Se se sentir à vontade com Docker, coloque o ambiente do scraper em contentor. Um Dockerfile básico para um TikTok scraper em Python fica assim:

1FROM python:3.11-slim
2RUN apt-get update && apt-get install -y libnss3 libatk-bridge2.0-0 libdrm2 libxcomposite1 libxdamage1 libxrandr2 libgbm1 libasound2
3RUN pip install TikTokApi playwright && python -m playwright install --with-deps chromium
4WORKDIR /app
5COPY . .
6CMD ["python", "scrape.py"]

Isto garante um ambiente reproduzível, independentemente do sistema operativo do host. Se o scraper funciona no Docker, qualquer falha fora dele é um problema de ambiente, não de código.

Fluxograma de troubleshooting:

  1. O repositório consegue correr o próprio exemplo com sucesso? → Se não, verifique a versão do runtime.
  2. A versão do runtime está correta? → Verifique a instalação do browser/Playwright.
  3. O browser está instalado? → Verifique tokens/cookies.
  4. Tokens/cookies são válidos? → Verifique se o TikTok está a bloquear a sessão.
  5. Tudo isto falhou? → Assuma que o repositório partiu, não que foi erro do utilizador. Troque de ferramenta.

Melhores práticas anti-ban para scraping do TikTok (sem pagar por proxies)

Utilizadores de fóruns queixam-se repetidamente de bans e deteção: "eles fazem a sua conta ser banida, o que é um custo adicional" e "sem usar Apify ou APIs pagas caras". Aqui estão alternativas práticas e gratuitas que não exigem assinatura de proxy paga.

tiktok_scraper_antiban_playbook_v1_3f3a302f6b.png

PráticaDificuldadeCustoEfetividade
Atrasos aleatórios entre pedidos (jitter de 2–8s)FácilGrátisModerada
Rotação de sessão/cookieMédiaGrátisModerada
Fazer scraping apenas de páginas públicas sem sessão iniciadaFácilGrátisModerada
Respeitar robots.txt + headers de limitação de taxaFácilGrátisBásica
Randomização da fingerprint do browser headless (Playwright)MédiaGrátisAlta
Usar endpoints da API móvel do TikTok (menor deteção)DifícilGrátisAlta
Rotação de proxy residencialMédiaUS$ 20–100/mêsAlta

Técnicas gratuitas que realmente ajudam

Atrasos aleatórios entre pedidos. Não envie pedidos em loop apertado. Adicione um jitter aleatório de 2 a 8 segundos entre pedidos. É a coisa mais simples que pode fazer:

1import time, random
2time.sleep(random.uniform(2, 8))

Reutilização de sessão e cookies. Não crie uma sessão completamente nova para cada pedido. Reutilize cookies e estado de sessão ao longo de um lote de pedidos e depois faça a rotação. É precisamente por isso que repositórios modernos pedem ms_token em vez de prometer scraping sem estado.

Faça scraping apenas de páginas públicas sem sessão iniciada. O que não suporta rotas autenticadas de utilizador e só funciona com dados visíveis quando se está deslogado. O scraping sem sessão tem um perfil de deteção mais baixo do que sessões autenticadas.

Respeite o robots.txt. O bloqueia muitos agentes por completo e só permite um conjunto limitado de caminhos públicos para crawling geral. Isto não autoriza scraping agressivo, mas respeitá-lo reduz a probabilidade de blacklist imediata do IP.

Técnicas intermédias para taxas de sucesso mais altas

Randomização da fingerprint do browser headless. Se estiver a usar Playwright, randomize o tamanho da viewport, o user-agent, o fuso horário e a localidade de cada sessão. Isto faz o scraper parecer um utilizador real diferente de cada vez, em vez do mesmo bot com um IP novo.

Uso dos endpoints móveis do TikTok. Alguns membros da comunidade relatam taxas de deteção mais baixas ao apontar para endpoints ao estilo mobile em vez da interface web. É mais difícil de implementar e menos documentado, mas é uma técnica real para utilizadores avançados.

Quando realmente precisa de proxy (e opções acessíveis)

Em escala, as técnicas gratuitas não chegam. A rotação de proxies residenciais é a abordagem padrão para scraping de alto volume no TikTok. Não vou recomendar aqui um serviço pago específico, mas a orientação geral é: evite proxies de data center (o TikTok sinaliza-os de forma agressiva) e procure pools de proxies residenciais ou móveis com rotação por pedido.

Como alternativa, ferramentas baseadas no browser como a contornam a questão do proxy porque correm na sua própria sessão de browser, imitando um utilizador real. Isto não as torna imunes à deteção em escala, mas, para casos típicos de marketing ou pesquisa — dezenas a centenas de páginas, não milhões —, é um caminho muito mais simples.

Que dados é que realmente obtém? Exemplos reais de saída de TikTok Scrapers

Os utilizadores querem saber que dados vão realmente receber antes de se comprometerem com uma ferramenta — e a maioria dos guias ignora esta parte por completo. Aqui estão estruturas de campos representativas, com base na documentação de origem.

Dados de perfil

Nome de utilizadorNome exibidoSeguidoresA seguirGostos totaisBioVerificadoURL do perfil
@examplecreatorJane Doe1.240.00031248.700.000"Culinária + comédia 🍳"tiktok.com/@examplecreator
@travelwithmarkMark S.890.00015022.100.000"Vlog de viagem 🌍"tiktok.com/@travelwithmark
@fitnessmayaMaya L.2.100.0008891.300.000"Treinos e bem-estar"tiktok.com/@fitnessmaya

Disponível em: scrapers do GitHub (TikTok-Api, Evil0ctal), Research API, Thunderbit (a partir de páginas visíveis de perfil).

Metadados de vídeo

URL do vídeoLegendaVisualizaçõesGostosComentáriosPartilhasMúsicaHashtagsData de publicaçãoDuração
tiktok.com/@ex/video/123"A melhor dica de massa de sempre 🍝"4.200.000312.0008.40021.000"Italian Vibes – DJ Marco"#pasta #cooking #hack2026-03-150:42
tiktok.com/@ex/video/456"POV: o teu gato está a julgar-te"9.100.0001.100.00023.00055.000"Original Sound"#cat #pov #funny2026-04-010:18
tiktok.com/@ex/video/789"Rotina da manhã que ninguém pediu"1.800.00098.0003.2007.500"Chill Morning – LoFi"#routine #morning2026-04-101:02

Disponível em: scrapers do GitHub (TikTok-Api, Evil0ctal), (campos incluem video_description, view_count, like_count, comment_count, share_count, music_id, hashtag_names, video_duration), Thunderbit ().

Dados de comentários

ComentadorTexto do comentárioGostosHoraRespostas
@user_abc"Testei isto e funciona mesmo 😂"1.2002026-03-16T08:12:00Z14
@chef_dan"Coloca alho da próxima vez, acredita"8902026-03-16T09:45:00Z7
@randomfan99"É este tipo de conteúdo que eu queria ver"3402026-03-16T11:30:00Z2

Disponível em: scrapers do GitHub (TikTok-Api, Evil0ctal), (campos incluem text, like_count, reply_count, create_time), Thunderbit (a partir das secções visíveis de comentários).

Dados de hashtags e pesquisa

HashtagURL do vídeo principalVisualizações agregadasEm destaque
#pastatiktok.com/@ex/video/1234.200.000Sim
#cookingtiktok.com/@chef/video/32111.000.000Sim
#hacktiktok.com/@tips/video/6542.900.000Não

Disponível em: scrapers do GitHub (varia consoante o repositório), Thunderbit ().

Nota: nenhum repositório único garante todos os campos o tempo todo. As estruturas de resposta do TikTok mudam, e até os mantenedores avisam para isso. Considere estes exemplos como representativos, não garantidos.

Como extrair dados do TikTok em 2 cliques com a Thunderbit (passo a passo)

Cansado do ciclo de quebrar e corrigir? Aqui está o caminho no-code — a saída de emergência para quem tentou e falhou com repositórios do GitHub.

  1. Instale a .
  2. Navegue até à página do TikTok que quer extrair — um perfil, uma página de resultados de pesquisa, uma página de hashtag ou um vídeo individual.
  3. Clique em "AI Suggest Fields". A IA da Thunderbit lê a página e sugere colunas: nome de utilizador, seguidores, legenda do vídeo, gostos, hashtags, etc.
  4. Ajuste os campos se necessário e clique em "Scrape". Os dados aparecem numa tabela estruturada.
  5. Use o scraping de subpáginas para enriquecer os dados. Clique em cada vídeo da listagem de perfil e puxe campos adicionais: legenda completa, detalhes da música, número de comentários, número de partilhas.
  6. Exporte para Google Sheets, Excel, Airtable ou Notion — totalmente grátis.

Sem manutenção, sem triagem de instalação, sem configuração anti-banimento. A IA adapta-se automaticamente às mudanças de layout do TikTok.

Enriquecendo dados do TikTok com scraping de subpáginas

Depois de extrair uma lista de vídeos de um perfil ou página de hashtag, clique em "Scrape Subpages" para que a IA visite cada página de vídeo e puxe campos adicionais. Isto é especialmente útil para profissionais de marketing que constroem bases de influenciadores ou fazem auditorias ao conteúdo de concorrentes — obtém uma tabela completa de dados de engagement ao nível de vídeo sem ter de clicar manualmente em dezenas de páginas.

Exportar e usar os seus dados do TikTok

A Thunderbit exporta para Google Sheets, Excel, Airtable, Notion, CSV ou JSON — tudo grátis. Casos de uso comuns:

  • Colocar os dados numa folha de cálculo para análise de engagement.
  • Enviar para o Airtable como rastreador de influenciadores ao estilo CRM.
  • Levar para o Notion para colaboração da equipa em pesquisas de conteúdo.

Para uma visão mais aprofundada sobre como a Thunderbit trata a extração de dados da web, veja o nosso ou assista aos tutoriais no .

Manter-se dentro da lei: Termos de Serviço do TikTok e conformidade no scraping

A posição legal do TikTok é clara. O da plataforma diz que os Termos de Serviço proíbem scripts automatizados que recolhem informações ou interagem com o serviço de formas não autorizadas, e menciona explicitamente a tentativa de contornar restrições de acesso. As do TikTok também proíbem tentativas enganosas de obter informações através de scripts automatizados ou web crawling.

Orientação prática:

  • Fique pelos dados publicamente disponíveis. Não faça scraping de conteúdo privado ou protegido por login.
  • Respeite os limites de taxa. Não sobrecarregue os servidores do TikTok.
  • Cumpra as leis de privacidade de dados. GDPR e CCPA continuam a aplicar-se se estiver a recolher, armazenar ou analisar dados pessoais.
  • Use a Research API quando tiver elegibilidade. É o caminho mais seguro do ponto de vista da conformidade.
  • Isto não é सलाह jurídica. Consulte um profissional para a sua situação específica.

Para saber mais sobre o panorama legal, veja o nosso guia sobre .

O que fazer quando o seu repositório de TikTok Scraper no GitHub morre

Resumo curto:

  1. Execute sempre o checklist de saúde do repositório de 60 segundos antes de clonar qualquer TikTok scraper do GitHub. A maioria dos repositórios já está morta.
  2. Perceba as suas opções. API oficial, scrapers do GitHub e ferramentas no-code servem utilizadores e casos de uso diferentes.
  3. Se optar pelo caminho do GitHub, reserve tempo para troubleshooting de instalação e configuração anti-banimento. Espere manutenção contínua.
  4. Saiba que dados vai realmente obter antes de se comprometer com uma ferramenta. Verifique os campos de saída, não apenas a contagem de estrelas.
  5. Se não é developer (ou está cansado de repositórios quebrados), experimente uma ferramenta no-code como a — dois cliques, dados estruturados, exportação gratuita.

Os dados do TikTok de que precisa estão acessíveis. A questão é se quer gastar o seu tempo a manter um scraper ou a usar realmente os dados. Escolha a abordagem que faz sentido para o seu nível técnico e caso de uso, e não deixe um repositório morto no GitHub desperdiçar outra tarde.

Perguntas frequentes

Existem scrapers de TikTok no GitHub que ainda funcionam em 2026?

Sim, mas a lista é curta. é a opção open source mais fiável com manutenção ativa até abril de 2026. também continua vivo, mas é mais complexo. O repositório com mais estrelas, drawrowfly/tiktok-scraper, não é atualizado desde maio de 2023 e está, na prática, morto. Execute sempre o checklist de saúde do repositório antes de investir tempo em qualquer repositório.

Os Termos de Serviço do TikTok proíbem explicitamente scraping automatizado. Dados visíveis publicamente entram numa zona jurídica cinzenta que varia consoante a jurisdição. O caminho mais seguro é a oficial para investigadores elegíveis. Se fizer scraping de dados públicos, mantenha-se em conteúdo acessível publicamente, respeite os limites de taxa e cumpra GDPR/CCPA. Isto não é aconselhamento jurídico — consulte um profissional para a sua situação.

Posso fazer scraping do TikTok sem programar?

Sim. Ferramentas de IA baseadas no browser, como a , permitem extrair dados estruturados do TikTok (perfis, metadados de vídeo, hashtags, métricas de engagement) sem escrever código. A TikTok Research API também exige programação mínima para candidatos aprovados. Para pessoas sem perfil técnico, as ferramentas no-code são o caminho mais rápido e fiável.

Que dados posso obter de um TikTok scraper?

Os tipos de dados mais comuns incluem informação de perfil (nome de utilizador, seguidores, bio, estado de verificação), metadados de vídeo (legenda, visualizações, gostos, comentários, partilhas, música, hashtags, duração, data de publicação), comentários (texto, gostos, hora, respostas) e dados de hashtags/pesquisa (vídeos principais, visualizações agregadas, estado de tendência). Os campos exatos dependem da ferramenta e do método — veja acima a secção com exemplos de saída para detalhes.

Por que razão o meu TikTok scraper continua a ser bloqueado?

O TikTok usa várias camadas de defesa anti-bot: limitação de taxa, bloqueio por cookie/sessão, fingerprint do navegador, deteção comportamental, parâmetros de pedido encriptados e fluxos de CAPTCHA. Causas comuns de bloqueio incluem enviar pedidos demasiado depressa, usar uma sessão limpa/nova para cada pedido, correr um browser headless com fingerprints padrão ou usar proxies de data center. Veja a secção de melhores práticas anti-ban acima para alternativas gratuitas e pagas.

Sumário

Experimente o Thunderbit

Extraia leads e outros dados em apenas 2 cliques. Com IA.

Obtenha o Thunderbit É grátis
Extraia dados usando IA
Transfira dados facilmente para Google Sheets, Airtable ou Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week