GitHub의 TikTok 스크래퍼 대부분은 죽었습니다 — 이제 이렇게 하세요

최종 업데이트: April 22, 2026

GitHub에서 "tiktok scraper"를 검색하면 가 나옵니다. 이 중 약 는 1년 넘게 푸시되지 않았고, 적어도 되어 있습니다.

인기 있는 TikTok 스크래퍼 저장소를 클론해 놓고 한 시간 동안 의존성 문제와 씨름하다가, 결국 아무 출력도 못 본 적이 있다면 — 혼자가 아닙니다. GitHub에서 가장 별이 많은 TikTok 스크래퍼인 drawrowfly/tiktok-scraper는 지금도 별 5,000개가 넘습니다. 하지만 이슈 트래커를 보면 , 같은 글이 가득하고, 둘 다 출력이 없다고 보고하고 있습니다. Thunderbit에서 몇 달 동안 TikTok 스크래핑 저장소의 상태를 추적해 온 결과, 패턴은 분명합니다. 이런 도구는 금방 깨지고, 대부분은 끝내 고쳐지지 않습니다. 이 글은 제가 처음 이 저장소들을 평가하던 때 꼭 있었으면 했던 실전 생존 가이드입니다. 지금 살아 있는 것, 죽은 것, 대신 무엇을 해야 하는지, 그리고 찾기도 전에 이미 멈춰 버린 코드에 몇 시간을 낭비하지 않는 방법까지 다룹니다.

GitHub의 대부분 TikTok 스크래퍼가 깨지는 이유, 그리고 계속 깨지는 이유

TikTok은 일반적인 스크래핑 대상이 아닙니다. 웹 표면이 계속 바뀝니다. 정적인 이커머스 상품 페이지나 디렉터리 목록과 달리, TikTok은 엔드포인트를 바꾸고, 안티봇 지문 인식을 업데이트하고, 페이지 렌더링 방식을 바꾸고, 새로운 세션/토큰 요구사항을 추가합니다. 마지막 변경 후 몇 주 안에 이런 일이 일어나기도 합니다.

오픈소스 유지관리자는 자원봉사자입니다. TikTok이 업데이트를 배포해 스크래퍼의 요청 경로를 망가뜨리면, 저장소는 며칠, 몇 주, 심지어 영구적으로도 깨진 채 남을 수 있습니다. 이건 유지관리자를 탓하려는 게 아닙니다. 빠르게 움직이고 자금도 충분한 플랫폼과, 본업이 따로 있는 무급 개발자 사이의 구조적 불일치일 뿐입니다.

최고 수준의 TikTok 스크래퍼 저장소조차도 결국 고장-수정의 반복에 올라타 있습니다. 하나를 쓰려면 평가, 문제 해결, 백업 계획이 모두 필요합니다.

TikTok의 안티봇 방어: 맞서야 할 것들

  • 요청 제한. TikTok의 는 승인된 연동에도 요청 쿼터를 명시적으로 문서화합니다. 비공식 스크래퍼는 이 제한에 훨씬 더 빨리 닿습니다.
  • 쿠키 및 세션 게이팅. 같은 최신 저장소는 ms_token을 요구하고, 같은 오래된 저장소는 예제에 tt_webid_v2를 사용하며, msToken, ttwid, X-Bogus, A_Bogus를 문서화합니다. TikTok은 요청이 실제 브라우징 세션에서 온 것처럼 보이는지 확인합니다.
  • 브라우저 지문 인식. 는 사이트가 헤더, 쿠키, TLS 시그니처, JavaScript로 노출되는 브라우저 특성을 실제 사용자 트래픽과 비교하는 이유를 설명합니다. 에서는 Canvas, WebGL, WebRTC, 폰트, 런타임 신호까지 다룹니다. 지문 인식은 TikTok이 브라우저의 신분증을 확인하는 것과 같습니다. 브라우저, 쿠키, 타이밍, 네트워크 시그니처가 맞지 않으면, 콘텐츠가 반환되기도 전에 요청이 가짜처럼 보입니다.
  • 행동 기반 탐지. TikTok 스크래핑에 대한 에서는 새 Playwright 세션이 CAPTCHA를 유발한다는 언급이 자주 나옵니다. 커뮤니티 글은 IP 재사용뿐 아니라 행동 타이밍과 상호작용 품질을 보는 탐지가 점점 더 늘고 있다고 설명합니다.
  • 암호화/서명된 요청 파라미터. Evil0ctal은 X-BogusA_Bogus를 문서화하고, 오래된 커뮤니티 gist들은 URL 서명과 토큰 생성에 집중합니다. TikTok은 점점 자사 브라우저/앱 트래픽이 가지고 오는 것과 같은 “도장”이 붙은 요청을 기대합니다.
  • CAPTCHA 및 검증 흐름. 의 존재만 봐도 CAPTCHA가 여전히 안티봇 표면의 일부라는 걸 알 수 있습니다.

오픈소스 유지관리자가 따라잡을 수 없는 이유

흐름은 늘 같습니다. 개발자가 TikTok 스크래퍼를 만들고, GitHub에서 크게 퍼지고, TikTok이 패치하고, 유지관리자가 고치거나 떠납니다.

두 저장소가 이 패턴을 정확히 보여줍니다.

  • drawrowfly/tiktok-scraper는 여전히 별 5,052개와 포크 889개를 보유하고 있지만, 입니다. GitHub에서 가장 별이 많은 정확한 구문의 TikTok 스크래퍼이지만, 지금 보면 높은 가시성과 높은 신뢰, 그리고 현재 유지관리는 없는 역사적 유물에 가깝습니다.
  • davidteather/TikTok-Api을 보여줍니다. 에는 2025년 4월, 7월, 10월, 2026년 4월에 의미 있는 유지보수가 있었고, 여기에는 사용자 비디오 크롤링과 새로운 프록시/세션 제어 수정도 포함됩니다. 하지만 이보다 건강한 프로젝트조차 TikTok이 요청을 차단하고, 사용자가 프록시, Playwright, 커스텀 세션 로직이 필요할 수 있다고 명시적으로 경고합니다.

패턴은 간단합니다.

  • 오래된 TikTok 스크래퍼 저장소는 아마 죽은 것입니다.
  • 살아 있는 TikTok 스크래퍼 저장소도 아마 여전히 불안정합니다.
  • 진짜 차이는 이번 달 깨진 부분을 고칠 사람이 아직 남아 있느냐뿐입니다.

60초 저장소 생체 신호 체크리스트: GitHub의 어떤 TikTok 스크래퍼든 평가하는 법

아무거나 클론하기 전에 이 체크리스트를 실행하세요. 1분도 안 걸리고, 수 시간의 좌절을 막아줍니다.

신호🟢 건강함🟡 위험함🔴 죽음
마지막 의미 있는 푸시3개월 이내3~12개월 전12개월 이상 전
열린 이슈 수적고, 최근 이슈에 답변이 있음쌓여 가지만 일부 유지관리 활동이 있음"깨짐/차단됨/작동 안 함" 보고가 많이 쌓이고 답변이 없음
최근 사용자 불만대부분 설정 질문설정 질문과 깨짐 불만이 섞여 있음"출력 없음", "403", "아직 작동하나요?"가 반복됨
현재 인증/세션 모델세션/쿠키 방식이 문서화됨토큰 의존도가 높지만 문서화됨현재 인증 안내 없이 오래된 웹 엔드포인트에 의존함
설치 난이도재현 가능하고 테스트된 설정수동 단계가 일부 있음오래된 의존성, 현대적인 설정 노트 없음
CI/테스트테스트가 있고 최신임테스트는 있지만 커버리지가 불명확함테스트 없음 또는 오래된 액션
데이터 범위 적합성실제 사용 사례와 맞음사용 사례의 일부만 지원함아예 다른 문제를 해결함

60초 안에 각 신호를 확인하는 법

  1. 마지막 푸시 날짜: GitHub 저장소 헤더를 보세요. "마지막 푸시 2년 전"이면 끝입니다.
  2. 열린 이슈: Issues 탭을 클릭하세요. 가장 최근 제목을 훑고 not working, 403, blocked, captcha, zero output를 검색하세요.
  3. 사용자 불만: 열린 이슈 상위 5개가 전부 "이제 안 됩니다"의 변형이라면, 답은 이미 나온 겁니다.
  4. 인증/세션 모델: README를 여세요. ms_token, Playwright 설정, 프록시 노트 같은 최신 안내가 있는지 보세요. README가 2023년 엔드포인트를 언급한다면 넘어가세요.
  5. 설치 난이도: requirements 파일, Docker 지원, 명확한 설정 지침을 확인하세요. README에 "npm install"만 있고 마지막으로 테스트된 Node 버전이 14라면 문제가 생길 가능성이 큽니다.
  6. CI/테스트: Actions 탭을 보세요. 테스트가 실패 중이거나 없으면, 깨짐 여부는 추측일 뿐입니다.
  7. 데이터 범위: 저장소가 실제로 필요한 데이터 유형(프로필, 비디오 메타데이터, 댓글, 해시태그)을 설명하나요? 많은 저장소는 비디오 다운로드만 하고 구조화된 데이터 추출은 하지 않습니다.

"그냥 포기하세요"를 의미하는 빨간 신호

  • 저장소가 아카이브되어 있음.
  • README에 "더 이상 유지보수하지 않음"이라고 적혀 있음.
  • 마지막 커밋이 2년 이상 된 TikTok API 버전을 참조함.
  • 이슈가 "작동 안 함" 보고로 넘쳐나는데 유지관리자가 몇 달째 반응이 없음.
  • 별은 많은데 최근 포크나 풀 리퀘스트가 없음.

팁: Issues 탭에서 is:issue is:open "not working" 또는 is:issue is:open "403"를 검색하세요. 결과가 많고 최신이라면, 저장소는 아마 깨진 상태입니다.

인기 있는 TikTok 스크래퍼 GitHub 저장소: 솔직한 상태 점검(2026)

tiktok_scraper_repo_status_v1_a5c4a7a45c.png

GitHub에서 "tiktok scraper"를 검색하면 실제로 마주치게 될 저장소들에 Repo 생체 신호 체크리스트를 적용해 보았습니다.

저장소마지막 푸시열린 이슈판정메모
drawrowfly/tiktok-scraper2023-05-195,05258🔴 죽음 / 참고용아직 유명하지만, 2026년 프로덕션용으로는 너무 오래됨
davidteather/TikTok-Api2026-04-016,301134🟡 살아 있지만 유지보수 부담 큼가장 강력한 오픈소스 선택지; Playwright, 토큰, 종종 프록시가 필요함
scrapfly/scrapfly-scrapers/tiktok-scraper2026-04-21938 (상위 저장소)~0 (모노레포)🟡 살아 있지만 순수 오픈소스는 아님최신이고 유용하지만 ScrapFly API 키가 필요함
Evil0ctal/Douyin_TikTok_Download_API2025-10-1217,397135🟡 살아 있음, 범위 넓음, 복잡함기능이 많은 멀티플랫폼 프로젝트; 고급 사용자용 플랫폼에 가까움
naseif/tiktok-scraper2024-07-2610713🟡 위험함사용자 정보와 해시태그 흐름에 대한 불만이 있는 소규모 저장소
loewehancara1rmyv/Tiktok-scraper2026-01-1240🔴 너무 새로워서 신뢰하기 어려움커뮤니티 검증을 거치지 않은 쇼케이스용 저장소

drawrowfly/tiktok-scraper

수년 동안 이 TypeScript 스크래퍼/다운로더는 "tiktok scraper github"에 대한 기본 답이었습니다. 사용자, 트렌드, 해시태그, 음악 피드를 처리했기 때문입니다. 2026년에는 역사 문서로 보는 것이 가장 좋습니다. 이고, 이슈 큐에는 2023~2025년의 해결되지 않은 , 보고가 남아 있습니다. 이 저장소를 클론했다가 아무것도 얻지 못해서 이 글을 읽고 있다면, 당신만 그런 게 아닙니다.

davidteather/TikTok-Api

2026년에도 가장 신뢰할 만한 살아 있는 오픈소스 TikTok 데이터 래퍼입니다. 활성 상태이고, 가 있으며, Playwright 설정, 비동기 사용, 토큰 처리, 프록시 지원, 세션 복구 기능을 명시적으로 문서화합니다. 하지만 "클론 후 바로 사용" 도구는 아닙니다. README 자체가 EmptyResponseException은 보통 TikTok이 요청을 차단하고 있다는 뜻이라고 말하며, 에서는 ms_token, 깨진 댓글 추출, KeyError: 'ItemModule', 엔드포인트별 실패에 대한 반복적인 고통이 보입니다. 판정: 살아 있음, 유용함, 개발자 전용, 유지보수 부담 큼.

주목할 만한 다른 저장소

  • : 최신이고 기술적으로도 관련성이 높지만, README에서 SCRAPFLY_KEY를 요구합니다. 이건 무료 독립 도구가 아니라 관리형 스크래핑 플랫폼의 코드 예시입니다.
  • : TikTok과 Douyin을 모두 다루고, 서명 로직(X-Bogus, A_Bogus, msToken)을 문서화하며, 댓글, 팔로워, 재생목록 등을 지원합니다. 기술 난도가 높고, 유료 API 참조와도 점점 더 얽히고 있습니다. 이슈 트래커에서는 2026년에도 비디오 링크와 사용자 정보 엔드포인트에 대한 버그 보고가 계속 보입니다. 살아 있고 기능도 많지만 복잡합니다.
  • : 더 작고, 공개 불만도 있습니다. 프로덕션용으로는 위험합니다.
  • : 별 4개, 이슈 0개, 너무 새로워서 신뢰하기 어렵습니다. 이를 홍보한 Medium 글은 비판 없이 소개했습니다.

TikTok 공식 API vs. GitHub 스크래퍼 vs. 노코드 도구: 의사결정 프레임워크

tiktok_scraper_decision_framework_v1_590e6b1852.png

대부분의 경쟁 글은 TikTok의 공식 접근 경로를 무시하거나, 곧바로 "GitHub를 쓰라"에서 "우리 서비스를 사라"로 넘어갑니다. 아래는 세 가지 경로를 중립적으로 비교한 표입니다.

요소TikTok 연구 APIGitHub 스크래퍼노코드 도구(예: Thunderbit)
접근 장벽학술/비즈니스 신청 필요; 승인까지 약 4주Git 클론 + 설정브라우저 확장 설치
데이터 범위승인된 엔드포인트만 (계정, 비디오, 댓글, 상점)넓음(프로필, 비디오, 댓글, 해시태그, 상점)보이는 페이지 데이터(프로필, 비디오, 참여도, 해시태그)
유지보수 부담낮음(공식, 안정적)높음(TikTok 업데이트 시 저장소가 깨짐)없음(AI가 레이아웃 변경에 적응)
차단 위험없음(승인됨)높음낮음(브라우저 기반, 실제 사용자처럼 동작)
비용무료(승인 시)무료(하지만 시간 소모 큼)무료 요금제 있음; 월 $15부터 크레딧 기반 플랜
코딩 필요 여부예(Python/R)예(Python/Node.js)아니요
가장 적합한 대상연구자, 학계, 승인된 조직유지보수에 익숙한 개발자마케터, 세일즈 팀, 운영팀, 비개발자

TikTok 연구 API가 적합한 경우

TikTok의 는 자격이 된다면 가장 깔끔한 공식 경로입니다. 의 적격 연구자는 공개 콘텐츠와 계정 데이터를 연구하기 위해 신청할 수 있습니다. 사용 가능한 데이터 범주에는 계정, 팔로워/팔로잉, 좋아요한 비디오, 고정된 비디오, 다시 게시한 비디오, 콘텐츠, 댓글, 상점이 포함됩니다. video_description, view_count, like_count, comment_count, share_count 같은 필드와 댓글 수준의 text, reply_count, create_time 같은 필드를 제공합니다.

단점은 자격이 특정 지역의 학술 기관과 자격을 갖춘 비영리/독립 연구자, 그리고 로 제한된다는 점입니다. 성장팀이나 에이전시처럼 빠른 운영 데이터를 원하는 경우에는 적합한 경로가 아닙니다.

TikTok은 광고 및 광고주 콘텐츠 데이터용 도 제공하며, 이는 투명성 연구에는 유용하지만 일반적인 스크래핑에는 해당하지 않습니다.

GitHub 스크래퍼가 여전히 유효한 경우

GitHub 스크래퍼는 공식 API의 승인 장벽을 넘지 못하는 공개 데이터에 비공식적으로 접근해야 하고, 스택 유지보수도 감수할 수 있는 개발자에게는 여전히 의미가 있습니다. 여기에는 저장소를 포크해 패치하는 것이 허용되는 자체 파이프라인에서, 보이는 프로필 그리드, 해시태그, 댓글, 재생목록, 비디오 메타데이터를 스크래핑하는 경우가 포함됩니다.

솔직한 주의점은 이것이 한 번 설정하고 끝나는 작업이 아니라는 점입니다. 2026년 기준 가장 믿을 만한 저장소 중 하나인 조차도 여전히 Playwright, 쿠키/토큰, 프록시, 커스텀 페이지/세션 팩토리가 필요할 수 있다고 사용자에게 말합니다.

Thunderbit 같은 노코드 도구가 적합한 경우

개발자가 아니신가요? 아니면 고장 나면 고치기를 반복하는 사이클에 지치셨나요? 브라우저 기반 AI 도구가 구조화된 TikTok 데이터로 가는 가장 빠른 길입니다.

우리는 를 Chrome 확장 프로그램으로 동작하는 AI 웹 스크래퍼로 만들었습니다. TikTok에서 Thunderbit은 보이는 ցանկացած 페이지(프로필, 비디오, 해시태그, 검색 결과)를 읽고, "AI 필드 제안"으로 열을 추천한 뒤, "스크래핑"을 클릭하면 구조화된 데이터를 추출할 수 있게 합니다. 에는 게시 날짜, 비디오 길이, 좋아요, 공유, 저장, 댓글, 조회수, 해시태그 같은 필드가 문서화되어 있습니다. 은 프로필 페이지에서 게시물 썸네일, URL, 캡션, 작성자 핸들, 참여 신호를 수집하는 방법을 보여줍니다. 은 비디오 URL, 작성자 사용자 이름, 설명, 게시 시간, 조회수, 좋아요, 댓글, 공유, 소리/오디오, 커버 이미지 URL을 다룹니다.

서브페이지 스크래핑을 사용하면 프로필 목록에서 각 비디오 페이지로 들어가 참여 지표, 캡션, 해시태그를 보강할 수 있습니다. 인플루언서 데이터베이스를 만들거나 경쟁사 콘텐츠 감사를 하는 마케터에게 특히 유용합니다.

유지보수 없음, 설치 트리아주 없음, 안티봇 설정 없음. AI가 레이아웃 변경에 자동으로 적응합니다. Google Sheets, Excel, Airtable, Notion, CSV, JSON으로 무료 내보내기가 가능합니다.

깨진 GitHub 저장소에 몇 시간을 태워버렸다면, 이건 억지로 끼워 넣은 제품 홍보가 아니라 진짜 대안입니다.

설치 트리아주: 가장 흔한 5가지 TikTok 스크래퍼 GitHub 설정 실패 고치기

설치 실패는 TikTok 스크래핑 포럼에서 세 번째로 많이 언급되는 문제인데, 주요 가이드 중 실제로 도움이 되는 건 거의 없습니다. 무엇이 잘못되는지 살펴보겠습니다.

Node.js 버전 충돌

문제: 많은 오래된 TikTok 스크래퍼 저장소(특히 drawrowfly/tiktok-scraper)는 Node.js 14~16용으로 만들어졌습니다. Node 20 이상을 사용 중이라면 npm install이 조용히 실패하거나 호환되지 않는 바이너리를 만들 수 있습니다.

해결: nvm(Node Version Manager)으로 올바른 버전을 설치하고 전환하세요.

1nvm install 16
2nvm use 16
3npm install

저장소가 Node 버전을 명시하지 않으면 package.jsonengines 필드를 확인하거나 CI 설정을 보세요.

Python 의존성 문제와 Playwright 설정

문제: 와 특정 브라우저 바이너리가 포함된 Playwright가 필요합니다. 사용자는 "browser not found" 같은 오류나 의존성 충돌을 겪습니다.

해결: 항상 가상 환경을 사용한 뒤, Playwright 브라우저를 명시적으로 설치하세요.

1python -m venv .venv
2source .venv/bin/activate   # Windows에서는: .venv\Scripts\activate
3pip install TikTokApi
4python -m playwright install

playwright install이 실패하면, 시스템 패키지 관리자에서 누락된 시스템 의존성(예: Ubuntu의 libnss3)을 확인하세요.

Linux/Ubuntu 권한 오류

문제: sudo pip install을 실행하면 시스템 Python 환경이 망가지고 연쇄적인 의존성 문제가 생깁니다.

해결: sudo pip install은 절대 쓰지 마세요. 항상 먼저 가상 환경을 만드세요.

1python3 -m venv .venv
2source .venv/bin/activate
3pip install -r requirements.txt

이렇게 하면 스크래퍼의 의존성이 시스템 Python과 분리됩니다.

Windows 경로 및 인코딩 문제

문제: Windows CMD는 인코딩 문제와 경로 길이 제한 때문에, 특히 Playwright가 중첩된 디렉터리에 브라우저 바이너리를 다운로드할 때 설치가 깨질 수 있습니다.

해결: CMD 대신 WSL(Windows Subsystem for Linux)이나 Git Bash를 사용하세요. WSL은 Windows 안에서 완전한 Linux 환경을 제공합니다.

1wsl --install
2# 그다음 WSL 터미널을 열고 Linux 설정 단계를 따르세요

Docker로 한 번에 넘기기: 의존성 문제를 통째로 건너뛰기

문제: 위의 모든 것.

해결: Docker를 편하게 쓸 수 있다면, 스크래퍼 환경을 컨테이너화하세요. Python 기반 TikTok 스크래퍼용 기본 Dockerfile은 다음과 같습니다.

1FROM python:3.11-slim
2RUN apt-get update && apt-get install -y libnss3 libatk-bridge2.0-0 libdrm2 libxcomposite1 libxdamage1 libxrandr2 libgbm1 libasound2
3RUN pip install TikTokApi playwright && python -m playwright install --with-deps chromium
4WORKDIR /app
5COPY . .
6CMD ["python", "scrape.py"]

이렇게 하면 호스트 OS와 상관없이 재현 가능한 환경이 보장됩니다. Docker에서는 작동하는데 밖에서만 실패한다면, 문제는 코드가 아니라 환경입니다.

문제 해결 플로우차트:

  1. 저장소 자체 예제가 성공적으로 실행되나요? → 아니오면 런타임 버전을 확인하세요.
  2. 런타임 버전이 맞나요? → 브라우저/Playwright 설치를 확인하세요.
  3. 브라우저가 설치됐나요? → 토큰/쿠키를 확인하세요.
  4. 토큰/쿠키가 유효한가요? → TikTok이 세션을 차단하는지 확인하세요.
  5. 위 항목이 전부 실패하나요? → 사용자 실수보다 저장소 자체의 깨짐을 의심하고, 도구를 바꾸세요.

TikTok 스크래핑 안티밴 모범 사례(프록시 비용 없이)

포럼 사용자들은 반복해서 차단과 탐지를 불평합니다. "계정을 차단해서 추가 비용이 든다", "Apify나 비싼 유료 API 없이"라는 식입니다. 아래는 유료 프록시 구독 없이도 가능한 무료 실전 우회책입니다.

tiktok_scraper_antiban_playbook_v1_3f3a302f6b.png

방법난이도비용효과
무작위 요청 지연(2~8초 지터)쉬움무료보통
세션/쿠키 회전보통무료보통
로그인되지 않은 공개 페이지만 스크래핑쉬움무료보통
robots.txt + rate-limit 헤더 준수쉬움무료기본
헤드리스 브라우저 지문 랜덤화(Playwright)보통무료높음
TikTok 모바일 API 엔드포인트 사용(탐지 감소)어려움무료높음
주거용 프록시 회전보통월 $20~100높음

실제로 도움이 되는 무료 기법

무작위 요청 지연. 요청을 빡빡하게 연속 실행하지 마세요. 요청 사이에 2~8초의 무작위 지터를 넣으세요. 가장 쉽게 할 수 있는 방법입니다.

1import time, random
2time.sleep(random.uniform(2, 8))

세션과 쿠키 재사용. 요청할 때마다 완전히 새 세션을 만들지 마세요. 여러 요청에서 쿠키와 세션 상태를 재사용한 뒤, 주기적으로 회전하세요. 최신 저장소들이 ms_token을 요구하면서 무상태 스크래핑을 장담하지 않는 이유가 바로 이것입니다.

로그아웃된 공개 페이지 스크래핑. 사용자 인증 경로를 지원하지 않으며, 로그인하지 않았을 때 보이는 데이터에서만 작동한다고 말합니다. 로그아웃 상태 스크래핑은 인증된 세션보다 탐지 가능성이 낮습니다.

robots.txt 준수. TikTok의 는 많은 에이전트를 아예 차단하고, 일반 크롤링에 허용되는 공개 경로도 제한적으로만 열어 둡니다. 공격적인 스크래핑을 해도 된다는 뜻은 아니지만, 이를 준수하면 즉시 IP 블랙리스트에 오를 가능성은 줄어듭니다.

성공률을 높이는 중간 단계 기법

헤드리스 브라우저 지문 랜덤화. Playwright를 쓴다면 세션마다 뷰포트 크기, 사용자 에이전트 문자열, 시간대, 로케일을 랜덤화하세요. 그러면 같은 봇이 새 IP로 다시 오는 것보다, 매번 다른 실제 사용자처럼 보일 수 있습니다.

TikTok 모바일 API 엔드포인트 사용. 일부 커뮤니티 구성원은 웹 프런트엔드보다 모바일 스타일 엔드포인트를 겨냥할 때 탐지율이 낮다고 보고합니다. 구현은 더 어렵고 문서도 적지만, 고급 사용자에게는 실제로 통하는 기법입니다.

프록시가 정말 필요한 경우와 합리적인 옵션

대규모에서는 무료 기법만으로는 부족합니다. 주거용 프록시 회전이 대량 TikTok 스크래핑의 표준 접근법입니다. 여기서는 특정 유료 프록시 서비스를 추천하지 않겠지만, 일반적인 조언은 이렇습니다. 데이터센터 프록시는 피하고(TikTok이 공격적으로 플래그합니다), 요청마다 회전 가능한 주거용 또는 모바일 프록시 풀을 찾으세요.

또는 같은 브라우저 기반 도구는 여러분의 브라우저 세션 안에서 실제 사용자처럼 동작하기 때문에 프록시 문제를 아예 우회합니다. 대규모에서 탐지가 완전히 불가능해지는 건 아니지만, 일반적인 마케팅이나 연구 사용 사례(수백만 페이지가 아니라 수십~수백 페이지)에서는 훨씬 단순한 경로입니다.

실제로 어떤 데이터를 얻을 수 있나요? TikTok 스크래퍼의 실제 출력 예시

사용자는 도구를 쓰기 전에 실제로 어떤 데이터를 얻는지 알고 싶어 합니다. 그런데 대부분의 가이드는 이 부분을 완전히 건너뜁니다. 아래는 소스 문서에 근거한 대표적인 필드 구조입니다.

프로필 데이터

사용자 이름표시 이름팔로워 수팔로잉 수총 좋아요 수소개글인증 여부프로필 URL
@examplecreatorJane Doe1,240,00031248,700,000"요리 + 코미디 🍳"tiktok.com/@examplecreator
@travelwithmarkMark S.890,00015022,100,000"여행 브이로거 🌍"tiktok.com/@travelwithmark
@fitnessmayaMaya L.2,100,0008891,300,000"운동 & 웰니스"tiktok.com/@fitnessmaya

제공 출처: GitHub 스크래퍼(TikTok-Api, Evil0ctal), Research API, Thunderbit(보이는 프로필 페이지에서).

비디오 메타데이터

비디오 URL캡션조회수좋아요 수댓글 수공유 수음악해시태그게시일길이
tiktok.com/@ex/video/123"역대급 파스타 팁 🍝"4,200,000312,0008,40021,000"Italian Vibes – DJ Marco"#pasta #cooking #hack2026-03-150:42
tiktok.com/@ex/video/456"POV: 고양이가 당신을 평가 중"9,100,0001,100,00023,00055,000"Original Sound"#cat #pov #funny2026-04-010:18
tiktok.com/@ex/video/789"아무도 묻지 않은 아침 루틴"1,800,00098,0003,2007,500"Chill Morning – LoFi"#routine #morning2026-04-101:02

제공 출처: GitHub 스크래퍼(TikTok-Api, Evil0ctal), (video_description, view_count, like_count, comment_count, share_count, music_id, hashtag_names, video_duration 포함), Thunderbit().

댓글 데이터

댓글 작성자댓글 내용좋아요 수타임스탬프답글 수
@user_abc"이거 해봤는데 진짜 되네요 😂"1,2002026-03-16T08:12:00Z14
@chef_dan"다음엔 마늘을 넣어 보세요, 믿어 보세요"8902026-03-16T09:45:00Z7
@randomfan99"제가 원한 바로 그 콘텐츠예요"3402026-03-16T11:30:00Z2

제공 출처: GitHub 스크래퍼(TikTok-Api, Evil0ctal), (text, like_count, reply_count, create_time 포함), Thunderbit(보이는 댓글 섹션에서).

해시태그 및 검색 데이터

해시태그상위 비디오 URL전체 조회수트렌딩 여부
#pastatiktok.com/@ex/video/1234,200,000
#cookingtiktok.com/@chef/video/32111,000,000
#hacktiktok.com/@tips/video/6542,900,000아니요

제공 출처: GitHub 스크래퍼(저장소별로 다름), Thunderbit().

참고: 어떤 단일 저장소도 모든 필드를 항상 보장하지는 않습니다. TikTok 응답 구조는 바뀌고, 유지관리자들도 그 점을 경고합니다. 위 표는 보장값이 아니라 대표 예시로 보세요.

Thunderbit로 TikTok 데이터를 2번 클릭으로 스크래핑하는 방법(단계별)

고장-수정 사이클에 지치셨나요? GitHub 저장소로 시도했다가 실패한 사람들을 위한 탈출구, 노코드 경로를 소개합니다.

  1. 을 설치하세요.
  2. 스크래핑하려는 TikTok 페이지로 이동하세요 — 프로필, 검색 결과 페이지, 해시태그 페이지, 개별 비디오 모두 가능합니다.
  3. "AI 필드 제안"을 클릭하세요. Thunderbit의 AI가 페이지를 읽고 사용자 이름, 팔로워 수, 비디오 캡션, 좋아요, 해시태그 등의 열을 추천합니다.
  4. 필요하면 필드를 조정한 뒤 "스크래핑"을 클릭하세요. 데이터가 구조화된 표로 채워집니다.
  5. 서브페이지 스크래핑으로 데이터를 보강하세요. 프로필 목록에서 각 비디오를 열어 전체 캡션, 음악 정보, 댓글 수, 공유 수 같은 추가 필드를 가져올 수 있습니다.
  6. Google Sheets, Excel, Airtable, Notion으로 내보내세요 — 완전히 무료입니다.

유지보수 없음, 설치 트리아주 없음, 안티봇 설정 없음. AI가 TikTok 레이아웃 변경에 자동으로 적응합니다.

서브페이지 스크래핑으로 TikTok 데이터 보강하기

프로필이나 해시태그 페이지에서 비디오 목록을 스크래핑한 뒤 "서브페이지 스크래핑"을 클릭하면 AI가 각 비디오 페이지를 방문해 추가 필드를 가져옵니다. 인플루언서 데이터베이스를 만들거나 경쟁사 콘텐츠 감사를 수행하는 마케터에게 특히 유용합니다. 수십 개 페이지를 일일이 클릭하지 않고도 비디오 수준의 참여 데이터 전체 표를 얻을 수 있습니다.

TikTok 데이터 내보내기와 활용하기

Thunderbit는 Google Sheets, Excel, Airtable, Notion, CSV, JSON으로 무료 내보내기를 지원합니다. 일반적인 사용 사례는 다음과 같습니다.

  • 참여도 분석을 위해 스프레드시트에 데이터를 넣기.
  • CRM 스타일의 인플루언서 추적용으로 Airtable에 보내기.
  • 팀 협업용 콘텐츠 리서치를 위해 Notion으로 넘기기.

Thunderbit의 웹 데이터 추출 방식을 더 자세히 보려면 를 확인하거나 에서 튜토리얼을 보세요.

합법적으로 유지하기: TikTok 이용약관과 스크래핑 준수

TikTok의 법적 입장은 명확합니다. 플랫폼의 는 이용약관이 정보 수집이나 서비스와의 비인가 상호작용을 하는 자동화 스크립트를 금지하며, 접근 제한 우회도 명시적으로 언급한다고 설명합니다. TikTok의 도 자동화 스크립트나 웹 크롤링을 통해 정보를 기만적으로 얻으려는 시도를 금지합니다.

실무 지침:

  • 공개된 데이터만 다루세요. 비공개 콘텐츠나 로그인 게이트 콘텐츠는 스크래핑하지 마세요.
  • 요청 제한을 지키세요. TikTok 서버를 과도하게 두드리지 마세요.
  • 데이터 보호법을 준수하세요. 개인정보를 수집, 저장, 분석한다면 GDPR과 CCPA가 여전히 적용됩니다.
  • 자격이 된다면 Research API를 사용하세요. 준수 관점에서 가장 안전한 경로입니다.
  • 이 내용은 법률 자문이 아닙니다. 자신의 상황에는 전문가와 상담하세요.

법적 쟁점에 대해 더 알고 싶다면 가이드를 참고하세요.

TikTok 스크래퍼 GitHub 저장소가 죽었을 때 해야 할 일

짧게 말하면:

  1. GitHub에서 어떤 TikTok 스크래퍼든 클론하기 전에 항상 60초 저장소 생체 신호 체크리스트를 실행하세요. 대부분의 저장소는 이미 죽어 있습니다.
  2. 선택지를 이해하세요. 공식 API, GitHub 스크래퍼, 노코드 도구는 각각 다른 사용자와 사용 사례를 위한 것입니다.
  3. GitHub 방식을 택한다면, 설치 문제 해결과 안티밴 설정에 시간을 확보하세요. 지속적인 유지보수를 각오해야 합니다.
  4. 도구를 쓰기 전에 실제로 어떤 데이터를 얻을지 알아두세요. 별 개수보다 출력 필드를 확인하세요.
  5. 개발자가 아니거나 깨진 저장소에 지쳤다면, 같은 노코드 도구를 써 보세요 — 두 번 클릭, 구조화된 데이터, 무료 내보내기.

필요한 TikTok 데이터는 접근 가능합니다. 문제는 스크래퍼를 유지보수하는 데 시간을 쓸지, 아니면 실제로 데이터를 쓸지입니다. 자신의 숙련도와 사용 사례에 맞는 방식을 고르고, 죽은 GitHub 저장소가 또 한 오후를 날려 버리게 두지 마세요.

자주 묻는 질문

2026년에도 GitHub에서 아직 작동하는 TikTok 스크래퍼가 있나요?

네, 하지만 목록은 짧습니다. 는 2026년 4월 기준으로 활발히 유지보수되는 가장 신뢰할 만한 오픈소스 선택지입니다. 도 살아 있지만 더 복잡합니다. 가장 별이 많은 drawrowfly/tiktok-scraper는 2023년 5월 이후 업데이트되지 않았고, 사실상 죽었습니다. 어떤 저장소든 시간 투자 전에 항상 저장소 생체 신호 체크리스트를 실행하세요.

TikTok 스크래핑은 합법인가요?

TikTok의 이용약관은 자동화된 스크래핑을 명시적으로 금지합니다. 공개적으로 보이는 데이터는 관할권에 따라 법적 회색지대에 놓일 수 있습니다. 자격이 된다면 가장 안전한 경로는 공식 입니다. 공개 데이터를 스크래핑한다면 공개 접근 가능한 콘텐츠만 다루고, 요청 제한을 지키며, GDPR/CCPA를 준수하세요. 이 내용은 법률 자문이 아니므로, 자신의 상황은 전문가와 상담하세요.

코딩 없이 TikTok을 스크래핑할 수 있나요?

네. 같은 브라우저 기반 AI 도구를 쓰면 코드를 한 줄도 쓰지 않고도 구조화된 TikTok 데이터(프로필, 비디오 메타데이터, 해시태그, 참여 지표)를 추출할 수 있습니다. TikTok Research API도 승인된 신청자에게는 최소한의 코딩만 요구합니다. 비개발자에게는 노코드 도구가 가장 빠르고 안정적인 경로입니다.

TikTok 스크래퍼로 어떤 데이터를 얻을 수 있나요?

일반적인 데이터 유형에는 프로필 정보(사용자 이름, 팔로워 수, 소개글, 인증 여부), 비디오 메타데이터(캡션, 조회수, 좋아요, 댓글, 공유, 음악, 해시태그, 길이, 게시일), 댓글(텍스트, 좋아요, 타임스탬프, 답글), 해시태그/검색 데이터(상위 비디오, 총 조회수, 트렌딩 상태)가 포함됩니다. 정확한 필드는 도구와 방식에 따라 다릅니다. 자세한 내용은 위의 출력 예시 섹션을 보세요.

왜 내 TikTok 스크래퍼는 계속 차단되나요?

TikTok은 요청 제한, 쿠키/세션 게이팅, 브라우저 지문 인식, 행동 기반 탐지, 암호화된 요청 파라미터, CAPTCHA 흐름 등 여러 층의 안티봇 방어를 사용합니다. 차단의 흔한 원인은 너무 빠른 요청, 요청마다 깨끗한 새 세션 사용, 기본 지문을 가진 헤드리스 브라우저 실행, 데이터센터 프록시 사용입니다. 무료 및 유료 우회책은 위의 안티밴 모범 사례 섹션을 참고하세요.

목차

Thunderbit 사용해보기

단 2번 클릭으로 리드와 기타 데이터를 수집하세요. AI로 구동됩니다.

Thunderbit 받기 무료입니다
AI로 데이터 추출하기
Google Sheets, Airtable, Notion으로 데이터를 쉽게 전송하세요
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week