Facebook Scraper GitHub: Co stále funguje a co už ne

Vyhledávání na GitHubu pro výraz "facebook scraper" vrací . Jen byly aktualizovány v posledních šesti měsících.

Právě tenhle rozdíl mezi tím, co je „k dispozici“, a tím, co „skutečně funguje“, je celý příběh scrapování Facebooku na GitHubu v roce 2026.

Strávil jsem spoustu času procházením záložek s issues, stížností na Redditu i skutečného výstupu z těchto nástrojů. Vzor je pořád stejný: většina projektů s vysokým počtem hvězdiček je tiše rozbitá, správci se tomu už nevěnují a Facebook dál zpřísňuje své obranné mechanismy proti scrapingu. Vývojáři i byznys uživatelé pořád končí na stejných výsledcích hledání, instalují stejné repozitáře a narážejí na stejný prázdný výstup. Tenhle článek je realitní kontrola pro rok 2026 — upřímný audit toho, které repozitáře si ještě zaslouží vaši pozornost, co Facebook dělá pro jejich rozbíjení a kdy byste měli GitHub rovnou přeskočit.

Proč lidé hledají Facebook Scraper na GitHubu

Důvody pro tohle hledání jsou stejné jako už roky — i když se nástroje pořád rozpadají:

Generování leadů: získávání kontaktních údajů z firemních stránek (e-maily, telefonní čísla, adresy) pro oslovení
Monitoring Marketplace: sledování produktových nabídek, cen a údajů o prodejcích pro ecommerce nebo arbitráž
Výzkum skupin: archivace příspěvků a komentářů pro průzkum trhu, OSINT nebo správu komunit
Archivace obsahu a příspěvků: ukládání veřejných příspěvků stránek, reakcí, obrázků a časových údajů
Agregace událostí: stahování názvů událostí, dat, míst a organizátorů

Přitažlivost GitHubu je jasná: viditelný kód, nulové náklady, komunitní údržba (alespoň teoreticky) a plná kontrola nad poli i datovým tokem.

Problém je v tom, že hvězdičky a forky neznamenají „aktuálně funkční“. Z deseti nejhvězdičkovanějších repozitářů s přesnou frází bylo k dubnu 2026 . Není to náhoda — je to norma.

Jeden uživatel Redditu v to po šesti měsících snažení popsal naprosto přímo: bylo to „nemožné bez placení za externí aplikaci na scraping dat“ nebo bez použití Pythonu, JS renderingu a značného výpočetního výkonu. Jiný uživatel v to shrnul takto: „Facebook je jeden z těžších cílů na scraping, protože agresivně blokuje automatizaci“ a automatizace v prohlížeči je „křehká, protože Facebook neustále mění svůj DOM.“

Případy použití jsou reálné. Poptávka je reálná. Frustrace je velmi reálná. Zbytek článku je o tom, jak se v tom rozdílu zorientovat.

Co přesně je Facebook Scraper GitHub repozitář?

„Facebook scraper“ na GitHubu je open-source skript — většinou v Pythonu — který programově získává veřejná data z Facebook stránek, příspěvků, skupin, Marketplace nebo profilů. Ne všechny fungují stejně. Dominují tři architektury:

Scrapery pro automatizaci prohlížeče vs. API wrappery vs. přímé HTTP scrapery

Přístup	Typický stack	Síla	Slabina
Automatizace prohlížeče	Selenium, Playwright, Puppeteer	Zvládne přihlašovací brány, napodobuje chování reálného uživatele	Pomalé, náročné na zdroje, snadno rozpoznatelné, pokud nejsou správně nastavené
Wrapper nad oficiálním API	Meta Graph API / Pages API	Stabilní, zdokumentované, při schválení v souladu s pravidly	Silně omezené — většina veřejných dat z příspěvků/skupin už není dostupná
Přímý HTTP scraper	`requests`, parsování HTML, nezdokumentované endpointy	Rychlý a lehký, když funguje	Rozbije se pokaždé, když Facebook změní strukturu stránky nebo proti-bot opatření

je klasický příklad přímého HTTP přístupu: scrapuje veřejné stránky „bez API klíče“ pomocí přímých requestů a parsování. je ukázka automatizace v prohlížeči. představuje starší éru Graph API, kdy šlo skripty tahat příspěvky ze stránek a skupin přes oficiální endpointy, které už nejsou obecně dostupné.

Typická cílová data napříč těmito repozitáři zahrnují text příspěvků, časová razítka, počty reakcí a komentářů, URL obrázků, metadata stránky (kategorie, telefon, e-mail, počet sledujících), pole z Marketplace a metadata skupin či událostí.

V roce 2026 není hlavní trade-off volba jazyka. Je to to, jaký typ selhání jste ochotni tolerovat.

Audit čerstvosti Facebook Scraper GitHub repozitářů pro rok 2026: Které repozitáře skutečně fungují?

Porovnal jsem nejhvězdičkovanější a nejdoporučovanější Facebook scraper repozitáře na GitHubu s reálnými daty pro rok 2026 — ne s tvrzeními v README, ale se skutečnými daty commitů, frontami issues a hlášeními komunity. Tohle je část, na které záleží nejvíc.

Kompletní tabulka auditu čerstvosti

Repozitář	Hvězdičky	Poslední push	Otevřené issues	Jazyk / runtime	Co ještě scrapuje	Stav
kevinzg/facebook-scraper	3,157	2024-06-22	438	Python ^3.6	Omezené veřejné příspěvky stránek, některé komentáře/obrázky, metadata stránky	⚠️ Částečně rozbité / zastaralé
moda20/facebook-scraper	110	2024-06-14	29	Python ^3.6	Totéž co kevinzg + pomocné metody pro Marketplace	⚠️ Částečně rozbitý / zastaralý fork
minimaxir/facebook-page-post-scraper	2,128	2019-05-23	53	Éra Pythonu 2/3, závislé na Graph API	Jen historická reference	❌ Opuštěný
apurvmishra99/facebook-scraper-selenium	232	2020-06-28	7	Python + Selenium	Automatizace prohlížeče pro scraping stránek	❌ Opuštěný
passivebot/facebook-marketplace-scraper	375	2024-04-29	3	Python 3.x + Playwright 1.40	Nabídky z Marketplace přes automatizaci prohlížeče	⚠️ Křehký / úzce zaměřený
Mhmd-Hisham/selenium_facebook_scraper	37	2022-11-29	1	Python + Selenium	Obecné Selenium scrapování	❌ Opuštěný
anabastos/faceteer	20	2023-07-11	5	JavaScript	Zaměřené na automatizaci	❌ Rizikové / málo důkazů

Z toho vyčnívá několik věcí:

I ten „aktivní fork“ (moda20) nebyl aktualizován od června 2024.
Fronty issues říkají skutečný příběh rychleji než README.
Jak kevinzg, tak moda20 stále deklarují Python ^3.6 ve svých souborech — což je signál, že základ závislostí nebyl modernizován.

kevinzg/facebook-scraper

Nejznámější Python Facebook scraper na GitHubu. Jeho popisuje scraping stránek, scraping skupin, přihlášení přes přihlašovací údaje nebo cookies a pole na úrovni příspěvku jako comments, image, images, likes, post_id, post_text, text a time.

Operační signál je ale slabý:

Poslední push: 22. června 2024
Otevřené issues: — včetně titulků jako „Example Scrape does not return any posts“
Správce nereagoval na nedávné problémy

Verdikt: Částečně rozbité. Má stále hodnotu pro malé experimenty s veřejnými stránkami a jako reference názvů polí, ale pro produkční použití není spolehlivý.

moda20/facebook-scraper (komunitní fork)

Nejviditelnější fork repozitáře kevinzg, s přidanými možnostmi a pomocnými funkcemi orientovanými na Marketplace, jako je extract_listing (zdokumentované v jeho ).

mluví o problému naprosto otevřeně:

„mbasic je pryč“
„CLI ‚Couldn't get any posts.‘“
„https://mbasic.facebook.com už nefunguje“

Když se zjednodušené rozhraní mbasic změní nebo zmizí, celá třída scraperů se najednou rozpadne.

Verdikt: Nejsledovanější fork, ale v roce 2026 také zastaralý a křehký. Pokud trváte na řešení přes GitHub, je to první, co stojí za zkoušku, ale na stabilitu nespoléhejte.

minimaxir/facebook-page-post-scraper

Kdysi velmi praktický nástroj pro Graph API na získávání příspěvků, reakcí, komentářů a metadat z veřejných Stránek a otevřených Skupin do CSV. Jeho stále vysvětluje, jak použít App ID a App Secret Facebook aplikace.

V roce 2026 je to historický artefakt:

Poslední push: 23. května 2019
Otevřené issues: 53 — včetně „HTTP 400 Error Bad Request“ a „No data retrieved!!“

Verdikt: Opuštěný. Těsně navázaný na model oprávnění API, který Meta od té doby výrazně omezila.

Další pozoruhodné repozitáře

passivebot/facebook-marketplace-scraper: Užitečný pro scénáře s Marketplace, ale jeho obsahuje „login to view the content“, „CSS selectors outdated“ a „Getting blocked“. Jednověté shrnutí toho, co se na scrapingu Marketplace rozbíjí.
apurvmishra99/facebook-scraper-selenium: Má issue doslova s otázkou ze září 2020. To vám řekne skoro všechno.
Mhmd-Hisham/selenium_facebook_scraper a anabastos/faceteer: Ani jeden z nich nemá dost současné aktivity, aby si zasloužil důvěru.

Obranné mechanismy Facebooku proti scrapingu: s čím se musí vypořádat každý GitHub scraper

Většina článků na tohle téma nabízí vágní upozornění typu „zkontrolujte ToS“. To není užitečné.

Facebook má jeden z nejagresivnějších systémů proti scrapingu ze všech velkých platforem. Pochopit konkrétní vrstvy obrany je rozdíl mezi fungujícím scraperem a odpolednem s prázdným výstupem.

Samotná inženýrská publikace Meta z popisuje „Anti Scraping team“, který používá statickou analýzu napříč celým kódem k identifikaci scrapingových vektorů, posílá výzvy k ukončení činnosti, deaktivuje účty a spoléhá na systémy rate-limitingu. To není hypotéza — je to organizační závazek.

Náhodné DOM a názvy CSS tříd

Facebook záměrně náhodně mění ID HTML prvků, názvy tříd a strukturu stránek. Jak to formuloval jeden komentující na : „Žádný normální scraper nemůže na Facebooku fungovat. HTML se mezi obnoveními mění.“

Co se rozbije: XPath a CSS selektory, které fungovaly minulý týden, dnes nevrátí nic.

Protiopatření: Kde je to možné, používejte selektory založené na textu nebo atributech. Lepší je také AI parsing, který čte obsah stránky, než spoléhání na rigidní selektory. Údržbu selektorů berte jako opakující se náklad.

Přihlašovací brány a správa relací

Mnoho částí Facebooku — profily, skupiny, některé nabídky v Marketplace — vyžaduje pro zobrazení přihlášení. Headless prohlížeče jsou přesměrovány nebo dostanou ořezaný HTML obsah. V záložce issues u Marketplace scrapera passivebot je jednou z nejčastějších stížností.

Co se rozbije: Anonymní requesty obsah nenajdou nebo skončí na přesměrování.

Protiopatření: Použijte session cookies z reálné relace v prohlížeči nebo nástroje pro scraping v prohlížeči, které běží v rámci vaší přihlášené relace. Střídání účtů je možné, ale rizikové.

Digitální fingerprinting

Inženýrská publikace Meta říká, že neautorizované scrapery — což je v praxi přiznání, že kvalita prohlížeče i chování jsou klíčové pro detekci. Komunitní diskuze z i dál doporučují anti-detect prohlížeče a konzistentní fingerprinty.

Co se rozbije: Standardní Selenium nebo Puppeteer sestavy se dají snadno identifikovat.

Protiopatření: Používejte nástroje jako undetected-chromedriver nebo anti-detect profily prohlížeče. Realistické relace a konzistentní fingerprinty jsou důležitější než pouhé spoofování user-agentu.

IP-based rate limiting a blokování

Inženýrská publikace Meta výslovně popisuje rate limiting jako součást obranné strategie, včetně omezení počtu položek ve sledovaném seznamu followerů tak, aby vzniklo více requestů, které pak . V praxi uživatelé hlásí, že se rate-limity spustí po publikování do .

Co se rozbije: Hromadné requesty ze stejné IP jsou během minut zpomaleny nebo zablokovány. Datacentrové proxy IP bývají často zablokované předem.

Protiopatření: Rotace rezidenčních proxy (ne datacentrových) s rozumným tempem requestů.

Změny GraphQL schématu

Některé scrapery spoléhají na interní GraphQL endpointy Facebooku, protože vracejí čistší strukturovaná data než surové HTML. Meta ale nezveřejňuje garanci stability pro interní GraphQL, takže tyto dotazy selhávají potichu — vrátí prázdná data místo chyb.

Co se rozbije: Strukturovaný sběr dat vrací potichu nic.

Protiopatření: Přidejte validační kontroly, sledujte schema endpointy a připínejte se na ověřené dotazy. Počítejte s údržbou.

Shrnutí obranných mechanismů proti scrapingu

Vrstva obrany	Jak rozbíjí váš scraper	Praktické protiopatření
Proměnlivá struktura rozhraní / nestabilní selektory	XPath a CSS selektory vrací nic nebo jen část polí	Dávejte přednost odolným ukotvením, ověřujte proti viditelnému výstupu stránky, počítejte s údržbou
Přihlašovací brány	Odhlášené requesty obsah minou nebo skončí přesměrováním	Používejte platné session cookies nebo nástroje s relací v prohlížeči
Fingerprinting	Standardní automatizace působí uměle	Používejte reálné prohlížeče, konzistentní kvalitu relace, anti-detect opatření
Rate limiting	Prázdný výstup, blokace, zpomalování	Pomalejší tempo, menší dávky, rotace rezidenčních proxy
Změny interních dotazů	Strukturovaný sběr vrací potichu prázdná data	Přidejte validační kontroly, počítejte s úpravami dotazů

Když GitHub repozitáře selžou: úniková cesta bez kódu

Velká část lidí, kteří hledají „facebook scraper github“, nejsou vývojáři. Jsou to obchodníci hledající e-maily firemních stránek, provozovatelé ecommerce sledující ceny na Marketplace nebo marketéři dělající analýzu konkurence. Nechtějí spravovat Python prostředí, ladit rozbité selektory ani rotovat proxy.

Pokud to zní jako vy, rozhodovací strom je krátký:

Scrapování kontaktních údajů z Facebook stránek (e-maily, telefonní čísla)

Pokud jde o získání e-mailů a telefonních čísel ze sekce „O nás“ na stránkách, je GitHub repozitář zbytečně moc. Bezplatný a od projdou webovou stránku a výsledky exportují do Sheets, Excelu, Airtable nebo Notion. AI stránku pokaždé čte znovu, takže změny DOMu Facebooku workflow nerozbijí.

Scrapování strukturovaných dat z Marketplace nebo firemních stránek

Pro získávání produktových nabídek, cen, lokací nebo firemních údajů vám Thunderbit AI Web Scraper umožní kliknout na „AI Suggest Fields“ — AI stránku přečte a navrhne sloupce jako cena, název, lokalita — a pak kliknete na „Scrape“. Žádná údržba XPath, žádná instalace kódu. Výstup můžete přímo exportovat do .

Plánované monitorování (cenové alerty na Marketplace, sledování konkurence)

Pro průběžné sledování — „upozorni mě, když nabídka na Marketplace odpovídá mému cenovému rozmezí“ — vám od Thunderbit umožní popsat interval běžným jazykem (třeba ) a nastavit URL. Běží automaticky, bez potřeby cron jobu.

Kdy je GitHub repozitář pořád správná volba

Pokud potřebujete hlubokou programovou kontrolu, rozsáhlý sběr dat nebo vlastní datové pipeline, jsou GitHub repozitáře (nebo pro strukturovaný sběr) správným nástrojem. Rozhodnutí je jednoduché: byznys uživatelé se základními potřebami sběru → nejdřív no-code; vývojáři stavějící datové pipeline → GitHub repozitáře nebo API.

Ukázky reálného výstupu: co skutečně dostanete

Každý konkurenční článek ukazuje ukázky kódu, ale nikdy ne samotný výstup. Níže je to, co můžete realisticky čekat od jednotlivých přístupů.

Ukázkový výstup: kevinzg/facebook-scraper (nebo aktivní fork)

Z vrací scrapovaný veřejný příspěvek JSON jako:

1{
2  "comments": 459,
3  "comments_full": null,
4  "image": "https://...",
5  "images": ["https://..."],
6  "likes": 3509,
7  "post_id": "2257188721032235",
8  "post_text": "Don't let this diminutive version...",
9  "text": "Don't let this diminutive version...",
10  "time": "2019-04-30T05:00:01"
11}

Všimněte si nulovatelných polí jako comments_full. V roce 2026 čekejte, že víc polí přijde prázdných nebo chybějících — to je obvykle signál blokace, ne neškodná chyba. Výstup je syrový JSON a vyžaduje další zpracování.

Ukázkový výstup: Facebook Graph API

Současné od Meta dokumentuje požadavky na informace o stránce jako GET /<PAGE_ID>?fields=id,name,about,fan_count. obsahuje pole jako followers_count, fan_count, category, emails, phone a další veřejná metadata — ale jen s odpovídajícími oprávněními, například .

To je mnohem užší datový tvar, než většina uživatelů GitHub scraperů očekává. Je to zaměřené na stránky, vázané na oprávnění a není to náhrada za libovolné scrapování veřejných příspěvků nebo skupin.

Ukázkový výstup: Thunderbit AI Web Scraper

AI navržené sloupce v Thunderbit pro facebookovou firemní stránku vytvoří čistou, strukturovanou tabulku:

URL stránky	Název firmy	E-mail	Telefon	Kategorie	Adresa	Počet sledujících
facebook.com/example	Example Biz	info@example.com	(555) 123-4567	Restaurace	123 Main St	12,400

Pro příspěvky a komentáře vypadá výstup takto:

URL příspěvku	Autor	Obsah příspěvku	Datum příspěvku	Text komentáře	Komentující	Datum komentáře	Počet lajků
fb.com/post/123	Název stránky	"Slavnostní otevření už tuto sobotu..."	2026-04-20	"Už se těším!"	Jane D.	2026-04-21	47

Strukturované sloupce, formátovaná telefonní čísla, data připravená k použití — žádné dodatečné zpracování. Kontrast se surovým JSONem z GitHub nástrojů je těžké přehlédnout.

Matice typ dat z Facebooku × nejlepší nástroj

V roce 2026 neumí na Facebooku všechno dobře žádný jediný nástroj.

Tahle matice vám umožní přeskočit rovnou k vašemu use casu místo toho, abyste četli celý článek v naději, že najdete správnou odpověď.

Typ dat z Facebooku	Nejlepší GitHub repozitář	Možnost přes API	Možnost bez kódu	Obtížnost	Spolehlivost v roce 2026
Veřejné příspěvky stránek	rodina kevinzg nebo scraper přes prohlížeč	Page Public Content Access, omezeně	Thunderbit AI Scraper	Střední–vysoká	⚠️ Křehké
Sekce O stránce / kontaktní údaje	Lehký parsing nebo metadata stránky	Pole z reference pro Page s oprávněními	Thunderbit Email/Phone Extractor	Nízká–střední	✅ Relativně stabilní
Příspěvky ve skupinách (člen)	Automatizace prohlížeče s přihlášením	Groups API deprecated	No-code přes prohlížeč (přihlášeno)	Vysoká	⚠️ Většinou rozbité / vysoké riziko
Nabídky v Marketplace	Scraper založený na Playwrightu	Žádná oficiální API cesta	Thunderbit AI nebo plánované scrapování přes prohlížeč	Střední–vysoká	⚠️ Křehké
Události	Automatizace prohlížeče nebo ad hoc parsování	Historická podpora přes API je z velké části pryč	Extrakce přes prohlížeč	Vysoká	❌ Křehké
Komentáře / reakce	GitHub repozitář s podporou komentářů	Některé workflow pro komentáře ke stránkám s oprávněním	Thunderbit scrapování podstránek	Střední	⚠️ Křehké

Který přístup sedí vašemu týmu?

Obchodní týmy získávající leady: Začněte s Thunderbit Email/Phone Extractor nebo AI Scraperem. Žádné nastavování, okamžité výsledky.
Ecommerce týmy sledující Marketplace: Thunderbit Scheduled Scraper nebo vlastní nastavení Scrapy + rezidenční proxy (pokud máte inženýrské kapacity).
Vývojáři stavějící datové pipeline: GitHub repozitáře (aktivní forky) + rezidenční proxy + rozpočet na údržbu. Počítejte s průběžnou prací.
Výzkumníci archivující obsah skupin: Jen workflow přes prohlížeč (Thunderbit nebo Selenium s přihlášením), s kontrolou souladu.

Upřímný závěr — a ten, ke kterému — je, že neexistuje jedno spolehlivé řešení pro všechno. Každý konkrétní datový požadavek přiřaďte k správnému nástroji.

Krok za krokem: Jak nastavit Facebook Scraper z GitHubu (když to dává smysl)

Pokud jste si přečetli audit čerstvosti a stejně chcete jít cestou GitHubu, fér. Tady je praktický postup — i s upřímnými poznámkami o tom, kde se to rozbíjí.

Krok 1: Vyberte správný repozitář (použijte audit čerstvosti)

Vraťte se k tabulce auditu. Vyberte nejméně zastaralý repozitář, který odpovídá vašemu cílovému povrchu. Než cokoliv nainstalujete, zkontrolujte záložku Issues — nedávné názvy issues vám řeknou o současné funkčnosti víc než README.

Krok 2: Nastavte Python prostředí

1python3 -m venv fb-scraper-env
2source fb-scraper-env/bin/activate
3pip install -r requirements.txt

Častý problém: konflikty verzí se závislostmi, hlavně u Selenium/Playwright. Jak kevinzg, tak moda20 deklarují Python ^3.6 ve svém — starší základ, který může kolidovat s novějšími knihovnami. Marketplace scraper passivebotu připíná , což je pro experimentování v pořádku, ale není to důkaz dlouhodobé odolnosti.

Krok 3: Nakonfigurujte proxy a anti-detekci

Pokud děláte něco víc než rychlý test:

Nastavte rotaci rezidenčních proxy (hledáte poskytovatele s IP pooly specifickými pro Facebook)
Pokud používáte automatizaci prohlížeče, nainstalujte undetected-chromedriver nebo nakonfigurujte anti-fingerprinting
Tento krok nevynechávejte — standardní Selenium nebo Puppeteer jsou odhaleny rychle

Krok 4: Spusťte malý testovací scraping a ověřte výstup

Začněte jednou veřejnou stránkou, ne velkou dávkou. Pečlivě zkontrolujte výstup:

Prázdná pole nebo chybějící data obvykle znamenají, že vás blokují obranné mechanismy Facebooku
Porovnejte výstup s tím, co skutečně vidíte na stránce v prohlížeči
Úspěšný test na jedné stránce je důležitější než pěkné README

Krok 5: Ošetřete chyby, rate limity a údržbu

Přidejte retry logiku a ošetření chyb
Počítejte s pravidelnými úpravami selektorů nebo konfigurace — je to průběžná údržba, ne něco, co nastavíte jednou a zapomenete
Pokud strávíte víc času údržbou scrapera než používáním dat, je to signál, že se máte vrátit k variantě bez kódu

Právní a etické aspekty scrapování Facebooku

Tahleta část je krátká a věcná. Není jádrem článku, ale ignorovat ji by bylo nezodpovědné.

Facebooku říkají, že uživatelé „nesmí přistupovat k datům z našich produktů ani je shromažďovat pomocí automatizovaných prostředků (bez našeho předchozího souhlasu).“ , aktualizované 3. února 2026, jasně říkají, že vymáhání může zahrnovat pozastavení, odebrání přístupu k API a zásahy na úrovni účtu.

To není teorie. Inženýrská publikace Meta z popisuje aktivní vyšetřování neoprávněného scrapingu, výzvy k ukončení činnosti a deaktivaci účtů. Meta také proti firmám zabývajícím se scrapingem (např. žaloba na Voyager Labs).

Nejbezpečnější rámování:

Podmínky Meta jsou výslovně proti scrapingu
Použití API s oprávněním je bezpečnější než neautorizovaný scraping
Veřejná dostupnost neznamená, že odpadnou povinnosti podle práva na ochranu soukromí (GDPR, CCPA atd.)
Pokud pracujete ve velkém měřítku, poraďte se s právníkem
Thunderbit je navržený pro scraping veřejně dostupných dat a při cloud scrapingu neobchází požadavky na přihlášení

Hlavní závěry: Co v roce 2026 skutečně funguje pro scraping Facebooku

Většina GitHub repozitářů pro Facebook scraper je v roce 2026 rozbitá nebo nespolehlivá. To není strašení — to prostě ukazují data commitů, fronty issues i hlášení komunity.

Několik aktivních forků pořád funguje pro omezená veřejná data stránek, ale vyžadují průběžnou údržbu, nastavení anti-detekce a realistické očekávání, že se to zase rozbije. Graph API je užitečné, ale úzké — pokrývá metadata na úrovni stránky při správných oprávněních, ne široké scrapování veřejných příspěvků nebo skupin, které většina lidí chce.

Pro byznys uživatele, kteří potřebují data z Facebooku bez developerské režie, nabízejí no-code nástroje jako spolehlivější a méně náročnou cestu. AI pokaždé znovu načte stránku, takže změny DOMu vám workflow nerozbijí. Můžete si zdarma vyzkoušet a exportovat do Sheets, Excelu, Airtable nebo Notion.

Praktické doporučení: začněte tabulkou auditu čerstvosti. Pokud nejste vývojář, zkuste nejdřív variantu bez kódu. Pokud vývojář jste, investujte do GitHub řešení jen tehdy, pokud máte technické zdroje — a trpělivost — ho udržovat. A bez ohledu na to, jakou cestu zvolíte, přiřaďte konkrétní datovou potřebu správnému nástroji místo doufání v jedno řešení na všechno.

Pokud chcete jít víc do hloubky v scrapování dat ze sociálních sítí a souvisejících nástrojích, máme návody na , a . Můžete se také podívat na postupy na .

Vyzkoušejte AI Web Scraper pro data z Facebooku

FAQ

Existuje v roce 2026 funkční Facebook scraper na GitHubu?

Ano, ale možností je málo. Nejvýraznější je fork původního repozitáře kevinzg — aktuální stav najdete v tabulce auditu čerstvosti výše. Dokáže částečně scrapovat veřejné příspěvky stránek a některá metadata, ale fronta issues ukazuje zásadní problémy kolem mbasic a prázdného výstupu. Většina ostatních repozitářů je opuštěná nebo úplně rozbitá.

Můžu scrapovat Facebook bez kódování?

Ano. Nástroje jako a bezplatné Email/Phone Extractory vám umožní vytáhnout data z Facebooku přímo v prohlížeči během pár kliknutí, bez nutnosti nastavovat Python nebo GitHub. AI stránku čte pokaždé znovu, takže nemusíte udržovat selektory, když Facebook změní rozhraní.

Je scrapování Facebooku legální?

Facebooku zakazují automatizovaný sběr dat bez povolení. Meta to aktivně vymáhá pomocí banů na účtech, výzev k ukončení činnosti a . Legálnost se liší podle jurisdikce a konkrétního použití. Držte se veřejně dostupných firemních dat, vyhněte se osobním profilům a pokud pracujete ve větším rozsahu, poraďte se s právníkem.

Jaká data ještě získám přes Facebook Graph API?

V roce 2026 je výrazně omezené. Můžete získat omezená data na úrovni stránky — pole jako id, name, about, fan_count, emails, phone — s odpovídajícími oprávněními, například . Většina dat veřejných příspěvků, dat ze skupin () a uživatelská data už přes API dostupná nejsou.

Jak často se GitHub repozitáře pro Facebook scraper rozbíjejí?

Často. Facebook průběžně mění strukturu DOMu, proti-bot opatření i interní API — oficiální rytmus zveřejněn není, ale hlášení komunity ukazují rozbíjení každých pár týdnů u aktivních scraperů. Fork moda20 a jeho issues kolem zmizení mbasicu jsou čerstvý příklad. Pokud spoléháte na GitHub repozitář, počítejte s rozpočtem na pravidelnou údržbu a ověřování výstupu.

Další informace

Facebook Scraper GitHub: Co stále funguje a co už ne

Vyzkoušej Thunderbit