É Legal Fazer Web Scraping no Japão? Todas as Leis que Você Precisa Conhecer

Cinco leis japonesas regulam o web scraping. Nenhuma delas usa, na prática, a expressão "web scraping."

Se você já tentou descobrir se o seu projeto de scraping é legal no Japão, provavelmente esbarrou numa muralha de posts genéricos em fóruns, artigos focados em treino de IA e conselhos contraditórios. Passei semanas a pesquisar estatutos japoneses oficiais, orientações do governo, dados de fiscalização e comentários jurídicos para montar o guia em inglês mais claro que consegui.

Se você acompanha preços da concorrência no Rakuten, recolhe dados imobiliários para análise de mercado ou monta uma lista de leads B2B, este artigo percorre todas as leis relevantes — com tabelas práticas, cenários reais e um checklist de conformidade em 10 passos para usar antes de começar a extrair dados.

O que significa, na prática, "É Legal Fazer Web Scraping no Japão"?

Web scraping — usar software para recolher automaticamente dados de sites — não é regulado por uma única lei japonesa. Nenhum estatuto diz que "scraping é legal" ou que "scraping é ilegal". A legalidade do seu projeto depende de três coisas: o que recolhe, como acede e o que faz com os dados depois.

Cinco leis formam a base jurídica:

Lei	O que cobre para quem faz scraping
Lei de Direitos de Autor (Lei nº 48 de 1970)	Protege obras criativas, imagens, textos e estruturas de bases de dados. O Artigo 30-4 traz uma ampla exceção para análise de dados.
APPI (Lei de Proteção de Informações Pessoais, Lei nº 57 de 2003)	Regula a recolha, o uso, o compartilhamento e a transferência internacional de dados pessoais sobre pessoas vivas.
UCAL (Lei de Proibição de Acesso Não Autorizado a Computadores, Lei nº 128 de 1999)	Criminaliza contornar autenticação e controlos de acesso — a lei japonesa contra ataques de hacking.
UCPA (Lei de Prevenção da Concorrência Desleal, Lei nº 47 de 1993)	Protege segredos comerciais e "dados partilhados com acesso restrito" contra obtenção indevida.
Código Penal (Lei nº 45 de 1907)	Os Artigos 233, 234 e 234-2 podem aplicar-se quando o scraping interrompe as operações de um site.

O resto do artigo detalha cada lei com exemplos práticos e avaliação de risco. Quer ir direto para a ação? Pule para o checklist de conformidade em 10 passos.

Lei de Direitos de Autor do Japão e o Artigo 30-4: a exceção para análise de informação

A Lei de Direitos de Autor do Japão protege obras criativas: artigos, fotos, descrições de produtos, estruturas de bases de dados com organização criativa. Quando um scraper descarrega uma página web, tecnicamente ele "reproduz" esse conteúdo segundo o Artigo 21 — o direito exclusivo de reprodução do autor.

Mas é aqui que o Japão se destaca.

Em 2018, o Japão aprovou uma ampla alteração legislativa (em vigor a 1 de janeiro de 2019) que acrescentou o Artigo 30-4 — uma exceção flexível de direitos de autor que torna legal a maior parte do web scraping analítico. A Agency for Cultural Affairs chama-lhe um dos regimes mais permissivos do mundo para análise de dados e desenvolvimento de IA.

A maioria dos artigos em inglês apresenta o Artigo 30-4 como algo relevante apenas para treino de IA. Isso é demasiado restrito. O estatuto cobre explicitamente "análise de informação" — extração, comparação, classificação e outras análises estatísticas de dados. Em outras palavras, exatamente o que os scrapers de negócios fazem todos os dias.

O que o Artigo 30-4 realmente diz (em linguagem simples)

O Artigo 30-4 permite o uso de uma obra protegida por direitos de autor "quando o objetivo não for desfrutar pessoalmente, ou fazer outra pessoa desfrutar, dos pensamentos ou sentimentos expressos na obra". Na prática, duas condições precisam ser cumpridas:

Teste do "desfrute". Se está a extrair dados factuais — preços, datas, área em metros quadrados, níveis de stock — em vez de consumir ou republicar conteúdo criativo, está do lado certo. A orientação de 2024 da ACA sobre IA e direitos de autor reforça que usos sem "desfrute" incluem análise de dados, classificação e indexação.
Teste do "dano injusto". O seu scraping não deve substituir a obra original nem prejudicar o mercado do titular dos direitos. Fazer scraping de um conjunto de dados pago e pronto para análise para evitar comprá-lo, por exemplo, pode falhar neste teste mesmo que a sua finalidade seja analítica.

ig_0a3cda0b72101bd40169f1b3ed9fd08191a17c22b803fb48ab_compressed.webp

Cenários reais de scraping sob o Artigo 30-4

Aqui é onde a teoria encontra a prática. O estatuto vai muito além do treino de IA:

Caso de uso	O Artigo 30-4 aplica-se?	Porquê
Fazer scraping de anúncios imobiliários para análise de preços de mercado	✅ Sim	Preço pedido, área e idade do imóvel são dados factuais para análise de informação, não fruição da expressão
Fazer scraping de dados de ações de sites de bolsa	✅ Sim	Finalidade de análise estatística
Fazer scraping de imagens de produtos para um site de ecommerce concorrente	❌ Não	Explora o próprio conteúdo expressivo
Fazer scraping de artigos de notícias para republicar	❌ Não	Substitui a obra original
Fazer scraping de descrições de produtos para monitorização de preços	✅ Provavelmente sim	Extração de dados factuais, não fruição da expressão
Construir um sistema RAG sobre documentos recolhidos	⚠️ Misto	A vetorização pode ser sem fruição, mas gerar excertos protegidos exige análise adicional

Mais um detalhe: o Artigo 47-5 oferece uma proteção mais restrita para a "exploração mínima" incidental ao processamento computadorizado de informações — pense em pequenos trechos ou miniaturas nos resultados de pesquisa. Não é o principal porto seguro do scraping, mas pode dar suporte à cópia preparatória necessária para serviços de pesquisa ou análise. O comentário de 2019 da ACA avalia o que é "mínimo" por proporção, quantidade e precisão de exibição.

Em resumo: se está a extrair factos para análise, e não a republicar conteúdo criativo, o enquadramento de direitos de autor do Japão joga a seu favor.

Lei de Acesso Não Autorizado a Computadores do Japão (UCAL): quando o scraping passa do limite

Quase nenhum artigo em inglês sobre scraping explica este estatuto. Ele é, possivelmente, a linha divisória mais importante no direito japonês.

A Lei de Acesso Não Autorizado a Computadores (不正アクセス禁止法, Lei nº 128 de 1999) é o equivalente funcional japonês ao CFAA dos EUA. Criminaliza o acesso não autorizado a computadores protegidos por mecanismos de autenticação. As penas do Artigo 11 podem chegar a 3 anos de prisão ou multa até ¥1.000.000.

A UCAL não proíbe fazer scraping de páginas públicas. A lei só entra em cena quando contorna ou dribla autenticação — ecrãs de login, palavras-passe, tokens de acesso ou controlos semelhantes. Essa distinção é tudo.

Níveis de risco da UCAL para cenários comuns de scraping

Cenário	Nível de risco da UCAL	Explicação
Fazer scraping de listagens públicas de produtos	✅ Baixo	Não há contorno de autenticação
Fazer scraping atrás de login com as suas próprias credenciais	⚠️ Médio — depende dos Termos de Serviço	A UCAL pode não se aplicar se as credenciais forem suas, mas o risco contratual e de ToS permanece
Contornar autenticação ou CAPTCHA para aceder a dados	❌ Alto — provável violação	O Artigo 2(4)(ii) cobre a evasão de restrições de acesso
Aceder a APIs restritas sem autorização	❌ Alto — provável violação	APIs autenticadas ou apenas para parceiros estão claramente no âmbito da UCAL
Usar credenciais ou tokens de sessão de outra pessoa	❌ Alto — provável violação	O Artigo 2(4)(i) trata diretamente do uso do código de identificação de outra pessoa

A Agência Nacional de Polícia do Japão informou 563 casos encerrados de violação da UCAL em 2024, um aumento de 8,1% face ao ano anterior. Desses, 511 casos (90,8%) envolviam uso não autorizado do código de identificação de outra pessoa. O foco da fiscalização está amplamente no uso indevido de credenciais, não no scraping público comum.

Como a UCAL difere do CFAA dos EUA

A UCAL é mais restrita que o CFAA num ponto importante. Foca-se especificamente em contornar autenticação, enquanto a expressão "exceeds authorized access" do CFAA tem sido debatida nos tribunais americanos durante décadas. Depois da decisão da Suprema Corte dos EUA em Van Buren, violar os Termos de Serviço de um site, por si só, tem menos probabilidade de gerar responsabilidade criminal ao abrigo do CFAA. O Japão chega a um resultado prático parecido: violação de ToS é uma questão contratual, não criminal, a menos que exista um elemento independente de controlo de acesso.

Alterações de 2022 à APPI: o que os scrapers precisam de saber sobre dados pessoais

A Lei de Proteção de Informações Pessoais do Japão (APPI) é a principal lei de proteção de dados do país — e as alterações de 2022 tornaram as regras significativamente mais apertadas. Se faz scraping de nomes, e-mails, telefones ou qualquer dado que identifique uma pessoa viva em sites japoneses, a APPI aplica-se.

A pergunta prática é: quando é que o scraping aciona obrigações de conformidade com a APPI?

O que conta como "informação pessoal" sob a APPI

O Artigo 2 da APPI define informação pessoal como dados que podem identificar uma pessoa viva específica — inclusive por cruzamento fácil com outras informações. A orientação de perguntas e respostas da PPC confirma que um e-mail corporativo como firstname.lastname@company.jp pode ser informação pessoal quando identifica uma pessoa específica, e que IDs de cookies passam a ser informação pessoal quando combinados com outros dados que permitam identificação.

As alterações de 2022 introduziram uma nova categoria: "informação relacionada ao indivíduo" — dados que não identificam diretamente alguém, mas podem fazê-lo quando combinados com outros dados (IDs de cookies, histórico de navegação, histórico de compras). Por que isso importa para scraping: dados que parecem anónimos para o scraper podem tornar-se identificáveis quando misturados com dados de CRM ou adtech no destino.

Restrições à transferência internacional

Se estiver a fazer scraping de sites japoneses a partir de fora do Japão e a recolher dados pessoais, o Artigo 28 da APPI exige uma análise antes de transferir esses dados para o exterior. A orientação da PPC sobre transferência internacional descreve três caminhos comuns: o destinatário está num país reconhecido pela PPC como equivalente, o destinatário adotou medidas de proteção equivalentes, ou aplica-se uma exceção do Artigo 27(1).

Se uma empresa dos EUA, da UE ou de Singapura faz scraping de dados pessoais em sites japoneses e os armazena fora do Japão, é necessária uma análise de transferência internacional ao abrigo da APPI. Isto apanha muitas equipas internacionais de surpresa.

A cláusula de opt-out para terceiros (Artigo 27)

A pergunta que mais vejo em fóruns é: "O que acontece se eu partilhar ou vender dados recolhidos por scraping de sites japoneses?"

O Artigo 27 da APPI geralmente exige consentimento prévio para fornecer dados pessoais a terceiros. Existe um mecanismo formal de opt-out — mas ele exige protocolo junto da Personal Information Protection Commission, notificação aos indivíduos e uma forma de impedir o fornecimento a terceiros. As alterações de 2022 apertaram ainda mais isto: o opt-out não pode ser usado para dados pessoais obtidos por meios ilícitos ou recebidos de outra empresa por via de opt-out.

O relatório anual de 2024 da PPC mostra 405 registos de opt-out aceites desde outubro de 2021, incluindo 93 no ano fiscal de 2024. O sistema existe, mas é formal, não casual.

Quando o scraping não aciona a APPI

A APPI não se aplica a dados que não conseguem identificar uma pessoa viva. Campos de menor risco sob a APPI incluem:

Preços de produtos, SKUs, níveis de stock e custos de envio
Horário de funcionamento de lojas e informações genéricas de contacto da empresa (info@company.jp)
Preço de anúncios imobiliários, área, idade do imóvel e distância da estação — quando não ligados a proprietários ou agentes nomeados
Estatísticas agregadas de mercado em que correspondências individuais foram removidas

Uma escolha prática de design que vale destacar: o recurso Thunderbit AI Suggest Fields permite ao utilizador definir exatamente quais colunas de dados extrair. Pode excluir deliberadamente campos de dados pessoais e focar-se apenas nos factos de negócio de que precisa — reduzindo a exposição à APPI por design, e não por acidente.

Lei de Prevenção da Concorrência Desleal (UCPA): scraping de dados de concorrentes

ig_0a3cda0b72101bd40169f1b4462be08191a1ab2d0796a7d30e_compressed.webp

A Lei de Prevenção da Concorrência Desleal entra em cena quando o scraping sai de factos públicos e entra em informações empresariais confidenciais ou conjuntos de dados protegidos por acesso restrito.

A UCPA define segredo comercial como informação que é (1) tratada como secreta, (2) útil para os negócios e (3) não é do conhecimento público. A METI resume isto como os três requisitos para proteção de segredo comercial.

Factos de sites públicos — preços de produtos, localização de lojas, vagas de emprego, catálogos de produtos — geralmente não são segredos comerciais porque não são secretos e são do conhecimento público. Fazer scraping deles normalmente não viola a UCPA.

Quando a UCPA pode aplicar-se ao scraping

Cenário	Risco ao abrigo da UCPA	Porquê
Fazer scraping do catálogo público de produtos de um concorrente para monitorizar preços	Geralmente baixo	Factos de catálogo público, em regra, não são secretos
Fazer scraping de dados internos de preços explorando uma vulnerabilidade de API	Alto	Informações empresariais úteis e não públicas obtidas por meios indevidos
Fazer scraping de uma base de dados paga só para parceiros ou de uma API licenciada fora do âmbito	Alto	As alterações de 2018 da UCPA protegem "dados partilhados com acesso restrito"
Usar dados recolhidos por scraping para criar um produto concorrente que se apoia de forma oportunista numa base de dados cara	Zona cinzenta	Os tribunais podem avaliar restrições de acesso, investimento e substituição

A alteração de 2018 à UCPA acrescentou proteção para "dados partilhados com acesso restrito" — informação técnica ou empresarial acumulada em grau significativo, gerida eletronicamente e fornecida regularmente a pessoas específicas. Mas o Artigo 19 da UCPA exclui dados substancialmente iguais a informações disponibilizadas ao público sem compensação. Portanto, uma listagem pública gratuita de produtos é diferente de um conjunto de dados comercial exclusivo para membros.

Sobrecarga de servidor e o Código Penal japonês: não derrube o site

Os dados em si podem ser perfeitamente legais de recolher. Mas como faz o scraping pode criar risco criminal. O Código Penal do Japão inclui dispositivos de obstrução de atividade comercial que entram em ação quando o acesso automatizado interrompe um site ou sistema empresarial.

Artigo do Código Penal	Conduta	Pena
Artigo 233	Obstrução de atividade comercial por meios fraudulentos	Até 3 anos ou ¥500.000
Artigo 234	Obstrução forçada de atividade comercial	Mesma do Artigo 233
Artigo 234-2	Obstrução por danificar/interferir num computador	Até 5 anos ou ¥1.000.000

Toda a discussão japonesa sobre scraping acaba por chegar ao incidente da Biblioteca Central da Cidade de Okazaki (por volta de 2010). Um engenheiro de software criou um crawler para recolher informações sobre novos livros no site da biblioteca, gerando cerca de 33.000 acessos automáticos em duas semanas. O servidor da biblioteca ficou difícil de usar, e a polícia prendeu o utilizador sob suspeita de obstrução de atividade comercial. O caso terminou sem julgamento de mérito, mas continua a ser um lembrete poderoso de que o impacto no servidor importa — mesmo quando os dados em si são públicos.

Algum contexto sobre porque os operadores de sites escalam o problema: a Thales/Imperva informou que bots automatizados representaram 51% do tráfego da web em 2024, com bots maliciosos em 37%. A Akamai constatou que os bots foram 42% de todo o tráfego web, com impacto especial no ecommerce.

Como evitar problemas de sobrecarga de servidor

Respeite o robots.txt (mesmo que não seja um estatuto, ele é evidência da intenção do operador)
Adicione atrasos entre as requisições e limite a concorrência
Evite horas de pico do site-alvo
Pare ou reduza o tráfego quando vir erros, bloqueios ou respostas de rate limit
Guarde em cache páginas já recolhidas, em vez de atingir repetidamente as mesmas URLs

O recurso de scraping em nuvem da Thunderbit distribui as requisições por vários servidores, o que naturalmente espalha a carga e reduz o risco de sobrecarregar um único servidor-alvo. Não é um escudo jurídico, mas é uma escolha prática de design que combina com scraping responsável.

Violações de Termos de Serviço: risco contratual, não criminal

Muitos sites japoneses incluem Termos de Serviço que proíbem scraping ou recolha automatizada de dados. Pela lei japonesa, violar os ToS é uma questão contratual — não um crime.

As Diretrizes Interpretativas da METI sobre Comércio Eletrónico explicam que os termos do site são vinculativos quando incorporados corretamente no contrato da transação. Acordos do tipo click-wrap (em que precisa de clicar em "Concordo") são os mais fortes. Termos escondidos em links de rodapé difíceis de notar são mais fracos.

Formato dos ToS	Sinal de aplicabilidade
Click-wrap claro com botão "Concordo" obrigatório	O mais forte
Termos vinculados perto da transação, mas sem clique de concordância	Mais incerto
Termos escondidos no rodapé ou em local difícil	Mais fraco
Sem relação contratual com o operador	A ação contratual pode ser fraca

Não foi encontrada autoridade confiável a mostrar que uma quebra de ToS, por si só, sem mais nada, se converta numa acusação criminal no Japão. A posição prática: violar os ToS pode gerar risco contratual civil (indemnização, liminar), mas a exposição criminal geralmente exige um elemento independente — evasão de controlo de acesso sob a UCAL, obstrução de atividade comercial sob o Código Penal ou violação de direitos de autor.

O meu conselho: leia os ToS antes de fazer scraping em qualquer site japonês. Se eles proibirem explicitamente o scraping, procure alternativas — uma API, parceria de dados ou outra fonte para a mesma informação.

Japão vs. EUA vs. UE: como as leis de web scraping se comparam

Se vem de um contexto jurídico dos EUA ou da UE, esta tabela ajuda a calibrar. O enquadramento japonês é mais permissivo em algumas áreas e mais restritivo noutras.

Dimensão jurídica	Japão	Estados Unidos	UE
Estatuto central de scraping	Não há um único estatuto; um mosaico de Lei de Direitos de Autor, APPI, UCPA, UCAL e Código Penal	CFAA, leis estaduais	GDPR, Diretiva de Bases de Dados, Diretiva DSM
Exceção de direitos de autor para análise de dados	Artigo 30-4 (amplo)	Fair use (caso a caso)	Exceção de TDM (Artigos 3-4 da Diretiva DSM) — com opt-out para TDM comercial
Scraping de dados pessoais	APPI — fornecimento a terceiros com opt-out (Art. 27)	Varia por estado (CCPA etc.)	GDPR — consentimento/interesse legítimo rigorosos
Contorno de controlos de acesso	UCAL — crime	CFAA — criminal e civil	Varia por país-membro
Quebra de ToS = ilegal?	Apenas direito contratual; não foi encontrada responsabilidade criminal	CFAA após Van Buren: provavelmente não	Varia; o GDPR ainda pode aplicar-se
Risco de sobrecarga de servidor	Código Penal Art. 233, 234-2 (obstrução de atividade comercial)	CFAA + interferência ilícita	Varia

Principais conclusões da comparação

O Artigo 30-4 do Japão é mais amplo do que o fair use dos EUA ou as exceções de TDM da UE — o que torna o Japão um dos países mais permissivos para scraping analítico do ponto de vista de direitos de autor. A UCAL é mais restrita que o CFAA porque foca-se exclusivamente em contornar autenticação. As regras de transferência internacional da APPI são mais rígidas do que os quadros fragmentados de privacidade dos EUA, mas em alguns detalhes operacionais são menos prescritivas do que o GDPR.

Para equipas internacionais: talvez tenha mais liberdade para fazer scraping de dados públicos japoneses para análise do que imagina. O processamento de dados pessoais é onde a complexidade realmente mora — especialmente transferências internacionais e partilha com terceiros.

O seu checklist de conformidade em 10 passos para fazer scraping em sites japoneses

Antes de começar a fazer scraping de qualquer site japonês, percorra estas dez perguntas de sim ou não. Cada uma relaciona-se com uma das cinco leis acima.

Os dados são publicamente acessíveis? (Sem login, sem paywall, sem evasão de controlo de acesso) → Se sim, o risco sob a UCAL é baixo.
Os Termos de Serviço do site proíbem scraping? → Se sim, avalie o risco contratual; considere fontes alternativas de dados.
Está a recolher informações pessoais, conforme definidas pela APPI? (Nomes, e-mails, telefones, IDs) → Se sim, garanta conformidade com a APPI.
Vai transferir dados pessoais recolhidos para fora do Japão? → Se sim, cumpra as regras de transferência internacional do Artigo 28 da APPI.
Pretende partilhar ou vender os dados recolhidos a terceiros? → Se sim, siga os procedimentos de opt-out do Artigo 27 da APPI ou obtenha consentimento.
Os dados são protegidos por direitos de autor? → Se o scraping for para análise de informação (e não para republicar conteúdo criativo), o Artigo 30-4 provavelmente aplica-se.
A sua atividade de scraping vai substituir a obra original? → Se sim, a proteção do Artigo 30-4 provavelmente não se aplica.
Está a contornar autenticação, CAPTCHA ou controlos de acesso? → Se sim, o risco sob a UCAL é alto — não prossiga sem orientação jurídica.
O volume do seu scraping pode sobrecarregar o servidor? → Se sim, limite as requisições, adicione atrasos e use scraping distribuído.
Os dados-alvo são tratados como segredo comercial pela empresa? → Se forem dados proprietários não públicos, a UCPA pode aplicar-se.

Se todas as respostas apontarem para dados públicos, factuais, não pessoais, com limitação de taxa e sem republicação — está em boa posição. Qualquer sinal de alerta deve acionar revisão jurídica antes de começar.

ig_0a3cda0b72101bd40169f1b4db54888191a61af73340d78e18_compressed.webp

Como a Thunderbit ajuda você a fazer scraping de sites japoneses em conformidade

Quero ser direto: a Thunderbit é uma ferramenta, não aconselhamento jurídico. Mas foi concebida de formas que se alinham com os princípios de conformidade que descrevi.

AI Suggest Fields: a IA da Thunderbit lê a página e sugere exatamente quais colunas de dados extrair. Isso ajuda a definir deliberadamente apenas os campos não pessoais de que precisa — reduzindo a recolha desnecessária de dados pessoais por design, e não por acidente.
Scraping em nuvem: distribui as requisições por vários servidores, espalhando naturalmente a carga e reduzindo o risco de sobrecarregar um único servidor japonês. (Pense nisto como uma amizade nativa com o rate limit.)
Extratores gratuitos de e-mail e telefone: quando de facto precisa de recolher informações de contacto de sites japoneses, o extrator de e-mail da Thunderbit e o extrator de telefone oferecem extração com um clique. Mas combine isso com as orientações da APPI acima — recolher dados pessoais exige compreender as suas obrigações de conformidade.
Exportação para Excel, Google Sheets, Airtable ou Notion: os dados recolhidos podem ser estruturados e exportados imediatamente para análise, apoiando a finalidade de "análise de informação" protegida pelo Artigo 30-4.
Sem manutenção necessária: a IA da Thunderbit lê o site novamente a cada execução, adaptando-se a mudanças de layout. Isso evita scrapers avariados a bater repetidamente no servidor com requisições falhadas — uma forma prática de evitar o tipo de problema de carga que desencadeou o incidente da Biblioteca de Okazaki.

Para um passo a passo de como usar a Thunderbit na prática, veja o nosso canal no YouTube ou o guia de início rápido. Pode testar grátis pela extensão do Chrome.

Experimente a Thunderbit para Web Scraping no Japão

Exemplos práticos de uso

Caso de uso	Campos recomendados para extrair	Justificativa jurídica
Monitorização de preços de ecommerce japonês	Nome do produto, preço listado, disponibilidade, vendedor, SKU, URL, timestamp	Dados factuais de negócio; análise de informação ao abrigo do Artigo 30-4; evite copiar imagens de produtos ou avaliações para republicação
Análise de mercado imobiliário japonês	Preço pedido, região/localização, área útil, idade do edifício, tipo de imóvel, estação mais próxima, URL, timestamp	Apoia análise agregada de mercado; exclua nomes de corretores, telefones e nomes de proprietários, a menos que haja conformidade com a APPI
Monitorização operacional B2B	Nome da empresa, endereço da filial, e-mail genérico da empresa, horário de funcionamento, categoria de serviço	Menor risco sob a APPI se nenhuma pessoa viva for identificada; reveja os ToS e os limites de taxa

Principais conclusões sobre a legalidade do web scraping no Japão

Web scraping é legal no Japão na maioria dos casos — especialmente quando recolhe dados públicos, não pessoais e factuais para fins de análise. Mas "na maioria dos casos" não significa "em todos os casos."

Lei de Direitos de Autor (Artigo 30-4): scraping analítico de dados públicos é permitido; republicar conteúdo criativo, não.
UCAL: não contorne autenticação ou controlos de acesso.
APPI: trate dados pessoais com cuidado, especialmente em transferências internacionais e partilha com terceiros.
UCPA: dados públicos geralmente não são segredo comercial; dados protegidos por acesso ou pagos têm mais risco.
Código Penal: não derrube o servidor.

Use o checklist de 10 passos antes de iniciar qualquer projeto de scraping. Em caso de dúvida, consulte um advogado — especialmente em projetos que envolvam dados pessoais ou conteúdo com acesso restrito.

Se está pronto para começar a fazer scraping de sites japoneses em conformidade, a Thunderbit foi criada para tornar o processo simples para utilizadores não técnicos. Defina os seus campos, extraia os dados, exporte para a ferramenta da sua preferência e concentre-se na análise.

Experimente o Raspador Web IA para sites japoneses Get Started Free

Perguntas frequentes

É legal fazer scraping de sites públicos no Japão?

Em geral, sim. Fazer scraping de dados publicamente disponíveis para análise de informação normalmente é legal ao abrigo do Artigo 30-4 da Lei de Direitos de Autor do Japão, desde que não sobrecarregue o servidor, não contorne controlos de acesso, não recolha dados pessoais sem conformidade com a APPI e não republique expressão protegida por direitos de autor. O fator decisivo é a finalidade: análise, não republicação.

Posso fazer scraping de dados pessoais (e-mails, telefones) de sites japoneses?

Pode, mas a APPI aplica-se. Precisa de uma finalidade lícita, deve informar como vai usar os dados e enfrenta restrições para transferências internacionais e partilha com terceiros. As alterações de 2022 tornaram estas regras bastante mais rígidas — especialmente para dados que saem do Japão ou são partilhados com outras empresas.

O que acontece se os Termos de Serviço de um site japonês proibirem scraping?

Violar os ToS é uma questão contratual (possível responsabilidade civil por danos ou liminar), não um crime. Ainda assim, isso pode fortalecer outras alegações jurídicas e aumentar a probabilidade de fiscalização. Leia sempre os ToS antes de fazer scraping e considere se os dados estão disponíveis por outro meio.

Fazer scraping atrás de login é legal no Japão?

Usar as suas próprias credenciais é uma zona cinzenta — a UCAL pode não se aplicar diretamente, mas o risco de violação de ToS e de contrato continua. Contornar autenticação, usar credenciais de outra pessoa ou burlar controlos de acesso provavelmente configura violação criminal da Lei de Acesso Não Autorizado a Computadores, com pena de até 3 anos de prisão ou ¥1.000.000.

Posso vender dados que recolhi por scraping de sites japoneses?

Se os dados contiverem informações pessoais, precisa de seguir o sistema de fornecimento a terceiros com opt-out do Artigo 27 da APPI — o que exige protocolo formal na PPC, notificação individual e mecanismos de opt-out. Vender dados pessoais sem os procedimentos corretos é uma infração de conformidade. Para agregados factuais não pessoais, o risco sob a APPI é menor, mas direitos de autor, UCPA, ToS e as implicações jurídicas do web scraping ainda se aplicam.

Saiba mais

Extraia dados usando IA

Transfira dados facilmente para Google Sheets, Airtable ou Notion

Chrome Store Rating

PRODUCT HUNT#1 Product of the Week