連携

CrewAI

CrewAI のエージェントに Thunderbit 駆動の Web リサーチ Tool を持たせる

CrewAI のエージェントには、新鮮できれいな Web コンテンツが必要です。/distill を CrewAI Tool としてラップすれば、crew 内のどのエージェントもオンデマンドで URL を読めます。

インストール

pip install crewai httpx

カスタム Tool

from crewai.tools import BaseTool
import httpx

API = "https://openapi.thunderbit.com/openapi/v1"
H = {"Authorization": "Bearer YOUR_API_KEY"}

class ReadUrlTool(BaseTool):
    name: str = "read_url"
    description: str = (
        "Fetch a URL and return clean Markdown. Use for any web research task: "
        "docs, articles, product pages, search results."
    )

    def _run(self, url: str) -> str:
        resp = httpx.post(f"{API}/distill",
                          headers=H,
                          json={"url": url, "renderMode": "basic"},
                          timeout=60.0)
        resp.raise_for_status()
        return resp.json()["data"]["markdown"]

Crew への組み込み

from crewai import Agent, Task, Crew

researcher = Agent(
    role="Web Researcher",
    goal="Gather authoritative information from public web pages",
    backstory="Skilled at distilling long pages into key facts.",
    tools=[ReadUrlTool()],
)

task = Task(
    description="Research how vector databases compare in 2026.",
    expected_output="A concise comparison table.",
    agent=researcher,
)

Crew(agents=[researcher], tasks=[task]).kickoff()

ヒント

  • 複数ソースのリサーチには、/batch/distill を 2 つ目の Tool(read_urls)として公開し、エージェントがファンアウトできるように
  • エージェントに渡す前に Markdown を ~8k トークンに制限 —— コンテキストの肥大化を防止

関連

この統合はマルチエージェント crew テンプレートで拡張予定です —— 続報をお待ちください。