CrewAI 生产化:缓存、回调、LLM 配置

CrewAI 生产化:缓存、回调、LLM 配置

概念速查

CrewAI 在生产环境中需要关注三个核心配置维度。Cache 机制对 Tool 调用做输入哈希缓存——相同输入命中缓存则跳过执行,直接返回上次结果。Callbacks是挂载在 Crew 事件上的钩子函数,用于日志、监控和远程追踪。LLM 配置在 Agent 级别通过 llm 参数传入模型对象,支持 model、temperature、max_tokens、api_key 等参数的不同组合。

# crewai>=0.30.0
from crewai import Agent, Crew
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    model="gpt-4o",
    temperature=0.1,
    max_tokens=4096,
    api_key="sk-xxx",
)

cache_llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0,
    max_tokens=512,
)

writer = Agent(
    role="Writer",
    goal="Write content",
    backstory="You are a writer.",
    llm=llm,
    cache=True,
)

底层原理

Cache:输入哈希与跨 Agent 共享

每次 Tool 调用时,CrewAI 对工具名称和参数做哈希处理,以哈希值为键查本地内存缓存。命中缓存则直接返回上次结果,不走模型调用。缓存在 Crew 级别共享——同一 Crew 内不同 Agent 调用相同工具和参数时也能命中。生产环境建议始终开启缓存,其内存开销极低(KB 级别),但对重复性工具调用(如反复查询天气或数据库)的收益非常明显。

# crewai>=0.30.0
# crewai.cache.cache 内部逻辑示意
from hashlib import sha256


def _cache_key(tool_name: str, args: dict) -> str:
    raw = f"{
     
     tool_name}:{
     
     sorted(args.items())}"
    return sha256(raw.encode()).hexdigest()

Crew 构造时传 cache=True(默认开启)使该 Crew 内所有 Agent 共享同一 Cache 实例。生产环境建议始终开启,内存开销低(~KB 级),对重复工具调用(如天气查询、数据库查询)收益明显。如需跳过单次缓存,Agent 构造传 cache=False

Callbacks:事件驱动的监控层

Crew 实例对外暴露了多种事件挂钩,包括 task 开始和完成、step 执行、tool 调用等。通过这些回调函数,可以在不修改 Agent 和 Task 定义的前提下实现日志记录、性能监控和远程追踪。本地调试时用简单 print,生产环境应接入外部监控系统。

# crewai>=0.30.0
from crewai import Crew


def on_task_started(task):
    print(f"[CREW] 开始执行: {
     
     task.description[:50]}")


def on_task_completed(task):
    print(f"[CREW] 完成: {
     
     task.description[:50]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ricky_Theseus

感谢大家,祝您生活愉快

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值