发表于 5月25日5月25日 框架概述 LlamaFirewall 是一款面向大语言模型(LLM)应用的系统级安全框架,采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险,包括越狱攻击(jailbreaking)、间接提示注入(indirect prompt injection)、目标劫持(goal hijacking)以及不安全代码输出等问题。 h
加入讨论
您现在可以发表并稍后注册. 如果您是会员,请现在登录来参与讨论.