PromptBench

一个基于 Pytorch 的 Python 包，用于评估和理解大型语言模型的统一库。它为研究人员提供了用户友好的 API，以便对 LLM 进行评估。

#Ai工具箱 #Ai提示指令

PromptBench简介

PromptBench，这是一个用于评估 LLM 的统一库。它由研究人员易于使用和扩展的几个关键组件组成：提示构建、提示工程、数据集和模型加载、对抗性提示攻击、动态评估协议和分析工具。PromptBench 被设计为一个开放、通用和灵活的代码库，用于研究目的，可以促进在创建新基准、部署下游应用程序和设计新评估协议方面进行原创研究。。

PromptBench项目地址：https://github.com/microsoft/promptbench

promptbench 目前提供什么？

快速模型性能评估：我们提供用户友好的界面，允许快速构建模型、加载数据集和评估模型性能。

提示工程：我们实施了几种快速工程方法。例如：Few-shot Chain-of-Thought [1]、Emotion Prompt [2]、Expert Prompting [3] 等。

评估对抗性提示：promptbench 集成了提示攻击 [4]，使研究人员能够模拟模型上的黑盒对抗性提示攻击并评估其鲁棒性（详见此处）。

动态评估以减轻潜在的测试数据污染：我们集成了动态评估框架 DyVal [5]，该框架以可控的复杂性即时生成评估样本。

PromptBench安装方式pip

我们为想要快速开始评估的用户提供了一个 Python 包提示台。只需运行：

pip install promptbench

请注意，pip 安装可能落后于最近的更新。因此，如果您想使用最新功能或基于我们的代码进行开发，您应该通过 GitHub 安装。

通过 GitHub 安装

首先，克隆存储库：

git clone git@github.com:microsoft/promptbench.git

然后

cd promptbench

若要安装所需的包，可以创建 conda 环境：

conda create --name promptbench python=3.9

然后使用 pip 安装所需的软件包：

pip install -r requirements.txt

请注意，这只安装了基本的 python 包。对于提示攻击，您还需要安装 TextAttack。

PromptBench用法：

Promptbench 易于使用和扩展。通过以下示例将帮助您熟悉 promptbench 以便快速使用、评估现有数据集和 LLM，或创建自己的数据集和模型。

ChatX.Ai

Bestprompts

与PromptBench相关工具

YPrompt

一个AI提示词管理和优化的工具。主要功能是通过 AI 对话了解用户要什么，自动做出专业提示词，还能帮忙改提示词、管版本、...

image to prompt

一个免费且无需登录的图片转提示词工具，主要功能是免费将上传的图片自动转换为文字提示词，适用于Stable Diffusi...

Teleprompter Online

一款免费的在线提词器网页应用，能在PC或Mac的现代网页浏览器上使用，没有额外限制。它可以为演讲、戏剧、视频等场景提供文...

Best Teleprompter

一个个免费的在线提词工具，专业内容创作者用着挺顺手。它有智能拖动滚动、双显示模式、高级镜像控制这些实用功能，适合拍视频、...

提示词优化器

一键优化提示词并支持多轮迭代改进测试的AI提示词优化工具，能帮助用户编写更好的AI提示词，提升 AI 输出质量，支持 W...

Quick Prompt

一个专注于提示词（Prompt）的管理和快速输入的浏览器扩展插件。可以帮助用户创建、管理和组织自己的提示词库，并在任何网...

最新工具

YPrompt

一个AI提示词管理和优化的工具。主要功能是通过 AI 对话了解用...

image to prompt

一个免费且无需登录的图片转提示词工具，主要功能是免费将上传的图片...

AI Gist

一款隐私优先的 AI 提示词管理工具，具备变量替换、Jinja ...

提示词优化器

一键优化提示词并支持多轮迭代改进测试的AI提示词优化工具，能帮助...

Quick Prompt

一个专注于提示词（Prompt）的管理和快速输入的浏览器扩展插件...

DescribePic

一个利用人工智能来生成上传图片描述的在线工具。DescribeP...

猫目社区

一个优质的AIGC应用平台，集合了多种先进的AI工具和模型，猫目...

PromptDodo

一个通过整合Stable Diffusion、DALL-E 和 ...

Ai艺术之家

一个提供Midjourney提示词和灵感的网站，超50,000+...

一设MJ咒语解析

免费的Midjourney以图生文工具，只需上传一张图片，一设M...

用户登录