Proxyless LLM Websearch:无需代理的LLM网络搜索引擎

Proxyless LLM Websearch是什么?

Proxyless LLM Websearch是一个无需代理的LLM网络搜索引擎,支持多引擎搜索、智能解析和异步处理,支持URL内容解析和网页爬取,结合LangGraph实现模块化智能体链路,专为大语言模型的外部知识调用场景而设计。

Proxyless LLM Websearch:无需代理的LLM网络搜索引擎.webp

Proxyless LLM Websearch特性

  • 无需代理:通过Playwright配置国内浏览器支持,无需代理也能进行网络搜索。

  • 多搜索引擎支持:支持Bing、夸克、百度、搜狗等主流搜索引擎,增强信息来源多样性。

  • 意图识别:系统能够根据用户的输入内容,自动判断是进行网络搜索还是解析URL。

  • 查询分解:根据用户的搜索意图,自动将查询分解为多个子任务,并依次执行,从而提升搜索的相关性与效率。

  • 智能体架构:基于LangGraph封装的“web_search”与“link_parser”。

  • 异步并发任务处理:支持异步并发任务处理,可高效处理多个搜索任务。

  • 内容处理优化

  • 内容切片:将网页长内容按段切分。

  • 内容重排:智能重排序,提高信息相关性。

  • 内容过滤:自动剔除无关或重复内容。

  • 多端支持

  • FastAPI后端接口:可集成到任意系统中。

  • Gradio Web UI:可快速部署成可视化应用。

  • 浏览器插件支持:支持Edge,提供智能URL解析插件,直接在浏览器中发起网页解析与内容提取请求。

安装使用

克隆仓库:

git clone https://github.com/itshyao/proxyless-llm-websearch.git
cd proxyless-llm-websearch

安装依赖:

pip install -r requirements.txt
python -m playwright install

环境变量配置:

需要配置 OPENai_API_KEY、OPENAI_BASE_URL、MODEL_NAME、EMBEDDING_MODEL_NAME、EMBEDDING_API_KEY、EMBEDDING_BASE_URL 等环境变量。

运行示例:

运行 demo:

python demo.py

运行 FastAPI 后端接口:

python api_serve.py

运行 Gradio Web UI:

python gradio_demo.py

测试效果

基于阿里的 WebWalkerQA 高难度问答数据集,与火山方舟、百炼等知名在线检索接口对比,proxyless-llm-websearch 取得了最高的正确率和最低的错误率

Github库:https://github.com/itshyao/proxyless-llm-websearch

收藏
最新工具
GridType
GridType

一款网格化字体设计工具。它让你生成不同类型的网格,在网格里画字体...

Solitaire Bliss
Solitaire Bliss

一个免费、无限次数的在线单人纸牌游戏网站,主要玩经典单人纸牌游戏...

TalenCat
TalenCat

一家提供在线简历制作工具的公司,主要产品TalenCat CV ...

BoardGameArena
BoardGameArena

简称BGA,是一个专注于在线桌游的平台,它通过将传统的桌面游戏数...

Dogod.io
Dogod.io

一款浏览器多人在线实时对战游戏,主题是“狗狗抡棒子”,画风魔性搞...

Drive Mad
Drive Mad

Martin Magni 开发的热门在线驾驶游戏。玩家需要驾驶车...

Fugue
Fugue

icons8旗下的免版税音乐下载网站,音乐可免费用于非商用场景...

PlayClassic Games
PlayClassic Games

PlayClassic Games 是一个能让你直接在浏览器里玩...

Modelfy 3D
Modelfy 3D

一个能把2D图片快速变成高质量3D模型的工具,生成的模型最多能有...

DryVocal
DryVocal

一款专业音频处理工具,主要用于从复杂音频中提取和增强人声,特别适...