基于 InternLM2.5-7B 的 MindSearch 怎么用?支持自定义引擎,透明路径助力学术研究!
作为一个基于 InternLM2.5-7B 的 AI 搜索框架,MindSearch 采用多智能体框架模拟人类思维,先规划再搜索,能有效提高信息搜集的准确性和完整性。对于学术研究来说,它支持自定义引擎和透明路径,能帮助研究者快速获取所需信息,下面为你详细介绍其使用方法。
? 本地部署指南
- 安装依赖:首先需要克隆项目并安装相关依赖。打开终端,输入以下命令:
bash
git clone https://github.com/InternLM/MindSearch
cd MindSearch
pip install -r requirements.txt
- 下载模型:下载书生・浦语模型,可通过以下命令实现:
bash
modelscope download --model=Shanghai_AI_Laboratory/internlm2_5-7b-chat --local_dir ./internlm2_5-7b-chat/
下载完成后,需要修改代码,将 lmdeploy 默认从 huggingface 下载的模型 id 改为本地文件地址,具体修改位置为:https://github.com/InternLM/MindSearch/blob/main/mindsearch/agent/models.py#L7,将 path 设置为本地模型路径,例如
3. 选择搜索引擎:由于默认的 DuckDuckGo 搜索引擎访问可能不畅,推荐使用 Bing 搜索引擎。同样需要修改代码,具体位置为:https://github.com/InternLM/MindSearch/blob/main/mindsearch/agent/init.py#L45,将搜索引擎配置为 BingBrowser,并设置相关参数,如 api_key 可通过环境变量获取。Bing API Key 可从微软 Bing 开发者中心获取。
4. 启动服务:完成上述配置后,就可以启动 MindSearch 服务了。在终端中输入以下命令启动后端:
path='/mnt/workspace/internlm2_5-7b-chat'
。3. 选择搜索引擎:由于默认的 DuckDuckGo 搜索引擎访问可能不畅,推荐使用 Bing 搜索引擎。同样需要修改代码,具体位置为:https://github.com/InternLM/MindSearch/blob/main/mindsearch/agent/init.py#L45,将搜索引擎配置为 BingBrowser,并设置相关参数,如 api_key 可通过环境变量获取。Bing API Key 可从微软 Bing 开发者中心获取。
4. 启动服务:完成上述配置后,就可以启动 MindSearch 服务了。在终端中输入以下命令启动后端:
bash
python -m mindsearch.app --lang cn --model_format internlm_server --search_engine BingSearch
然后启动前端界面,可根据需求选择 React、Gradio 或 Streamlit 等前端框架。例如,使用 Gradio 前端,输入以下命令:
bash
python frontend/mindsearch_gradio.py
启动后,在浏览器中访问相应的地址即可开始使用 MindSearch。
?️ 自定义引擎配置
MindSearch 支持多种搜索引擎,包括 DuckDuckGo、Bing、Brave、Google 和腾讯搜索等。要配置自定义引擎,你可以按照以下步骤进行:
- 获取 API 密钥:如果你想使用 Bing 等需要 API 密钥的搜索引擎,需要先在相应的平台上注册并获取 API 密钥。例如,使用 Bing 搜索引擎,需要从微软 Bing 开发者中心获取 API 密钥。
- 修改配置文件:在 MindSearch 的配置文件中,找到搜索引擎相关的配置部分。例如,如果你想使用 Bing 搜索引擎,需要在
mindsearch/agent/__init__.py
文件中找到 BingBrowser 的配置,并设置searcher_type
为 'BingSearch',api_key
为你获取的 Bing API 密钥。 - 添加新搜索引擎:如果你想添加其他搜索引擎,需要了解该搜索引擎的 API 接口,并在 MindSearch 的代码中进行相应的配置。例如,添加一个新的学术数据库搜索引擎,可能需要编写相应的搜索器类,并在配置文件中进行注册。
? 透明路径功能应用
透明路径是 MindSearch 的一个重要功能,它能展示搜索过程中的思考路径、搜索关键词等完整内容,提高回复的可信度和可用性。在学术研究中,透明路径功能可以帮助研究者跟踪搜索过程,优化搜索策略,具体应用如下:
- 复杂问题拆解:当面对一个复杂的学术问题时,MindSearch 会将其分解为多个子问题节点,并构建一个动态图(DAG)来模拟解决过程。例如,研究 “中国高铁技术的发展”,MindSearch 会将其分解为 “技术起源”“关键技术”“国际合作”“现有网络”“未来展望” 等子问题,每个子问题对应一个搜索节点。
- 搜索过程跟踪:在搜索过程中,MindSearch 会实时记录每个子问题的搜索关键词、搜索结果以及推理过程。研究者可以通过透明路径查看这些信息,了解搜索的进展和结果的来源。例如,在搜索 “中国高铁技术的起源” 时,MindSearch 会记录搜索关键词 “中国高铁技术起源” 以及相关的搜索结果页面,并分析这些结果是否能回答该子问题。
- 搜索策略优化:根据透明路径提供的信息,研究者可以调整搜索策略,例如修改搜索关键词、更换搜索引擎或补充搜索子问题。例如,如果发现某个子问题的搜索结果不够全面,研究者可以添加新的搜索关键词或选择其他搜索引擎进行补充搜索。
? 学术研究场景实战
- 文献检索:在进行学术研究时,需要检索大量的文献资料。MindSearch 可以帮助研究者快速定位相关文献,提高检索效率。例如,搜索 “人工智能在医学影像诊断中的应用”,MindSearch 会将其分解为 “人工智能算法”“医学影像类型”“诊断准确率” 等子问题,并通过多个搜索引擎并行搜索相关文献,最后整合搜索结果,提供详细的文献综述。
- 数据挖掘:在数据分析和挖掘过程中,MindSearch 可以帮助研究者获取相关的数据资源。例如,研究 “气候变化对农业产量的影响”,MindSearch 可以搜索全球气候变化数据、农业产量统计数据等,并通过透明路径展示数据的来源和处理过程,确保数据的可信度和可用性。
- 论文撰写:在撰写论文时,需要引用大量的学术观点和研究成果。MindSearch 可以帮助研究者快速找到相关的学术论文和研究报告,并通过透明路径展示引用内容的来源,方便研究者进行引用和参考文献的整理。
⚠️ 常见问题及解决
- 部署问题:在部署 MindSearch 时,可能会遇到依赖安装失败、模型下载缓慢等问题。可以检查网络连接是否正常,或者尝试使用国内的镜像源来加速下载。例如,在安装依赖时,可以使用豆瓣镜像源:
bash
pip install -r requirements.txt -i https://pypi.douban.com/simple
bash
复制
pip install -r requirements.txt -i https://pypi.douban.com/simple
- 搜索结果不准确:如果搜索结果不准确,可能是搜索关键词不够精准或搜索引擎配置不当。可以尝试调整搜索关键词,或者更换搜索引擎。例如,使用 Bing 搜索引擎可能会比 DuckDuckGo 获得更准确的搜索结果。
- API 密钥错误:如果在配置 API 密钥时遇到错误,需要检查密钥是否正确,以及是否具有相应的权限。例如,Bing API 密钥需要在微软 Bing 开发者中心进行注册和配置,并确保密钥处于激活状态。
总之,MindSearch 是一个功能强大的 AI 搜索框架,基于 InternLM2.5-7B 模型,支持自定义引擎和透明路径,能有效助力学术研究。通过本地部署、自定义引擎配置和透明路径功能的应用,研究者可以更高效地获取所需信息,提高研究效率和质量。
【该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具】