问题背景
目前 mem 已在 macOS 平台上支持接入本地大语言模型(Local LLM),这是一项非常实用的功能,可以有效保护用户的数据隐私并降低对云端服务的依赖。然而,据我所知,Windows 平台目前尚未支持本地 LLM 的接入。这对使用 Windows 的用户来说是一个明显的缺失。
功能请求
希望 mem 能够在 Windows 平台上支持接入本地大语言模型,具体建议如下:
优先支持 llama.cpp 后端
我目前在 Windows 上使用 llama.cpp 作为本地大模型的推理引擎。llama.cpp 具有以下特点,适合作为优先支持的方案:
- 跨平台支持(Windows / macOS / Linux)
- 提供兼容 OpenAI 格式的本地 HTTP API 服务(
llama-server),默认运行在 http://localhost:8080
- 支持主流开源模型(如Qwen、Gemma 等 GGUF 格式模型)
- 完全本地运行,数据不外传,隐私性强
- 无需 GPU,CPU 即可运行(可选 GPU 加速)
使用场景
- 在无网络或弱网络环境下继续使用 mem 的 AI 功能
- 对数据隐私有较高要求的个人用户或企业用户
- 希望降低 API 调用成本,使用开源模型替代云端服务
我的环境
| 项目 |
内容 |
| 操作系统 |
Windows 11 |
| 本地推理引擎 |
llama.cpp(llama-server) |
| 模型格式 |
GGUF |
| API 地址 |
http://localhost:8080/v1(OpenAI 兼容格式) |
期望的优先级
希望团队能将 Windows 本地 LLM 支持列入近期路线图,感谢团队的持续改进,期待这一功能早日上线!
问题背景
目前 mem 已在 macOS 平台上支持接入本地大语言模型(Local LLM),这是一项非常实用的功能,可以有效保护用户的数据隐私并降低对云端服务的依赖。然而,据我所知,Windows 平台目前尚未支持本地 LLM 的接入。这对使用 Windows 的用户来说是一个明显的缺失。
功能请求
希望 mem 能够在 Windows 平台上支持接入本地大语言模型,具体建议如下:
优先支持 llama.cpp 后端
我目前在 Windows 上使用 llama.cpp 作为本地大模型的推理引擎。llama.cpp 具有以下特点,适合作为优先支持的方案:
llama-server),默认运行在http://localhost:8080使用场景
我的环境
http://localhost:8080/v1(OpenAI 兼容格式)期望的优先级
希望团队能将 Windows 本地 LLM 支持列入近期路线图,感谢团队的持续改进,期待这一功能早日上线!