[功能请求] 支持 Windows 平台接入本地 LLM（以 llama.cpp 为例）

### 问题背景

目前 mem 已在 macOS 平台上支持接入本地大语言模型（Local LLM），这是一项非常实用的功能，可以有效保护用户的数据隐私并降低对云端服务的依赖。然而，据我所知，**Windows 平台目前尚未支持本地 LLM 的接入**。这对使用 Windows 的用户来说是一个明显的缺失。

---

### 功能请求

希望 mem 能够在 **Windows 平台**上支持接入本地大语言模型，具体建议如下：

**优先支持 llama.cpp 后端**

我目前在 Windows 上使用 [llama.cpp](https://github.com/ggerganov/llama.cpp) 作为本地大模型的推理引擎。llama.cpp 具有以下特点，适合作为优先支持的方案：

- 跨平台支持（Windows / macOS / Linux）
- 提供兼容 OpenAI 格式的本地 HTTP API 服务（`llama-server`），默认运行在 `http://localhost:8080`
- 支持主流开源模型（如Qwen、Gemma 等 GGUF 格式模型）
- 完全本地运行，数据不外传，隐私性强
- 无需 GPU，CPU 即可运行（可选 GPU 加速）

---

### 使用场景

- 在无网络或弱网络环境下继续使用 mem 的 AI 功能
- 对数据隐私有较高要求的个人用户或企业用户
- 希望降低 API 调用成本，使用开源模型替代云端服务

---

### 我的环境

| 项目 | 内容 |
|------|------|
| 操作系统 | Windows 11 |
| 本地推理引擎 | llama.cpp（llama-server） |
| 模型格式 | GGUF |
| API 地址 | `http://localhost:8080/v1`（OpenAI 兼容格式） |

---

### 期望的优先级

希望团队能将 Windows 本地 LLM 支持列入近期路线图，感谢团队的持续改进，期待这一功能早日上线！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[功能请求] 支持 Windows 平台接入本地 LLM（以 llama.cpp 为例） #225

问题背景

功能请求

使用场景

我的环境

期望的优先级

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

项目	内容
操作系统	Windows 11
本地推理引擎	llama.cpp（llama-server）
模型格式	GGUF
API 地址	`http://localhost:8080/v1`（OpenAI 兼容格式）

[功能请求] 支持 Windows 平台接入本地 LLM（以 llama.cpp 为例） #225

Description

问题背景

功能请求

使用场景

我的环境

期望的优先级

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions