歌词生成系统 - 使用LoRA和强化学习的AIGC创意文本生成

项目简介

本项目是一个基于DeepSeek和Qwen大语言模型的歌词生成系统，通过LoRA微调和强化学习技术优化生成质量。系统提供GUI界面，用户输入关键词即可生成创意歌词。

系统要求

Python 3.11
CUDA 12.6 (如需GPU加速)
至少16GB内存 (推荐32GB)
支持PyTorch的NVIDIA GPU (推荐)

安装指南

1. 创建conda环境

conda create -n Goodmusic python=3.11
conda activate Goodmusic

2. 安装PyTorch

根据您的硬件选择以下命令之一：

CUDA 12.6版本:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

CPU版本:

pip3 install torch torchvision torchaudio

3. 安装项目依赖

pip install -r requirements.txt

配置说明

模型配置

系统支持以下预训练模型适配器：

DS_LoRA/: 基础DeepSeek模型的LoRA适配器
DS_RL_model/: 强化学习微调的DeepSeek模型
Qwen_LoRA/: 基础Qwen模型的LoRA适配器
Qwen_CoT_LoRA/: 带思维链的基础Qwen模型适配器

默认使用DS_RL_model，如需切换模型，请修改code/_MyModel.py中的model_path参数。

推理参数配置

可在code/_MyModel.py中调整以下参数：

max_length: 生成文本最大长度
temperature: 生成随机性
top_p: 核采样参数
repetition_penalty: 重复惩罚系数

使用方法

启动GUI界面

python code/__main__.py

界面操作指南

在输入框输入关键词(如"爱情"、"夏天")
点击"生成"按钮
等待生成结果(CPU推理可能需要较长时间)

模型训练

数据准备

将训练数据放入data/文件夹
支持的数据格式：
- CoTdata.txt: 带思维链的训练数据
- DSdata.txt: 关键词-原文对训练数据
- processed_data.txt: 预处理后的训练数据
- 由于后两个数据文件过大，您还需要下载项目之后解压，如果您想得到原始数据，请去我的HuggingFace主页下载
- https://huggingface.co/AISkywalker

训练流程

LoRA微调:

python code/LORA.py

或带思维链版本:

python code/LORA_with_CoT.py

强化学习优化: 运行code/GRPO.ipynb笔记本进行基于规则的策略优化

训练参数调整

各训练脚本中提供详细参数注释，主要可调整：

学习率
训练轮次
批大小
LoRA秩参数

项目结构

project/
├── README.md              # 项目说明文档
├── requirements.txt       # Python依赖包列表
│
├── code/                  # 源代码目录
│   ├── __main__.py        # 主程序入口(GUI启动)
│   ├── _MyModel.py        # 核心模型实现(加载/推理)
│   ├── UI.py              # PyQt5用户界面实现
│   ├── reward.py          # 强化学习奖励函数定义
│   ├── data_process.py    # 数据预处理和清洗
│   ├── deepseek_vaule.py  # 调用DeepSeek模型评价相关工具
│   ├── getCOT.py          # 思维链生成工具
│   ├── GRPO.ipynb         # 强化学习训练笔记本
│   ├── LORA.py            # LoRA微调基础实现
│   ├── LORA_with_CoT.py   # 带思维链的LoRA微调
│   ├── test.ipynb         # 测试和实验笔记本
│   └── threads_data_extract.py  # 多线程数据处理得到关键词对数据s
│
├── data/                  # 数据目录
│   ├── CoTdata.txt        # 带思维链的训练数据
│   ├── DSdata.txt         # 原始训练数据(关键词-歌词对)
│   └── processed_data.txt # 预处理后的训练数据
│
├── DS_LoRA/               # DeepSeek基础LoRA适配器
│
├── DS_RL_model/           # 强化学习微调模型
│
├── Qwen_LoRA/             # Qwen基础LoRA适配器
│
└── Qwen_CoT_LoRA/         # 带思维链的Qwen适配器

常见问题

GPU内存不足:
- 减小max_length参数
- 使用LORA.py中的fp16选项
生成质量不佳:
- 调整temperature和top_p参数
- 使用带思维链的模型(Qwen_CoT_LoRA)
安装问题:
- 确保Python版本为3.11
- 检查CUDA/cuDNN版本匹配

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

歌词生成系统 - 使用LoRA和强化学习的AIGC创意文本生成

项目简介

系统要求

安装指南

1. 创建conda环境

2. 安装PyTorch

3. 安装项目依赖

配置说明

模型配置

推理参数配置

使用方法

启动GUI界面

界面操作指南

模型训练

数据准备

训练流程

训练参数调整

项目结构

常见问题

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
DS_LoRA		DS_LoRA
DS_RL_model		DS_RL_model
Qwen_CoT_LoRA		Qwen_CoT_LoRA
Qwen_LoRA		Qwen_LoRA
code		code
data		data
README.md		README.md
requirements.txt		requirements.txt
technical_report.pdf		technical_report.pdf

Folders and files

Latest commit

History

Repository files navigation

歌词生成系统 - 使用LoRA和强化学习的AIGC创意文本生成

项目简介

系统要求

安装指南

1. 创建conda环境

2. 安装PyTorch

3. 安装项目依赖

配置说明

模型配置

推理参数配置

使用方法

启动GUI界面

界面操作指南

模型训练

数据准备

训练流程

训练参数调整

项目结构

常见问题

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages