本仓库可将学术论文 PDF(含代码)自动转化为tutorail。
- PDF → Markdown(保留公式、表格、图片)
- 自动提取并分类代码(预处理、前向、反演、评估)
- 按论文结构生成带详细中文讲解的教程
# 1. PaddleOCR(必须)
python -m pip install paddlepaddle-gpu==3.2.2 -i https://www.paddlepaddle.org.cn/packages/stable/cu126/
python -m pip install paddleocr
# 2. 其他依赖
pip install -r requirements.txt- 编辑
config.yaml,填入你的模型信息(示例):
llm:
provider: openai
api_key:
model: gpt-4o
temperature: 0.0-
把论文和代码放进
input/目录
示例:input/fpm.pdf和input/code.md -
修改
test.sh中的文件名 -
运行:
bash test.sh完成后在 output/ 目录得到完整的中文教程 Markdown。