GLM-TTS是智谱刚刚开源的一个基于Transformer的文本到语音(TTS)模型,本分享了我在Windows系统上使用WSL2(Windows Subsystem for Linux)部署GLM-TTS推理环境的完整流程。过程中大概率会碰到依赖构建失败问题,或者依赖缺少问题。可以直接跳到后面章节查看处理方式,因为那也是我碰到的问题。
系统环境
硬件环境
- 操作系统: Windows 11 专业版 25H2
- 内存: 32GB
- GPU: 移动版的NVidia
软件环境
- WSL2: 已安装并配置的WSL2环境,Ubuntu 22.04 LTS
- Python: Python 3.12
- CUDA: CUDA 11.8
第一步:WSL2环境配置
1.1 启用WSL2功能
以管理员身份打开PowerShell,执行以下命令:
1 | # 启用WSL功能 |
1.2 安装WSL2 Linux发行版
重启后,打开Microsoft Store,搜索并安装Ubuntu 22.04 LTS。
或者使用命令行安装:
1 | # 查看可用的发行版 |
1.3 设置WSL2为默认版本
1 | wsl --set-default-version 2 |
第二步:WSL2环境准备
2.1 启动WSL2并更新系统
打开Ubuntu终端,执行:
后续命令都是在wsl的shell下执行
1 | # 更新系统包管理器 |
2.2 安装Miniconda(推荐)
1 | # 下载并安装Miniconda |
2.3 安装CUDA(如使用GPU)
1 | # 下载并安装CUDA 11.8 |
第三步:GLM-TTS项目部署
3.1 克隆项目仓库
在WSL2中执行:
1 | # 克隆GLM-TTS仓库 |
3.2 创建Conda虚拟环境
1 | # 创建名为glm-tts的conda环境,指定Python 3.12 |
3.3 安装项目依赖
1 |
|
3.4 安装可选依赖(强化学习模块)
1 | # 进入grpo目录 |
第四步:模型下载
4.1 创建模型目录
1 | mkdir -p ckpt |
4.2 从ModelScope下载模型
1 | # 安装modelscope |
第五步:环境验证
5.1 验证Conda环境
1 | # 验证conda环境 |
5.2 验证模型文件
1 | # 检查模型文件是否完整 |
第六步:运行推理测试
6.1 命令行推理测试
1 | # 基本推理测试 |
6.2 启动Web界面
1 | # 启动Gradio交互界面 |
第七步:常见问题解决
7.1 内存不足问题
如果遇到内存不足错误:
1 | # 减少批处理大小 |
7.2 WSL2与Windows文件系统权限问题
如果项目在Windows文件系统中:
1 | # 在WSL2中处理Windows文件时,可能需要修复权限 |
7.3 依赖构建失败问题,或者依赖缺少问题
- 构建sentencepiece失败
1 | # 直接pip安装sentencepiece |
- 构建pynini失败
1 | # 通过conda安装pynini |
- 运行时缺少soxr库
1 | # 安装soxr库 |
如果还有其他同类的问题,都可以尝试直接通过pip安装,或者通过conda安装,版本可能不一致,但只要后面运行ok,应该就没问题。
如果还遇到任何问题,欢迎留言一块讨论。