1650

查询码: 00000840

ChatGLM3-6B大模型的部署与使用教程（保姆级）

来源:https://blog.csdn.net/m0_59235945/article/details/139969700

作者: 系统管理员1 于 2024年07月04日 发布在分类 / 配置安装 / AI / LLM ,于 2024年07月04日编辑

linux windows 模型文件代码博客版本

本文链接： https://blog.csdn.net/m0_59235945/article/details/139969700

版权

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，具有对话流畅、部署门槛低等众多优秀特性。本文将从零开始，讲解ChatGLM3-6b的部署及使用，全文一共2000多字，篇幅较长，主要包括以下六个部分：

一、下载项目代码和模型文件

二、安装miniconda

三、创建conda环境

四、根据cuda版本来选择合适的pytorch版本

五、运行chatglm相关的服务

六、FastGPT知识库问答使用本地 chatglm服务

本文实验的配置：

GPU：英伟达 3090 24G显存

操作系统：centos 7

一、下载项目代码和模型文件

1、代码地址：

https://github.com/THUDM/ChatGLM3

2、下载对应的模型文件

modelscope对应的模型地址：

https://modelscope.cn/models/ZhipuAI/chatglm3-6b/files

可以使用如下的 git命令进行下载：

git lfs install``git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

文件大小11.64G，根据个人网速不同，本人大约等待30分钟后，下载完成；

下载完成后，将代码和对应的模型文件传到服务器上，作者是将模型文件放在项目代码的根目录。

二、安装miniconda

-------若已安装miniconda或者conda可以跳过这节------------

1、安装最新版本的 miniconda

wget http://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh

2、执行安装

bash Miniconda3-latest-Linux-x86_64.sh

输入enter ，一路yes即可

安装完成后，关闭shell窗口，重新打开，就可以看到已经装好了

三、创建conda环境

创建一个conda环境，用于安装大模型运行的依赖包

3.1 首先看到requirements.txt，可以看到官网推荐的torch版本>=2.0，但是当torch==1.13.1时也可以运行，看你们自己的选择。

3.2 选择合适的python的版本

python与pytorch版本的对应关系如下：

https://github.com/pytorch/vision#installation

3.3 选择的 python版本大于3.8，使用如下命令进行创建conda环境。

conda create --name py3811 python==3.8.11

3.4 激活创建好的conda环境：

conda activate py3811

四、根据显卡cuda的版本来选择合适的pytorch版本

4.1、查看显卡信息

nvidia-smi

ps:如何安装cuda及cudnn，可自行百度安装，本文不再讲述。

从官网选择合适的pytorch版本：

地址：https://pytorch.org/get-started/previous-versions/

因为作者的显卡cuda版本为11.6，所以选择 torch==1.13.1的版本；

4.2 cuda为11.6 的pytorch安装命令

conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.6 -c pytorch -c nvidia

如果你的显卡cuda版本为11.7或者11.8，你可以选择torch>=2.0的版本

4.3 cuda为11.7或者11.8的pytorch安装命令

# CUDA 11.7``conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.7 -c pytorch -c nvidia``# CUDA 11.8``conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.8 -c pytorch -c nvidia

4.4 本文采用cuda为11.6 的pytorch安装命令

4.5 进入代码目录，安装依赖包

作者的torch版本为1.13.1，所以删除掉 requirements.txt 中的红框部分，如果你的torch大于2.0 ，则不需要删除这一行。

4.6 执行如下命令，批量安装依赖包

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

安装完成！

五、运行chatglm相关的服务

5.1、交互式对话程序：cli_demo.py

（1）修改模型文件加载的路径

模型文件放在代码的根目录。

本文将模型文件放在代码的同级目录，所以修改下cli_demo.py 中模型文件存放的位置，填入模型文件所在的相对路径或者绝对路径。

#原始路径``tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)``model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).cuda()``#改为下面的路径``tokenizer = AutoTokenizer.from_pretrained("chatglm3-6b", trust_remote_code=True)``model = AutoModel.from_pretrained("chatglm3-6b", trust_remote_code=True).cuda()

（2）运行简单交互对话的程序：

python cli_demo.py

启动服务后，显存大概占用了 12G左右。

5.1、启动openai的接口服务：openai_api.py

（1）同样需要修改模型路径

（2）修改代码

将openai_api.py文件中3处

chunk.json(exclude_unset=True, ensure_ascii=False)

替换为

chunk.model_dump_json(exclude_unset=True,exclude_none=True)

改为如下图红框位置所示：

（3）启动服务

python openai_api.py

（4）利用requests请求调用chatglm的接口服务：

openai_url=“http://ip:8000/v1/chat/completions”

ip:chatglm部署的ip

完整代码如下：

#!/usr/bin/env python``# -*- coding: UTF-8 -*-``"""``@Project ：chatgpt``@File ：openai_function.py``@Author ：aixiaoxin``@Date ：2023/10/27 17:28``"""``import requests``  ``def request_chatgpt_function():`  `# 通用方法：利用requests 请求调用`  `question = "你是谁？"`  `openai_url="http://ip:8000/v1/chat/completions" # 可以替换为任何代理的接口，官网地址 https://api.openai.com/v1/chat/completions` `OPENAI_API_KEY="sk-amd6pTaiXrJ6U8VjFb7dB439A97542D5A2E4Ed38C1BaC9D2" # openai的key，此处不需要填写` `header={"Content-Type": "application/json","Authorization": "Bearer " +OPENAI_API_KEY}` `data={` `"model": "gpt-3.5-turbo",` `"messages": [` `{` `"role": "system",` `"content": "You are a helpful assistant."` `},` `{` `"role": "user",` `"content": question` `}` `],` `"stream":False` `}` `print("问题:{}".format(question))` `response=requests.post(url=openai_url,headers=header,json=data).json()` `print("完整的响应结果:{}".format(response))` `answer = response["choices"][0]["message"]["content"]` `print("答案:{}".format(answer))`` `` `` ``if __name__ == "__main__":` `request_chatgpt_function() # 通用方法：利用requests 请求调用

运行结果：

（5）利用openai接口流式调用chatglm的服务：

openai.api_base = “http://ip:8000/v1”

ip:填入chatglm部署的服务器的ip

完整代码如下：

#!/usr/bin/env python``# -*- coding: UTF-8 -*-``"""``@Project ：chatgpt_project``@File ：chatglm_request.py``@Author ：aixiaoxin``@Date ：2023/10/29 14:32``"""``import openai``if __name__ == "__main__":`  `openai.api_base = "http://ip:8000/v1"`  `openai.api_key = "none"`  `for chunk in openai.ChatCompletion.create(`    `model="chatglm3-6b",`    `messages=[`      `{ "role": "user", "content": "你好"}`    `],`    `stream=True`  `):`    `if hasattr(chunk.choices[0].delta, "content"):`      `print(chunk.choices[0].delta.content, end="", flush=True)

运行截图：

六、FastGPT知识库问答使用本地 chatglm服务

先运行上一节中的接口服务：python openai_api.py

找到fastgpt项目中的

files\deploy\fastgpt\docker-compose.yml 文件

将OPEN_BASE_URL 改为如下地址：

http://ip:8000/v1

ip：表示大模型部署服务器的ip

综合
评分

0.0分

0人参与

备注	修改日期	修改人
内容更新	2024-07-04 00:08:53[当前版本]	系统管理员1
创建版本	2024-07-04 00:07:55	系统管理员1

附件类型	PNG
0015bc23c7ad40379c9d6bb3c6e22766.png(241364.0b) 20f777b950384634a171f7f1344b9f55.png(97470.0b) 2f57fa225b1a48e9989ccab8870e1c59.png(97701.0b) 34d6694819404cad9f22e94ffbca7add.png(262943.0b) 4361748236dd4c9085915cb75bb5158b.png(8042.0b) 457ad5f15cb74c62b200593a7dfbb7ff.png(68227.0b) 49d4bfb01911481ca856db4a2dfcaa77.png(149893.0b) 4a3d784956624454b7683b20ef36df74.png(90429.0b) 537916066d9f4e02a0e1748b7964610a.png(18762.0b) 6541b44308884b248170053bda7e8788.png(44044.0b) 660aa4556778422292b5ad85fdce0b0b.png(262280.0b) 6a649cde67f7468eb5f66e7308151df0.png(70739.0b) 7bfd66f7d56c4e40b77d9c615a84710f.png(166566.0b) 7d65ef9ea51e4ac8ae03ae7594d6f667.png(183336.0b) 7f6140032ee049c5824950e93c7be4d7.png(24989.0b) 87b1d8e8fbba4b5084eb8c6957162402.png(93094.0b) 88b590d148a947b09e60eb350415c8ab.png(71789.0b) 93678f8903c64b3eb66c47dd1809bbae.png(33409.0b) 96a3bf880cdd4e98a194e7b2b1ead7d6.png(239741.0b) 9ce81d7ebadd4714be30dad93e46c8a0.png(9217.0b) 9fd8c2f149404ae8ac5cd9fac2d1d5d7.png(163253.0b) a673af418757499eb34474cd49e62913.png(214444.0b) b697ada9ab174d9c89025fcba9154dfc.png(70739.0b) ce004fed711548598569130ccb3fb864.png(276240.0b) eb28168f00024024814b675b1076b2c8.png(103428.0b) eb66ef97947d45a2aeb006d7923c8acd.png(364280.0b) eca11c2ed518411dabcdef8fe808d2cf.png(27479.0b) f674f2622a21417f9ec3933fb0f8e7bf.png(36253.0b) fdd45ebe2833424c94d238ddc698e0ab.png(109282.0b) ff54c098a30e48329ba20ddd228c8c48.png(46694.0b)

[Title]