今天我们开始第5节课的学习啦! 第5节课打卡DDL:1月19日(周五)晚20:30 第5节课内容:使用 LMDeploy 量化部署你的 InternLM 大模型,体验极致的推理速度和显存优化 文档:https://github.com/InternLM/tutorial/blob/vansin-patch-4/lmdeploy/lmdeploy.md 视频:https://www.bilibili.com/video/BV1iW4y1A77P 第5节课(15班)作业提交地址:https://github.com/InternLM/tutorial/discussions/95 第5节课(15班)笔记提交地址:https://github.com/InternLM/tutorial/discussions/40

作业

基础作业:

进阶作业(可选做)

笔记

部署

Untitled

挑战

Untitled

LMDeploy

Untitled

1 量化的作用

Untitled

大模型是内存性任务

Untitled

核心算法 MIT AWQ or GPTQ