今天我们开始第5节课的学习啦! 第5节课打卡DDL:1月19日(周五)晚20:30 第5节课内容:使用 LMDeploy 量化部署你的 InternLM 大模型,体验极致的推理速度和显存优化 文档:https://github.com/InternLM/tutorial/blob/vansin-patch-4/lmdeploy/lmdeploy.md 视频:https://www.bilibili.com/video/BV1iW4y1A77P 第5节课(15班)作业提交地址:https://github.com/InternLM/tutorial/discussions/95 第5节课(15班)笔记提交地址:https://github.com/InternLM/tutorial/discussions/40
基础作业:
进阶作业(可选做)
挑战
LMDeploy
1 量化的作用
大模型是内存性任务
核心算法 MIT AWQ or GPTQ