首页
文章
分类
标签
一言
友链
关于
开往
搜索
搜索
标签: SFT
共找到 1 篇相关文章
返回标签列表
人工智能实训Day2:大模型对齐技术实践——SFT与DPO
2026-06-24 15:00:00
人工智能实训Day2笔记:使用LLaMA-Factory对Qwen1.5-0.5B-Chat进行SFT监督微调(GSM8K)与DPO直接偏好优化(Math-Step-DPO-10K),包括CoT推理增强与β参数敏感性分析。
人工智能
大模型
SFT
DPO
对齐
实训
学习
实习
Read More