首页
秒杀
榜单
抢券
9块9
搜商品
工业/农业技术
历史
旅游
生活
计算机/网络
外语/语言文字
经济
国外原版书/台版、港版书
传记
医学卫生
地图/地理
娱乐时尚
报纸
政治军事
期刊杂志
法律
淘宝网开店书籍专区
社会科学
培训课程
考试/教材/论文
小说
文化
管理
自我实现/励志
漫画/动漫小说
自然科学
文学
报刊订阅
保健/心理类书籍
工具书/百科全书
艺术
哲学和宗教
低于5元专区
儿童读物/教辅
育儿书籍
体育运动(新)
上新
销量
价格↑
价格↓
强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版
折后
¥
54.5
最近售200+件
and Large Language 海外直订Deep with Learning Chatbots Python 深度强 Reinforcement Rlhf for
券后
¥
585
最近售0件
and Rlhf Language 9798868802720 Chatbots Large Understand Learning Python 4周达 Deep Mod... with Reinforcement
折后
¥
672
最近售0件
4
效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 当当网 CoT
折后
¥
72.3
¥75.4
当当网官方旗舰店
售400+件
5
SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习
折后
¥
69.6
¥69.6
臣马图书音像专营店
售100+件
6
效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 强化学习 大模型算法 CoT
折后
¥
65.4
¥109
浙江新华书店旗舰店
售27件
7
SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习
1元
券后
¥
72
¥72
锦瑭图书专营店
售0件
8
效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT
折后
¥
57.55
¥57.55
畅想之星图书专营店
售36件
9
效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT
折后
¥
59.9
¥59.9
时代蔚蓝图书专营店
售0件
10
强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版
折后
¥
53.5
¥109
京广博图书专营店
售0件
11
强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版
折后
¥
53.5
¥109
清文图书专营店
售0件