首页秒杀榜单抢券 9块9

工业/农业技术 历史 旅游 生活 计算机/网络 外语/语言文字 经济 国外原版书/台版、港版书 传记 医学卫生 地图/地理 娱乐时尚 报纸 政治军事 期刊杂志 法律 淘宝网开店书籍专区 社会科学 培训课程 考试/教材/论文 小说 文化 管理 自我实现/励志 漫画/动漫小说 自然科学 文学 报刊订阅 保健/心理类书籍 工具书/百科全书 艺术 哲学和宗教 低于5元专区 儿童读物/教辅 育儿书籍 体育运动(新)

上新销量价格↑价格↓

强化学习微调与对齐书籍从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南电子工业出版大模型算法社正版

折后¥54.5

最近售200+件

and Large Language 海外直订Deep with Learning Chatbots Python 深度强 Reinforcement Rlhf for

券后¥585

最近售0件

and Rlhf Language 9798868802720 Chatbots Large Understand Learning Python 4周达 Deep Mod... with Reinforcement

折后¥672

最近售0件

4

效果优化及其实践详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法：强化学习当当网 CoT

折后¥72.3¥75.4
当当网官方旗舰店售400+件

5

SFT DPO 详解强化学习微调与对齐效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法：强化学习

折后¥69.6¥69.6
臣马图书音像专营店售100+件

6

效果优化及其实践详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 强化学习大模型算法 CoT

折后¥65.4¥109
浙江新华书店旗舰店售27件

7

SFT DPO 详解强化学习微调与对齐效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法：强化学习

1元

券后¥72¥72
锦瑭图书专营店售0件

8

效果优化及其实践书籍详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法：强化学习正版 CoT

折后¥57.55¥57.55
畅想之星图书专营店售36件

9

效果优化及其实践书籍详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法：强化学习正版 CoT

折后¥59.9¥59.9
时代蔚蓝图书专营店售0件

10

强化学习微调与对齐书籍从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南电子工业出版大模型算法社正版

折后¥53.5¥109
京广博图书专营店售0件

11

强化学习微调与对齐书籍从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南电子工业出版大模型算法社正版

折后¥53.5¥109
清文图书专营店售0件