首页秒杀榜单抢券9块9

  • 强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版

    折后¥54.5

    最近售200+件

    and Large Language 海外直订Deep with Learning Chatbots Python 深度强 Reinforcement Rlhf for

    券后¥585

    最近售0件

    and Rlhf Language 9798868802720 Chatbots Large Understand Learning Python 4周达 Deep Mod... with Reinforcement

    折后¥672

    最近售0件

    4

    效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 当当网 CoT

    折后¥72.3¥75.4

    当当网官方旗舰店售400+件

    5

    SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习

    折后¥69.6¥69.6

    臣马图书音像专营店售100+件

    6

    效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 强化学习 大模型算法 CoT

    折后¥65.4¥109

    浙江新华书店旗舰店售27件

    7

    SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习

    1元

    券后¥72¥72

    锦瑭图书专营店售0件

    8

    效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT

    折后¥57.55¥57.55

    畅想之星图书专营店售36件

    9

    效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT

    折后¥59.9¥59.9

    时代蔚蓝图书专营店售0件

    10

    强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版

    折后¥53.5¥109

    京广博图书专营店售0件

    11

    强化学习 微调与对齐 书籍 从RLHF到DPO全流程解析大语言模型训练优化与安全部署指南 电子工业出版 大模型算法 社正版

    折后¥53.5¥109

    清文图书专营店售0件