首页秒杀榜单抢券9块9

  • 效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 当当网 CoT

    折后¥72.3

    最近售400+件

    SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习

    折后¥69.6

    最近售100+件

    效果优化及其实践 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 强化学习 大模型算法 CoT

    折后¥65.4

    最近售27件

    4

    SFT DPO 详解强化学习 微调与对齐 效果优化及其实践 DeepSeek蒸馏 CoT GRPO RLHF 大模型算法:强化学习

    1元

    券后¥72¥72

    锦瑭图书专营店售0件

    5

    效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT

    折后¥57.55¥57.55

    畅想之星图书专营店售36件

    6

    效果优化及其实践书籍 详解强化学习 DeepSeek蒸馏 RLHF GRPO DPO 微调与对齐 SFT 大模型算法:强化学习 正版 CoT

    折后¥59.9¥59.9

    时代蔚蓝图书专营店售0件