Xianming谈到了强化学习的看法:强化学习不是万金油。强化学习一定需要一个

楷瑞看汽车啊 2026-03-02 17:42:41

Xianming 谈到了强化学习的看法:

强化学习不是万金油。

强化学习一定需要一个非常强的基座模型,它至少能采样到可实现这个问题解决方案的一个可行性。如果连这个东西没有的话,其它就没有办法进行。

但是强化学习是效率特别高、且定向去解决问题的、且能持续去探索各种coner case 的一种学习方式,所以大家不用吧它当成一个解决万物的万能体,而是一个高效学习方式。

小鹏汽车小鹏第二代vla发布

0 阅读:0
楷瑞看汽车啊

楷瑞看汽车啊

感谢大家的关注