阿里在研的对标o1模型的技术: Marco-o1
Marco-o1 结合了链式思维(Chain-of-Thought, CoT)微调、蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)、反思机制以及创新的推理策略,专为解决复杂的现实问题任务而优化。
不过目前只是发了论文,还未发布对应的产品。
阿里在研的对标o1模型的技术: Marco-o1
Marco-o1 结合了链式思维(Chain-of-Thought, CoT)微调、蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)、反思机制以及创新的推理策略,专为解决复杂的现实问题任务而优化。
不过目前只是发了论文,还未发布对应的产品。