AlphaXiv запустили онлайн-симулятор RL Playground, где можно посмотреть, как ведут себя разные алгоритмы обучения с подкреплением