在过去一年的研究中,OpenAI团队开源一个使用 MuJoCoengine开发的用于机器人模拟的高性能Python库。据悉,该Python库是OpenAI团队深入学习机器人研究的核心工具之一,现在该团队发布的是作为MuJoCo的主要版本的mujoco-py(Python 3的 MuJoCo 绑定)。 Mujoco-py 1.50.1.0带来了许多新的功能和显着的性能提升。获悉,新功能包括以下几点:
轨迹(trajectory)优化和强化学习中的许多方法(如LQR,PI2和TRPO)可以从并行运行多个模拟中受益。 mujoco-py通过OpenMP使用数据并行,并通过Cython和NumPy直接访问内存管理,从而使批量模拟更有效率。
新版本的MjSimPool接口的初步使用显示,速度超过旧版本的400%,并且在一个已优化和受限的使用模式中(通过 Python 的多处理工具包获取相同水平的并行计算)仍然大约为旧版本的180%。提速的大部分原因在于MuJoCo各种数据结构的访问时间缩短。
在OpenAI的许多项目中都使用域随机化技术。 最新版本的mujoco-py支持支持自动的(headless)GPU 渲染,与基于CPU的渲染相比,它的速度有40倍的提升,可以每秒产生数百帧的合成图像数据。 在上述(减速)动画中,OpenAI使用理随机化技术来改变一个机器人的纹理,帮助这个机器人辨识其身体(在将其从模拟器转移至现实时)。 请查看examples / disco_fetch.py以获取随机纹理生成的示例。
由mujoco-py公开的API足以使虚拟现实交互而无需任何额外的C ++代码。 OpenAI使用mujoco-py将MuJoCo的C ++ VR示例移植到Python。 如果您有HTC Vive VR设置,您可以尝试使用这一示例(此支持被认为是实验性的,但是OpenAI已经在内部使用它了)。
开始使用mujoco-py的最简单的方式是使用MjSim class。 它是围绕模拟模型和数据的包装(wrapper),可让您轻松地进行模拟并从相机传感器中渲染图像。 下面是一个简单的例子:
对于高阶用户,OpenAI 提供了大量的低水平接口以直接访问 MuJoCo C 结构体和内部函数。
上一篇:GPT-4o发布!人工智能引发全民教育焦虑斯坦星球Python AI课程培养未来人才
下一篇:微软:VS Code 是性能和体验最好的 Python 代码编辑器