Facebook的CherryPi团队开源星际争霸平台TorchCraftAI
2018年11月23日 由 浅浅 发表
664370
0
2018 AIIDE StarCraft AI挑战赛顺利结束,Facebook AI Research的CherryPi团队获得亚军,现在宣布在Github上开源TorchCraftAI。
TorchCraftAI是一个平台,可以让你建立智能体学习玩《星际争霸:母巢之战》。TorchCraftAI包括:
- 用于构建星际争霸代理的模块化框架,其中模块可以被其他模块攻击,替换为其他模块,或者由ML / RL训练模型
- CherryPi,玩星际争霸游戏的机器人(2017年SSCAIT冠军,AIIDE 2018亚军)
- 完整游戏,迷你游戏,模型和训练循环的强化学习环境
- TorchCraft支持与星际争霸和BWAPI的TCP通信
- 支持Linux,Windows和OSX
教程
1.建筑物安置(torchcraft.github.io/TorchCraftAI/docs/bptut-intro.html)
将开发用于构建放置的神经网络模型。在星际争霸中,建筑物需要经济发展,例如收集资源或生产特定单位类型的能力。从整体决定用什么建筑,在哪里放置它带有一定的战略意义。
我们来看看CherryPi中使用的BuildingPlacer模块。它的输入是一个UPCTuple,带有“Create”命令和指定的单元类型(必须是建筑物)。然后,模块将位置分布细化到具体位置。实际构造将由Builder模块执行;然而,BuildingPlacer模块将使用智能体任务跟踪它,并执行可能不同位置的重试,直到最终构建建筑物。
2.微观管理(torchcraft.github.io/TorchCraftAI/docs/microtut-intro.html)
将使用Evolution Strategies开发一个用于微观管理场景的模型,微观管理是在战斗情况下控制你的部队,这是星际争霸胜利的关键组成部分。通过仔细控制你的单位,你可以摧毁更多的敌方单位。一个例子是聚焦射击:通过将攻击集中在较少的目标上,你可以更快地消灭敌方单位并减少它们对你造成的伤害。另一个例子是kiting:如果你有快速单位,与较慢的单位战斗距离较短或冷却时间较短,你可以执行攻击-逃跑-攻击-逃跑的序列,以便减少伤害。
开源:github.com/TorchCraft/TorchCraftAI