帮酷LOGO
  • 显示原文与译文双语对照的内容
Play Google's T-rex game with TensorFlow

  • 源代码名称:TF-rex
  • 源代码网址:http://www.github.com/vdutor/TF-rex
  • TF-rex源代码文档
  • TF-rex源代码下载
  • Git URL:
    git://www.github.com/vdutor/TF-rex.git
  • Git Clone代码到本地:
    git clone http://www.github.com/vdutor/TF-rex
  • Subversion代码到本地:
    $ svn co --depth empty http://www.github.com/vdutor/TF-rex
    Checked out revision 1.
    $ cd repo
    $ svn up trunk
  • tf

    在这个项目中,我们使用强化学习来玩谷歌游戏。 RL算法基于深度q 学习算法 [1],并在TensorFlow中实现。

    ========================================================================== =

    查看 ACCOMPAGNYING BLOGPOST 它包含了很多有用的信息。

    ========================================================================== =

    依赖项

    • python 3.5或者更高的
    • 枕头 4.3.0
    • mytable 0.19.1
    • tensorflow 1.7.0或者更高版本
    • 可选:tensorflow tensorboard

    安装

    在 macOS,Debian,Ubuntu和基于Ubuntu的发行版上测试。

    从克隆存储库开始

    $ git clone https://github.com/vdutor/TF-rex

    我们建议在安装所需的软件包之前创建一个 virtualenv 。 有关如何执行这里操作,请参见 virtualenv 或者 virtualenv包装器。

    可以使用pip方便地安装依赖项。

    $ optional: open the virtualenv
    $ pip install -r requirements.txt

    正在启动

    用于运行 javascript-t 游戏的服务器端服务器

    运行t javascript游戏需要一个简单的web服务器。 实现这一点最简单的方法是使用简单的python HTTP服务器模块。 打开一个新终端并导航到 TF-Rex/game,然后运行以下命令

    $ cd/path/to/project/TF-Rex/game
    $ python2 -m SimpleHTTPServer 8000

    游戏现在在你的本地主机 127.0.0.1:8000 上。 这个方法被测试为 Chrome 和 Mozilla Firefox 。

    tf

    首先,所有命令行参数都可以用

    $ python main.py --help

    使用 pretrained q 学习器快速检查安装是否成功。

    $ python main.py --notraining --logdir./trained-model

    这个命令将恢复pretrained模型,存储在 ./trained-model 中,并播放t 游戏。

    重要:浏览器需要与 python 端连接。 因此,在激发后刷新浏览器 python main.py --notraining --logdir./trained-model

    TF-REX

    培训一个新的模型可以如下所

    $ python main.py --logdir logs

    同样,浏览器需要刷新以启动进程。 作为 logdir 参数传递的目录将用于存储中间tensorflow检查点和tensorboard信息。

    训练时,可以打开不同的终端来启动 tensorboard

    $ tensorboard --logdir logs

    tensorboards在 http://127.0.0.1:6006/ 上可见。

    引用

    [1] play Atari Deep强化学习。




    Copyright © 2011 HelpLib All rights reserved.    知识分享协议 京ICP备05059198号-3  |  如果智培  |  酷兔英语