极客网·人工智能 8月28日讯,在AI领域中,有一种叫做“强化学习”的衍生项目,其原理是利用奖赏(或惩罚)来驱动代理朝着特定的目标前进,目前DeepMind就是利用这种学习方式AlphaGo。然而,作为新兴事物的强化学习,其框架尚处于雏形,而且还在一定程度上缺乏人性化,例如用户需要花很多时间来掌握一个目标,十分死板也不够稳定。
针对这种种问题,Google近日提出了一个关于“强化学习”的改善方案,那就是基于其机器学习库TensorFlow的开源进行对学习框架的强化。据悉,该强化学习框架就灵活性、稳定性和重现性三个核心原则进行开发,目前它已在GitHub正式发布。
除了开源框架外,Google还做了一个网站,站内允许开发人员能快速将针对多个代理的培训运行进行可视化。另外,该网站也可以它还提供经过训练的模型、原始统计日志和TensorFlow事件文件,这些功能还可以跟TensorBoard一起绘图,而TensorBoard则是Google开发的用于TensorFlow程序的可视化工具套件。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )