当前位置：首页 > news >正文

MLAgents (0) Unity 安装及运行

news 2026/5/13 2:34:33

1、下载ML-Agents

下载地址

GitHub - Unity-Technologies/ml-agents: The Unity Machine Learning Agents Toolkit (ML-Agents) is an open-source project that enables games and simulations to serve as environments for training intelligent agents using deep reinforcement learning and imitation learning.

在develop-Tags中，选择release_18

下载zip文件，解压

2、anaconda配置pytorch环境

conda create -n 名称 python=3.9.9

注意：Python 3.9.10 以上目前与mlagents-learn 套件不相容，会出现错误TypeError: Invalid first argument to `register()`. typing.Dict[mlagents.trainers.settings.RewardSignalType, mlagents.trainers.settings.RewardSignalSettings] is not a class.

conda activate 名称

激活环境

在环境中安装pytorch

conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge

安装完成后，执行python-->import torch-->torch.cuda.is_available()

如果为true，则安装成功

3、安装ml-agents-release_18所需要的库

在anaconda激活的环境中

（1）cd ml-agents-release_18的文件目录

定位到ml-agents-envs，在文件夹中创建文件setup.cfg清华源加快下载速度

[easy_install]

index_url = https://pypi.tuna.tsinghua.edu.cn/simple

执行命令 python setup.py install

安装库

安装出现 Finished processing dependencies for mlagents-envs==0.27.0

则为安装成功

（2）cd .. --> cd ml-agents

也增加setup.cfg文件

执行命令 python setup.py install

出现错误：error: urllib3 2.0.4 is installed but urllib3<2.0 is required by {'google-auth'}

执行：pip uninstall urllib3

pip install -i https://pypi.douban.com/simple urllib3=1.26.9

重新安装urllib3

再次执行python setup.py install

当出现 Finished processing dependencies for mlagents==0.27.0

即为安装完成

4、在unity中 Window--> Package Manager

找到 com.unity.ml-agents，导入package.json

等待安装完成

之后可以搭建环境，并设置参数等

5、开启ml-agents，运行项目

在unity项目中，创建training-->xxx_config.yamlzheshi

behaviors:RB:trainer_type: ppohyperparameters:batch_size: 10buffer_size: 100learning_rate: 0.0003beta: 0.0005epsilon: 0.2lambd: 0.99num_epoch: 3learning_rate_schedule: linearnetwork_settings:normalize: falsehidden_units: 128num_layers: 2reward_signals:extrinsic:gamma: 0.99strength: 1.0max_steps: 500000time_horizon: 64summary_freq: 10000

设置完成后，在anaconda中，定位到unity项目的training

cd xx/xx/unity_project/training

执行命令： mlagents-learn.exe xxx.yaml --run-id=RB

报错：ModuleNotFoundError: No module named 'six'

执行 pip install -i https://pypi.douban.com/simple six

再次执行命令

当出现以下界面

则运行成功，端口也开启成功

此时点击unity的运行按钮，执行运行操作

结果生成在training文件夹中

当要界面化看结果时，需要执行命令

tensorbord.exe --logdir results --port 6006

预训练后的模型保存在Assets中，要使用预训练后的模型

可将模型拖到Behavior Parameters的Model上

mlagents-learn.exe xxx.yaml --run-id=RB --resume

继续上次训练的命令

MLAgents (0) Unity 安装及运行

1、下载ML-Agents 下载地址 GitHub - Unity-Technologies/ml-agents: The Unity Machine Learning Agents Toolkit (ML-Agents) is an open-source project that enables games and simulations to serve as environments for training intelligent agents using deep reinfo…...

编程日记 2023/9/21 9:27:20

typename关键字详解(消除歧义)

typename关键字详解文章目录 typename关键字详解定义用法1.和class同义，用于引入泛型编程中所用到的模板参数2.用来消除歧义，告诉编译器后面的是类型名而不是变量名定义 typename相当于泛型编程中class的同义关键字，用来指出模板类型所依赖…...

编程日记 2023/9/21 9:26:19

设计模式_解释器模式

解释器模式案例角色 1 解释器基类 （BaseInterpreter） 2 具体解释器1 2 3... (Interperter 1 2 3 ) 3 内容 (Context) 4 用户 (user) 流程 (上下文) ---- 传…...

编程日记 2023/9/21 9:23:16

【算法基础】数学知识

质数质数的判定 866. 试除法判定质数 - AcWing题库时间复杂度是logN #include<bits/stdc.h> using namespace std; int n; bool isprime(int x) {if(x<2) return false;for(int i2;i<x/i;i){if(x%i0) return false;}return true; } signed main() {cin>&g…...

编程日记 2023/9/21 9:22:15

PDCA循环

目录 1.认识PDCA： 2.PDCA循环的经典案例 3.PDCA的四个阶段和八个步骤 4.PDCA循环的优缺点： 5.案例 6.其他作用 1.认识PDCA： PDCA循环最早由美国质量统计控制之父Shewhat（休哈特）提出的PDS（Plan Do Se…...

编程日记 2023/9/21 9:20:13

Redis 缓存雪崩、缓存穿透、缓存击穿

Redis 是一种常用的内存缓存工具，但在某些情况下，它可能会遭受缓存雪崩、缓存穿透和缓存击穿等问题。下面是一些预防这些问题的建议： 1、缓存雪崩缓存雪崩指的是在某个时间点上，大量的缓存数据同时失效或过期，导致大…...

编程日记 2023/9/21 9:18:12

Android Media3 ExoPlayer 开启缓存功能

ExoPlayer 开启播放缓存功能，在下次加载已经播放过的网络资源的时候，可以直接从本地缓存加载，实现为用户节省流量和提升加载效率的作用。方法一：采用 ExoPlayer 缓存策略第 1 步：实现 Exoplayer 参考 Exoplayer 官…...

编程日记 2023/9/21 9:17:11

MyBatis注解开发

MyBatis常用注解注解对应XML说明Insert< insert>新增SQLUpdate< update>更新SQLDelete< delete>删除SQLSelect< select>查询SQLParam–参数映射Results< resultMap>结果映射Result< id>< result>字段映射开发流程： 1…...

编程日记 2023/9/21 9:15:09

C# Onnx Yolov8 Cls 分类

效果项目代码 using Microsoft.ML.OnnxRuntime; using Microsoft.ML.OnnxRuntime.Tensors; using OpenCvSharp; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System…...

编程日记 2023/9/21 9:11:05

Fiddler常用的快键键

Fiddler有很多常用的快捷键，这些快捷键可以帮助你更快速地完成任务。以下是一些常用的快捷键： F12：启动/停止抓包。 CtrlR：打开FiddlerScript窗口。 CtrlH：切换到 Inspector 页签的 Header 视图。 CtrlT：切…...

编程日记 2023/9/21 9:10:04

【Linux】生产消费模型 + 线程池

文章目录 📖 前言1. 生产消费模型2. 阻塞队列2.1 成员变量：2.2 入队(push)和出队(pop)：2.3 封装与测试运行：2.3 - 1 对代码进一步封装2.3 - 2 分配运算任务2.3 - 3 测试与运行 3. 循环阻塞队列3.1 POSIX信号量：3.1 - 1…...

编程日记 2023/9/21 9:04:58

基于springboot+vue的爱心助农网站(前后端分离)

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战主要内容：毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询文末联系获取项目介绍…...

编程日记 2023/9/21 9:02:55

“华为杯”研究生数学建模竞赛2019年-【华为杯】D题：汽车行驶工况构建（附获奖论文和MATLAB代码实现）

目录摘要： 1. 问题重述 2. 模型假设 2.1 题目对模型给出的假设...

编程日记 2023/9/21 9:01:54

v-cloak的作用和原理

1、作用 v-cloak 指令常用在插值表达式的标签中，用于解决当网络加载很慢或者频繁渲染页面时，页面显示出源代码的情况。所以为了提高用户的体验性，使用指令 v-cloak，搭配着 CSS 一起使用，在加载时隐藏挂载内容&#x…...

编程日记 2023/9/21 8:55:49

pip pip3安装库时都指向python2的库

当在python3的环境下使用pip3安装库时，发现居然都指向了python2的库 pip -V pip3 -V安装命令更改为： python3 -m pip install <package>...

编程日记 2023/9/21 8:54:47

和逸云 RK3229 如何进入maskrom强刷模式

图中红圈两个点短接以后插usb，就可以进入maskrom模式强刷...

编程日记 2023/9/21 8:53:46

防静电离子风扇的应用及优点

防静电静电离子风扇是一种用于消除静电的设备，它可以通过离子化原理将静电荷离子化，从而达到静电的效果。防静电静电离子风扇通常采用离子风扇的形式，通过离子化原理将静电荷离子化，从而消除静电。防静电静电离子风扇的工作原理…...

编程日记 2023/9/21 8:52:45

git中无法使用方向键的问题

windows下使用git命令行执行react脚本安装，发现无法使用上下键来去选中选项。最后只能换成cmd命令执行，发现可以上下移动以选中需要的选项。 bash命令行：移动光标无法移动选项 cmd命令行...

编程日记 2023/9/21 8:51:44

负载均衡中间件---Nginx

一.nginx的好处学习 Nginx 对于一个全栈开发者来说是非常有价值的，下面是一些学习 Nginx 的原因和好处： 反向代理和负载均衡：Nginx 是一个高性能的反向代理服务器，可以用于将客户端请求转发给多个后端服务器，实现负…...

编程日记 2023/9/21 8:45:38

Linux硬链接、软链接

硬链接是一个目录条目(在基于目录的文件系统中)，它将一个名称与一个文件关联起来。因此，每个文件必须至少有一个硬链接。为文件创建额外的硬链接可以使该文件的内容可以通过额外的路径访问(即通过不同的名称或在不同的目录中)这会导致别名效应(alias eff…...

编程日记 2023/9/21 8:44:37

终极指南：如何使用Harepacker-resurrected打造你的MapleStory游戏Mod

终极指南：如何使用Harepacker-resurrected打造你的MapleStory游戏Mod 【免费下载链接】Harepacker-resurrected All in one .wz file/map editor for MapleStory game files 项目地址: https://gitcode.com/gh_mirrors/ha/Harepacker-resurrected 如果你是一…...

编程新知 2026/5/12 23:23:17

Codex入门09-Git工作流（小白入门：不会写commit信息？AI帮你自动生成规范提交）

🎯 本文目标学会用 Codex 自动化 Git 操作：提交、冲突解决、PR 描述生成。 😰 Git 新手的典型痛点你的提交记录是不是这样的： git log --oneline a3f4b2c fix 9d1e8c4 update 4c7b91f 修改了一些东西 f0a2d3e 。。。 b5c8e7a 又改了这就是"屎山提交记录"—…...

编程新知 2026/5/12 22:52:45

教培机构管理越忙越乱？用对工具，比多雇两个人更高效

不少培训机构校长都有同样的感受：明明团队很拼，每天从早忙到晚，可机构依旧问题不断。招生线索散落在微信、表格、登记本里，跟进不及时就白白流失；排课全靠人工核对，老师冲突、教室撞期、调课通知不到位是常…...

编程新知 2026/5/12 20:52:44

英特尔转型芯片代工：从IDM巨头到服务商的六大挑战与机遇

1. 英特尔代工之路：从IDM巨头到服务提供商的六大挑战在半导体行业，英特尔这个名字几乎就是高性能微处理器的代名词。这家公司凭借其垂直整合制造模式，在过去几十年里构筑了难以撼动的技术护城河。然而，当行业的目光从单纯的制程竞…...

编程新知 2026/5/12 19:45:26

3分钟掌握Windows安装APK：告别复杂模拟器的终极方案

3分钟掌握Windows安装APK：告别复杂模拟器的终极方案【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经遇到过这样的场景？同事发来一个实…...

编程新知 2026/5/12 19:45:19

RAD-NeRF：面向实时人像合成的神经辐射场高效架构

1. 项目概述：当NeRF遇上实时人像，RAD-NeRF到底在解决什么问题？我第一次看到“Efficient NeRFs for Real-Time Portrait Synthesis (RAD-NeRF)”这个标题时，手边正调试一个跑在RTX 4090上的标准NeRF模型——单帧渲染耗时23秒&#…...

编程新知 2026/5/12 19:37:04

3步精通MOOTDX：量化投资数据接口实战指南

3步精通MOOTDX：量化投资数据接口实战指南【免费下载链接】mootdx 通达信数据读取的一个简便使用封装项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx MOOTDX是一个专为量化投资和数据分析设计的Python库，它提供了高效、便捷的通达信数…...

编程新知 2026/5/12 18:54:20

Flutter + 开源鸿蒙实战 | 极简记账本 Day1：项目初始化 + 底部导航框架搭建

🔥 Flutter 开源鸿蒙实战 | 极简记账本 Day1：项目初始化底部导航框架搭建欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.csdn.net 系列项目：极简记账本（6 天完结）环境：Flutt…...

编程新知 2026/5/12 18:34:06

当1000A牵引电流遇上微安级信号：高铁轨道电路中扼流变压器的‘抗干扰’实战解析

高铁轨道电路中扼流变压器的抗干扰设计与工程实践电气化铁路的轨道电路系统面临着前所未有的电磁兼容挑战——如何在承载1000A级牵引电流的钢轨上，同时可靠传输微安级的信号电流？这个看似矛盾的需求，正是现代高铁信号系统设计的核心难题之一…...

编程新知 2026/5/12 18:26:39

AJV布尔验证终极指南：掌握JSON Schema中最简单的数据类型处理技巧

AJV布尔验证终极指南：掌握JSON Schema中最简单的数据类型处理技巧【免费下载链接】ajv The fastest JSON schema Validator. Supports JSON Schema draft-04/06/07/2019-09/2020-12 and JSON Type Definition (RFC8927) 项目地址: https://gitcode.com/gh_mirror…...

编程新知 2026/5/12 18:16:02

1、下载ML-Agents

2、anaconda配置pytorch环境

3、安装ml-agents-release_18所需要的库

4、在unity中 Window--> Package Manager

相关文章：