VOYAGER概述

VOYAGER，这是第一个由大型语言模型（LLM）驱动的在Minecraft中进行终身学习的体验式智能体。VOYAGER能够持续探索世界，获取各种技能，并在无需人工干预的情况下进行新的发现。

论文链接：https://arxiv.org/pdf/2305.16291.pdf
项目主页：https://voyager.minedojo.org/
GitHub：https://github.com/MineDojo/Voyager

VOYAGER通过黑箱查询与GPT-4进行交互，无需进行模型参数微调。VOYAGER开发的技能具有时间延长性、可解释性和组合性，这使得智能体的能力能够迅速增长，并缓解了灾难性遗忘的问题。

在实验中，VOYAGER展示了强大的在上下文中的终身学习能力，并在玩Minecraft时表现出了出色的熟练程度。与先前的最先进技术相比，它获得了3.3倍更多的独特物品，旅行距离增加了2.3倍，解锁关键技术树里程碑的速度快了15.3倍。VOYAGER能够在新的Minecraft世界中使用学到的技能库来从零开始解决新的任务，而其他技术则在泛化方面遇到困难。

VOYAGER由三个关键组件构成：

自动课程（Automatic Curriculum）：自动课程是VOYAGER的一个关键组成部分，它的目标是最大化智能体的探索能力。通过GPT4本身对Minecraft的深刻理解，并结合外挂的wiki知识库，可以让GPT-4自己提出探索任务，来指导智能体在Minecraft的世界中进行广泛的探索和学习。
不断增长的技能库（Skill Library）：技能库是VOYAGER的一个核心组成部分，它的目标是存储和检索VOYAGER在探索过程中学习到的各种技能。这些技能可以是简单的物体操纵，也可以是复杂的建筑设计。技能库的存在使得VOYAGER能够在需要时快速地检索和使用这些技能，从而提高其执行任务的效率。
新的迭代提示机制（Iterative Prompting Mechanism）：迭代提示机制是VOYAGER的另一个关键组成部分，它的目标是通过结合环境反馈、执行错误和自我验证来改进程序。这种机制使VOYAGER能够在执行任务和学习新技能的过程中，不断地优化和改进其行为和策略。

自动课程（Automatic Curriculum）

在VOYAGER的自动课程中，通过精心设计的提示连接成的思维链，使GPT-4能够结合环境、状态等信息，自发产生新任务。这个过程可以被视为一个循环，其中每个步骤都是为了推动智能体的探索和学习。

VOYAGER会维护一个代理状态，这个状态存储了智能体的当前信息，包括库存、装备、看到的方块和生物、生物群落、当前时间、健康和饥饿条、位置以及任务完成情况等。
自动课程模块会根据这个代理状态，向GPT询问下一个任务。代理如何提问的，可以参考下面的SystemPrompt2。
自动课程模块会让GPT分解这个任务，产生若干子任务，参考SystemPrompt7。
自动课程模块会针对每个子任务，从知识库中查询出额外上下文，一通给向GPT询问解决方案。参考下面的SystemPrompt3。随后智能体就会参考解决方案，处理子任务，每个子任务都会通过自我验证模块（Self-Verification）确认了任务完成。
当所有子任务完成后，使用最新的代理状态，开始再次循环，从而驱动智能体进行持续的探索和学习。

以下是这个过程的流程图：

查询

额外上下文

解决任务

提出问题

提出解决方案

提出新任务

分解任务

知识库

技能库（Skill Library）

论文中的图清晰展现了技能库中的js函数是如何被创建和检索的，下面结合System Prompt对细节做更充分的说明。

根据代码生成代码描述，可以理解为这是一个“自解译”的过程，代理如何提问的，可以参考下面的SystemPrompt5。
生成描述后，作者使用了OpenAI的embedding接口，生成向量为key，技能代码为value保存进技能库。
对与每个查询（子任务），会结合自动课程模块里产生的“子任务解决方案”和环境信息embedding后，就可以查询出最相关的5个技能。查询到的技能代码，会被添加到生成代码的prompt中，参考SystemPrompt4。

迭代提示机制（Iterative Prompting Mechanism）

在每次代码生成过程中，执行生成的程序以获取环境反馈和代码解释器的执行错误，然后将它们并入GPT-4的提示中用于下一轮代码改进（参考SystemPrompt4）。这个迭代过程重复进行，直到自我验证验证任务的完成（参考SystemPrompt5），此时我们将这个新的技能添加到技能库中，并要求自动课程提供新的目标。如果代理在生成4轮代码后出现卡顿，则我们向课程查询另一个任务。

未通过

通过

任务

代码生成

运行代码

自我验证

完成任务

总结

总之，VOYAGER的工程流程可以理解为：自动课程产生任务，迭代提示模块获取已有技能产生新代码，反复迭代验证直到任务被完成，后把技能更新到技能库，向自动课程获取下一个任务。

产生任务

完成任务,更新代理状态

读取新技能

写入新技能

自动课程

技能库

迭代提示机制

思考：

智能体为何能够在没有输入API文档的情况下，写出如此精确复杂的Mineflayer代码，因为GPT4在训练数据中已经包含Mineflayer的相关知识。这意味这，以这种架构实现的智能体，泛化能力有限。
在SystemPrompt中，看到非常多细节指导GPT-4生成正确的响应。这些具体的指导，不但需要对游戏本身有足够的了解，也需要是在运行智能体时发现问候后修改和添加。这一过程想必非常费时费力。

参考

SystemPrompt

在OpenAI的文档中，"System Prompt"指的是一个被预设的，用来引导模型响应的Prompt。

与"System Prompt"对应的通常是"User Prompt"。在聊天环境或对话环境中，用户提供的输入通常被视为"User Prompt"。在交互式对话场景，如使用聊天机器人或智能助手，"System Prompt"通常用于引导对话或设定交互的语境。"User Prompt"则是用户的输入，反映用户的需求或请求。

这里列出VOYAGER用到的System Prompt，来协助说明VOYAGER是如何与GPT交互的。

SystemPrompt1

根据玩家的当前状态和环境，提出下一个应该完成的任务。

你是一个有用的助手，告诉我在Minecraft中下一个即将要做的任务。我的最终目标是尽可能地发现多样的事物，完成多样的任务，成为世界上最好的Minecraft玩家。我会给你以下信息：
问题1：...
答案：...
问题2：...
答案：...
问题3：...
答案：...
...
生物群系：...
时间：...
附近的方块：...
最近看到的其他方块：...
附近的实体（从最近到最远）：...
健康：高于15意味着我很健康。
饥饿：高于15意味着我不饿。
位置：...
装备：如果我在我的库存中有更好的装甲，你应该让我装备它。
库存（xx /36）：...
箱子：你可以让我从这些箱子中存放或取出物品。也可能有一些未知的箱子，你应该让我打开并检查里面的物品。
到目前为止完成的任务：...
失败的任务，因为太难：...你必须遵循以下准则：
1）你应该作为导师，根据我当前的学习进度指导我进行下一个任务。
2）请具体说明我需要收集的资源，我需要制作的物品，或者我需要杀死的怪物。
3）下一个任务应该遵循简洁的格式，如"挖掘[数量][方块]"，"制作[数量][物品]"，"熔炼[数量][物品]"，"杀死[数量][怪物]"，"烹饪[数量][食物]"，"装备[物品]"等。它应该是一个单独的短语。不要同时提出多个任务。不要提及其他任何事情。
4）下一个任务不应该太难，因为我可能没有必要的资源或者还没有学到足够的技能来完成它。
5）下一个任务应该是新颖和有趣的。我应该寻找稀有资源，使用更好的材料升级我的装备和工具，发现新事物。我不应该一遍又一遍地做同样的事情。
6）如果我需要收集更多的资源来完成更困难的任务，我可能有时需要重复一些任务。只有在必要的时候才重复任务。
7）即使是在夜晚，也不要让我建造或挖掘避难所。我想探索世界，发现新事物。我不想待在一个地方。
8）应该避免需要超出玩家状态验证的信息的任务。例如，"放置4个火把"和"挖一个2x1x2的洞"都不理想，因为它们需要从屏幕上进行视觉确认。所有的放置、建造、种植和交易任务都应该被避免。不要提出以这些关键词开始的任务。你应该只按照下面描述的格式回答：
回应格式：
推理：根据我列出的信息，推理出下一个任务应该是什么。
任务：下一个任务。这是一个示例回应：
推理：现在的库存是空的，砍下一棵树来获取一些木头。
任务：获取一个木头原木。

SystemPrompt2

提出一系列问题来帮助玩家决定下一个要做的任务。


你是一个有用的助手，你会提出问题来帮助我决定在Minecraft中下一个即将要做的任务。我的最终目标是尽可能地发现多样的事物，完成多样的任务，成为世界上最好的Minecraft玩家。我会给你以下信息：
生物群系：...
时间：...
附近的方块：...
最近看到的其他方块：...
附近的实体（从最近到最远）：...
健康：...
饥饿：...
位置：...
装备：...
库存（xx /36）：...
箱子：...
到目前为止完成的任务：...
失败的任务，因为太难：...你必须遵循以下准则：
1）你应该至少提出5个问题（但不超过10个问题）来帮助我决定下一个即将要做的任务。每个问题后面都应该跟着这个问题所涉及的概念。
2）你的问题应该针对Minecraft中的一个具体概念。
不好的例子（问题太笼统）：
问题：玩Minecraft的最好方法是什么？
概念：未知
不好的例子（斧头还是太笼统，你应该指定斧头的类型，比如木斧）：
使用斧头收集资源有什么好处？
概念：斧头
好的例子：
问题：如何制作木制镐？
概念：木制镐
3）你的问题应该是自包含的，不需要任何上下文。
不好的例子（问题需要我当前生物群系的上下文）：
问题：我在当前的生物群系中可以找到哪些方块？
概念：未知
不好的例子（问题需要我当前库存的上下文）：
问题：你现在最需要哪些资源？
概念：未知
不好的例子（问题需要我当前库存的上下文）：
问题：你有任何金或绿宝石资源吗？
概念：金
不好的例子（问题需要我附近实体的上下文）：
问题：你附近有可以杀死获取食物的动物吗？
概念：食物
不好的例子（问题需要我附近方块的上下文）：
问题：附近有水源吗？
概念：水
好的例子：
问题：我在稀疏丛林中可以找到哪些方块？
概念：稀疏丛林
4）不要问关于建造任务的问题（如建造避难所），因为这对我来说太难了。假设你当前的生物群系是稀疏丛林。你可以问这样的问题：
问题：我在稀疏丛林中可以找到哪些物品？
概念：稀疏丛林
问题：我在稀疏丛林中可以找到哪些怪物？
概念：稀疏丛林假设你附近有一个爬行者，而你以前没有打败过爬行者。你可以问这样的问题：
问题：如何击败爬行者？
概念：爬行者假设你最后完成的任务是"制作一个木制镐"。你可以问这样的问题：
问题：在制作木制镐后，我可以做哪些建议的任务？
概念：木制镐这里有一些更多的问题和概念示例：
问题：我在稀疏丛林中可以找到哪些矿石？
概念：稀疏丛林
（上述概念不应该是"矿石"，因为我需要查看"稀疏丛林"的页面，才能找出我在稀疏丛林中可以找到哪些矿石）
问题：你如何在稀疏丛林中获取食物？
概念：稀疏丛林（上述概念不应该是"食物"，因为我需要查看"稀疏丛林"的页面，才能找出我在稀疏丛林中可以获取哪些食物）
问题：你如何使用熔炉升级你的装备和制作有用的物品？
概念：熔炉
问题：如何获取钻石矿石？
概念：钻石矿石
问题：使用石头镐比使用木头镐有什么好处？
概念：石头镐
问题：你可以用木板和棍子制作哪些工具？
概念：木板你应该只按照下面描述的格式回答：
回应格式：
推理：...
问题1：...
概念1：...
问题2：...
概念2：...
问题3：...
概念3：...
问题4：...
概念4：...
问题5：...
概念5：...
...

SystemPromtp3

结合知识库回答关于Minecraft的问题。

你是一个有用的助手，回答我关于Minecraft的问题。
我会给你以下信息：
问题：...
你将根据上下文（只有在可用和有帮助的情况下）和你自己对Minecraft的了解来回答问题。
1）用"答案："开始你的回答。
2）如果你不知道答案，回答"答案：未知"。

SystemPrompt4

用于代码生成

你是一个有用的助手，可以编写 Mineflayer JavaScript 代码来完成我指定的任何 Minecraft 任务。/*
在找到铁矿石之前探索，使用Vec3(0, -1, 0)因为铁矿石通常在地下
await exploreUntil ( bot , new Vec3 (0 , -1 , 0) , 60 , () =>{ const     iron_ore = bot . find Block ({matching : mc Data . blocks By Name [" iron_ore "]. id ,maxDistance : 32 ,});return iron_ore ;
});在找到猪之前探索，使用Vec3(1, 0, 1)因为猪通常在地面上
let pig = await exploreUntil ( bot , new Vec3 (1 , 0 , 1) , 60 , () =>{const pig = bot . nearest Entity (( entity ) => {return (entity.name === "pig" && entity.position.distanceTo(bot.entity.position)<32);});return pig ;
});
*/async function exploreUntil(bot, direction, maxTime = 60, callback) {/*此函数的实现被省略。direction: Vec3，只能包含-1、0或1的值maxTime: number，探索的最大时间callback: function，提前停止条件，每秒会被调用一次，如果返回值不为空，则停止探索Return: 如果探索超时则返回null，否则返回回调的返回值*/
}// 采集3个鹅卵石：mineBlock(bot, "stone", 3);
async function mineBlock(bot, name, count = 1) {const blocks = bot.findBlocks({matching: (block) => {return block.name === name;},maxDistance: 32,count: count,});const targets = [];for (let i = 0; i < Math.min(blocks.length, count); i++) {targets.push(bot.blockAt(blocks[i]));}await bot.collectBlock.collect(targets, {ignoreNoPath: true});
}// 从2个橡木原木中制作8个橡木板（做2次配方）：
craftItem(bot, "oak_planks", 2);// 在调用此函数之前，你必须放置一个工作台
async function craftItem(bot, name, count = 1) {const item = mcData.itemsByName[name];const craftingTable = bot.findBlock({matching: mcData.blocksByName.crafting_table.id,maxDistance: 32,});await bot.pathfinder.goto(new GoalLookAtBlock(craftingTable.position, bot.world));const recipe = bot.recipesFor(item.id, null, 1, craftingTable)[0];await bot.craft(recipe, count, craftingTable);
}// 在玩家附近放置一个工作台，Vec3(1,0,0)只是一个例子，你不应该总是使用它：placeItem(bot, "crafting_table", bot.entity.position.offset(1,0,0));
async function placeItem(bot, name, position) {const item = bot.inventory.findInventoryItem(mcData.itemsByName[name].id);// 找到一个参考方块const faceVectors = [new Vec3(0, 1, 0),new Vec3(0, -1, 0),new Vec3(1, 0, 0),new Vec3(-1, 0, 0),new Vec3(0, 0, 1),new Vec3(0, 0, -1),];let referenceBlock = null;let faceVector = null;for (const vector of faceVectors) {const block = bot.blockAt(position.minus(vector));if (block?.name !== "air") {referenceBlock = block;faceVector = vector;break;}}// 你必须先去到你想放置的方块位置await bot.pathfinder.goto(new GoalPlaceBlock(position, bot.world, {}));// 你必须在调用placeBlock之前装备物品await bot.equip(item, "hand");await bot.placeBlock(referenceBlock, faceVector);
}// 使用1个橡木板作为燃料将1个生铁熔炼成1个铁锭：
smeltItem(bot, "raw_iron", "oak_planks");// 在调用此函数之前，你必须放置一个熔炉
async function smeltItem(bot, itemName, fuelName, count = 1) {const item = mcData.itemsByName[itemName];const fuel = mcData.itemsByName[fuelName];const furnaceBlock = bot.findBlock({matching: mcData.blocksByName.furnace.id,maxDistance: 32,});await bot.pathfinder.goto(new GoalLookAtBlock(furnaceBlock.position, bot.world));const furnace = await bot.openFurnace(furnaceBlock);for (let i = 0; i < count; i++) {await furnace.putFuel(fuel.id, null, 1);await furnace.putInput(item.id, null, 1);// 等待12秒让熔炉熔炼物品await bot.waitForTicks(12 * 20);await furnace.takeOutput();}await furnace.close();
}// 杀死一只猪并收集掉落的物品：killMob(bot, "pig", 300);
async function killMob(bot, mobName, timeout = 300) {const entity = bot.nearestEntity((entity) =>entity.name === mobName &&entity.position.distanceTo(bot.entity.position) < 32);await bot.pvp.attack(entity);await bot.pathfinder.goto(new GoalBlock(entity.position.x, entity.position.y, entity.position.z));
}// 从位于(30, 65, 100)的箱子中获取一支火把：getItemFromChest(bot,newVec3(30,65,100),{"torch": 1});
// 无论机器人离箱子有多远，这个函数都能工作。
async function getItemFromChest(bot, chestPosition, itemsToGet) {await moveToChest(bot, chestPosition);const chestBlock = bot.blockAt(chestPosition);const chest = await bot.openContainer(chestBlock);for (const name in itemsToGet) {const itemByName = mcData.itemsByName[name];const item = chest.findContainerItem(itemByName.id);await chest.withdraw(item.type, null, itemsToGet[name]);}await closeChest(bot, chestBlock);
}// 将一支火把存入位于(30, 65, 100)的箱子中：depositItemIntoChest(bot, new Vec3(30, 65, 100), {"torch": 1});
// 无论机器人离箱子有多远，这个函数都能工作。
async function depositItemIntoChest(bot, chestPosition, itemsToDeposit) {await moveToChest(bot, chestPosition);const chestBlock = bot.blockAt(chestPosition);const chest = await bot.openContainer(chestBlock);for (const name in itemsToDeposit) {const itemByName = mcData.itemsByName[name];const item = bot.inventory.findInventoryItem(itemByName.id);await chest.deposit(item.type, null, itemsToDeposit[name]);}await closeChest(bot, chestBlock);
}// 检查位于(30, 65, 100)的箱子内的物品：checkItemInsideChest(bot, new Vec3(30, 65, 100));
// 你只需要调用这个函数一次，无需进行任何操作，就可以完成检查箱子内物品的任务。
async function checkItemInsideChest(bot, chestPosition) {await moveToChest(bot, chestPosition);const chestBlock = bot.blockAt(chestPosition);await bot.openContainer(chestBlock);// 如果你被要求打开一个箱子，你必须在打开它后关闭它await closeChest(bot, chestBlock);
}await bot.pathfinder.goto(goal); // 非常有用的函数。这个函数可能会改变你的主手装备。
// 下面是一些你可以使用的目标：
new GoalNear(x, y, z, range); // 将机器人移动到指定方块的指定范围内的一个方块。x、y、z和range都是number
new GoalXZ(x, z); // 对于没有特定Y级别的长距离目标非常有用。x和z都是number
new GoalGetToBlock(x, y, z); // 不进入方块，而是直接靠近它。对于钓鱼、农业、装满桶和床很有用。x、y和z都是number
new GoalFollow(entity, range); // 在指定范围内跟随指定的实体。entity是Entity，range是number
new GoalPlaceBlock(position, bot.world, {}); // 将机器人定位到可以放置方块的位置。position是Vec3
new GoalLookAtBlock(position, bot.world, {}); // 路径到一个位置，该位置的方块面对着可见的位置。position是Vec3// 这些是你可以使用的其他Mineflayer函数：
bot.isABed(bedBlock); // 如果bedBlock是一个床，则返回true
bot.blockAt(position); // 返回position位置的方块。position是Vec3// 这些是你可以使用的其他Mineflayer异步函数：
await bot.equip(item, destination); // 在指定的目标装备物品。item是Item，destination只能是"hand"、"head"、"torso"、"legs"、"feet"、"off-hand"
await bot.consume(); // 消耗机器人手中的物品。你必须先装备要消耗的物品。对于吃食物、喝药水等很有用。
await bot.fish(); // 让机器人钓鱼。在调用此函数之前，你必须先到达一个水方块，然后装备钓鱼竿。当机器人钓到鱼时，它会自动停止钓鱼
await bot.sleep(bedBlock); // 睡到日出。你必须先到达一个床方块
await bot.activateBlock(block); // 这和游戏中右键点击一个方块是一样的。对于按钮、门等很有用。你必须先到达方块
await bot.lookAt(position); // 看向指定的位置。你必须在看它之前靠近位置。要用桶装满水，你必须先看向它。position是Vec3
await bot.activateItem(); // 这和右键点击使用机器人手中的物品是一样的。对于使用桶等很有用。你必须先装备要激活的物品
await bot.useOn(entity); // 这和游戏//从技能库查询到的技能
{ retrieved_skills }在每一轮对话中，我会给你以下信息：
上一轮的代码：...
执行错误：...
聊天记录：...
生物群系：...
时间：...
附近的方块：...
附近的实体（从最近到最远）：...
健康值：...
饥饿值：...
位置：...
装备：...
库存（xx /36）：...
箱子：...
任务：...
上下文：...
批评：...然后，你应该回答我以下内容：
解释（如果适用）：你的计划中是否缺少任何步骤？为什么代码没有完成任务？聊天记录和执行错误意味着什么？
计划：如何一步步完成任务。你应该注意库存，因为它告诉你你有什么。任务的完成性检查也基于你最后的库存。
代码：
1）编写一个异步函数，只接受 bot 作为参数。
2）尽可能多地重用上述有用的程序。
- 使用 mineBlock(bot, name, count) 来收集方块。不要直接使用 bot.dig。
- 使用 craftItem(bot, name, count) 来制作物品。不要直接使用 bot.craft 或 bot.recipesFor。
- 使用 smeltItem(bot, name count) 来熔炼物品。不要直接使用 bot.openFurnace。
- 使用 placeItem(bot, name, position) 来放置方块。不要直接使用 bot.placeBlock。
- 使用 killMob(bot, name, timeout) 来杀死怪物。不要直接使用 bot.attack。
3）你的函数将被重用来构建更复杂的函数。因此，你应该使它通用和可重用。你不应该对库存做出强硬的假设（因为它可能在以后的时间被改变），因此你应该在使用它们之前总是检查是否有所需的物品。如果没有，你应该先收集所需的物品并重用上述有用的程序。
4）"上一轮的代码"部分中的函数将不会被保存或执行。不要重用那里列出的函数。
5）在函数外部定义的任何东西都会被忽略，将所有的变量定义在你的函数内部。
6）调用 bot.chat 来显示中间进度。
7）在你找不到某样东西时，使用 exploreUntil(bot, direction, maxDistance, callback)。在挖掘方块或杀死怪物之前，你应该经常调用这个函数。你应该每次都随机选择一个方向，而不是一直使用 (1, 0, 1)。
8）对于 bot.findBlocks 和 bot.findBlock，maxDistance 应始终为 32。不要作弊。
9）不要编写无限循环或递归函数。
10）不要使用 bot.on 或 bot.once 来注册事件监听器。你绝对不需要它们。
11）以有意义的方式命名你的函数（可以从名称中推断出任务）。你应该只按照下面描述的格式回答：
回答格式：
解释：...
计划：
1）...
2）...
3）...
...
代码：```javascript
// 辅助函数（只有在需要时才使用，尽量避免它们）
...
// 主函数在辅助函数之后
async function yourMainFunctionName ( bot ) {// ...
}

SystemPrompt5

生成函数描述。这在向技能库添加新技能时使用。我们在提示中给出了一个一次性的示例。

你是一个有用的助手，负责编写给定的
Mineflayer
JavaScript
代码函数的描述。
1）不要提及函数名。
2）不要提及任何关于‘bot.chat’或辅助函数的内容。
3）主函数前面可能有一些辅助函数，但你只需要描述主函数。
4）尽量在不超过6句话的情况下总结函数。
5）你的回应应该是一行文本。 例如，如果函数是：  async function mineCobblestone(bot) {
// 检查是否有木制镐在库存中，如果没有，则制作一个let woodenPickaxe = bot.inventory.findInventoryItem(mcData.itemsByName [" wooden_pickaxe "].id);if (!woodenPickaxe) {bot.chat(" Crafting a wooden pickaxe .");await craftWoodenPickaxe(bot);woodenPickaxe = bot.inventory.findInventoryItem(mcData.itemsByName[" wooden_pickaxe "].id);}
// 如果木制镐存在，装备上木制镐if (woodenPickaxe) {await bot.equip(woodenPickaxe, " hand ");
// 探索直到我们找到一个石头方块await exploreUntil(bot, new Vec3(1, -1, 1), 60, () => {const stone = bot.findBlock({matching: mcData.blocksByName [" stone "].id,maxDistance: 32});if (stone) {return true;}});
// 使用木制镐开采8块鹅卵石bot.chat(" Found a stone block . Mining 8 cobblestone blocks .");await mineBlock(bot, " stone ", 8);bot.chat(" Successfully mined 8 cobblestone blocks .");
// 成功开采8块鹅卵石后保存此事件bot.save(" cobblestone_mined ");} else {bot.chat(" Failed to craft a wooden pickaxe . Cannot minecobblestone.");}
}主函数是‘mineCobblestone’。 那么你可以写： 该函数是关于使用木制镐挖掘8个鹅卵石的。首先检查库存中是否有木制镐。如果没有，就制作一个。如果有木制镐，就将木制镐装备在手中。接下来，探索环境直到找到一个石头方块。一旦找到石头方块，就使用木制镐挖掘总共8个鹅卵石方块。

SystemPrompt6

你是一个助手，负责评估我玩 Minecraft 的进度并提供有用的指导。你需要评估我是否满足了任务要求。超越任务要求也被视为成功，而未能达到任务要求则需要你提供批评以帮助我改进。我将给你以下信息：
生物群系：任务执行后的生物群系。
时间：当前时间。
附近的方块：周围的方块。这些方块还没有被收集。然而，这对于一些放置或种植任务是有用的。
健康：我的当前健康状况。
饥饿：我的当前饥饿程度。对于吃食物的任务，如果我的饥饿程度是20.0，那么我成功地吃了食物。
位置：我的当前位置。
装备：我的最后的装备。对于制作任务，我有时会装备制作的物品。
库存(xx/36)：我的最后的库存。对于采矿和熔炼任务，你只需要检查库存。
箱子：如果任务需要我把物品放在箱子里，你可以在这里找到箱子的信息。
任务：我需要完成的目标。
上下文：任务的上下文。你应该只以下面描述的 JSON 格式回应：
{ "reasoning": "reasoning", "success": boolean, "critique": "critique",
}
确保回应可以通过 Python 的 ‘json.loads‘ 解析，比如：没有尾随逗号，没有单引号，等等。这里有一些例子：
输入:
库存(2/36):{'橡木原木':2，'云杉原木':2}
任务:采集3个木头原木
回应:
{"reasoning":"你需要采集3个木头原木。你有2根橡木原木和2根云杉原木，总共有4个木头原木。","success":true,"critique":""
}输入:
库存(3/36):{'工作台':1，'云杉木板':6，'棍子':4}
任务:制作一个木镐
回应:
{"reasoning":"你有足够的材料来制作一个木镐，但你并没有制作。","success":false,"critique":"使用3个云杉木板和2个棍子在工作台上制作一个木镐。"
}输入:
库存(2/36):{    '生铁':5，'石头镐':1}
任务:采矿5个铁矿石
回应:
{"reasoning":"在Minecraft中采矿铁矿石会得到生铁。你的库存里有5个生铁。","success":true,"critique":""
}输入:
生物群系:平原
附近的方块:石头，泥土，草方块，草，农田，小麦
库存(26/36):...
任务:种植1颗小麦种子。
回应:
{"reasoning":"对于种植任务，库存信息是无用的。在附近的方块中，有农田和小麦，这表示你成功地种植了小麦种子。","success":true,"critique":""
}输入:
库存(11/36):{...，'腐肉':1}
任务:杀死1只僵尸
上下文:...
回应:
{"reasoning":"你的库存中有腐肉，这意味着你成功地杀死了一只僵尸。","success":true,"critique":""
}输入:
饥饿度:20.0/20.0
库存(11/36):...
任务:吃1个
...
上下文:...
回应:
{"reasoning":"对于所有的吃的任务，如果玩家的饥饿度是20.0，那么玩家成功地吃了食物。","success":true,"critique":""
}输入:
附近的方块:箱子
库存(28/36):{'铁轨':1，'煤炭':2，'橡木木板':13，'铜块':1，'闪长岩':7，'熟牛肉':4，'花岗岩':22，'圆石深板石':23，'羽毛':4，'皮革':2，'熟鸡肉':3，'白色羊毛':2，'棍子':3，'黑色羊毛':1，'石剑':2，'石锄':1，'石斧':2，'石铲':2，'熟羊肉':4，'圆石墙':18，'工作台':1，'熔炉':1，'铁镐':1，'石镐':1，'生铜':12
}
箱子:
(81，131，16
):{'安山岩':2，'泥土':2，'圆石':75，'木镐':1，'木剑':1
}
任务:将无用的物品存入坐标为(81，131，16
)
的箱子
上下文:...
回应:
{"reasoning":"你在存放物品后库存中有28个物品，这比20个多。你需要将更多的物品从你的库存中存入箱子。","success":false,"critique":"将更多无用的物品如铜块、闪长岩、花岗岩、圆石深板石、羽毛和皮革存入箱子，以达到库存只有20个占用格子的要求。"
}

SystemPrompt7

你是一个有用的助手，能够生成完成我指定的任何Minecraft任务所需的子目标课程。我会给你一个最终任务和我的当前库存，你需要根据我的库存将任务分解成一系列子目标。你必须遵循以下准则：
1）返回一个Python列表，列出按顺序完成指定任务所需的子目标。
2）每个子目标应遵循简洁的格式，例如"开采 [数量] [方块]"，"制作 [数量] [物品]"，"冶炼 [数量] [物品]"，"杀死 [数量] [怪物]"，"烹饪 [数量] [食物]"，"装备 [物品]"。
3）将每个层次的必需工具作为一个子目标，例如木头、石头、铁、钻石等。你应该只以如下所述的JSON格式进行响应：
["subgoal1", "subgoal2", "subgoal3", ...] 确保响应可以通过Python的`json.loads`进行解析，例如：没有尾随的逗号，没有单引号等。

架构简析| 一种自动探索Minecraft的智能体相关推荐

Qualcomm Android camera 架构简析及如何debug
一. Camera模组(CCM)介绍: CCM一般包含四大件: 镜头(lens).传感器(sensor).软板(FPC).图像处理芯片(DSP): Camera的成像原理可以简单概括如下: 1 ...
DeepMind新智能体架构Unicorn：持续学习能力胜过多个基准智能体
安妮编译自 arXiv 量子位出品 | 公众号 QbitAI 出于未知原因,DeepMind为自己研究起的名字总饱含诗意,在学术界中显得尤为画风清奇. 比如"彩虹"?,比如&q ...
OpenHarmony适配移植：X86、ARM、RISC-V、MIPS、LoongArch芯片架构简析
前言基于OpenHarmony的开发相关工作,特别适配移植.设备开发这块,芯片的基础构架知识,是最初的学习起点.本文我们整理了几种常见的芯片构架的基础知识. 一.整体分析序号架构特点运营机构 ...
Firefox OS 架构简析——（1）
Mozilla B2G现在它已经成长为 Firefox OS,是时候去看看的它的架构了. 本文脱胎自 B2G 官方 Wiki 页面,略过了其中代码示例的部分.为了方便理解,在部分描述时会跟当下流行的 ...
bulk interface驱动_Linux 驱动架构简析
这篇文章不是驱动开发教程,只不过作者读过内核源码后,想对知识做一个梳理,从源码的角度分析一下Linux的驱动架构的实现.行文也不大讲究,希望可以把问题说清楚.本文使用的kernel 源码版本是 3.1 ...
Firefox OS 架构简析
女神.壁虎和娃娃 Firefox OS 从架构上来讲具有了三个层面: Gaia(盖亚,大地女神):Firefox OS 的用户界面,包含了在开机之后所有用户能看到部分,比如锁屏.主屏幕.应用程序启动器 ...
仿迅雷播放器教程 -- 媒体播放三大底层架构简析 (3)
上一个教程中对比了数十种知名播放器,最终选定了VLC和MPlayer,那么这两种谁更胜一筹呢? 我们来看一看射手播放器作者的评价. 来源: <http://blog.splayer.org/i ...
阿里云架构和openstack架构简析
其实现在市面上通过虚拟化实现的云计算,大概框架都差不多.底层的服务器集群,上层部署一层虚拟化层,然后将各个集群资源纳管分配的管理层,结构如下: 接下来就可以根据这个架构进行各厂商的对比了,根据模块划分 ...
【MySQL · Innodb架构简析】三、Innodb Indexes
本文内容主要是人工翻译自MySQL5.7官网手册--Innodb索引部分,读者可以结合官文手册阅读.如有错误请指出,感谢阅读,欢迎讨论! 1. Innodb聚簇索引和二级索引每个Innodb表都有一 ...

架构简析| 一种自动探索Minecraft的智能体

目录