当前位置：首页 > news >正文

使用MoA(Mixture of Agents)混合智能体技术,结合多个开源大语言模型如Llama3、phi-3和Mistral,实现一个强大的AI智能体

news 2026/5/17 4:08:23

1.简介

论文简介:

论文提出了一种称为混合智能体(Mixture-of-Agents,MoA)的方法,利用多个大语言模型(LLM)的集体智慧来提高自然语言理解和生成任务的性能。
MoA采用了分层结构,每一层包含多个LLM智能体。每个智能体都将前一层所有智能体的输出作为辅助信息来生成自己的回答。通过迭代地综合和优化回答,MoA可以充分利用不同LLM的独特优势。

实验发现,即使其他模型提供的辅助回答质量较低,LLM也倾向于生成更好的回答,体现出LLM具有内在的协作性。MoA正是利用了这种协作性。

在AlpacaEval 2.0、MT-Bench和FLASK等基准测试中,MoA取得了目前最佳的性能,仅使用开源LLM就超过了GPT-4。例如在AlpacaEval 2.0上,MoA达到了65.1%的得分,而GPT-4 Omni为57.5%。

进一步的分析表明,MoA并非简单地从辅助回答中选择最佳答案,而是对它们进行了复杂的综合;使用更多不同的LLM作为提议者可以提高MoA的性能。

通过预算分析,MoA的几种实现可以达到与GPT-4 Turbo相当的性能,同时成本却降低了一半。

展示了如何通过混合智能体的框架来发挥多个LLM的协同效应,在提高性能的同时兼顾了计算成本,为后续研究指明了一个很有前景的方向。

2.MoA 的工作原理

MoA 采用了一种分层的架构，每一层都包含多个 LLM 代理。这些代理协同工作，共同处理输入并生成响应。MoA 的工作流程通常包括以下步骤：

输入处理： 将用户的输入发送给 MoA 的第一层。

分层处理： 每一层的 LLM 代理都会对输入进行处理，并生成中间结果。

结果聚合： 将每一层的中间结果进行聚合，生成最终的响应。

3.拉取ollama模型

ollama run llama3:instruct
ollama run mistral:instruct
ollama run phi3:instruct

4.git clone GitHub - win4r/MoA

5.修改项目里的配置文件.env

API_BASE=http://localhost:11434/v1
API_KEY=ollamaAPI_BASE_2=https://api.groq.com/openai/v1
API_KEY_2=aaaMAX_TOKENS=4098
TEMPERATURE=0.7
ROUNDS=2MODEL_AGGREGATE=llama3-70b-8192MODEL_REFERENCE_1=llama3:latest
MODEL_REFERENCE_2=mistral:instruct
MODEL_REFERENCE_3=phi3:instruct

6.安装依赖

7.python bot.py

文章来源
视频去哪了？-创建者去哪了？-播单去哪了？-哔哩哔哩视频

使用MoA(Mixture of Agents)混合智能体技术,结合多个开源大语言模型如Llama3、phi-3和Mistral,实现一个强大的AI智能体

1.简介论文简介: 论文提出了一种称为混合智能体(Mixture-of-Agents,MoA)的方法,利用多个大语言模型(LLM)的集体智慧来提高自然语言理解和生成任务的性能。 MoA采用了分层结构,每一层包含多个LLM智能体。每个智能体都将前一层所有智能体的输出作为辅助信息来生成自己的回答。通…...

编程日记 2024/7/1 16:27:09

前端面试题_Css

一、说一下Css的盒子模型？ HTML中所有元素都可以看成是一个盒子盒子的组成：content、padding、border、margin 盒子的类型： 标准盒模型：marginborderpaddingcontent -- box-sizing：content-box（默认&a…...

编程日记 2024/7/1 16:25:07

AI在线免费视频工具3：声音生视频

1、声音生视频 Noisee：通过声音生成对应视频，可以增加prompt指定生成内容相关视频 https://noisee.ai/create...

编程日记 2024/7/1 16:23:04

final、const、readonly关键字在不同语言中代表着什么

一、Java 1.被final修饰的类不能被继承。 2.被final修饰的方法不能被重写。被 final 修饰的类中所有的成员方法都会隐式的定义为 final 方法。若父类中 final 方法的访问权限为 private ，则子类中不能直接继承该方法。此时可以在子类中定义相同方法名的函数&…...

编程日记 2024/7/1 16:17:58

HarmonyOS ArkUi Tabs+TabContent+List实现tab吸顶功能

Demo效果 Entry Component struct StickyNestedScroll {State message: string Hello WorldState arr: number[] []scroller new Scroller()StyleslistCard() {.backgroundColor(Color.White).height(72).width("100%").borderRadius(12)}build() {Scroll(this.sc…...

编程日记 2024/7/1 16:16:57

Hugging Face Accelerate 两个后端的故事：FSDP 与 DeepSpeed

社区中有两个流行的零冗余优化器 (Zero Redundancy Optimizer，ZeRO)算法实现，一个来自DeepSpeed，另一个来自PyTorch。Hugging FaceAccelerate对这两者都进行了集成并通过接口暴露出来，以供最终用户在训练/微调模型时自主选择其中之…...

编程日记 2024/7/1 16:14:55

TextField是用于在用户界面中输入文本的控件。它广泛应用于表单、搜索框、评论区等需要用户输入文字的场景

TextField是用于在用户界面中输入文本的控件。它广泛应用于表单、搜索框、评论区等需要用户输入文字的场景。以下是对TextField的详细解释，涵盖其各个方面的功能和属性。基本属性 text 描述：TextField中当前显示的文本。用法：text: "示…...

编程日记 2024/7/1 16:12:52

MYSQL 四、mysql进阶 5（InnoDB数据存储结构）

一、数据库的存储结构：页索引结构给我们提供了高效的索引方式，不过索引信息以及数据记录都是保存在文件上的，确切说时存储在页结构中，另一方面，索引是在存储引擎中实现的，Mysql服务器上的存储引擎负责对表…...

编程日记 2024/7/1 16:07:46

Spring企业开发核心框架-下

五、Spring AOP面向切面编程 1、场景设定和问题复现 ①准备AOP项目项目名：Spring-aop-annotation ②声明接口 /*** - * / 运算的标准接口!*/ public interface Calculator { int add(int i, int j); int sub(int i, int j); int mul(int i, in…...

编程日记 2024/7/1 16:04:42

X射线底片焊缝缺陷检测

实现四种焊缝缺陷的检测和分割处理。...

编程日记 2024/7/1 16:02:39

直播的js代码debug解析找到protobuf消息的定义

我们都知道直播的弹幕消息是通过websocket发送的，而且是通过protobuf传输的，那么这里面传输了哪些内容，这个proto文件又要怎么定义？每个消息叫什么，消息里面又包含有哪些字段，每个字段又是什么类型&#xf…...

编程日记 2024/7/1 16:01:38

详细学习es6扩展运算符

ES6中的扩展运算符（Spread Operator）是一种非常方便的语法，主要用于将可迭代对象（比如数组、字符串等）展开成多个参数。以下是关于ES6扩展运算符的详细内容： 用法： 在数组字面量中展开数组&am…...

编程日记 2024/7/1 16:00:36

HEC-HMS水文模型教程

原文链接：HEC-HMS水文模型教程https://mp.weixin.qq.com/s?__bizMzUzNTczMDMxMg&mid2247607904&idx5&sn1a210328a3fc8f941b433674d8fe2c85&chksmfa826787cdf5ee91d01b6981ebd89deac3e350d747d0fec45ce2ef75d7cb8009341c6f55114d&token90645021…...

编程日记 2024/7/1 15:58:33

Spring Cloud LoadBalancer基础入门与应用实践

官网地址：https://docs.spring.io/spring-cloud-commons/reference/spring-cloud-commons/loadbalancer.html 【1】概述 Spring Cloud LoadBalancer是由SpringCloud官方提供的一个开源的、简单易用的客户端负载均衡器，它包含在SpringCloud-commons中用…...

编程日记 2024/7/1 15:57:32

layui在表格中嵌入上传按钮，并修改上传进度条

当需要在表格中添加上传文件按钮，并不需要弹出填写表单的框的时候，需要在layui中，用按钮触发文件选择有一点需要说明的是，layui定义table并不是在定义的标签中渲染，而是在紧接着的标签中渲染，所以要获取实…...

编程日记 2024/7/1 15:55:29

14-10 AIGC 项目生命周期——第一阶段

生成式 AI 项目生命周期的整个过程类似于从范围、选择、调整和对齐/协调模型以及应用程序集成开始的顺序依赖过程。流程表明每个步骤都建立在前一步的基础上。有必要了解每个阶段对于项目的成功都至关重要。下面的流程图重点介绍了生成式 AI 项目生命周期的第一阶段 1 — “范…...

编程日记 2024/7/1 15:54:28

经典小游戏（一）C实现——三子棋

switch(input){case 1:printf("三子棋\n");//这里先测试是否会执行成功break;case 0:printf("退出游戏\n");break;default :printf("选择错误，请重新选择!\n");break;}}while(input);//直到输入的结果为假，循环才会结束} …...

编程日记 2024/7/1 15:52:26

如何利用AI生成可视化图表（统计图、流程图、思维导图……）免代码一键绘制图表

由于目前的AI生成图表工具存在以下几个方面的问题： 大多AI图表平台是纯英文，对国内用户来说不够友好；部分平台在生成图表前仍需选择图表类型、配置项，操作繁琐；他们仍需一份规整的数据表格，需要人为对数据…...

编程日记 2024/7/1 15:51:25

Firefox 编译指南2024 Windows10-使用Git 管理您的Firefox（五）

1. 引言在现代软件开发中，版本控制系统（VCS）是不可或缺的工具，它不仅帮助开发者有效管理代码的变化，还支持团队协作与项目管理。Mercurial 是一个高效且易用的分布式版本控制系统，其设计目标是简洁、快速…...

编程日记 2024/7/1 15:50:24

ubuntu 18 虚拟机安装（1）

ubuntu 18 虚拟机安装 ubuntu 18.04.6 Ubuntu 18.04.6 LTS (Bionic Beaver) https://releases.ubuntu.com/bionic/ 参考： 设置固定IP地址 https://blog.csdn.net/wowocpp/article/details/126160428 https://www.jianshu.com/p/1d133c0dec9d ubuntu-18.04.6-l…...

编程日记 2024/7/1 15:48:21

可逆计算与量子电路合成：改进QM算法与全局优化

1. 可逆计算与量子电路合成基础在量子计算领域，可逆计算是一项关键技术，它不仅是实现低功耗设计的核心方法，更是量子电路合成的基础。传统计算机中的逻辑门大多是不可逆的，这意味着计算过程中会丢失信息并产生热量。而量子计算由于…...

编程新知 2026/5/17 3:50:06

Agent 的记忆也会被投毒：长期记忆安全的六阶段框架

过去，我们更习惯把大模型的风险理解为“这一轮输入有没有问题”“这一轮输出会不会越界”。但有了长期记忆之后，风险结构发生了变化。恶意内容不一定在当场触发，也不一定在同一轮任务里显现出来。它可以先悄悄进入记忆，在几天后、…...

编程新知 2026/5/17 2:30:02

如何用1条prompt触发真实针孔物理特性？揭秘焦距=0.8mm、景深无限、色散偏移的3层嵌套语法结构（附可运行JSON配置）

更多请点击： https://intelliparadigm.com 第一章：如何用1条prompt触发真实针孔物理特性？揭秘焦距0.8mm、景深无限、色散偏移的3层嵌套语法结构（附可运行JSON配置） 针孔成像并非抽象概念，而是可通过精确 p…...

编程新知 2026/5/17 2:21:43

dotAI：将AI能力环境化，打造可配置的智能开发工作流

1. 项目概述：当AI成为你的“数字管家”最近在GitHub上看到一个挺有意思的项目，叫udecode/dotai。乍一看这个标题，你可能和我最初的反应一样，有点摸不着头脑。dotai？是“点AI”的意思吗？它和.env文件那种“点…...

编程新知 2026/5/17 2:13:34

AI应用开发实战：从RAG系统到多模型API调用的开源项目解析

1. 项目概述：一个AI项目的开源实践最近在GitHub上看到一个名为“hferello/ai”的项目，这个标题非常简洁，甚至可以说有些“神秘”。乍一看，它可能是一个关于人工智能的通用仓库，但点进去之后，你会发现它远不…...

编程新知 2026/5/17 1:56:56

小智聊天机器人的本地化部署。

前天到了，小智机器人ESP32-S2的套件（非焊接版的那一款），找王同学，学了学怎么焊接。昨天，使用面包板搭建电路，安装元器件，服务器端注册设置，刷程序，很快就完成…...

编程新知 2026/5/17 1:11:19

多脉冲重复频率解速度模糊：原理、仿真与MATLAB实现

1. 脉冲雷达的速度模糊问题雷达测速的基本原理大家都懂，就是通过多普勒效应计算目标速度。但实际操作中会遇到一个头疼的问题——速度模糊。这就像用卷尺量身高，如果身高超过卷尺长度，就得把几段卷尺接起来量，但接缝处容易出错。…...

编程新知 2026/5/17 0:48:12

【Midjourney胶片摄影风格终极指南】：20年影像工程师亲授7种不可外传的参数组合与暗房逻辑复刻法

更多请点击： https://intelliparadigm.com 第一章：胶片摄影的数字复刻本质与Midjourney底层成像机制胶片摄影的“颗粒感”“色偏”“晕影”并非缺陷，而是光化学反应在银盐乳剂中非线性响应的物理印记；Midjourney 并不模拟胶片&a…...

编程新知 2026/5/17 0:26:12

RML2016.10a数据集读取避坑指南：用Python pickle解决‘latin-1’编码报错

RML2016.10a数据集读取避坑指南：用Python pickle解决‘latin-1’编码报错当你第一次拿到RML2016.10a数据集，满心欢喜准备开始实验时，一个简单的.pkl文件读取操作却可能让你陷入编码错误的泥潭。UnicodeDecodeError: utf-8 codec cant decode…...

编程新知 2026/5/17 0:21:59

Arm Neoverse CMN-650架构解析与性能优化

1. Arm Neoverse CMN-650架构概览CMN-650是Arm Neoverse平台中的第三代一致性网格网络(Coherent Mesh Network)互连技术，专为高性能计算和数据中心场景设计。作为SoC内部的核心互连架构，它承担着连接处理器集群、内存控制器、I/O子系统以及加速器单元的关…...

编程新知 2026/5/17 0:13:52

1.简介

2.MoA 的工作原理

3.拉取ollama模型

4.git clone GitHub - win4r/MoA

相关文章：