当前位置: 首页 > news >正文

2024年顶级小型语言模型前15名

本文,我们将深入了解2024年备受瞩目的十五款小型语言模型(SLMs),它们分别是Llama 3.1 8B、Gemma2、Qwen 2、Mistral Nemo、Phi-3.5等。这些SLMs以其精巧的体积和高效率著称,它们不需要依赖庞大的服务器资源,这与它们的大型语言模型(LLMs)对手形成了鲜明对比。它们为速度和实时性能而生,甚至能在智能手机、平板电脑或智能手表上流畅运行。

图片

来源:Lu et al., 2024(https://arxiv.org/pdf/2409.15790)

我们即将展开的旅程将带领我们检视这些SLMs的卓越之处、潜在的不足,以及它们各自独有的特色。

首先,让我们聚焦于Qwen2,这是一款涵盖0.5B、1B至7B参数范围的模型系列。对于追求极致轻量化应用的开发者而言,0.5B版本无疑是理想之选。而对于那些需要更强大模型来执行摘要或文本生成等任务的用户,7B版本将提供无与伦比的性能。Qwen2模型在速度与效率并重的实用场景中大放异彩,尤其适合对快速响应或资源受限的应用场景。

接下来,我们有Mistral Nemo 12B,这款拥有12B参数的模型在处理复杂的自然语言处理(NLP)任务,如语言翻译和实时对话系统方面表现出色。它与Falcon 40B、Chinchilla 70B等模型同台竞技,却能在无需庞大基础设施的条件下本地运行,实现了复杂性与实用性的完美结合。

Llama 3.1 8B,这款携带8B参数的模型,在功能与效率之间取得了令人赞叹的平衡。它在问答和情感分析等任务中表现出类拔萃。对于那些急需快速结果而又不愿牺牲计算能力的用户,Llama 3.1 8B提供了一个性能与速度并重的优选。

Pythia系列,参数从1.6亿延伸至28亿,这一系列模型专为推理和编程技能任务量身定制。对于软件开发者,Pythia在处理结构化、逻辑性任务方面的能力无人能出其右。它在编码和推理任务上的表现超越了GPT-Neo等其他模型,尽管在更广泛的语言任务中可能会有所波动。Pythia的公共训练透明度和定制选项令人印象深刻,它的灵活性使其成为适应特定需求的强有力工具。

Cerebras-GPT,这款参数在1.11亿至27亿间变动的高效快速模型,专为资源有限但对性能有高要求的环境设计。与GPT-3或LLaMA 13B等大型模型相比,Cerebras-GPT虽在广泛训练上或有不及,但其遵循Chinchilla缩放法则,展现出极高的计算效率。对于那些追求可扩展性和效率的用户,Cerebras-GPT无疑是最佳选择。

Phi-3.5,这款38亿参数的模型,以其128K令牌的上下文长度独树一帜。它能够处理长文档或多轮对话任务,且不会丢失上下文,同时支持多语言,成为Llama 13B和GPT-3.5等模型的强有力竞争者,且计算需求相对较低。它在文档摘要、多语言任务和逻辑推理方面的表现令人期待。

StableLM-Zephyr,这款30亿参数的小型语言模型,在提供精确性和速度方面表现出色。它在边缘系统或资源受限设备中,面对需要快速决策的环境时,能提供出色的表现。StableLM-Zephyr在推理甚至角色扮演任务中同样游刃有余,虽然在处理写作或编码等复杂任务时可能不及大型模型,但考虑到其体积,它的表现已足够令人称赞。若速度和效率是您的首要考量,StableLM-Zephyr无疑是个坚实的选择。

TinyLlama,这款11亿参数的紧凑模型,以其出色的效率在移动和边缘设备上的表现令人印象深刻。在现实世界的任务中,尤其是在常识推理方面,TinyLlama甚至超越了Pythia-1.4B等模型。尽管它可能缺乏LLaMA 13B等大型模型的原始计算能力,但它在性能与资源效率之间取得了巧妙的平衡,使其成为资源受限环境中的理想选择。

MobileLLaMA,这款为移动和低功耗设备设计的LLaMA专用版本,拥有14亿参数,旨在在性能与效率间找到平衡点。它针对移动设备中的低延迟AI应用进行了优化。无论是MobileLLaMA-1.4B还是MobileLLaMA-2.7B版本,都在速度上超越了TinyLLaMA 1.1B等小型模型,并与OpenLLaMA 3B不相上下,且速度提升约40%。对于需要设备上实时AI的用户,MobileLLaMA无疑是完美的伴侣。

LaMini-GPT,这款参数介于7.74亿至15亿的模型,专为多语言任务设计,它在资源受限的环境中表现出色,能够处理多种语言而不需要大量计算资源。LaMini-GPT通过从GPT家族的大型模型中进行知识蒸馏而开发,这使得它在遵循指令的任务中表现出色。尽管它在特定任务上表现出色,但对于需要深入上下文理解或更广泛文本生成的应用,它可能不是最佳选择。如果您寻求的是快速且高效的解决方案,尤其是在多语言场景下,LaMini-GPT是一个可靠的选择。

Gemma2,这款20亿参数的模型,若您考虑本地部署,它将展现出卓越的性能。它轻量级且高效,非常适合文本生成或翻译等任务。与OpenAI o1-preview等重量级选手相比,Gemma2更专注于实时应用而非复杂推理。对于边缘计算,它是GPT-3.5或Llama 65B等资源密集型模型的完美替代品。

MiniCPM,这款参数在10亿至40亿之间的模型,在性能与资源效率之间取得了良好的平衡。它旨在轻松处理一般语言任务,并在众多应用中提供可靠的性能,是一个全能的选择。MiniCPM虽小,但其性能可与Mistral-7B和LLaMA 7B等大型模型相媲美。它特别针对英语和中文的语言处理进行了优化,使其成为资源有限环境中的高效轻量级替代品。

OpenELM,这款参数在2.7亿至30亿之间的灵活且可适应的模型,专为需要多任务处理和低延迟响应的环境设计。由苹果公司开发,OpenELM专注于能源效率和设备上的AI应用。它与MobiLlama和OLMo等模型竞争,在针对特定任务进行调整时显示出显著的改进。凭借其广泛的参数范围,OpenELM针对更小、更受限的环境进行了优化。

DCLM,这款10亿参数的模型,专为常识推理设计。它在需要理解和逻辑推断的真实世界任务中表现出色。DCLM在语言理解和推理方面表现出色,尤其是其70亿参数版本。它与LLaMA 2 (7B)和Mistral 7B等模型竞争,在常识推理和逻辑推断任务中表现同样出色。DCLM针对需要效率和较少计算资源的真实世界应用进行了高度优化,因此当您拥有需要强大性能而不需要重型基础设施的环境时,DCLM是一个很好的选择。

Fox,这款16亿参数的模型,专为速度和效率而生。它为移动应用优化,保持低延迟至关重要。Fox在不消耗过多计算能力的情况下提供快速响应。

模型名称参数开源主要特点
Qwen20.5B, 1B, 7B可扩展,适用于各种任务
Mistral Nemo 12B12B复杂的自然语言处理任务,本地部署
Llama 3.1 8B8B是*平衡性能和效率
Pythia160M - 2.8B专注于推理和编码
Cerebras-GPT111M - 2.7B计算效率高,遵循Chinchilla缩放法则
Phi-3.53.8B是**长上下文长度(128K令牌),多语言
StableLM-zephyr3B快速推理,边缘系统高效
TinyLlama1.1B移动和边缘设备高效
MobileLLaMA1.4B为移动和低功耗设备优化
LaMini-GPT774M - 1.5B多语言,指令跟随任务
Gemma29B, 27B本地部署,实时应用
MiniCPM1B - 4B平衡性能,英文和中文优化
OpenELM270M - 3B多任务处理,低延迟,节能
DCLM1B常识推理,逻辑推理
Fox1.6B为移动应用速度优化

通过这个表格,我们总结了上述所有内容,展示了各模型的参数、开源状态和主要特点。这些SLMs在许多方面证明了,规模小并不意味着能力弱,反而在很多情况下,它们更加智能和灵活。预计这些SLMs将更多地融入到我们的日常生活中。so,找到合适的模型来完成工作是关键——在很多情况下,合适的模型可能只是小而敏捷的。

相关文章:

2024年顶级小型语言模型前15名

本文,我们将深入了解2024年备受瞩目的十五款小型语言模型(SLMs),它们分别是Llama 3.1 8B、Gemma2、Qwen 2、Mistral Nemo、Phi-3.5等。这些SLMs以其精巧的体积和高效率著称,它们不需要依赖庞大的服务器资源&#xff0c…...

精通 Python 网络安全(一)

前言 最近,Python 开始受到越来越多的关注,最新的 Python 更新添加了许多可用于执行关键任务的包。我们的主要目标是帮助您利用 Python 包来检测和利用漏洞,并解决网络挑战。 本书将首先带您了解与网络和安全相关的 Python 脚本和库。然后&…...

【python自动化二】pytest集成allure生成测试报告

pytest本身不会直接生成测试报告,而allure是一种生成测试报告的公共插件,可与多种测试框架配合生成测试报告,本文介绍下如何集成allure生成测试报告。 1.allure安装 1.安装allure-pytest 先安装allure的pytest插件,用于在pytes…...

网络版本的通讯录青春版(protobuf)

环境搭建 Protobuf 还常⽤于通讯协议、服务端数据交换场景。 因为我们主要目的只是为了学习protobuf,因此对于客户端,原本应该具备: 新增⼀个联系⼈ ◦ 删除⼀个联系⼈ ◦ 查询通讯录列表 ◦ 查询⼀个联系⼈的详细信息 这样四个功能。 …...

开源模型应用落地-安全合规篇-用户输入价值观判断(三)

一、前言 在深度合规功能中,对用户输入内容的价值观判断具有重要意义。这一功能不仅仅是对信息合法性和合规性的简单审核,更是对信息背后隐含的伦理道德和社会责任的深刻洞察。通过对价值观的判断,系统能够识别可能引发不当影响或冲突的内容,从而为用户提供更安全、更和谐的…...

神经网络入门实战:(十四)pytorch 官网内置的 CIFAR10 数据集,及其网络模型

(一) pytorch 官网内置的网络模型 图像处理: Models and pre-trained weights — Torchvision 0.20 documentation (二) CIFAR10数据集的分类网络模型(仅前向传播): 下方的网络模型图片有误,已做修改,具…...

【Rust在WASM中实现pdf文件的生成】

Rust在WASM中实现pdf文件的生成 前言概念和依赖问题描述分步实现pdf转Blob生成URL两种方式利用localstorage传递参数处理图片Vec<u8>到pdf格式的Vec<u8>使用rust创建iframe显示pdf的Blob最后 前言 实现了一个通用的前端jpg转pdf的wasm,因为动态响应框架无法直接打…...

在MySQL中执行sum case when报错:SUM does not exist

1. 报错 在pgsql中能正常运行的一段SQL在MySQL中运行的时候报错了&#xff1a; SELECT DATE( hr.handle_time ) AS statsDate,SUM ( CASE WHEN hma.app_type IN ( 2, 5 ) THEN ch_money ELSE 0 END ) AS aliPayAmt,SUM ( CASE WHEN hma.app_type IN ( 1, 4 ) THEN ch_money EL…...

【openssl】相关指令

熟悉下相关概念 x509&#xff1a;证书标准pem和der&#xff1a;两种&#xff08;包括公私钥、证书签名请求、证书等内容的&#xff09;的格式&#xff0c;前者是文本形式&#xff0c;linux常用&#xff0c;后者是二进制形式&#xff0c;windows常用&#xff0c;仅仅是格式&…...

实例分割详解

实例分割详解 引言 实例分割是计算机视觉领域的一项复杂任务&#xff0c;它要求模型能够识别图像中不同类别的对象&#xff0c;并对每个单独的对象进行像素级别的分类。与语义分割不同的是&#xff0c;实例分割不仅要区分不同的类别&#xff0c;还要识别同一类别中的不同个体…...

D87【python 接口自动化学习】- pytest基础用法

day87 pytest运行参数 -m -k 学习日期&#xff1a;20241203 学习目标&#xff1a;pytest基础用法 -- pytest运行参数-m -k 学习笔记&#xff1a; 常用运行参数 pytest运行参数-m -k pytest -m 执行特定的测试用例&#xff0c;markers最好使用英文 [pytest] testpaths./te…...

浅谈MySQL路由

华子目录 mysql-router介绍下载mysql-router安装mysql-router实验 mysql-router介绍 mysql-router是一个对应用程序透明的InnoDB Cluster连接路由服务&#xff0c;提供负载均衡、应用连接故障转移和客户端路由利用路由器的连接路由特性&#xff0c;用户可以编写应用程序来连接到…...

matlab中disp,fprintf,sprintf,display,dlmwrite输出函数之间的区别

下面是他们之间的区别&#xff1a; disp函数与fprintf函数的区别 输出格式的灵活性 disp函数&#xff1a;输出格式相对固定。它会自动将变量以一种比较直接的方式显示出来。对于数组&#xff0c;会按照行列形式展示&#xff1b;对于字符串&#xff0c;直接原样输出并换行。例如…...

30.100ASK_T113-PRO 用QT编写视频播放器(一)

1.再buildroot中添加视频解码库 X264, 执行 make menuconfig Target packages -->Libraries --> Multimedia --> X264 CLI 还需要添加 FFmpeg 2. 保存,重新编译 make all 3.将镜像下载开发板...

Linux-GPIO应用编程

本章介绍应用层如何控制 GPIO&#xff0c;譬如控制 GPIO 输出高电平、或输出低电平。 只要是用到GPIO的外设&#xff0c;都有可能用得到这些操作方法。 照理说&#xff0c;GPIO的操作应该是由驱动层去做的&#xff0c;使用寄存器操作或者GPIO子系统之类的框架。 但是&#xff0…...

opencvocr识别手机摄像头拍摄的指定区域文字,文字符合规则就语音报警

安装python&#xff0c;pycharm&#xff0c;自行安装。 Python下安装OpenCv 2.1 打开cmd,先安装opencv-python pip install opencv-python --user -i https://pypi.tuna.tsinghua.edu.cn/simple2.2 再安装opencv-contrib-python pip install opencv-contrib-python --user …...

微服务即时通讯系统(5)用户管理子服务,网关子服务

用户管理子服务&#xff08;user文件&#xff09; 用户管理子服务也是这个项目中的一个业务最多的子服务&#xff0c;接口多&#xff0c;但是主要涉及的数据表只有user表&#xff0c;Redis的键值对和ES的一个搜索引擎&#xff0c;主要功能是对用户的个人信息进行修改管理&#…...

postgreSQL安装后启动有The application server could not be contacted问题

不得不说pgsql是真的麻烦,找问题找了几个小时才解决.直接步入主题吧 首先问题如下 安装后,双击启动就出现上述问题 首先删除路径为 c:\Users\your_name\AppData\Roaming\pgAdmin 之内的所有文件和文件夹, 如果找不到AppData,就把这个点开 接着找到你安装pgsql的路径,我的是D…...

架构05-架构安全性

零、文章目录 架构05-架构安全性 1、软件架构安全的重要性 **系统安全&#xff1a;**不仅包括防御黑客攻击&#xff0c;还包括安全备份与恢复、安全审计、防治病毒等。**关注重点&#xff1a;**认证、授权、凭证、保密、传输安全、验证。 2、认证&#xff08;Authenticatio…...

虚幻引擎---材质篇

一、基础知识 虚幻引擎中的材质&#xff08;Materials&#xff09; 定义了场景中对象的表面属性&#xff0c;包括颜色、金属度、粗糙度、透明度等等&#xff1b;可以在材质编辑器中可视化地创建和编辑材质&#xff1b;虚幻引擎的渲染管线的着色器是用高级着色语言&#xff08;…...

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…...

CentOS下的分布式内存计算Spark环境部署

一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架&#xff0c;相比 MapReduce 具有以下核心优势&#xff1a; 内存计算&#xff1a;数据可常驻内存&#xff0c;迭代计算性能提升 10-100 倍&#xff08;文档段落&#xff1a;3-79…...

第 86 场周赛:矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有 从 1 到 9 的不同数字的 3 x 3 矩阵&#xff0c;其中每行&#xff0c;每列以及两条对角线上的各数之和都相等。 给定一个由整数组成的row x col 的 grid&#xff0c;其中有多少个 3 3 的 “幻方” 子矩阵&am…...

Spring数据访问模块设计

前面我们已经完成了IoC和web模块的设计&#xff0c;聪明的码友立马就知道了&#xff0c;该到数据访问模块了&#xff0c;要不就这俩玩个6啊&#xff0c;查库势在必行&#xff0c;至此&#xff0c;它来了。 一、核心设计理念 1、痛点在哪 应用离不开数据&#xff08;数据库、No…...

【HarmonyOS 5 开发速记】如何获取用户信息(头像/昵称/手机号)

1.获取 authorizationCode&#xff1a; 2.利用 authorizationCode 获取 accessToken&#xff1a;文档中心 3.获取手机&#xff1a;文档中心 4.获取昵称头像&#xff1a;文档中心 首先创建 request 若要获取手机号&#xff0c;scope必填 phone&#xff0c;permissions 必填 …...

零基础在实践中学习网络安全-皮卡丘靶场(第九期-Unsafe Fileupload模块)(yakit方式)

本期内容并不是很难&#xff0c;相信大家会学的很愉快&#xff0c;当然对于有后端基础的朋友来说&#xff0c;本期内容更加容易了解&#xff0c;当然没有基础的也别担心&#xff0c;本期内容会详细解释有关内容 本期用到的软件&#xff1a;yakit&#xff08;因为经过之前好多期…...

C++.OpenGL (14/64)多光源(Multiple Lights)

多光源(Multiple Lights) 多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...

iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中&#xff0c;性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期&#xff0c;开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发&#xff0c;但背后往往隐藏着系统资源调度不当…...

GitFlow 工作模式(详解)

今天再学项目的过程中遇到使用gitflow模式管理代码&#xff0c;因此进行学习并且发布关于gitflow的一些思考 Git与GitFlow模式 我们在写代码的时候通常会进行网上保存&#xff0c;无论是github还是gittee&#xff0c;都是一种基于git去保存代码的形式&#xff0c;这样保存代码…...

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好&#xff0c;我是java1234_小锋老师&#xff0c;看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】&#xff0c;分享下哈。 项目视频演示 【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...