当前位置: 首页 > news >正文

【大模型】大模型分类

大模型(Large Models)通常指参数量巨大、计算能力强大的机器学习模型,尤其在自然语言处理(NLP)、计算机视觉(CV)等领域表现突出。以下是大模型的常见分类方式:

1. 按应用领域分类

  • 自然语言处理(NLP)模型
    如GPT-3、BERT、T5等,主要用于文本生成、翻译、问答等任务。
  • 计算机视觉(CV)模型
    如ResNet、EfficientNet、Vision Transformer (ViT)等,用于图像分类、目标检测等任务。
  • 多模态模型
    如CLIP、DALL·E等,能够同时处理文本和图像等多模态数据。
  • 语音模型
    如WaveNet、Whisper等,用于语音识别、合成等任务。
  • 强化学习模型
    如AlphaGo、AlphaZero等,用于游戏、机器人控制等领域。

2. 按模型架构分类

  • Transformer 模型
    如GPT、BERT、T5等,基于Transformer架构,广泛应用于NLP。
  • 卷积神经网络(CNN)模型
    如ResNet、Inception等,主要用于图像处理。
  • 循环神经网络(RNN)模型
    如LSTM、GRU等,适用于序列数据处理。
  • 生成对抗网络(GAN)模型
    如StyleGAN、BigGAN等,用于图像生成和编辑。
  • 图神经网络(GNN)模型
    如GCN、GAT等,用于图结构数据处理。

3. 按模型规模分类

  • 小型模型
    参数量较少(如数百万到数亿),适合移动设备或实时应用。
  • 中型模型
    参数量在数十亿左右,适合一般企业应用。
  • 大型模型
    参数量达数百亿甚至千亿(如GPT-3、PaLM),适合复杂任务。
  • 超大规模模型
    参数量超过千亿(如GPT-4、Megatron-Turing NLG),需大量计算资源。

4. 按训练方式分类

  • 预训练模型
    如BERT、GPT等,通过大规模数据预训练,可微调以适应特定任务。
  • 微调模型
    在预训练基础上,针对特定任务进行微调。
  • 端到端模型
    直接从输入到输出进行训练,无需预训练。

5. 按开源与闭源分类

  • 开源模型
    如BERT、GPT-2等,代码和权重公开,可自由使用和修改。
  • 闭源模型
    如GPT-3、GPT-4等,仅通过API提供,无法访问内部细节。

6. 按模型功能分类

  • 生成模型
    如GPT、DALL·E等,用于生成文本、图像等内容。
  • 判别模型
    如BERT、ResNet等,用于分类、检测等任务。
  • 多任务模型
    如T5、UniLM等,能够同时处理多种任务。

7. 按模型部署方式分类

  • 云端模型
    如GPT-3、PaLM等,部署在云端,通过API调用。
  • 边缘模型
    如MobileNet、TinyBERT等,部署在边缘设备上,适合低延迟场景。

8. 按模型优化目标分类

  • 通用模型
    如GPT、BERT等,适用于多种任务。
  • 专用模型
    如AlphaFold(蛋白质结构预测)、Codex(代码生成)等,针对特定领域优化。

这些分类方式有助于更好地理解大模型的特点和应用场景。

相关文章:

【大模型】大模型分类

大模型(Large Models)通常指参数量巨大、计算能力强大的机器学习模型,尤其在自然语言处理(NLP)、计算机视觉(CV)等领域表现突出。以下是大模型的常见分类方式: 1. 按应用领域分类 …...

Redis 的几个热点知识

前言 Redis 是一款内存级的数据库,凭借其卓越的性能,几乎成为每位开发者的标配工具。 虽然 Redis 包含大量需要掌握的知识,但其中的热点知识并不多。今天,『知行』就和大家分享一些 Redis 中的热点知识。 Redis 数据结构 Redis…...

【新手入门】SQL注入之getshell(木马)

木马介绍 木马其实就是一段程序,这个程序运行到目标主机上时,主要可以对目标进行远程控制、盗取信息等功能,一般不会破坏目标主机,当然,这也看黑客是否想要搞破坏。 按照功能分类:远控型、破坏型、流氓软件型、盗取信…...

【pytest框架源码分析二】pluggy源码分析之add_hookspecs和register

这里我们看一下_manager.py里的类和方法,最主要的是PluginManager类,类的初始化函数如下: class PluginManager:"""Core class which manages registration of plugin objects and 1:N hookcalling.You can register new hoo…...

四、数据存储

在爬虫项目中,我们需要将目标站点数据进行持久化保存,一般数据保存的方式有两种: 文件保存数据库保存 在数据保存的过程中需要对数据完成去重操作,所有需要使用 redis 中的 set 数据类型完成去重。 1.CSV文件存储 1.1 什么是c…...

【原创】Ollama Test API For Linux/MacOS/Unix

安装Json解析工具 Linux/Unix sudo apt-get install jq -yMacOS brew install jq -y设置环境变量 export IP"192.168.250.229" export PORT"8080" export MODEL"deepseek-r1:7b"检查Ollama版本 curl http://"$IP":"$PORT&qu…...

LeetCode-Hot100-005盛最多水的容器

不懂的可以在评论区问我。 代码 双指针&#xff0c;开始的时候一个在最左边&#xff0c;一个在最右边。每次移动矮的那头&#xff0c;因为这是矮柱子作为容器能装的水的极限了。 class Solution { public:int maxArea(vector<int>& height) {int left 0; int rig…...

电源测试系统有哪些可以利用AI工具的科技??

AI技术的发展对电源模块测试系统的影响是深远的&#xff0c;不仅协助系统提升了测试效率和精度&#xff0c;还推动了测试方法的创新和智能化。那么在电源测试系统中哪些模块可以利用AI工具实现自动化测试? 1. 自动化测试与效率提升 智能测试流程优化 AI算法可以自动优化测试…...

【3-3】springcloud

OpenFeign 启动OpenFeign 定义客户端接口 注入客户端并使用 OpenFeignhttp调用ribbon负载均衡 gateway 来自&#xff1a;https://mynamelancelot.github.io/spring-cloud/spring-cloud-gateway.html#cors https://blog.csdn.net/qingdao666666/article/details/119973771 …...

Goby 漏洞安全通告| Ollama /api/tags 未授权访问漏洞(CNVD-2025-04094)

漏洞名称&#xff1a;Ollama /api/tags 未授权访问漏洞&#xff08;CNVD-2025-04094&#xff09; English Name&#xff1a;Ollama /api/tags Unauthorized Access Vulnerability (CNVD-2025-04094) CVSS core: 6.5 风险等级&#xff1a; 中风险 漏洞描述&#xff1a; O…...

‌Debian 包版本号比较规则详解

1 版本号组成结构 Debian 版本号格式为&#xff1a;[epoch:]upstream_version[-debian_revision] 示例‌&#xff1a;2:1.18.3~betadfsg1-5b1 组件说明比较优先级‌Epoch‌冒号前的数字 (2:)最高‌Upstream‌主版本 (1.18.3~betadfsg1)中‌Debian修订号‌减号后的部分 (5)最…...

009---基于Verilog HDL的单比特信号边沿检测

文章目录 摘要一、边沿检测二、时序逻辑实现2.1 rtl2.2 tb 三、组合逻辑实现3.1 rtl3.2 tb 摘要 文章为学习记录。采用时序逻辑和组合逻辑实现边沿检测的核心逻辑。组合逻辑实现的上升沿和下降沿的脉冲比时序逻辑实现的上升沿和下降沿的脉冲提前一拍。 一、边沿检测 边沿检测…...

2025全开源Java多语言跨境电商外贸商城/Tk/FB内嵌商城I商家入驻I批量下单I完美运行

商城程序介绍&#xff1a; 2025全新版UI 新增全球多站点选择 PC端&#xff1a;vueelementui 用户端使用&#xff1a;uniapp 管理端使用&#xff1a;vueelementui 后台服务使用&#xff1a;springbootmybatisplusmysql 商城功能介绍&#xff1a; 商城含21种语言 代理…...

iOS实现一个强大的本地状态记录容器

我们开发中经常会遇到这样的场景&#xff0c;就是我们客户端用户进行了某个操作&#xff0c;这个操作影响了数据的状态&#xff0c;但是我们又不方便重新请求一次数据&#xff0c; 这个时候&#xff0c;就需要我们记录一下本地状态在内存中&#xff0c;随着业务越来越复杂&…...

【mysql】有索引和没有索引字段更新时锁的不同

结论 对于有索引的的字段作为更新条件&#xff0c;如果更加语句用上了索引&#xff0c;那么只会在对于的更新字段的索引和对于记录的主键索引上加上x锁 如果更新字段没有索引&#xff0c;由于需要全部扫描&#xff0c;那么就会给所有主键索引加上x&#xff0c;导致其他事务的更…...

机器学习的三个基本要素

机器学习的基本要素包括模型、学习准则&#xff08;策略&#xff09;和优化算法三个部分。机器学习方法之间的不同&#xff0c;主要来自其模型、学习准则&#xff08;策略&#xff09;、优化算法的不同。 模型 机器学习首要考虑的问题是学习什么样的模型&#xff08;Model&am…...

神经机器翻译:联合学习对齐和翻译

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 摘要 神经机器翻译是最近提出的机器翻译方法。与传统的统计机器翻译不同&#xff0c;神经机器翻译旨在构建一个可以联合调整以最大化翻译性能的单一神经网络。最近为神经机器翻译提出的模型通常属于编码…...

[Web 安全] PHP 反序列化漏洞 —— PHP 魔术方法

关注这个专栏的其他相关笔记&#xff1a;[Web 安全] 反序列化漏洞 - 学习笔记-CSDN博客 PHP 魔术方法 - 简介 - PHP 魔术方法 - 简单教程&#xff0c;简单编程PHP 中&#xff0c;以两个下划线 ( __ ) 开头方法称之为 「 魔术方法 」 这些 「 魔术方法 」 在 [PHP](/l/yufei/php…...

聆听PostgreSQL数据库的使用

参考&#xff1a;&#xff08;1&#xff09;零基础入门PostgreSQL教程 &#xff08;2&#xff09;菜鸟教程 文章目录 一、PostgreSQL是什么&#xff1f;二、基本使用1.下载2.操作&#xff08;1&#xff09;数据库&#xff08;2&#xff09;表 一、PostgreSQL是什么&#xff1f;…...

2025嵌入式软件开发工程师--音频方向

一、选择题&#xff08;每题3分&#xff0c;共30分&#xff09; 1.以下哪个不是C语言中的关键字?&#xff08; &#xff09; A. int B. Float C. Define D. Return 2.以下代码的输出是: &#xff08; &#xff09; inta 5, b 10; printf("%d“, a b); A. 15 B.16 …...

将Taotoken集成到自动化客服系统实现智能问答降本增效

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 将Taotoken集成到自动化客服系统实现智能问答降本增效 对于需要构建或升级智能客服系统的企业而言&#xff0c;核心诉求往往集中在…...

RK3506 SPI Slave模式开发实战:从设备树配置到驱动调试全攻略

1. 项目概述与核心价值 最近在做一个物联网边缘数据采集的项目&#xff0c;需要将多个传感器节点采集到的数据&#xff0c;通过一个主控单元汇总后上传到云端。传感器节点用的是瑞芯微的RK3506&#xff0c;这颗芯片性价比高&#xff0c;功耗控制得也不错&#xff0c;非常适合这…...

中药实验管理系统|基于springboot+vue的中药实验管理系统(源码+数据库+文档)

中药实验管理系统 目录 基于springbootvue的中药实验管理系统 一、前言 二、系统设计 三、系统功能设计 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍&#xff1a;✌️大厂码农|毕设布道师&#xff0c;…...

飞机在飞行中将电力传输至地面接收器

此次演示为太空太阳能新方案奠定了基础。在2025年11月一个狂风大作的日子&#xff0c;一架塞斯纳涡轮螺旋桨飞机在5000米的高度飞越宾夕法尼亚州上空时&#xff0c;遭遇了时速高达70节&#xff08;约130公里/小时&#xff09;的侧风&#xff0c;风速几乎与这架小型飞机的飞行速…...

在Taotoken平台观测大模型API用量与成本的实际体验

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 在Taotoken平台观测大模型API用量与成本的实际体验 对于需要持续调用多个大模型API的开发者或团队而言&#xff0c;成本控制与预算…...

Beyond Compare 5密钥生成终极指南:3分钟完成软件激活的完整解决方案

Beyond Compare 5密钥生成终极指南&#xff1a;3分钟完成软件激活的完整解决方案 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 你是否正在为Beyond Compare 5的"评估模式错误"而烦恼…...

Hitboxer SOCD Cleaner:键盘输入仲裁系统的底层实现与技术架构分析

Hitboxer SOCD Cleaner&#xff1a;键盘输入仲裁系统的底层实现与技术架构分析 【免费下载链接】socd Key remapper for epic gamers 项目地址: https://gitcode.com/gh_mirrors/so/socd 在竞技游戏领域&#xff0c;键盘输入精度直接影响玩家操作表现。传统键盘在处理同…...

AI 变频调速水泵智能功率 MOSFET 完整选型方案

2026年&#xff0c;AI技术在智能水务及工业泵控系统深度渗透&#xff08;如预测性维护、能效优化、智能流量调节&#xff09;&#xff0c;变频器对功率 MOSFET 提出更高要求&#xff1a;高效节能、高可靠性、快速响应。微碧半导体&#xff08;VBsemi&#xff09;基于先进的 Tre…...

公域卖课佣金高、粉丝留不住?这套私域打法,完课率提升了3倍

公域卖课的两大痛点痛点一&#xff1a;佣金太高&#xff0c;利润被吃掉一大块。相信在公域卖过课的朋友都有体会。平台抽成、分销佣金、投流成本……七七八八算下来&#xff0c;到手的钱可能连一半都不到。你辛辛苦苦打磨的课程&#xff0c;大头却被别人拿走了。这感觉&#xf…...

别再只会用vi了!openEuler 20.03 LTS下保姆级安装vim教程(附yum源配置)

从零配置到高效编辑&#xff1a;openEuler系统vim全攻略 刚接触openEuler系统的开发者常会遇到一个尴尬场景&#xff1a;习惯性输入vim命令后&#xff0c;终端却冷冷地回应"command not found"。这个看似简单的问题背后&#xff0c;其实涉及Linux发行版的软件管理机制…...