常见LLM大模型总结
常见LLM大模型总结
| 模型名称 | 发布机构 | 主要特点 | 参数规模 | 应用场景 |
|---|---|---|---|---|
| GPT-4 | OpenAI | 强大的推理能力,支持多模态(图像+文本),上下文理解更深 | 1.7万亿参数 | 聊天机器人、内容生成、代码生成 |
| ChatGPT | OpenAI | 面向对话优化,支持多轮对话记忆,训练数据更偏实际应用 | 数百亿参数 | 客服、教育辅助、任务型对话 |
| LLaMA 2 | Meta | 开源模型,提供不同参数规模的版本,适合研究和定制化开发 | 7B/13B/70B | 科研研究、垂直领域应用 |
| Claude 2 | Anthropic | 强调对齐性和安全性,擅长长文档总结和推理任务 | 未公开 | 法律、技术文档总结、教育工具 |
| PaLM 2 | Google DeepMind | 强化多语言和多任务处理能力,支持代码生成和翻译等任务 | 未公开 | 搜索引擎、跨语言翻译、代码编写 |
| MPT-7B | MosaicML | 训练成本低,支持开源和自定义优化,具备灵活性和可扩展性 | 7B | 开源模型实验、轻量化应用 |
| BLOOM | BigScience | 开源多语言模型,支持46种语言,关注全球化和多样性 | 176B | 多语言NLP任务、学术研究 |
| Falcon | TII UAE | 开源模型,优化推理速度,适合高效推理任务 | 7B/40B | 内容生成、聊天机器人、高效推理任务 |
| GPT-NeoX | EleutherAI | 高度开源,训练成本优化,支持大规模预训练 | 20B | 学术研究、开放性开发 |
| OPT | Meta | 专为高效训练和推理设计,模型开源,参数规模可调 | 175B | NLP研究、工业级应用 |
| Ernie Bot | 百度 | 强化中文理解能力,结合知识图谱支持深度问答 | 未公开 | 中文搜索、企业应用、智能客服 |
| Spark | 阿里巴巴达摩院 | 强调在中文环境下的生成式任务和工业应用优化 | 未公开 | 工业应用、中文生成、业务智能化 |
| Tongyi Qianwen | 阿里巴巴 | 强化中文语言生成,适配多业务场景,具备多模态能力 | 未公开 | 中文写作、智能助手、跨领域应用 |
注释
- 参数规模:部分模型的参数规模未公开。
- 应用场景:基于公开信息总结,实际应用可能更广泛。
- 数据来源:模型发布机构的官网和相关文档。
相关文章:
常见LLM大模型总结
常见LLM大模型总结 模型名称发布机构主要特点参数规模应用场景GPT-4OpenAI强大的推理能力,支持多模态(图像文本),上下文理解更深1.7万亿参数聊天机器人、内容生成、代码生成ChatGPTOpenAI面向对话优化,支持多轮对话记…...
向量检索+大语言模型,免费搭建基于专属知识库的 RAG 智能助手
随着生成式人工智能技术的飞速发展,越来越多的人和企业开始应用AI到日常的工作和生活中。但公域的AI助手其数据来自互联网上的大量公开文本,虽然具有广泛的知识,但在面对一些特定领域的专业问题时,可能会出现回答不够准确或深入的…...
基础11C++中的异常处理以及swap
一、异常处理手段 抛出异常:throw 异常 作用:让调用者看见这个异常,如果调用者不理睬,就让调用者的调用者看见 接住异常: try {可能异常的code} catch(异常类型) {处理方式} 异常类型:一般为const &,防…...
写作词汇积累:得偿所望、可见一斑、搭腔
得偿所望 【得偿所望】是指经过长时间的期盼和努力,最终实现了自己的愿望或目标。 【得偿所望】强调了愿望实现后的满足感和成就感,是一个充满正能量和积极情感的词语。 【得偿所望】与【得偿所愿】在表达上也具有相似的含义,都指愿望得到了…...
android jetpack compose Model对象更新变量 UI不更新、不刷新问题
以前是搞老本行Android原生开发的,因为工作原因,一直在用vue小程序;因为一些工作需要,又需要用到Android原生开发,建了个项目,打开源码一看,天塌了!!!我以前的…...
数据库概论
目录 1、数据库管理系统(DBMS) 1.1 DBMS的主要功能 1. 数据库的定义功能 2. 数据库的操纵功能 3. 数据库的运行控制功能 4. 数据库的维护 5. 数据字典(Data Dictionary,DD) 2、数据模型 2.1 信息和数据(了解) 2.2 数据模型的三个层次 2.3 信息世界中的基…...
基于python使用UDP协议对飞秋进行通讯—DDOS
基于飞秋的信息传输 声明:笔记的只是方便各位师傅学习知识,以下代码、网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负。 老规矩,封面在文末! 飞秋介绍 (…...
数据库管理-第275期 Oracle 23ai:画了两张架构图(20241225)
数据库管理275期 2024-12-25 数据库管理-第275期 Oracle 23ai:画了两张架构图(20241225)1 系统管理分片2 用户定义分片总结 数据库管理-第275期 Oracle 23ai:画了两张架构图(20241225) 作者:胖…...
使用Streamlit部署机器学习模型
机器学习: 计算机能够从经验中学习,而无需明确编程。机器学习是目前最热门的领域之一,世界各地的顶级公司都在使用它来改善他们的服务和产品。但是没有使用在Jupyter Notebook中训练的机器学习模型。因此,我们需要部署这些模型&am…...
依图科技简介
依图科技(YITU Technology)是中国一家全球领先的人工智能(AI)公司,成立于2012年,总部位于上海。公司专注于计算机视觉、语音识别和自然语言处理等核心AI技术,致力于推动AI技术在医疗、安防、金融…...
苍穹外卖day07缓存部分分析
苍穹外卖Day07部分聚焦于缓存功能的实现与优化,通过引入redis缓存机制,结合Spring Cache 注解,降低了数据库负载,提升其响应速度。 以下是清除缓存功能代码: RestController RequestMapping("/admin/dish"…...
OCR实践-Table-Transformer
前言 书接上文 OCR实践—PaddleOCR Table-Transformer 与 PubTables-1M table-transformer,来自微软,基于Detr,在PubTables1M 数据集上进行训练,模型是在提出数据集同时的工作, paper PubTables-1M: Towards comp…...
HarmonyOS NEXT 实战之元服务:静态案例效果---电台推荐
背景: 前几篇学习了元服务,后面几期就让我们开发简单的元服务吧,里面丰富的内容大家自己加,本期案例 仅供参考 先上本期效果图 ,里面图片自行替换 效果图1完整代码案例如下: Index import { authentica…...
微信小程序 不同角色进入不同页面、呈现不同底部导航栏
遇到这个需求之前一直使用的小程序默认底部导航栏,且小程序默认入口页面为pages/index/index,要使不同角色呈现不同底部导航栏,必须要在不同页面引用不同的自定义导航栏。本篇将结合分包(subPackages)展开以下三步叙述…...
MATLAB符号计算-符号表达式基础运算操作
1.1.2符号变量取值域的限定 默认复数域 【例1-1-2】解不等式 1.1.3创建符号表达式 对符号对象进行各种运算(算术运算、关系运算、逻辑运算),即可创建符号表达式。 1.算术运算与转置 【例1-1-3】 f5是f4的共轭转置 f6是f4的转置 2.关系…...
服务器被攻击怎么办
当服务器遭受恶意流量攻击,如DDoS(分布式拒绝服务)或CC(Challenge Collapsar)攻击时,传统的防护措施可能不足以应对。此时,采用高防IP服务可以有效缓解攻击压力,确保业务连续性和数据…...
精准识别花生豆:基于EfficientNetB0的深度学习检测与分类项目
精准检测花生豆:基于EfficientNet的深度学习分类项目 在现代农业生产中,作物的质量检测和分类是确保产品质量的重要环节。针对花生豆的检测与分类需求,我们开发了一套基于深度学习的解决方案,利用EfficientNetB0模型实现高效、准…...
【UE5 C++课程系列笔记】13——GameInstanceSubsystem的简单使用
目录 概念 基本使用案例 效果 步骤 概念 UGameInstanceSubsystem 类继承自 USubsystem,它与 GameInstance 紧密关联,旨在为游戏提供一种模块化、可方便扩展和管理的功能单元机制。在整个游戏运行期间,一个 GameInstance 可以包含多个 UGa…...
实用工具推荐----Doxygen使用方法
目录 目录 1 软件介绍 2 Doxygen软件下载方法 3 Doxygen软件配置方法 4 标准注释描述 4.1 块注释 和 特殊描述字符 4.1.1 函数描述示例 4.1.2结构体数组变量示例 特别注意: 4.2单行注释 4.2.1 单个变量注释示例 特别注意: 4.2.2对于枚举变量…...
js垃圾回收机制详细讲解
JavaScript 垃圾回收机制(Garbage Collection, GC)负责自动管理内存的分配和释放,确保程序在运行时不会因为内存泄漏而崩溃。它的主要任务是回收不再使用的内存空间,防止内存泄漏。JavaScript 的垃圾回收通常由引擎自动完成&#…...
wechat-need-web:基于Manifest V3的微信网页版访问架构解析与实现方案
wechat-need-web:基于Manifest V3的微信网页版访问架构解析与实现方案 【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 微信网页版访问限制…...
树莓派 AP 模式作为中继器或子路由器配置
树莓派 AP 模式作为中继器或子路由器配置设备:Raspberry Pi 4B W | 日期:2026-04-02 WiFi 芯片:BCM43455 | 系统:Raspberry Pi OS (64-bit)一、环境信息项目值设备型号Raspberry Pi Zero 2 WWiFi 芯片BCM43455内核版本6.6.x操作系…...
零基础也能入行!大模型AI学习指南,收藏这份进阶路线图
零基础也能入行!大模型AI学习指南,收藏这份进阶路线图 本文为AI大模型新手提供了一份系统化学习路线图,从认知重塑、基础准备、核心知识入门、动手实践到定位方向与求职准备,详细拆解了学习步骤与关键点。强调先应用后理论、重实践…...
SEO_内容与SEO如何结合?高效优化步骤详解
SEO与内容结合:高效优化步骤详解 在当今数字化时代,搜索引擎优化(SEO)和内容营销无疑是提升网站流量和品牌影响力的关键。SEO和内容的结合并不是一件简单的事情。很多人可能在这两者之间产生困惑,不知道如何在保持内容…...
ai赋能openclaw:通过快马平台实现智能路径规划与自适应抓取
最近在做一个智能抓取机器人OpenClaw的项目,正好体验了一把AI辅助开发的便利。这个项目需要实现机械爪在复杂环境中的自主路径规划和自适应抓取,过程中发现InsCode(快马)平台的AI功能确实帮了大忙,分享下具体实现思路和踩坑经验。 场景搭建与…...
显卡驱动清理完全指南:从问题诊断到自动化解决方案
显卡驱动清理完全指南:从问题诊断到自动化解决方案 【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/display-drivers-uninstaller …...
实战指南:基于快马ai与ubuntu24.04从零部署高可用个人博客系统
今天想和大家分享一个实战项目:在Ubuntu 24.04上从零部署一个高可用的个人博客系统。这个系统不仅前后端分离,还用到了Nginx反向代理和Gunicorn应用服务器,非常适合想学习全栈开发的朋友练手。 系统架构设计 整个博客系统采用经典的前后端分离…...
BiliTools AI视频总结:让B站学习效率提升300%的智能解决方案
BiliTools AI视频总结:让B站学习效率提升300%的智能解决方案 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …...
OpenClaw隐私方案:Kimi-VL-A3B-Thinking本地处理医疗影像数据分析
OpenClaw隐私方案:Kimi-VL-A3B-Thinking本地处理医疗影像数据分析 1. 为什么医疗数据必须留在本地? 去年参与一个医学研究项目时,团队需要分析3000多份CT影像。当我们尝试使用某云服务时,合规部门直接叫停——这些包含患者面部特…...
科哥版HeyGem实战应用:企业内训播报,文字转语音再转数字人全流程
科哥版HeyGem实战应用:企业内训播报,文字转语音再转数字人全流程 1. 企业内训数字人播报的价值与痛点 在当今快节奏的商业环境中,企业内训面临着内容更新频繁、制作周期紧张、人力成本高昂等挑战。传统的内训视频制作需要协调讲师时间、租赁…...
