大语言模型学习指南:入门、应用与深入
0x00 学习路径概述
本文将学习路径划分为三个部分:入门篇、应用篇、深入篇。每个章节针对不同的学习需求,帮助你从基础知识入手,逐步掌握大语言模型(LLM)的使用、应用开发以及技术原理等内容。
学习目标
-
入门篇:
- 了解大语言模型的基础知识及常见术语
- 学会使用编程语言访问 OpenAI API 等模型接口
- 面向非专业背景用户的大模型普及
-
应用篇:
- 搭建开源模型推理环境
- 学习大语言模型应用开发框架(如 LangChain、Dify 等)
- 掌握 Prompt 工程、RAG、Agent 等应用开发模式
-
深入篇:
- 了解大模型的技术原理、训练微调、数据工程和推理优化
- 探索大语言模型的前沿技术和应用进展
根据自身需求,可以选择关注相应的章节。如果对大语言模型的原理不感兴趣,可以直接学习入门篇和应用篇。
0x10 入门篇
基础学习资源
-
申请 OpenAI API
- 请访问 OpenAI Quickstart,并确保有良好的国际互联网访问条件。
- 推荐使用 OpenRouter 来访问多种闭源和开源模型。
-
入门课程推荐:
- ChatGPT Prompt Engineering for Developers:
- 适合入门者,内容简单,提供中英双语字幕。
- 中英双语字幕资源。
- OpenAI Quickstart 【必看】:
- OpenAI 官方文档及 API Reference。
- State of GPT:【必看】
- GPT 联合创始人演示,涵盖 GPT 的训练及应用。
- 视频 | PPT
- ChatGPT Prompt Engineering for Developers:
0x20 应用篇
应用开发与框架
-
系统构建教程:
- Building Systems with the ChatGPT API:学习如何构建 ChatGPT API 应用。提供中文字幕。
-
大语言模型应用框架:
- LangChain:最火的大语言模型应用开发框架。
- LangChain for LLM Application Development:中文字幕。
- Dify:开源的应用编排工具。
- GPT best practices:OpenAI 官方最佳实践。
- openai-cookbook:OpenAI 官方 Cookbook,含大量实用示例。
- Brex’s Prompt Engineering Guide:Prompt 工程简介。
- LangChain:最火的大语言模型应用开发框架。
0x30 深入篇
0x31 大模型技术基础
- 深度学习入门:
- 《动手学深度学习》 配合 李沐 B 站视频【必看】。
- 台湾大学李宏毅深度学习课程:幽默且内容深入。
- 3blue1brown 深度学习视频【必看】。
0x32 大模型技术原理
- 大语言模型综述【必看】:
- 大语言模型综述:最好的中文综述。
- 大语言模型:最好的大语言模型书籍。
- 大规模语言模型:从理论到实践:另一本不错的中文书籍。
- 清华大模型公开课第二季【必看】。
- GPT 系列论文精读。
- Llama3.1 论文精读。
- 复杂推理:大语言模型的北极星能力。
- ICML 2024 Tutorial: Physics of Language Models【必看】。
0x33 大模型训练与微调
- 训练大模型【必看】:
- Build a Large Language Model (From Scratch)。
- LLaMA-Factory:个人推荐的微调工具。
- MAP-NEO:开源中文大模型微调工具。
0x34 大模型数据工程
- 数据处理与生成:
- 如何合成微调数据。
- 中文行业预训练语料 IndustryCorpus 2.0:科学的数据处理流。
- 数据处理工具 FlagData。
0x35 大模型推理优化
- 推理速度与性能分析【必看】:
- 长上下文 Transformer 部署挑战:性能瓶颈分析。
- 大模型量化解析。
0x36 大模型应用
- Prompt 工程与 RAG:
- Prompt 工程综述。
- Modular RAG:RAG 系统优化。
- LLM Powered Autonomous Agents。
总结:本文为大语言模型的学习者提供了从基础到深入的全方位资源,涵盖了模型的基本使用、开发框架、技术原理、微调以及推理优化等多个方面。根据自己的需求选择相应的章节进行学习,逐步掌握大语言模型的相关技术和应用开发。
相关文章:
大语言模型学习指南:入门、应用与深入
0x00 学习路径概述 本文将学习路径划分为三个部分:入门篇、应用篇、深入篇。每个章节针对不同的学习需求,帮助你从基础知识入手,逐步掌握大语言模型(LLM)的使用、应用开发以及技术原理等内容。 学习目标 入门篇&…...
【Linux-进程间通信】匿名管道+4种情况+5种特征
匿名管道 匿名管道(Anonymous Pipes)是Unix和类Unix操作系统中的一种通信机制,用于在两个进程之间传递数据。匿名管道通常用于命令行工具之间的数据传递; 匿名管道的工作原理是创建一个临时文件,该文件被称为管道文件…...
Perl打印9x9乘法口诀
本章教程主要介绍如何用Perl打印9x9乘法口诀。 一、程序代码 1、写法① use strict; # 启用严格模式,帮助捕捉变量声明等错误 use warnings; # 启用警告,帮助发现潜在问题# 遍历 1 到 9 的数字 for my $i (1..9) {# 对于每个 $i,遍历 1…...
Android--第一个android程序
写在前边 ※安卓开发工具常用模拟器汇总Android开发者必备工具-常见Android模拟器(MuMu、夜神、蓝叠、逍遥、雷电、Genymotion...)_安卓模拟器-CSDN博客 ※一般游戏模拟器运行速度相对较快,本文选择逍遥模拟器_以下是Android Studio连接模拟器实现(先从以上博文中…...
MySQL的并行复制原理
1. 并行复制的概念 并行复制(Parallel Replication)是一种通过同时处理多个复制任务来加速数据复制的技术。它与并发复制的区别在于,并行复制更多关注的是数据块或事务之间的并行执行,而不是单纯的任务并发。在数据库主从复制中&…...
2023年五一杯数学建模C题双碳目标下低碳建筑研究求解全过程论文及程序
2023年五一杯数学建模 C题 双碳目标下低碳建筑研究 原题再现: “双碳”即碳达峰与碳中和的简称,我国力争2030年前实现碳达峰,2060年前实现碳中和。“双碳”战略倡导绿色、环保、低碳的生活方式。我国加快降低碳排放步伐,大力推进…...
信息安全工程师(57)网络安全漏洞扫描技术与应用
一、网络安全漏洞扫描技术概述 网络安全漏洞扫描技术是一种可以自动检测计算机系统和网络设备中存在的漏洞和弱点的技术。它通过使用特定的方法和工具,模拟攻击者的攻击方式,从而检测存在的漏洞和弱点。这种技术可以帮助组织及时发现并修补漏洞ÿ…...
练习题 - Scrapy爬虫框架 Spider Middleware 爬虫页中间件
在 web 爬虫开发中,Scrapy 是一个非常强大且灵活的框架,它可以帮助开发者轻松地从网页中提取数据。Scrapy 的下载器中间件(Downloader Middleware)是 Scrapy 处理下载请求和响应的一个重要组件。通过使用和编写下载器中间件,开发者可以自定义请求的处理过程,增加请求头信…...
探索C++的工具箱:双向链表容器类list(1)
引言 在C中,std::list 是一个标准库提供的容器类,属于C STL(标准模板库)。std::list 是一种独特而强大的容器,它使用双向链表结构来管理元素。无论是在处理动态数据集合,还是在需要频繁进行插入和删除操作时…...
大厂高频算法考点--单调栈
什么是单调栈: 单调栈就是借助一个栈,在仅仅使用当前栈的条件下,时间复杂度是N(n),将每个节点最有离这他最近的大于或者是小于的数据返回,将已知数组的元素放到栈里。再自我实现的代码里面我们使用数组实现…...
Unity使用Git及GitHub进行项目管理
git: 工作区,暂存区(存放临时要存放的内容),代码仓库区1.初始化 git init 此时展开隐藏项目,会出现.git文件夹 2.减小项目体积 touch .gitignore命令 创建.gitignore文件夹 gitignore文件夹的内容 gitignore中添加一下内容 # This .gitignore file should be place…...
如何将本地 Node.js 服务部署到宝塔面板:完整的部署指南
文章简介: 将本地开发的 Node.js 项目部署到线上服务器是开发者常见的工作流程之一。在这篇文章中,我将详细介绍如何将本地的 Node.js 服务通过宝塔面板(BT 面板)上线。宝塔面板是一个强大的服务器管理工具,具有简洁的…...
SpringBoot项目启动报错:命令行太长解决
文章目录 SpringBoot项目启动报错:命令行太长解决1. 第一种方法1. 第二种方法1-1 旧版本Idea1-2 新版本Idea 3. 重新启动SpringBoot项目即可解决 SpringBoot项目启动报错:命令行太长解决 报错信息: 1. 第一种方法 1. 第二种方法 找到项目…...
使用Docker启动的Redis容器使用的配置文件路径等问题以及Python使用clickhouse_driver操作clickhouse数据库
一、使用Docker启动的Redis容器使用的配置文件路径等问题 1.docker启动的redis使用的配置文件路径是什么 使用docker搭建redis服务,本身redis启动的时候可以指定配置文件的, redis-server /指定配置文件路径/redis.conf。 但手上也没有一个redis配置文件…...
硬盘格式化后能恢复数据吗?4款好用的数据恢复软件,格式化后也能安心
咱们今天来谈谈一个挺烦人的问题——硬盘格式化后能恢复数据吗?别担心,能的!只要你用对方法,就算硬盘被清空了,那些重要文件还是能找回来的。下面,我就给你们介绍几款超给力的数据恢复软件,让你…...
【选择C++游戏开发技术】
在选择C游戏开发技术时,以下几个因素是需要考虑的: 1. 游戏类型:不同类型的游戏可能需要不同的技术。例如,2D游戏通常采用基于精灵的引擎,而3D游戏通常采用基于物理模拟的引擎。根据游戏类型选择适合的技术是很重要的…...
Oracle数据库系统表空间过大,清理SYSTEM、SYSAUX表空间
一.前言 在oracle数据库中,system为系统表空间,存放着一些我们经常用到的系统表和视图,sysaux为辅助表空间,辅助着系统表空间。这两个表空间不宜添加数据文件,会使系统表空间过于臃肿,从而影响数据库的使用…...
LaTeX参考文献工具和宏包bibmap项目简介
LaTeX参考文献工具和宏包bibmap项目简介 LaTeX 中的参考文献生成方式主要有三种:第一种是手动写thebibliography环境的,第二种事基于bibtex程序的,第三种则是基于biblatex宏包和biber程序的。本文介绍的bibmap项目则提供了第四种方法。目前b…...
微软的 Drasi:一种轻量级的事件驱动编程方法
微软的开源数据变化处理平台有望提供一种全新的方式来构建和管理可产生持续事件流的云应用程序。 Microsoft Azure 孵化团队是微软超大规模云中比较有趣的组成部分之一。它介于传统软件开发团队和研究组织之间,致力于构建大规模分布式系统问题的解决方案。 这些解决…...
vue3 笔记-插槽
结构类似的模块,我们可以考虑用插槽,以便后续复用: 代码: 1.插槽 <script setup> defineProps({title: {required: true,type: String},number: {required: true,type: Number} }) </script><template><d…...
破局迷茫:Java 2026行业前瞻、零基础通关路径与理科大学生职业跃迁全攻略
你是否正站在人生的十字路口,被一连串的问题反复拷问:听过Java的大名,却始终搞不懂它到底是什么、能支撑你走多远?想入门编程,却面对海量资料无从下手,怕走弯路、怕投入时间最终竹篮打水?刷到无…...
STM32定时器级联功能实战:如何构建64位定时器
1. 为什么需要64位定时器? 在嵌入式开发中,32位定时器对于大多数应用场景已经足够用了。比如一个72MHz的STM32,32位定时器最大能计时的时长大约是59.6秒(2^32/72MHz)。但在一些特殊场景下,比如需要记录设备…...
ThinkPad风扇噪音终结者:TPFanCtrl2智能控温全攻略
ThinkPad风扇噪音终结者:TPFanCtrl2智能控温全攻略 【免费下载链接】TPFanCtrl2 ThinkPad Fan Control 2 (Dual Fan) for Windows 10 and 11 项目地址: https://gitcode.com/gh_mirrors/tp/TPFanCtrl2 如果你是ThinkPad用户,是否常被风扇频繁启停…...
QueryWrapper常用案例
记录于 2023.09.18 个人博客,现转录CSDNQueryWrapper MyBatis-Plus 提供的「SQL 条件自动拼接工具」 不用手写 SQL 语句,用 Java 链式代码,自动帮你拼出 where、order by、like、in、between 等查询条件。 1.多条数据查询 import com.baomid…...
2025新版机器视觉软件开发框架|Halcon+WPF插件源码(含完整算子库)
温馨提示:文末有联系方式2025年度升级版机器视觉软件框架发布 全新适配工业AI检测趋势,本框架为面向实际产线部署优化的轻量级、模块化视觉开发平台,专为自动化检测、定位引导与尺寸测量等场景设计,代码结构清晰,便于二…...
高效办公:浏览器扩展无需安装桌面软件的全功能解决方案
高效办公:浏览器扩展无需安装桌面软件的全功能解决方案 【免费下载链接】se-office se-office扩展,提供基于开放标准的全功能办公生产力套件,基于浏览器预览和编辑office。 项目地址: https://gitcode.com/gh_mirrors/se/se-office 在…...
RBTray完全指南:Windows任务栏清理终极解决方案
RBTray完全指南:Windows任务栏清理终极解决方案 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否经常感到Windows任务栏拥挤不堪?各种后台程序…...
G-Helper华硕笔记本优化指南:告别臃肿控制软件,3步打造高效设备
G-Helper华硕笔记本优化指南:告别臃肿控制软件,3步打造高效设备 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, …...
ESP32确定性块存储驱动:零开销结构化EEPROM持久化
1. 项目概述ESP32-EEPROM-BlockDriver 是一个面向 ESP32 平台的非易失性存储块设备驱动,其核心设计目标并非模拟传统文件系统,而是为嵌入式应用提供一种确定性、可预测、零运行时开销的结构化数据持久化机制。该驱动不依赖于 ESP-IDF 的nvs(N…...
FlowState Lab版本管理与回滚:在星图平台实现平滑升级
FlowState Lab版本管理与回滚:在星图平台实现平滑升级 1. 为什么需要版本管理 在AI模型开发过程中,版本管理就像给代码打标签一样重要。想象一下,你正在使用FlowState Lab开发一个智能客服系统,突然发现最新更新的模型开始给出奇…...
