当前位置：首页 > news >正文

AI大语言模型

news 2026/2/9 1:41:37

一、AIGC和生成式AI的概念

1-1、AIGC

Al Generated Content：AI生成内容

1-2、生成式AI：generative ai

AIGC是生成式 AI 技术在内容创作领域的具体应用成果。

目前有许多知名的生成式 AI：

文本生成领域

OpenAI GPT 系列
百度文心一言
阿里通义千问

图像生成领域

Midjourney
StableDiffusion
DALL - E 2

代码生成领域

GitHub Copilot（由 GitHub 和 OpenAI 合作开发）
CodeGeeX（由字节跳动研发的代码生成模型）

生成式AI是深度学习的一种应用。

二、AI人工智能的子领域

2-1、机器学习

不需要人类做显示编程、让计算机通过算法，自行学习和改进，通过数据和经验来改善自身性能，自动从数据中学习模式和规律，并利用这些规律进行预测和决策。

机器学习的分支：

监督学习；
无监督学习；
强化学习。

1、监督学习

监督学习是指利用一组带有标签（即已知输出结果）的数据来训练模型，让模型学习输入数据和对应标签之间的映射关系。训练完成后，模型就可以对新的、未知的数据进行预测，输出对应的标签。

监督学习的工作模式：你拿着一个苹果和一个香蕉，告诉孩子：“这是苹果，它的形状是圆的，颜色通常是红色或绿色；这是香蕉，它的形状是长条形，颜色通常是黄色。”孩子会学习到特征与类别的对应关系，预测出新拿出的水果是苹果还是香蕉。

在监督学习中，机器学习算法会接受有标签（期望的输出值）的训练数据。每个训练数据点都既包括：输入特征、期望的出数值；

算法的学习目标是学习输入和输出之间的映射关系，从而在给定新的输入特征后能够准确预测出相应的输出值。

经典的监督学习任务：分类、回归（对数值进行预测）

2、无监督学习

算法的任务是自主的发现数据里的模式和规律。

无监督学习的工作模式：你让孩子观察一堆水果，没有直接告诉他每一个水果的名称，而是鼓励他自己找出如何根据形状，颜色等属性将这些水果分组的方法。

经典的无监督学习任务：聚类（把数据进行分组）

在机器学习中，监督学习与无监督学习都需要你明确地告诉机器(或者说孩子)数据的特征(形状与颜色)是什么。

监督学习需要在机器进行学习时，人为提供数据对象的类别(如苹果或香蕉)，而无监督学习一般没有预设的类别标识，通过机器自动学习数据的分布并将相似的数据对象归为同类(如红色圆形是苹果)。

3、强化学习

聚焦于智能体（Agent）如何在环境中通过与环境进行交互，不断尝试和学习，以最大化累积奖励。

强化学习模拟了人类和动物通过试错来学习的过程。在强化学习的框架中，智能体处于一个特定的环境中，它会根据当前环境的状态做出一个动作，环境会因为智能体的动作而发生改变，同时给予智能体一个奖励信号，智能体的目标是通过不断地与环境交互，学习到一个最优的策略，使得长期累积的奖励最大化。

强化学习的工作模式为：你不会直接教孩子苹果和香蕉的区别，而是每次展示一个水果让他进行判断。如果他判断正确，就给他一个奖励(比如一块糖果)；如果判断错误，则不给奖励。通过反复尝试和反馈，孩子会通过这种奖励机制逐渐学习到如何更准确地判断苹果和香蕉。这种学习过程中的关键在于孩子需要在探索新的判断方法和利用已有经验之间找到平衡，以最大化获得奖励的次数。

应用场景

游戏领域：如 AlphaGo 通过强化学习击败人类顶级围棋选手，以及各种电子游戏中的智能对手。
机器人控制：使机器人学会完成各种任务，如机器人的导航、抓取物体、行走等。
自动驾驶：让车辆学习在不同的交通场景下做出最优的驾驶决策。
金融领域：用于投资组合管理、交易策略优化等。
资源管理：如数据中心的资源分配、能源管理系统中的能源调度等。

4、深度学习

深度学习是机器学习的一个方法，模拟人类大脑的神经网络结构和功能，让计算机自动从大量数据中学习复杂的模式和特征，以实现对数据的理解、分类、预测和生成等任务。

深度学习的核心基于人工神经网络，特别是深度神经网络（DNN）。

深度学习，使用人工神经网络，模仿人脑处理信息的方式，通过层次化的方法，提取和表示数据的特征。

神经网络是由许多基本的计算和储存单元组成，这些单元被称为神经元。这些神经元通过层层连接来处理数据，所以，深度学习模型通常由许多层。

神经网络可以用于：监督学习、无监督学习、强化学习。

三、大语言模型LLM：Large Language Model

深度学习的应用，专门用于进行自然语言处理任务。

大语言模型是基于海量文本数据进行训练的人工智能模型，它具有强大的语言理解和生成能力，能够处理各种自然语言任务，如文本生成、问答系统、机器翻译、摘要提取等。这些模型通常具有数十亿甚至数万亿的参数，通过学习大量文本中的语言模式、语义信息和知识，来实现对自然语言的有效处理。

大语言模型的例子：

OpenAI GPT 系
谷歌 PaLM
百度文心一言
深言科技 DeepSeek 系列
- DeepSeek - LLM：具备广泛的知识覆盖和强大的语言理解与生成能力。在多个权威评测中表现优异，例如在 MMLU 评测基准中，DeepSeek - LLM 67B 模型取得了较高的分数，超过了 GPT - 3.5 Turbo。
- DeepSeek - Coder：专注于代码领域，在代码理解和生成方面表现突出。在 HumanEval 代码生成评测集上，DeepSeek - Coder 67B 模型达到了较高的通过率，超越了其他开源模型。
清华 ChatGLM 系列