当前位置：首页 > news >正文

了解一下InternLM2

news 2026/5/12 23:44:20

大模型的出现和发展得益于增长的数据量、计算能力的提升以及算法优化等因素。这些模型在各种任务中展现出惊人的性能，比如自然语言处理、计算机视觉、语音识别等。这种模型通常采用深度神经网络结构，如 Transformer、BERT、GPT（ Generative Pre-trained Transformer ）等。大模型的优势在于其能够捕捉和理解数据中更为复杂、抽象的特征和关系。通过大规模参数的学习，它们可以提高在各种任务上的泛化能力，并在未经过大量特定领域数据训练的情况下实现较好的表现。然而，大模型也面临着一些挑战，比如巨大的计算资源需求、高昂的训练成本、对大规模数据的依赖以及模型的可解释性等问题。因此，大模型的应用和发展也需要在性能、成本和道德等多个方面进行权衡和考量。InternLM-7B 包含了一个拥有 70 亿参数的基础模型和一个为实际场景量身定制的对话模型。该模型具有以下特点:1，利用数万亿的高质量 token 进行训练，建立了一个强大的知识库；2.支持 8k token 的上下文窗口长度，使得输入序列更长并增强了推理能力。基于 InternLM 训练框架，上海人工智能实验室已经发布了两个开源的预训练模型：InternLM-7B 和 InternLM-20B。
InternLM 是一个开源的轻量级训练框架，旨在支持大模型训练而无需大量的依赖。通过单一的代码库，它支持在拥有数千个 GPU 的大型集群上进行预训练，并在单个 GPU 上进行微调，同时实现了卓越的性能优化。在 1024 个 GPU 上训练时，InternLM 可以实现近 90% 的加速效率。基于 InternLM 训练框架，上海人工智能实验室已经发布了两个开源的预训练模型：InternLM-7B 和 InternLM-20B。Lagent 是一个轻量级、开源的基于大语言模型的智能体（agent）框架，支持用户快速地将一个大语言模型转变为多种类型的智能体，并提供了一些典型工具为大语言模型赋能。通过 Lagent 框架可以更好的发挥 InternLM 的全部性能。

7B demo 的训练配置文件样例如下:

JOB_NAME = "7b_train"
SEQ_LEN = 2048
HIDDEN_SIZE = 4096
NUM_ATTENTION_HEAD = 32
MLP_RATIO = 8 / 3
NUM_LAYER = 32
VOCAB_SIZE = 103168
MODEL_ONLY_FOLDER = "local:llm_ckpts/xxxx"
# Ckpt folder format:
# fs: 'local:/mnt/nfs/XXX'
SAVE_CKPT_FOLDER = "local:llm_ckpts"
LOAD_CKPT_FOLDER = "local:llm_ckpts/49"
# boto3 Ckpt folder format:
# import os
# BOTO3_IP = os.environ["BOTO3_IP"] # boto3 bucket endpoint
# SAVE_CKPT_FOLDER = f"boto3:s3://model_weights.{BOTO3_IP}/internlm"
# LOAD_CKPT_FOLDER = f"boto3:s3://model_weights.{BOTO3_IP}/internlm/snapshot/1/"
CHECKPOINT_EVERY = 50
ckpt = dict(enable_save_ckpt=False,  # enable ckpt save.save_ckpt_folder=SAVE_CKPT_FOLDER,  # Path to save training ckpt.# load_ckpt_folder=LOAD_CKPT_FOLDER, # Ckpt path to resume training(load weights and scheduler/context states).# load_model_only_folder=MODEL_ONLY_FOLDER, # Path to initialize with given model weights.load_optimizer=True,  # Wheter to load optimizer states when continuing training.checkpoint_every=CHECKPOINT_EVERY,async_upload=True,  # async ckpt upload. (only work for boto3 ckpt)async_upload_tmp_folder="/dev/shm/internlm_tmp_ckpt/",  # path for temporarily files during asynchronous upload.snapshot_ckpt_folder="/".join([SAVE_CKPT_FOLDER, "snapshot"]),  # directory for snapshot ckpt storage path.oss_snapshot_freq=int(CHECKPOINT_EVERY / 2),  # snapshot ckpt save frequency.
)
TRAIN_FOLDER = "/path/to/dataset"
VALID_FOLDER = "/path/to/dataset"
data = dict(seq_len=SEQ_LEN,# micro_num means the number of micro_batch contained in one gradient updatemicro_num=4,# packed_length = micro_bsz * SEQ_LENmicro_bsz=2,# defaults to the value of micro_numvalid_micro_num=4,# defaults to 0, means disable evaluatevalid_every=50,pack_sample_into_one=False,total_steps=50000,skip_batches="",rampup_batch_size="",# Datasets with less than 50 rows will be discardedmin_length=50,# train_folder=TRAIN_FOLDER,# valid_folder=VALID_FOLDER,
)
grad_scaler = dict(fp16=dict(# the initial loss scale, defaults to 2**16initial_scale=2**16,# the minimum loss scale, defaults to Nonemin_scale=1,# the number of steps to increase loss scale when no overflow occursgrowth_interval=1000,),# the multiplication factor for increasing loss scale, defaults to 2growth_factor=2,# the multiplication factor for decreasing loss scale, defaults to 0.5backoff_factor=0.5,# the maximum loss scale, defaults to Nonemax_scale=2**24,# the number of overflows before decreasing loss scale, defaults to 2hysteresis=2,
)
hybrid_zero_optimizer = dict(# Enable low_level_optimzer overlap_communicationoverlap_sync_grad=True,overlap_sync_param=True,# bucket size for nccl communication paramsreduce_bucket_size=512 * 1024 * 1024,# grad clippingclip_grad_norm=1.0,
)
loss = dict(label_smoothing=0,
)
adam = dict(lr=1e-4,adam_beta1=0.9,adam_beta2=0.95,adam_beta2_c=0,adam_eps=1e-8,weight_decay=0.01,
)lr_scheduler = dict(total_steps=data["total_steps"],init_steps=0,  # optimizer_warmup_stepwarmup_ratio=0.01,eta_min=1e-5,last_epoch=-1,
)beta2_scheduler = dict(init_beta2=adam["adam_beta2"],c=adam["adam_beta2_c"],cur_iter=-1,
)model = dict(checkpoint=False,  # The proportion of layers for activation aheckpointing, the optional value are True/False/[0-1]num_attention_heads=NUM_ATTENTION_HEAD,embed_split_hidden=True,vocab_size=VOCAB_SIZE,embed_grad_scale=1,parallel_output=True,hidden_size=HIDDEN_SIZE,num_layers=NUM_LAYER,mlp_ratio=MLP_RATIO,apply_post_layer_norm=False,dtype="torch.float16",  # Support: "torch.float16", "torch.half", "torch.bfloat16", "torch.float32", "torch.tf32"norm_type="rmsnorm",layer_norm_epsilon=1e-5,use_flash_attn=True,num_chunks=1,  # if num_chunks > 1, interleaved pipeline scheduler is used.
)
"""
zero1 parallel:1. if zero1 <= 0, The size of the zero process group is equal to the size of the dp process group,so parameters will be divided within the range of dp.2. if zero1 == 1, zero is not used, and all dp groups retain the full amount of model parameters.3. zero1 > 1 and zero1 <= dp world size, the world size of zero is a subset of dp world size.For smaller models, it is usually a better choice to split the parameters within nodes with a setting <= 8.
pipeline parallel (dict):1. size: int, the size of pipeline parallel.2. interleaved_overlap: bool, enable/disable communication overlap when using interleaved pipeline scheduler.
tensor parallel: tensor parallel size, usually the number of GPUs per node.
"""
parallel = dict(zero1=8,pipeline=dict(size=1, interleaved_overlap=True),sequence_parallel=False,
)cudnn_deterministic = False
cudnn_benchmark = False

30B demo 训练配置文件样例如下:

JOB_NAME = "30b_train"
SEQ_LEN = 2048
HIDDEN_SIZE = 6144
NUM_ATTENTION_HEAD = 48
MLP_RATIO = 8 / 3
NUM_LAYER = 60
VOCAB_SIZE = 103168
MODEL_ONLY_FOLDER = "local:llm_ckpts/xxxx"
# Ckpt folder format:
# fs: 'local:/mnt/nfs/XXX'
SAVE_CKPT_FOLDER = "local:llm_ckpts"
LOAD_CKPT_FOLDER = "local:llm_ckpts/49"
# boto3 Ckpt folder format:
# import os
# BOTO3_IP = os.environ["BOTO3_IP"] # boto3 bucket endpoint
# SAVE_CKPT_FOLDER = f"boto3:s3://model_weights.{BOTO3_IP}/internlm"
# LOAD_CKPT_FOLDER = f"boto3:s3://model_weights.{BOTO3_IP}/internlm/snapshot/1/"
CHECKPOINT_EVERY = 50
ckpt = dict(enable_save_ckpt=False,  # enable ckpt save.save_ckpt_folder=SAVE_CKPT_FOLDER,  # Path to save training ckpt.# load_ckpt_folder=LOAD_CKPT_FOLDER, # Ckpt path to resume training(load weights and scheduler/context states).# load_model_only_folder=MODEL_ONLY_FOLDER, # Path to initialize with given model weights.load_optimizer=True,  # Wheter to load optimizer states when continuing training.checkpoint_every=CHECKPOINT_EVERY,async_upload=True,  # async ckpt upload. (only work for boto3 ckpt)async_upload_tmp_folder="/dev/shm/internlm_tmp_ckpt/",  # path for temporarily files during asynchronous upload.snapshot_ckpt_folder="/".join([SAVE_CKPT_FOLDER, "snapshot"]),  # directory for snapshot ckpt storage path.oss_snapshot_freq=int(CHECKPOINT_EVERY / 2),  # snapshot ckpt save frequency.
)
TRAIN_FOLDER = "/path/to/dataset"
VALID_FOLDER = "/path/to/dataset"
data = dict(seq_len=SEQ_LEN,# micro_num means the number of micro_batch contained in one gradient updatemicro_num=4,# packed_length = micro_bsz * SEQ_LENmicro_bsz=2,# defaults to the value of micro_numvalid_micro_num=4,# defaults to 0, means disable evaluatevalid_every=50,pack_sample_into_one=False,total_steps=50000,skip_batches="",rampup_batch_size="",# Datasets with less than 50 rows will be discardedmin_length=50,# train_folder=TRAIN_FOLDER,# valid_folder=VALID_FOLDER,
)
grad_scaler = dict(fp16=dict(# the initial loss scale, defaults to 2**16initial_scale=2**16,# the minimum loss scale, defaults to Nonemin_scale=1,# the number of steps to increase loss scale when no overflow occursgrowth_interval=1000,),# the multiplication factor for increasing loss scale, defaults to 2growth_factor=2,# the multiplication factor for decreasing loss scale, defaults to 0.5backoff_factor=0.5,# the maximum loss scale, defaults to Nonemax_scale=2**24,# the number of overflows before decreasing loss scale, defaults to 2hysteresis=2,
)
hybrid_zero_optimizer = dict(# Enable low_level_optimzer overlap_communicationoverlap_sync_grad=True,overlap_sync_param=True,# bucket size for nccl communication paramsreduce_bucket_size=512 * 1024 * 1024,# grad clippingclip_grad_norm=1.0,
)
loss = dict(label_smoothing=0,
)
adam = dict(lr=1e-4,adam_beta1=0.9,adam_beta2=0.95,adam_beta2_c=0,adam_eps=1e-8,weight_decay=0.01,
)lr_scheduler = dict(total_steps=data["total_steps"],init_steps=0,  # optimizer_warmup_stepwarmup_ratio=0.01,eta_min=1e-5,last_epoch=-1,
)
beta2_scheduler = dict(init_beta2=adam["adam_beta2"],c=adam["adam_beta2_c"],cur_iter=-1,
)model = dict(checkpoint=False,  # The proportion of layers for activation aheckpointing, the optional value are True/False/[0-1]num_attention_heads=NUM_ATTENTION_HEAD,embed_split_hidden=True,vocab_size=VOCAB_SIZE,embed_grad_scale=1,parallel_output=True,hidden_size=HIDDEN_SIZE,num_layers=NUM_LAYER,mlp_ratio=MLP_RATIO,apply_post_layer_norm=False,dtype="torch.float16",  # Support: "torch.float16", "torch.half", "torch.bfloat16", "torch.float32", "torch.tf32"norm_type="rmsnorm",layer_norm_epsilon=1e-5,use_flash_attn=True,num_chunks=1,  # if num_chunks > 1, interleaved pipeline scheduler is used.
)
"""
zero1 parallel:1. if zero1 <= 0, The size of the zero process group is equal to the size of the dp process group,so parameters will be divided within the range of dp.2. if zero1 == 1, zero is not used, and all dp groups retain the full amount of model parameters.3. zero1 > 1 and zero1 <= dp world size, the world size of zero is a subset of dp world size.For smaller models, it is usually a better choice to split the parameters within nodes with a setting <= 8.
pipeline parallel (dict):1. size: int, the size of pipeline parallel.2. interleaved_overlap: bool, enable/disable communication overlap when using interleaved pipeline scheduler.
tensor parallel: tensor parallel size, usually the number of GPUs per node.
"""
parallel = dict(zero1=-1,tensor=4,pipeline=dict(size=1, interleaved_overlap=True),sequence_parallel=False,
)
cudnn_deterministic = False
cudnn_benchmark = False

30B Demo — InternLM 0.2.0 文档

了解一下InternLM2

大模型的出现和发展得益于增长的数据量、计算能力的提升以及算法优化等因素。这些模型在各种任务中展现出惊人的性能，比如自然语言处理、计算机视觉、语音识别等。这种模型通常采用深度神经网络结构，如 Transformer、BERT、GPT（ Generative P…...

编程日记 2024/1/9 0:51:44

关于使用统一服务器，vscode和网页版jupyter notebook的交互问题

autodl 查看虚拟环境在antodl上租借了一个服务器，通过在网页上运行jupyter notebook和在vscode中运行，发现环境都默认的是miniconda3。 conda info --envs 当然环境中所有的包都是一样的。要查看当前虚拟环境中安装的所有包，可以使用以…...

编程日记 2024/1/9 0:49:43

Linux22.04系统安装显卡驱动，cuda，cudnn流程

1. 安装显卡驱动 ubuntu-drivers deices显示所有适配显卡的驱动型号，recommended为推荐安装安装 sudo apt install nvidia-driver-440重启 sudo reboot验证 nvidia-smi2. 安装cuda 在 CUDA Toolkit 的下载页面选择系统版本和安装方式，下载并运行…...

编程日记 2024/1/9 0:48:42

【常考简答题】操作系统

目录 1、什么是进程 2、创建进程步骤 3、什么是死锁 4、死锁四个必要条件 5、什么是内存管理 6、内存管理功能 7、进程的三个基本状态转化图 8、操作系统为什么引入线程 9、什么是对换技术，好处是什么 10、DMA直接存取控制工作方式流程图 11、什么是假脱…...

编程日记 2024/1/9 0:47:40

Large Language Models Paper 分享

论文1： ChatGPTs One-year Anniversary: Are Open-Source Large Language Models Catching up? 简介 2022年11月，OpenAI发布了ChatGPT，这一事件在AI社区甚至全世界引起了轰动。首次，一个基于应用的AI聊天机器人能够提供有帮助、…...

编程日记 2024/1/9 0:46:39

微信小程序实战-01翻页时钟-1

文章目录前言需求分析功能设计界面设计界面结构设计界面样式设计逻辑设计单页功能实现运行结果前言我经常在手机上用的一款app有一个功能是翻页时钟，基于之前学习的小程序相关的基础内容，我打算在微信小程序中也设计一个翻页时钟功能，J…...

编程日记 2024/1/9 0:42:36

BigDecimal的性能问题

BigDecimal 是 Java 中用于精确计算的数字类，它可以处理任意精度的小数运算。由于其精确性和灵活性，BigDecimal 在某些场景下可能会带来性能问题。 BigDecimal的性能问题 BigDecimal的性能问题主要源于以下几点： 内存占用：BigDec…...

编程日记 2024/1/9 0:40:35

Defi安全-Monox攻击事件Foundry复现

其它相关内容可见个人主页 Mono攻击事件的介绍见：Defi安全–Monox攻击事件分析–phalconetherscan 1. 前情提要和思路介绍 Monox使用单边池模型，创建的是代币-vCash交易对，添加流动性时，只需添加代币，即可进行任意代…...

编程日记 2024/1/9 0:39:34

大二上总结和寒假计划

👂 Start Again - Connor Price/Chloe Sagum - 单曲 - 网易云音乐 👂 年年 - 徐秉龙 - 单曲 - 网易云音乐目录 🌼前言 👊成长 （1）情感 （2）运动 （3）穿搭…...

编程日记 2024/1/9 0:38:33

使用 pdfh5 实现 pdf 预览功能

1. 安装 npm install pdfh5 2. 使用 html部分： <div id"showPdf" style"width: 100%;"></div> js部分： <script> //合同展示组件 import Pdfh5 from pdfh5 //合同组件样式 import pdfh5/css/pdfh5.css expo…...

编程日记 2024/1/9 0:37:32

HttpRunner辅助函数debugtalk.py

辅助函数debugtalk.py Httprunner框架中，使用yaml或json文件进行用例描述，无法做一些复杂操作，如保存一些数据跨文件调用，或者实现一些复杂逻辑判断等，为了解决这个问题，引入了debugtalk.py辅助函数来进行一…...

编程日记 2024/1/9 0:36:31

PC端扫描小程序二维码登录

1、获取二维码地址，通过请求微信开发者文档中的服务端获取无限制小程序二维码URL #controller层 import org.apache.commons.codec.binary.Base64;/*** 获取小程序二维码*/PassTokenGetMapping("/getQrCode")public AjaxResult getQrCode(BlogUserDto bl…...

编程日记 2024/1/9 0:35:30

计算机毕业设计 | SpringBoot+vue移动端音乐网站音乐播放器(附源码)

1，项目背景随着计算机技术的发展，网络技术对我们生活和工作显得越来越重要，特别是现在信息高度发达的今天，人们对最新信息的需求和发布迫切的需要及时性。为了满足不同人们对网络需求，各种特色，各种主题的…...

编程日记 2024/1/9 0:31:27

Flutter 中的 Stream：异步编程的利器

在Flutter中，异步编程是非常重要的一部分，特别是在处理用户输入、网络请求或其他涉及时间的操作时。Flutter提供了一种强大的工具，称为Stream，用于简化异步编程的过程。什么是 Stream？ Stream是一种用于处理异步数据…...

编程日记 2024/1/9 0:29:25

2023 波卡年度报告选读：Polkadot SDK 与开发者社区

原文：https://dashboards.data.paritytech.io/reports/2023/index.html#section6 编译：OneBlock 编者注：Parity 数据团队发布的 2023 年 Polkadot 年度数据报告，对推动生态系统的关键数据进行了深入分析。报告全文较长&#xff…...

编程日记 2024/1/9 0:28:23

深入了解Go语言中的unsafe.Sizeof()：探究变量与数据类型的内存占用

当涉及到在 Go 语言中确定变量或数据类型所占用的内存空间大小时，unsafe 包中的 Sizeof() 函数成为了一个强有力的工具。它可以用来获取变量或数据类型所占用的字节数，但需要注意的是，它不考虑内存对齐和填充的情况。因此，在使用 …...

编程日记 2024/1/9 0:23:19

安卓上使用免费的地图OpenStreetMap

前一段使用了微信的地图，非常的好用。但是存在的问题是海外无法使用，出国就不能用了； 其实国内三家：百度，高德，微信都是一样的问题，当涉及到商业使用的时候需要付费； 国外除了谷歌…...

编程日记 2024/1/9 0:22:19

基于Java SSM框架实现时间管理系统项目【项目源码+论文说明】

基于java的SSM框架实现时间管理系统演示摘要随着科学技术的飞速发展，各行各业都在努力与现代先进技术接轨，通过科技手段提高自身的优势；对于时间管理系统当然也不能排除在外，随着网络技术的不断成熟，带动了时间管理…...

编程日记 2024/1/9 0:21:18

Mac安装upx及不同os计算md5值

Mac安装upx 最近需要将exe文件打包到pod内部，为了减少包占用磁盘空间，需要借用upx对windows exe文件进行压缩。 1 概念：压缩工具 UPX 全称是 “Ultimate Packer for eXecutables”，是一个免费、开源、编写、可扩展、高性能的可执行…...

编程日记 2024/1/9 0:20:17

Qt/C++编写视频监控系统82-自定义音柱显示

一、前言通过音柱控件实时展示当前播放的声音产生的振幅的大小，得益于音频播放组件内置了音频振幅的计算，可以动态开启和关闭，开启后会对发送过来的要播放的声音数据，进行运算得到当前这个音频数据的振幅，类似于分贝…...

编程日记 2024/1/9 0:19:15

在Node.js后端服务中集成Taotoken调用多模型API实战

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在Node.js后端服务中集成Taotoken调用多模型API实战构建需要AI能力的Web服务时，后端开发者常面临模型选型、API接入复…...

编程新知 2026/5/12 23:35:57

Cursor Pro永久免费使用终极指南：如何绕过试用限制完整教程

Cursor Pro永久免费使用终极指南：如何绕过试用限制完整教程【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached you…...

编程新知 2026/5/12 23:18:56

【2026社工】初级社会工作者历年真题及答案PDF电子版（2010-2025年）

2026年初级社会工作者职业水平考试安排考试时间： 2026年5月23日考试科目与形式科目名称考试形式社会工作实务闭卷笔试社会工作综合能力闭卷笔试备考资源说明提供2010-2025年完整历年真题及解析，覆盖全部考试科目，具体功能如下&#…...

编程新知 2026/5/12 21:40:51

Windows下Python包管理权限踩坑实录：从WinError 5到WinError 32的完整解决流程

Windows下Python包管理权限问题深度解析：从WinError 5到WinError 32的实战指南作为一名长期在Windows平台进行Python开发的工程师，我深刻理解文件权限问题带来的困扰。特别是当你在紧急项目交付前夜，突然遭遇PermissionError: [WinError 5]或…...

编程新知 2026/5/12 21:15:59

AI智能体审批系统设计：从规则到价值网络的动态决策引擎

1. 项目概述：为什么AI需要“举手提问”？在AI智能体（Agent）日益深入业务流程自动化的今天，一个核心的、却常被忽视的问题浮出水面：这个拥有一定自主决策能力的“数字员工”，在什么情况下应该停下…...

编程新知 2026/5/12 20:11:44

Deepin Boot Maker终极指南：3步搞定系统启动盘制作

Deepin Boot Maker终极指南：3步搞定系统启动盘制作【免费下载链接】deepin-boot-maker 项目地址: https://gitcode.com/gh_mirrors/de/deepin-boot-maker 还在为制作系统启动盘而烦恼吗？😓 命令行操作复杂易错，传统工具兼…...

编程新知 2026/5/12 16:42:30

别再折腾Windows了！用Mac或Linux搞定ACM LaTeX模板的字体难题（附保姆级配置流程）

跨平台LaTeX写作：为什么macOS和Linux是ACM模板的最佳选择第一次接触ACM LaTeX模板的研究人员，往往会在字体兼容性问题上耗费大量时间——特别是Windows用户。当你反复尝试安装Libertine字体、解决各种编译错误时，是否想过问题可能出在操作系…...

编程新知 2026/5/12 15:52:14

SIGTRAN协议：电信网络IP化的关键技术解析

1. SIGTRAN：下一代电信网络的信令传输基石2003年全球电信业寒冬中，一个技术决策正在悄然改变行业格局。当运营商们紧缩资本开支时，AT&T、Verizon等巨头却不约而同地加大了对IP网络的投入。这背后隐藏着一个关键技术转折——传统TDM网络向…...

编程新知 2026/5/12 15:37:48

APK Installer终极指南：如何在Windows上快速安装安卓应用？

APK Installer终极指南：如何在Windows上快速安装安卓应用？ 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 还在为Windows上安装安卓应用而烦恼吗…...

编程新知 2026/5/12 15:15:57

告别手动拖拽！用ENVI的Crosshairs和Cursor Value功能，精准搞定无坐标影像拼接

告别手动拖拽！用ENVI的Crosshairs和Cursor Value功能，精准搞定无坐标影像拼接在遥感影像处理中，遇到没有地理参考信息的影像拼接任务时，很多用户的第一反应是手动拖拽对齐——这种看似直观的方法实际上效率低下且精度堪忧。想象一…...

编程新知 2026/5/12 10:31:18

相关文章：