当前位置：首页 > article >正文

Firefly：一站式大模型训练工具，从零到一掌握LLM微调

article 2026/5/13 15:30:54

1. 项目概述一站式大模型训练工具Firefly如果你正在寻找一个能够让你快速上手从零开始训练或微调主流大语言模型LLM的开源项目那么Firefly流萤绝对值得你花时间深入了解。作为一名在AI模型训练领域摸爬滚打了多年的从业者我见过太多工具要么配置复杂、文档晦涩要么对新模型的支持严重滞后。Firefly的出现很大程度上解决了这些痛点。它本质上是一个高度集成和封装的大模型训练框架其核心目标非常明确让开发者无论经验深浅都能以最低的学习成本和硬件门槛对市面上绝大多数开源大模型进行高效的预训练、指令微调SFT和直接偏好优化DPO。这个项目支持从Qwen2、Llama3、Gemma这样的新秀到ChatGLM、Baichuan、InternLM等中文主力再到Mistral、Mixtral-8x7B、Zephyr等国际知名模型覆盖面之广令人印象深刻。更重要的是它原生支持全量参数训练、LoRA和QLoRA这三种主流的微调范式特别是对QLoRA的深度优化使得在消费级显卡如单张24GB显存的RTX 4090上微调百亿参数模型成为可能。项目通过配置文件驱动将复杂的训练参数、数据格式和模型模板抽象出来你只需要修改几个JSON配置文件就能启动一次完整的训练这对于快速实验和迭代来说效率极高。接下来我将为你深入拆解Firefly的设计思路、核心用法以及我在实际使用中积累的经验和避坑指南。2. 核心设计思路与架构解析Firefly的成功并非偶然其设计哲学深深植根于解决大模型训练中的实际工程难题。理解其背后的思路能帮助你在使用时事半功倍甚至能根据自身需求进行定制化修改。2.1 统一配置驱动的训练流程Firefly最显著的特点是其“配置即代码”的理念。所有训练相关的超参数、数据路径、模型选择都被封装在train_args目录下的JSON配置文件中。例如一个典型的QLoRA微调配置文件可能长这样{ output_dir: ./output/firefly-qwen2-7b-sft, model_name_or_path: Qwen/Qwen2-7B-Instruct, train_file: data/my_sft_data.jsonl, template_name: qwen2, num_train_epochs: 3, per_device_train_batch_size: 2, gradient_accumulation_steps: 8, learning_rate: 2e-4, max_seq_length: 2048, train_mode: qlora, lora_rank: 64, lora_alpha: 16, lora_dropout: 0.1, use_unsloth: true }为什么这么设计可复现性配置文件完整记录了实验的所有设置只需分享配置文件他人就能完全复现你的训练过程这对于学术研究和团队协作至关重要。降低心智负担你无需记忆海量的命令行参数也无需在冗长的Python脚本中寻找需要修改的变量。所有可调参数一目了然修改起来非常方便。模块化管理项目为不同模型Llama3, Qwen2等和不同训练模式全量/QLoRA/DPO预置了基础配置文件。你可以基于这些模板快速创建新实验而无需从零开始。2.2 对主流模型与高效微调技术的深度适配Firefly并非简单地将Hugging Face的Trainer套个壳它在底层做了大量适配和优化工作。模型模板系统 (component/template.py)这是Firefly的“灵魂”之一。不同的大模型如ChatGLM、Qwen、Llama有着截然不同的对话模板和特殊Token如|im_start|,[INST]。Firefly为每个支持的模型预定义了对应的template_name。在训练和推理时系统会自动根据template_name调用正确的模板处理函数将原始的多轮对话数据格式化为模型能理解的输入序列。这保证了微调后的模型能无缝对接其原始Chat模型的对话格式避免了生成混乱或无法停止的问题。对QLoRA的优先支持项目作者显然将资源有限的开发者作为重要用户群体。QLoRA通过将预训练权重量化为4-bit并在此基础上添加可训练的LoRA适配器实现了惊人的显存节省。Firefly不仅默认推荐使用QLoRA还针对不同模型可能存在的兼容性问题如Baichuan2需要特定版本的torchQwen需要卸载flash-attn在文档和配置中给出了明确指引。这种细节上的关照能为你节省大量排查环境问题的时间。集成Unsloth加速Unsloth是一个专注于优化LoRA/QLoRA训练速度与显存占用的库。Firefly通过use_unsloth参数无缝集成该功能。根据官方报告使用Unsloth后训练Llama3-8B可节省超过40%的显存并提速30%以上。这意味着原本需要A100才能跑起来的实验现在用RTX 3090/4090就有可能完成。2.3 高质量、多领域的数据集整合“巧妇难为无米之炊”数据质量直接决定模型性能上限。Firefly项目另一个巨大的贡献是整理并开源了多个高质量指令微调数据集并统一为相同的jsonl格式。这包括firefly-train-1.1M覆盖23种中文NLP任务包含大量中华文化相关数据对联、诗词、文言文等数据质量高指令模板丰富。moss-003-sft-data复旦大学开源的百万级中英文多轮对话数据非常适合训练对话能力。ultrachat / WizardLM_evol_instruct_V2_143k优质的英文对话和复杂指令数据对于提升模型的指令遵循和推理能力很有帮助。这种“工具箱弹药库”的组合让你在启动训练时无需再花费大量精力去四处搜集、清洗和格式化数据可以直接使用或混合这些高质量数据源快速进入模型迭代环节。3. 环境搭建与核心配置详解纸上得来终觉浅绝知此事要躬行。要真正用好Firefly第一步就是搭建一个稳定、兼容的训练环境。这里面的坑我几乎都踩过一遍。3.1 环境安装版本兼容性是第一道坎Firefly的requirements.txt固定了核心依赖版本这是为了保证基础功能的稳定性。但大模型生态日新月异新模型往往需要新版本的transformers库。因此绝对不要无脑pip install -r requirements.txt。我的建议是先根据你要训练的模型确定基础环境再进行安装基础环境适用于大部分旧版模型如LLaMA2、ChatGLM2、Baichuan1# 创建虚拟环境是好习惯 conda create -n firefly python3.10 conda activate firefly # 安装PyTorch根据CUDA版本选择 pip install torch1.13.1cu117 torchvision0.14.1cu117 torchaudio0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117 # 安装Firefly基础依赖 pip install -r requirements.txt训练Qwen1.5系列模型 Qwen1.5需要更高版本的transformers。pip install transformers4.37.0 # 其余依赖仍可按requirements.txt安装如有冲突优先保证transformers版本训练Gemma模型 Gemma需要更新的transformers和torch。pip install torch2.0.0 pip install transformers4.38.1启用Unsloth加速强烈推荐如果你想使用Unsloth来加速训练并节省显存需要安装特定的版本组合。注意这可能会与基础环境产生冲突通常建议为使用Unsloth的实验单独创建环境。pip install --upgrade pip pip install torch2.2.2 pip install xformers0.0.25.post1 pip install bitsandbytes0.43.1 pip install peft0.10.0 # 安装Unsloth pip install githttps://github.com/unslothai/unsloth.git # 如果你要训练Qwen1.5需要安装作者适配的版本 # pip install githttps://github.com/yangjianxin1/unsloth.git实操心得环境隔离我强烈建议使用conda或venv为不同的模型家族如Llama系、Qwen系、使用Unsloth的实验创建独立的环境。用pip list导出环境配置 (pip freeze requirements_model_x.txt)这是未来复现实验的保障。我曾经因为在一个环境里混装版本导致一个运行了一周的训练任务突然崩溃排查了整整一天才发现是某个底层库的不兼容更新导致的。3.2 核心训练参数深度解读train_args目录下的配置文件是控制训练行为的核心。理解每个参数的含义能让你真正掌控训练而不是“开盲盒”。基础参数output_dir模型检查点和日志的输出目录。建议使用有意义的命名如output/llama3-8b-sft-qlora-lr2e4。model_name_or_path可以是Hugging Face模型ID如Qwen/Qwen2-7B-Instruct或本地模型文件夹路径。首次使用会自动下载模型请确保网络通畅和磁盘空间充足。train_file训练数据路径。对于SFT指向一个.jsonl文件对于预训练指向一个包含多个.jsonl文件的目录。template_name这是最容易出错的地方之一。必须与所选模型严格对应。例如训练Qwen2-Chat模型就用qwen2训练Llama3-Instruct就用llama3。用错了模板会导致模型无法理解输入或生成异常。可以在component/template.py中查看所有支持的模板。训练规模与效率参数per_device_train_batch_size每张GPU上的批大小。这是影响显存占用的最大因素。从1或2开始尝试。gradient_accumulation_steps梯度累积步数。有效批大小 GPU数量 * per_device_train_batch_size * gradient_accumulation_steps。当你GPU显存很小无法设置大的batch_size时通过增大此参数来增大有效批大小以稳定训练。max_seq_length训练时序列的最大长度。越长单样本显存占用越高且训练速度越慢。需根据你的数据长度和显存情况权衡。对于对话数据1024或2048通常足够。gradient_checkpointing设置为true可以显著减少显存占用可能减少30%-50%但代价是训练速度会变慢约20%因为它通过重计算部分激活来节省存储空间。在显存告急时启用它。优化器与学习率参数learning_rateQLoRA训练时学习率可以设得稍大如2e-4到5e-4。全量参数微调时学习率要小得多通常为1e-5到5e-6否则容易破坏预训练好的知识。lr_scheduler_type学习率调度器。cosine余弦退火或linear线性衰减是常见选择。warmup_steps学习率热身步数。在训练初期学习率从0线性增长到设定值有助于训练稳定。通常设为总步数的5%左右。optim优化器。adamw_8bit或adamw_bnb_8bit是QLoRA的常用选择能进一步节省显存。全量微调可用adamw_hf。LoRA/QLoRA特定参数lora_rank(r)LoRA矩阵的秩。这是控制可训练参数数量和效果的关键。值越大能力越强但显存占用和训练速度也会增加。论文默认64实践中对于7B模型8或16有时也能取得不错效果是速度与效果的折中。lora_alpha缩放因子。通常设为lora_rank的两倍左右如 rank16, alpha32。lora_dropoutLoRA层的Dropout率用于防止过拟合一般设为0.05或0.1。lora_target_modules指定将LoRA适配器添加到哪些模块。Firefly的配置文件通常已经根据模型预设好了如[q_proj, k_proj, v_proj, o_proj]对于LLaMA。高级用户可以修改它以进行针对性调整。4. 从数据准备到模型训练全流程实操指南让我们以一个具体的例子贯穿始终使用QLoRA在单张RTX 409024GB上微调一个Qwen2-7B-Instruct模型使其擅长处理中文法律问答。4.1 步骤一准备与格式化训练数据Firefly要求SFT数据为jsonl格式每条数据一个JSON对象且必须包含conversation字段。这是一个标准示例{ conversation_id: 1, category: legal_qa, conversation: [ { human: 根据《中华人民共和国劳动合同法》用人单位在哪些情况下可以单方面解除劳动合同, assistant: 根据《劳动合同法》第三十九条劳动者有下列情形之一的用人单位可以解除劳动合同一在试用期间被证明不符合录用条件的二严重违反用人单位的规章制度的三严重失职营私舞弊给用人单位造成重大损害的四劳动者同时与其他用人单位建立劳动关系对完成本单位的工作任务造成严重影响或者经用人单位提出拒不改正的五因本法第二十六条第一款第一项规定的情形致使劳动合同无效的六被依法追究刑事责任的。 }, { human: 如果公司没有缴纳社保员工可以立即解除合同并要求赔偿吗, assistant: 可以。根据《劳动合同法》第三十八条和第四十六条用人单位未依法为劳动者缴纳社会保险费的劳动者可以解除劳动合同并且用人单位应当向劳动者支付经济补偿。经济补偿按劳动者在本单位工作的年限每满一年支付一个月工资的标准向劳动者支付。六个月以上不满一年的按一年计算不满六个月的向劳动者支付半个月工资的经济补偿。 } ] }实操要点多轮对话conversation是一个列表可以包含多轮“human”和“assistant”的交替。这能很好地训练模型的多轮对话能力。仅计算Assistant的Loss在训练时只有“assistant”部分的token会参与损失计算“human”部分的token会被掩码掉。这意味着你的数据中assistant字段的文本质量至关重要。数据清洗确保回答准确、专业、无害。对于法律、医疗等专业领域数据的准确性是第一位的。可以混合使用Firefly开源的高质量通用数据如moss-003-sft-data和你自有的领域数据比例可以根据任务调整例如 1:1 或 1:2。数据量对于QLoRA微调几千条高质量的领域数据就能带来显著的效果提升。我们假设你准备了5000条法律问答数据保存为data/law_qa_5k.jsonl。4.2 步骤二配置训练参数我们基于项目内置的Qwen2配置文件进行修改。找到train_args/sft/qlora/目录下类似qwen2-7b-sft-qlora.json的文件复制一份并重命名为qwen2-7b-law-qlora.json然后修改关键参数{ output_dir: ./output/qwen2-7b-instruct-law-qlora, model_name_or_path: Qwen/Qwen2-7B-Instruct, train_file: data/law_qa_5k.jsonl, template_name: qwen2, num_train_epochs: 3, per_device_train_batch_size: 2, gradient_accumulation_steps: 4, learning_rate: 3e-4, max_seq_length: 2048, logging_steps: 10, save_steps: 200, save_total_limit: 3, lr_scheduler_type: cosine, warmup_steps: 50, optim: adamw_8bit, seed: 42, fp16: true, train_mode: qlora, lora_rank: 64, lora_alpha: 128, lora_dropout: 0.05, use_unsloth: false }参数选择理由per_device_train_batch_size2和gradient_accumulation_steps4在24G显存上batch_size2对于2048长度序列的Qwen2-7B QLoRA训练通常是安全的。有效批大小 1 * 2 * 4 8。learning_rate3e-4QLoRA的典型学习率范围。num_train_epochs3对于5000条数据3个epoch通常足够模型学习到数据分布。数据量很大时通常只训练1个epoch。use_unslothfalse因为Qwen2的Unsloth支持需要作者的特殊分支为求稳定首次尝试我们先关闭它。4.3 步骤三启动训练在Firefly项目根目录下执行以下命令开始训练CUDA_VISIBLE_DEVICES0 python train.py --train_args_file train_args/sft/qlora/qwen2-7b-law-qlora.json训练过程监控控制台会打印损失loss日志。正常情况下loss应该随着训练步数稳步下降并在几个epoch内逐渐收敛。训练产生的所有文件模型检查点、日志、TensorBoard事件文件都会保存在output_dir指定的目录中。你可以使用tensorboard --logdir ./output/qwen2-7b-instruct-law-qlora来启动TensorBoard可视化查看损失曲线等指标。注意事项中断与恢复Firefly的训练脚本基于Hugging FaceTrainer支持断点续训。如果训练意外中断只需重新运行相同的命令它会自动从最新的检查点恢复训练。save_total_limit参数控制了最多保留几个检查点超出的旧检查点会被自动删除以节省空间。4.4 步骤四模型推理测试训练完成后output_dir里保存的是LoRA适配器权重adapter_model.bin和adapter_config.json而非完整的模型。我们需要将其与基础模型合并或直接加载适配器进行推理。方法一合并权重生成完整模型便于部署使用项目提供的合并脚本python script/merge_lora.py \ --base_model_name_or_path Qwen/Qwen2-7B-Instruct \ --peft_model_path ./output/qwen2-7b-instruct-law-qlora/checkpoint-600 \ --output_dir ./merged_model/qwen2-7b-law合并后的模型就是一个完整的Hugging Face格式模型可以用任何标准方式加载。方法二使用适配器直接推理节省磁盘空间Firefly提供了方便的交互式聊天脚本cd script/chat python chat.py \ --model_name_or_path Qwen/Qwen2-7B-Instruct \ --checkpoint_path ../output/qwen2-7b-instruct-law-qlora/checkpoint-600 \ --template_name qwen2 \ --max_new_tokens 512运行后会进入一个交互界面你可以直接输入问题测试模型的法律问答能力。5. 高级技巧与深度优化掌握了基础流程后一些高级技巧能让你更好地驾驭Firefly解决复杂问题或追求极致性能。5.1 混合任务训练与数据配比你很少会只用一个数据集。Firefly允许你将多个数据集混合。你需要做的是将不同来源的数据如通用对话、领域知识、代码数据全部处理成统一的jsonl格式。编写一个简单的脚本将它们按比例采样并合并成一个大的训练文件。在配置文件的train_file中指向这个合并后的文件。数据配比策略这是一个经验性很强的过程。一个常见的策略是“领域数据为主通用数据为辅”。例如如果你的目标是法律模型可以按法律数据:通用对话数据 4:1 的比例混合。通用数据能帮助模型保持原有的语言流畅性和通用知识防止“灾难性遗忘”。5.2 使用Unsloth进行极致优化如果你的显卡是RTX 30/40系列并且训练Llama3、Mistral、Gemma等已支持的模型强烈建议启用Unsloth。你需要做两件事正确安装Unsloth环境如前文环境搭建部分所述。在训练配置文件中将use_unsloth: true。启用后你可能会观察到显存占用大幅下降可能从原来的18GB降到10GB这意味着你可以使用更大的batch_size或max_seq_length。训练速度明显提升由于内核优化每一步的训练时间缩短。潜在风险Unsloth作为加速库可能在某些边缘情况或新模型架构上存在兼容性问题。如果开启后出现奇怪错误首先关闭Unsloth进行测试以确定问题来源。5.3 超参数调优实战虽然Firefly提供了合理的默认配置但针对你的特定任务和数据微调超参数能带来进一步提升。学习率与Batch Sizelearning_rate和有效批大小 (batch_size * gradient_accumulation_steps) 存在耦合关系。通常更大的有效批大小允许使用更大的学习率。你可以尝试在[1e-4, 5e-4]范围内调整学习率并使用linear或cosine调度器。LoRA Rank (r)这是最重要的参数之一。如果你的任务非常复杂或与预训练领域差异大可以尝试增大r如128。反之如果只是简单的风格微调r8可能就足够了。增大r会增加可训练参数量可能提升效果但也增加了过拟合的风险和训练成本。序列长度如果你的数据中包含长文档或长对话适当增加max_seq_length如4096是必要的。但请注意显存消耗和训练时间会近似线性增长。QLoRA由于量化了主干模型对长度增加带来的显存压力相对不敏感。一个简单的调优流程是固定其他参数先调整learning_rate和lr_scheduler找到一个使loss平稳快速下降的组合然后调整lora_rank在验证集上观察效果变化。6. 常见问题排查与解决方案实录在实际操作中你几乎一定会遇到各种报错。下面是我和社区中常见问题的解决方案汇总。6.1 显存不足OOM问题这是最常见的问题。错误信息通常包含CUDA out of memory。排查与解决步骤降低per_device_train_batch_size这是最直接有效的方法从1开始尝试。启用梯度检查点在配置文件中设置gradient_checkpointing: true。这通常能节省30%-50%的显存。缩短max_seq_length如果你的数据没有特别长的样本将长度从2048降到1024可以显著减少显存。使用QLoRA而非全量微调如果你还在尝试全量微调立刻切换到QLoRA模式。启用Unsloth如果模型支持这能进一步优化显存。检查数据格式极少数情况下错误的数据格式可能导致单个样本异常膨胀占用巨量显存。用脚本检查一下数据中是否有超长文本。6.2 模型生成异常或无法停止症状模型在推理时胡言乱语或者不断生成内容不输出结束符如Qwen的|im_end|。原因与解决template_name错误这是最可能的原因。确保训练和推理时使用的template_name完全一致且与模型匹配。训练Qwen2-Base模型但用了Qwen2-Chat的模板就会出问题。对于Qwen-Base、Yi-Base这类非对话基座模型官方建议设template_namedefault。数据格式错误检查你的训练数据conversation字段是否正确是否为human和assistant交替的列表。推理参数不当在script/chat.py中调整temperature降低如0.2可使生成更确定、top_p如0.9、repetition_penalty如1.1等参数能极大影响生成质量。6.3 包版本冲突与安装错误不同模型对库版本的要求可能冲突。Firefly的README给出了关键指引这里再强调一下模型关键依赖注意事项Baichuan2torch2.0必须卸载xformers和apex否则会报xformers::efficient_attention_forward错误。Qwen (1.0)-进行QLoRA训练时需卸载flash-attn否则会报断言错误。Qwen1.5transformers4.37无需卸载flash-attn且推荐安装以加速。Gemmatransformers4.38.1,torch2.0.0需要较新版本。使用Unsloth特定版本组合 (torch2.2.2,bitsandbytes0.43.1等)建议创建独立环境。通用排查方法遇到任何ImportError或运行时错误首先检查错误信息中提到的包然后对照官方文档或项目Issue确认所需的版本。使用pip list | grep packagename查看当前版本。6.4 多卡训练与卡指定当你有多张GPU时可以使用torchrun进行分布式训练以加速。# 使用0号和1号GPU进行双卡训练 CUDA_VISIBLE_DEVICES0,1 torchrun --nproc_per_node2 train.py --train_args_file train_args/sft/qlora/llama3-8b-sft-qlora.json注意事项多卡训练时per_device_train_batch_size是每张卡的批大小。总的有效批大小会乘以GPU数量。因此你可能需要相应地调小per_device_train_batch_size或gradient_accumulation_steps以保持总批大小不变避免影响优化效果。6.5 评估与效果验证Firefly本身主要关注训练流程。对于模型效果的评估你需要额外进行人工评测准备一个涵盖不同场景的测试集让模型生成回答人工评判其准确性、相关性和流畅度。这是最可靠的方法。使用评测框架对于通用能力可以使用 OpenCompass 、 LLM-Evaluation-Harness 等工具在标准基准如C-Eval, MMLU上进行测试。但这通常需要合并后的完整模型。损失曲线观察训练过程中确保训练损失train loss平稳下降。如果损失剧烈波动或不再下降可能是学习率太高、数据有问题或模型容量不足。最后我想分享一点个人体会。Firefly这样的工具极大地降低了大模型微调的门槛但它只是一个“引擎”。最终模型效果的天花板取决于你的“燃料”——也就是数据质量。花费70%的精力在数据清洗、构造和评估上往往比调整那30%的超参数带来的收益更大。尤其是在垂直领域精心构建的、无噪音的、指令明确的数据是成功的关键。Firefly为你提供了强大且易用的工具而如何用好它创造出有价值的模型则需要你的领域知识和创造性思维。

Firefly：一站式大模型训练工具，从零到一掌握LLM微调

相关文章：

Firefly：一站式大模型训练工具，从零到一掌握LLM微调

如何快速将Figma设计文件转换为结构化JSON数据：完整指南

Loop：基于Swift开发的macOS窗口管理框架解决方案

TrguiNG汉化版：三招彻底改变你的Transmission远程管理体验

基于LM567的反射式红外检测电路在智能车信标检测中的实战应用与优化

架构范式转移：DeepSeek-Coder-V2如何重构企业级代码智能的ROI模型

Umi-CUT：如何用一款免费工具实现批量图片去黑边与智能裁剪

使用Node.js在虚拟机后端服务中集成Taotoken多模型调用

Cangaroo：开源CAN总线分析软件的技术架构与部署指南

5种智能匹配模式：Illustrator脚本replaceItems.jsx如何让设计元素替换效率提升20倍

pdf2pptx：LaTeX到PowerPoint的无缝转换终极方案

别再只懂BDF了！手把手教你理解PCIe ARI如何将Function数量扩展到256个

在Google Cloud上构建OpenAI兼容API网关：无缝对接Vertex AI模型

幸福依赖于抽象的能力的庖丁解牛

【DeepSeek API接入实战指南】：20年架构师亲授5大避坑法则与3小时极速接入方案

Android Studio中文界面：从英文困扰到母语开发的完整解决方案

实战指南：VRM-Addon-for-Blender 终极VRM格式导入导出解决方案

Keil 5 Debug隐藏技巧：手把手教你配置软件仿真，避开‘no read permission’等常见报错

adloop：可编程规则引擎驱动的浏览器网络请求深度拦截与定制

n8n与Claude集成指南：构建AI代码生成与自动化执行工作流

通过Taotoken CLI工具一键为团队统一配置开发环境

手把手教你用Python/Node.js快速接入抖音开放平台，实现用户信息获取

ARMv8-A开发实战：DC IVAC指令详解，手把手教你正确清理数据缓存

如何通过HWInfo插件实现精准硬件监控与风扇控制：完整配置指南

卸载软件后右键菜单残留？用PowerShell精准清理注册表（附一键备份脚本）

3步打造你的专属游戏串流服务器：Sunshine终极指南

Illustrator智能对象替换引擎：企业级设计自动化的技术杠杆

终极指南：如何用免费3D模型库打造你的Cherry MX个性化键帽

Windows更新修复终极指南：Script-Reset-Windows-Update-Tool完全解析

3种高效方案：让Windows直接运行Android应用的全新体验手册