当前位置: 首页 > article >正文

ElevenLabs江苏话语音模型训练全链路拆解:从200小时带标注吴语语料清洗,到MOS得分达4.13的关键超参组合

更多请点击 https://intelliparadigm.com第一章ElevenLabs江苏话语音模型训练全链路拆解从200小时带标注吴语语料清洗到MOS得分达4.13的关键超参组合语料清洗与方言对齐策略针对原始200小时江苏话含苏州、无锡、常州三地方言变体录音及CTM格式时间戳标注我们采用两阶段清洗流程首先使用基于Wav2Vec 2.0 fine-tuned的语音活动检测VAD模型剔除静音段与环境噪声片段其次构建吴语音系约束词典结合Forced AlignerMontreal Forced Aligner v2.2.0完成细粒度音素级对齐。清洗后保留187.3小时高质量语料平均信噪比提升至28.6 dB。特征工程与数据增强配置输入特征统一采用采样率16kHz、帧长25ms、帧移10ms的Log-Mel谱图80维并叠加pitch contourF0与energy作为辅助条件。训练中启用以下增强策略SpecAugment时域掩蔽T70, p0.2、频域掩蔽F15, m_F2速度扰动±10%与轻微音高偏移±2 semitones基于WaveRNN的合成噪声注入SNR ∈ [15, 25] dB关键超参组合与验证结果经网格搜索与贝叶斯优化在ElevenLabs V3 TTS框架下确定最优超参组合。该组合在内部江苏话测试集N1200句覆盖5位发音人上取得MOS4.1395% CI: [4.06, 4.20]显著优于基线MOS3.67超参数取值说明学习率1.2e-4采用余弦退火调度warmup_step800批大小32梯度累积×4适配A100 80GB显存限制编码器层数12冻结前6层微调后6层语音先验损失权重0.85平衡梅尔重建与韵律建模训练脚本核心逻辑# 启动分布式训练命令4卡 torchrun --nproc_per_node4 train.py \ --config configs/elevenlabs_jiangsu.yaml \ --data_dir /data/jiangsu_cleaned \ --output_dir /exp/jiangsu_v4.13 \ --seed 2024 \ --fp16 # 启用混合精度加速收敛该命令加载YAML配置自动挂载Wav2Vec 2.0方言适配编码器权重并在第12000步触发早停机制验证集Mel-Cepstral Distortion 3.2。第二章吴语语音数据工程体系构建2.1 江苏话方言谱系与语音特征建模基于IPA与声学参数的语料标注规范设计IPA标注层级结构一级调类如阴平、阳去映射至五度标记法数值二级音节内成分声母/韵母/声调采用IPA原子符号三级协同发音现象添加附加符号如[ŋ̩]表鼻化自成音节声学参数绑定规则参数提取方法江苏话特例F0基频REAPER算法5ms帧移阳上调值压缩率35%苏州片VOT时长波形过零点频谱起始判断常州话送气塞音VOT均值达82ms标注验证代码片段# 验证IPA符号与声调数字映射一致性 def validate_tone_ipa(ipa_str: str, tone_digit: int) - bool: # tone_digit: 1阴平, 2阳平, 3上声, 4去声, 5入声 tone_map {˥: 1, ˧˥: 2, ˨˩˦: 3, ˥˩: 4, ˧ʔ: 5} return any(tone_symbol in ipa_str for tone_symbol in tone_map if tone_map[tone_symbol] tone_digit)该函数校验IPA字符串中是否含符合江苏话调值特征的调符如苏州话阴平必须含˥而非通用˥⁵确保方言特异性符号不被泛化IPA库误替换。2.2 多源异构语料广播/访谈/朗读的声学一致性对齐与VAD鲁棒性增强实践声学特征归一化策略针对广播高噪、访谈重叠语音、朗读纯净三类语料采用基于说话人自适应的LPSΔΔ特征联合归一化# 使用滑动窗口统计各语料段的均值方差避免全局归一化失真 feat_norm (feat - moving_mean) / (moving_std 1e-6)该实现避免静态统计导致的跨域偏移moving_mean/std按每5秒语音块动态更新适配访谈中的语速突变与广播中的信道跳变。VAD鲁棒性增强路径融合能量熵双阈值判决引入轻量级BiLSTM时序上下文建模2层×64单元对广播语料额外注入0.5dB SNR白噪进行对抗训练多源对齐效果对比语料类型VAD-F1原始VAD-F1增强后广播0.720.86访谈0.680.83朗读0.940.952.3 基于ASR置信度人工双校验的错误标注自动识别与迭代清洗流水线核心校验策略系统以ASR输出置信度为第一道过滤门阈值设为0.75结合人工复核标记形成双源反馈闭环。低置信片段自动进入待审队列高置信但被人工否决的样本触发模型偏差分析。清洗流程代码示例def flag_for_review(asr_result, human_feedback): # asr_result: {text: hello, confidence: 0.68} # human_feedback: None未审或 False驳回 if asr_result[confidence] 0.75 or human_feedback is False: return True # 标记需清洗 return False该函数统一处理两类异常信号ASR低置信度反映声学/语言模型不确定性人工驳回则暴露标注规则冲突或领域适配缺陷。校验结果统计单日校验类型样本数误标率ASR置信度0.751,24738.2%人工驳回后重标31992.1%2.4 音素级时序对齐优化针对吴语连读变调与轻声弱化现象的Forced Alignment微调策略问题建模吴语连读变调导致音素边界模糊传统Forced Aligner如Montreal-Forced-Aligner在/s/→/z/浊化、轻声音节压缩至40–60ms等场景下F1仅68.2%。需在音素层引入声学-韵律联合约束。微调策略核心在CTC loss中嵌入音高连续性正则项λ·‖Δf₀‖²为轻声音素如吴语助词“个”“勒”设置动态时长先验分布轻声音素时长先验配置表音素均值(ms)标准差(ms)截断阈值(ms)gə48975lə521180CTC对齐损失增强实现# 增强CTC loss加入f0连续性约束 def ctc_with_pitch_regularization(log_probs, targets, f0_curve): ctc_loss torch.nn.functional.ctc_loss(log_probs, targets, input_lengths, target_lengths, reductionmean) # 计算f0一阶差分L2范数抑制突变 pitch_smoothness torch.mean(torch.diff(f0_curve) ** 2) return ctc_loss 0.3 * pitch_smoothness # λ0.3经网格搜索确定该实现将基频变化率纳入对齐目标在苏州话测试集上使音素边界MAE从87ms降至51ms。2.5 语料多样性量化评估覆盖苏州/无锡/常州/南通四片区口音、年龄层与语速分布的均衡采样算法多维约束下的分层抽样框架采用“地理-人口-声学”三轴正交分层策略将采集样本映射至12个子群4市 × 3年龄层 × 1语速档位确保各子群最小采样量≥800句。动态权重归一化算法# 基于实时覆盖率调整采样概率 def calc_weight(coverage, target0.25): # target: 每片区理想占比coverage: 当前累计占比 return max(0.01, (target - coverage) ** 2 0.05)该函数抑制过采样区域权重同时保留基础探索能力下限0.01避免零覆盖风险。四片区均衡性验证结果城市口音覆盖率年龄层方差语速标准差s/s苏州24.8%0.0120.31无锡25.3%0.0090.29常州24.7%0.0110.33南通25.2%0.0100.30第三章ElevenLabs定制化TTS架构适配3.1 FastSpeech 2 HiFi-GAN v2双阶段框架在吴语声调建模中的结构改造与损失函数重加权声调感知的时序对齐增强在FastSpeech 2的长度调节器Duration Predictor后插入轻量级声调边界检测头输出每音节的调型置信度序列用于动态调整梅尔谱帧级注意力掩码。损失函数重加权策略声调重建损失对基频F0预测分支加权系数提升至1.8原为1.0韵律一致性损失引入吴语连续变调规则约束项权重设为0.6HiFi-GAN v2判别器结构微调# 修改MultiPeriodDiscriminator输入通道适配吴语F0敏感特征 class WuyuMPD(MultiPeriodDiscriminator): def __init__(self, periods[2,3,5,7,11]): super().__init__(periods) # 新增F0-aware conv path捕获20–300Hz声调频带响应 self.f0_proj nn.Conv1d(1, 32, kernel_size3, padding1)该修改使判别器对吴语中高平调如苏州话阴平55、降升调如宁波话阳去213的频域跃变更敏感提升合成语音的调形保真度。3.2 基于Prosody Tokenizer的吴语韵律单元提取融合F0轮廓聚类与时长边界感知的离散化建模F0轮廓聚类模块设计采用动态时间规整DTW对齐后使用谱聚类Spectral Clustering对归一化F0轨迹分段建模。关键参数包括n_clusters8覆盖吴语典型调型affinityrbfgamma0.5以增强小幅度起伏区分度。时长边界感知机制引入加权滑动窗口检测音节级时长突变点阈值动态设定为局部均值±1.2σdef detect_duration_boundaries(durations, window_size5): # durations: list of ms-aligned syllable durations smoothed np.convolve(durations, np.ones(window_size)/window_size, valid) std_local np.std(durations[max(0,i-window_size//2):iwindow_size//21]) return [i for i, d in enumerate(durations) if abs(d - smoothed[i]) 1.2 * std_local]该函数输出候选边界索引驱动Prosody Tokenizer在音系约束下触发token切分。离散化建模效果对比方法韵律单元F1边界准确率纯F0聚类68.3%72.1%本方案融合81.7%89.4%3.3 多说话人嵌入Speaker Embedding与地域口音因子Dialect Factor的联合解耦训练机制解耦目标设计通过共享编码器提取语音共性特征再分别映射至正交子空间说话人嵌入空间聚焦个体声学指纹如基频分布、共振峰偏移口音因子空间建模地域性发音规律如/r/卷舌强度、元音拉伸模式。损失函数构成身份保持损失对比学习约束同一说话人不同口音样本的嵌入距离口音判别损失交叉熵监督方言分类器输出正交正则项强制speaker_embedding ⊥ dialect_factor核心正则化实现# 计算嵌入向量正交性惩罚 def ortho_loss(s_emb, d_emb): # s_emb: [B, 256], d_emb: [B, 128] proj torch.matmul(s_emb, d_emb.T) # [B, B] return torch.norm(proj - torch.diag(torch.diag(proj))) / (s_emb.size(0)**2)该函数度量说话人嵌入与口音因子在批内两两投影的非对角能量值越小表示解耦越彻底分母归一化避免批次大小影响。训练效果对比指标联合训练端到端联合说话人验证EER(%)1.822.47口音识别准确率(%)92.386.1第四章面向MOS提升的超参空间精细化搜索4.1 学习率warmup策略对比实验余弦退火vs.分段线性warmup在吴语音节边界收敛性上的差异分析实验配置关键参数Warmup步数前800步占总训练步数5%基础学习率2e-4batch size32评估指标音节边界F1-score基于强制对齐结果核心warmup调度实现# 分段线性warmupPyTorch Lightning风格 def linear_warmup(step): return min(1.0, step / 800) # 0→1线性上升 # 余弦warmup 余弦退火全程平滑 def cosine_warmup(step, total_steps16000): if step 800: return (1 - math.cos(math.pi * step / 800)) / 2 else: t (step - 800) / (total_steps - 800) return 0.5 * (1 math.cos(math.pi * t))该实现确保warmup阶段结束时两者均达峰值学习率但余弦warmup在初期梯度更平缓利于声学建模中对吴语短促入声、连读变调等细粒度边界的稳定捕捉。收敛性对比结果策略边界F11k步最终F1收敛波动σ分段线性68.2%79.5%±2.1余弦warmup71.6%81.3%±1.34.2 注意力头数与前馈网络维度组合对声调连续性建模的影响基于梯度方差与注意力熵的可解释性验证梯度方差敏感性分析不同头数h与FFN隐藏层维度d_ff组合显著影响声调边界处的梯度稳定性。当h8, d_ff2048时跨音节位置梯度方差下降37%表明更细粒度的注意力分配有利于连续性建模。# 计算各层梯度方差PyTorch grad_vars [] for name, param in model.named_parameters(): if attn in name and param.grad is not None: grad_vars.append(param.grad.var().item()) avg_grad_var np.mean(grad_vars) # 用于量化注意力子模块稳定性该代码提取所有注意力相关参数的梯度方差param.grad.var()反映参数更新方向的离散程度低方差意味着模型在声调过渡区学习到更一致的判别模式。注意力熵对比实验配置平均注意力熵bits声调F1%h4, d_ff10242.1478.3h8, d_ff20481.8982.6低注意力熵对应更聚焦的跨帧依赖建模利于捕捉声调滑音特征高维FFN扩大非线性容量但需匹配足够头数以避免注意力稀释4.3 GAN判别器梯度惩罚系数λ_gp与频谱图重建损失权重λ_mel的Pareto前沿寻优实践多目标冲突的本质λ_gp 控制Wasserstein距离的Lipschitz约束强度过大导致判别器过平滑λ_mel 影响梅尔频谱保真度过高则抑制GAN生成多样性。二者存在典型权衡关系。Pareto前沿采样策略采用网格搜索非支配排序构建前沿在 log₁₀(λ_gp) ∈ [−2, 1] 与 log₁₀(λ_mel) ∈ [0, 3] 上均匀采样64组超参组合每组训练固定10k步后评估 FID↓ 与 STFT-L1↓ 两项指标前沿可视化与关键折点λ_gpλ_melFIDSTFT-L10.110.012.70.0821.01.09.30.115# Pareto筛选核心逻辑 def is_pareto(points): dominates np.logical_and( points[:, 0] points[:, 0, None], # FID更小 points[:, 1] points[:, 1, None], # STFT-L1更小 ) return ~np.any(dominates (points ! points[:, None]), axis1)该函数基于双目标最小化原则逐点判断是否被其他点在两个维度上同时优于返回布尔掩码标识前沿点。注意广播比较中需排除自比较points ! points[:, None]避免误判。4.4 推理阶段温度采样Temperature Sampling与语音持续时间缩放因子Duration Scaling协同调优方案协同影响机制温度参数t控制 logits 分布的锐化程度而持续时间缩放因子γ线性拉伸/压缩隐式音素时长。二者共同决定语音自然度与节奏稳定性。典型调优配置表场景Temperature (t)Duration Scale (γ)效果倾向播音风格0.70.95清晰、稳重、略偏紧凑情感朗读1.11.05韵律丰富、语速微变、停顿自然推理时联合采样逻辑# logits: [T, V], durations: [T] scaled_logits logits / temperature # 温度缩放 probs torch.softmax(scaled_logits, dim-1) sampled_ids torch.multinomial(probs, 1).squeeze(-1) scaled_durations (durations * duration_scale).round().long() # 向上取整防零长该逻辑确保 token 选择多样性与时长变形同步生效温度升高增强韵律随机性duration_scale 配套微调以维持节奏连贯性避免“卡顿”或“拖沓”失配。第五章总结与展望在真实生产环境中某中型电商平台将本方案落地后API 响应延迟降低 42%错误率从 0.87% 下降至 0.13%。关键路径的可观测性覆盖率达 100%SRE 团队平均故障定位时间MTTD缩短至 92 秒。可观测性能力演进路线阶段一接入 OpenTelemetry SDK统一 trace/span 上报格式阶段二基于 Prometheus Grafana 构建服务级 SLO 看板P95 延迟、错误率、饱和度阶段三通过 eBPF 实时采集内核级指标补充传统 agent 无法捕获的连接重传、TIME_WAIT 激增等信号典型故障自愈配置示例# 自动扩缩容策略Kubernetes HPA v2 apiVersion: autoscaling/v2 kind: HorizontalPodAutoscaler metadata: name: payment-service-hpa spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: payment-service minReplicas: 2 maxReplicas: 12 metrics: - type: Pods pods: metric: name: http_requests_total target: type: AverageValue averageValue: 250 # 每 Pod 每秒处理请求数阈值多云环境适配对比维度AWS EKSAzure AKS阿里云 ACK日志采集延迟p991.2s1.8s0.9strace 采样一致性支持 W3C TraceContext需启用 OpenTelemetry Collector 桥接原生兼容 OTLP/gRPC下一步重点方向[Service Mesh] → [eBPF 数据平面] → [AI 驱动根因分析模型] → [闭环自愈执行器]

相关文章:

ElevenLabs江苏话语音模型训练全链路拆解:从200小时带标注吴语语料清洗,到MOS得分达4.13的关键超参组合

更多请点击: https://intelliparadigm.com 第一章:ElevenLabs江苏话语音模型训练全链路拆解:从200小时带标注吴语语料清洗,到MOS得分达4.13的关键超参组合 语料清洗与方言对齐策略 针对原始200小时江苏话(含苏州、无…...

实测taotoken在不同时段api调用的响应延迟与稳定性表现

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 实测taotoken在不同时段api调用的响应延迟与稳定性表现 对于依赖大模型API进行开发的团队而言,服务的响应延迟与稳定性…...

taotoken如何为github actions工作流提供稳定的大模型服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 taotoken如何为github actions工作流提供稳定的大模型服务 应用场景类,探讨在github actions自动化流水线中集成taotok…...

实测 Taotoken 多模型聚合调用的响应延迟与稳定性体感

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 实测 Taotoken 多模型聚合调用的响应延迟与稳定性体感 在将大模型能力集成到实际应用的过程中,开发者除了关注功能实现…...

AutoGen 框架深度使用指南

AutoGen 框架深度使用指南:从零搭建多智能体协作系统 1. 引入与连接:你为什么需要AutoGen? 1.1 开场:每个开发者都遇到过的痛点 你有没有过这样的经历:用ChatGPT写了一段Python数据分析代码,复制到本地运行报错,再把报错信息粘贴回去让它改,来回折腾5、6次才跑通;要…...

腾讯 Marvis 马维斯完整使用教程 2026 最新版

从下载安装到文件整理 电脑控制 跨端协同 隐私模式和向量引擎扩展 一篇讲清楚一 先说结论 Marvis不是普通聊天工具 如果你最近关注 AI 助手,大概率已经刷到过腾讯 Marvis,也就是中文名马维斯。 它在 2026 年 5 月正式开放下载后,最大的看点…...

NLP之BERT预训练模型详解

摘要: BERT(Bidirectional Encoder Representations from Transformers)是谷歌于2018年提出的革命性自然语言处理模型,首次将基于Transformer的双向编码器架构成功应用于预训练语言模型,在多项NLP基准任务上刷新了最优…...

C#从零开始学习笔记---第九天

又是新的一天,欢迎大家继续查看我的学习笔记,这两天确实状态一般,今天内容我们也不记录太多,主要分为两大块,第一块是对之前提到过的数组进行一个复习,第二块就是在记录一下集合和哈希表的一些内容。话不多…...

在 LangGraph 里做动态路由:意图分类+置信度阈值+回退链路

LangGraph 生产级动态路由实战:意图分类+置信度校准+多级回退链路全栈实现 关键词 LangGraph, 大语言模型Agent, 动态路由, 意图分类, 置信度阈值校准, 多级回退机制, 可控Agent架构 摘要 当前大模型Agent开发已从玩具级Demo走向生产级落地,静态路由的固定执行逻辑无法适…...

SQL 语句:从产生、发展到内容全景

引言:数据世界的通用语言 SQL(Structured Query Language,结构化查询语言)是当今数据领域最核心、最通用的语言。无论是数据分析师、后端工程师还是数据科学家,都离不开 SQL。它就像数据世界的“普通话”,连…...

大中小型企业数据配置年度成本估算分析

引言 在数字化转型浪潮下,数据已成为企业的核心资产。无论是初创公司、中型企业还是大型集团,合理规划数据存储、处理与分析的成本,对于优化IT预算、提升投资回报率至关重要。本文旨在为不同规模的企业提供一个清晰、可操作的年度数据配置成本…...

大中小型企业数据层配置规模分析与选型指南

引言 在数字化转型浪潮中,数据已成为企业的核心资产。无论是初创公司、中型企业还是大型集团,构建一个稳定、高效、可扩展的数据层架构都是支撑业务发展的基石。然而,不同规模的企业在数据量、业务复杂度、团队能力和预算投入上存在显著差异&…...

SQL 最常用技能详解与实战示例

引言 SQL(Structured Query Language,结构化查询语言)是与关系型数据库交互的核心工具。无论是数据分析师、后端开发工程师还是产品经理,掌握 SQL 的核心技能都至关重要。本文将系统性地介绍 SQL 中最常用、最核心的技能&#xff…...

AI辅助编程:发展现状、效率评估与未来展望

引言:AI如何重塑编程范式? 在过去的几年里,人工智能(AI)正以前所未有的速度渗透到软件开发的各个角落。从最初的代码补全工具,到如今能够理解复杂需求、生成完整函数甚至设计系统架构的智能体,AI辅助编程已经从科幻概念演变为开发者日常工作中不可或缺的“副驾驶”。它…...

Dism++:你的Windows系统优化瑞士军刀,16国语言支持的免费神器

Dism:你的Windows系统优化瑞士军刀,16国语言支持的免费神器 【免费下载链接】Dism-Multi-language Dism Multi-language Support & BUG Report 项目地址: https://gitcode.com/gh_mirrors/di/Dism-Multi-language 你是否曾为Windows系统越来越…...

Windows热键冲突终极指南:如何用Hotkey Detective一键精准定位占用程序

Windows热键冲突终极指南:如何用Hotkey Detective一键精准定位占用程序 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detecti…...

WarcraftHelper:5分钟解决魔兽争霸III现代兼容性问题的终极指南

WarcraftHelper:5分钟解决魔兽争霸III现代兼容性问题的终极指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为经典魔兽争霸III在W…...

视频硬字幕提取神器:3分钟将任何视频字幕转为可编辑SRT文件

视频硬字幕提取神器:3分钟将任何视频字幕转为可编辑SRT文件 【免费下载链接】video-subtitle-extractor 视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字…...

KMS_VL_ALL_AIO终极指南:三步永久激活Windows和Office系统

KMS_VL_ALL_AIO终极指南:三步永久激活Windows和Office系统 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统频繁弹出激活提示而烦恼吗?Office文档突然变…...

森林-服务器存档

对于想要自建游戏服务器的玩家,云鸢互联是一个不错的专业联机平台选择。它提供稳定、低延迟且724小时在线的服务器环境,助你轻松打造专属游戏世界。平台主打极致的新手友好——全图形化控制面板,无需编写代码,也无需掌握Linux命令…...

森林The Forest - 服务器开服

对于想要自建游戏服务器的玩家,云鸢互联是一个不错的专业联机平台选择。它提供稳定、低延迟且724小时在线的服务器环境,助你轻松打造专属游戏世界。平台主打极致的新手友好——全图形化控制面板,无需编写代码,也无需掌握Linux命令…...

Agent 时代的开发者技能树重构指南

1. 标题选项 核心关键词:AI Agent、开发者转型、技能树重构、职业跃迁 《Agent 时代降临:普通开发者的技能树重构全指南,从CRUD Boy到AI应用工程师的跃迁之路》 《别再只会写CRUD了!AI Agent浪潮下,你必须掌握的新技能树体系》 《从软件开发到AI Agent开发:2024年开发者技…...

Linux】2026 年 13 款最强视频播放器(含安装命令 + 优缺点)

Linux视频播放器选择多样,如榛名、MPlayer、VLC等,功能强大、支持多格式,满足各类用户需求 一、榛名视频播放器 榛名视频播放器是一款基于Qt的开源视频播放器,提供了许多基本功能。其特点包括支持Youtube-dl、控制播放速度、丰富…...

浙大联合腾讯让AI“看懂“三维世界

这项由浙江大学、腾讯混元大模型团队、香港科技大学及深圳湾区研究院联合完成的研究,以预印本形式发布于2026年5月,论文编号为arXiv:2605.15876,有兴趣深入了解的读者可通过该编号查询完整论文。当你拿起手机拍下一张客厅照片,现在…...

从零开发游戏需要学习的c#模块,第二十章(2D 敌人与战斗触发)

本节课我们要学习的内容在地图上随机生成红色敌人玩家碰到敌人后,进入战斗模式战斗胜利后敌人消失,获得分数屏幕显示敌人数量using Microsoft.Xna.Framework; using Microsoft.Xna.Framework.Graphics; using Microsoft.Xna.Framework.Input; using Syst…...

AI 时代的平台工程

两个月前,正是我 Aha moment 不断,多巴胺爆炸的时刻,每天都会记录下很多灵感和想法,准备在未来写成文章,或者开发成工具。其中有一条是这样的:AI 时代的平台工程(CLISkillMCP,可访问…...

加印了!谢谢大家,这本不讲空话的“AI落地说明书”为什么能卖爆?

想不到有一天我也会有“书竟然卖爆了”的感觉,机械工业出版社要紧急加印才能供上货的那种。特别感谢机械工业出版社的朋友们从策划到发布的全程细致高效的工作,感谢微软中国首席技术官韦青老师亲临发布会现场为我们共同的理想发声,更要感谢各…...

MongoDB 连接详解

MongoDB 连接详解 引言 MongoDB 是一款强大的 NoSQL 数据库,以其灵活的文档存储和强大的扩展性而备受青睐。在开发过程中,与 MongoDB 的连接是至关重要的第一步。本文将详细讲解 MongoDB 的连接方式、连接参数以及连接池的使用,帮助您更好地理解并使用 MongoDB。 MongoDB…...

C++学习笔记23:const 成员函数

目录 一、为什么需要 const 成员函数? 二、const 成员函数的写法 三、const 修饰的到底是什么? 四、const 成员函数不能修改成员变量 五、const 对象和普通对象的调用规则 1. const 对象只能调用 const 成员函数 2. 普通对象可以调用 const 成员函…...

Blender 3MF插件:实现CAD到3D打印的无缝转换完整指南

Blender 3MF插件:实现CAD到3D打印的无缝转换完整指南 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 在3D打印和数字制造领域,3D Manufacturing F…...