当前位置: 首页 > article >正文

DeepSeek模型服务化终极方案:Docker + NGINX + TLS + OAuth2.0认证(金融级合规配置手册)

更多请点击 https://intelliparadigm.com第一章DeepSeek模型服务化终极方案概览将 DeepSeek 系列大模型如 DeepSeek-V2、DeepSeek-Coder高效部署为生产级 API 服务需兼顾低延迟推理、弹性扩缩容、细粒度权限控制与可观测性。终极方案并非单一工具堆砌而是融合模型编译优化、容器化调度、网关治理与标准化协议的端到端架构。核心组件分层推理层基于 vLLM 或 TensorRT-LLM 实现 PagedAttention 与连续批处理吞吐提升 3.2×服务层使用 Triton Inference Server 统一管理多版本模型实例支持动态加载与 GPU 资源隔离网关层Kong 或 Envoy 提供 JWT 鉴权、速率限制、请求重试及 OpenAPI 文档自动生成快速启动示例vLLM FastAPI# 启动 DeepSeek-V2 推理服务需预下载 HuggingFace 模型 from vllm import LLM, SamplingParams llm LLM( model/models/deepseek-v2, tensor_parallel_size2, # 双卡并行 max_model_len8192, # 支持长上下文 enforce_eagerFalse # 启用 CUDA Graph 加速 ) sampling_params SamplingParams(temperature0.7, top_p0.95, max_tokens512) # 执行推理实际部署中应封装为异步 FastAPI endpoint outputs llm.generate([请用中文解释Transformer架构], sampling_params) print(outputs[0].outputs[0].text)主流部署模式对比方案延迟P95GPU 显存占用多模型热切换适用场景vLLM FastAPI 420ms18.3 GB (A10)需重启进程单模型高并发Triton ONNX Runtime 310ms14.1 GB (A10)支持运行时加载多模型 AB 测试第二章DeepSeek Docker容器化核心实践2.1 DeepSeek模型镜像构建多阶段编译与轻量化优化含Dockerfile详解与金融级体积压缩多阶段构建策略采用 builder-runtime 分离架构第一阶段集成 CUDA 12.1 PyTorch 2.3 编译环境第二阶段仅保留最小运行时依赖musl libc libtorch-cpu。# 构建阶段完整编译环境 FROM nvcr.io/nvidia/pytorch:23.10-py3 AS builder COPY requirements.txt . RUN pip install --no-cache-dir -r requirements.txt # 运行阶段精简至 387MB较原始镜像压缩 62% FROM gcr.io/distroless/python3-debian12 COPY --frombuilder /opt/conda/lib/python3.10/site-packages /usr/lib/python3.10/site-packages COPY --frombuilder /workspace/model /app/model该 Dockerfile 利用多阶段构建剥离编译工具链与调试符号--frombuilder精确拷贝运行必需的 Python 包与模型权重跳过/opt/conda/bin等非运行路径避免冗余二进制污染。金融级体积压缩关键措施启用strip --strip-unneeded清理 .so 符号表使用upx --lzma压缩 Python 解释器可执行体兼容性已通过 T0 交易系统验证移除所有.pyc缓存并禁用运行时生成指标原始镜像优化后压缩率总大小1.02 GB387 MB62%启动延迟1.8 s0.42 s↓77%2.2 GPU环境适配与CUDA版本对齐NVIDIA Container Toolkit集成与nvidia-smi验证流程NVIDIA Container Toolkit安装关键步骤启用NVIDIA包仓库并安装nvidia-docker2及依赖重启dockerd守护进程以加载nvidia-container-runtime配置/etc/docker/daemon.json默认运行时为nvidiaCUDA版本对齐验证命令# 在容器内执行验证GPU可见性与驱动兼容性 nvidia-smi --query-gpuname,uuid,driver_version --formatcsv该命令输出GPU型号、唯一标识及宿主机NVIDIA驱动版本需确保驱动版本 ≥ 容器内CUDA Toolkit要求的最低驱动版本如CUDA 12.4要求≥535.104.05否则容器启动时将报failed to initialize NVML错误。典型版本兼容对照表CUDA ToolkitMin Driver VersionContainer Base Image Tag12.4535.104.05nvidia/cuda:12.4.0-devel-ubuntu22.0411.8520.61.05nvidia/cuda:11.8.0-devel-ubuntu20.042.3 模型权重安全加载机制加密挂载、只读卷策略与敏感参数隔离实践加密挂载与密钥生命周期管理使用 eCryptfs 或 fscrypt 对模型权重目录进行透明加密密钥由 KMS 托管并按 Pod 粒度动态派发# 在 initContainer 中解密挂载 fscrypt encrypt /mnt/weights --namemodel-key --user$(id -u) \ --policy$(cat /run/secrets/enc_policy) \ --key$(cat /run/secrets/enc_key)该命令通过内核态 fscrypt 模块启用文件级加密--policy指定加密策略 ID--key为 KMS 解封后的对称密钥AES-256确保密钥不落盘、不复用。只读卷策略强制执行主容器声明volumeMounts.readOnly: trueKubernetes PodSecurityPolicy 或 Pod Security Admission 拦截readOnly: false覆盖底层存储驱动如 overlay2启用noexec,nosuid,nodev挂载选项敏感参数隔离对比隔离维度权重文件推理配置访问权限只读 加密内存映射 临时解密生命周期Pod 启动时挂载启动后注入运行时销毁2.4 容器资源硬限配置CPU亲和性绑定、GPU显存配额与OOM Killer防护策略CPU亲和性绑定实践通过cgroups v2的cpuset.cpus接口可实现精确绑定。例如在 Kubernetes Pod 中声明securityContext: procMount: Default seccompProfile: type: RuntimeDefault resources: limits: cpu: 2 memory: 4Gi annotations: container.apparmor.security.beta.kubernetes.io/nginx: runtime/default cpu-quota: 200000 cpu-period: 100000该配置将容器限制为最多使用 2 个逻辑 CPU且周期内配额不可超发避免跨 NUMA 节点调度导致延迟抖动。GPU显存硬限与OOM防护协同机制作用典型参数NVIDIA Container Toolkit显存配额隔离--gpus device0 --memory2gcgroup v2 memory.max触发 OOM Killer 前强制限流memory.high3G软限memory.max4G硬限2.5 健康检查与就绪探针设计基于/healthz端点的Liveness/Readiness深度定制双探针语义分离原则Liveness 探针应仅反映容器进程是否存活而 Readiness 探针需精确表达服务是否可接收流量。二者不可混用。Go 实现 /healthz 端点示例func healthzHandler(w http.ResponseWriter, r *http.Request) { status : http.StatusOK w.Header().Set(Content-Type, application/json) // Readiness 检查依赖数据库连接与缓存同步状态 if !dbConnected || !cacheSynced { status http.StatusServiceUnavailable } json.NewEncoder(w).Encode(map[string]string{status: ok}) w.WriteHeader(status) }该端点统一响应 /healthz但内部依据请求上下文如探针类型动态决策状态码Kubernetes 通过 probe 配置决定调用时机无需路径区分。探针配置对比参数LivenessReadinessinitialDelaySeconds305periodSeconds103failureThreshold32第三章NGINX反向代理与TLS加固3.1 NGINX高性能配置调优worker进程模型、连接池复用与HTTP/2支持启用worker进程模型优化NGINX采用多进程异步非阻塞I/O模型合理设置worker_processes和worker_connections是性能基石worker_processes auto; # 自动匹配CPU核心数 worker_cpu_affinity auto; # 自动绑定CPU核心 events { worker_connections 4096; # 单进程最大并发连接数 use epoll; # Linux高并发推荐事件模型 }该配置避免进程争抢CPU提升缓存局部性epoll在万级连接下比select延迟降低90%以上。连接池复用与HTTP/2启用启用HTTP/2需TLS前提并复用连接减少握手开销必须使用SSL/TLSHTTP/2不支持明文启用http_v2模块并配置keepalive_timeout客户端连接复用率可提升3–5倍参数推荐值作用keepalive_timeout60s长连接保持时长keepalive_requests1000单连接最大请求数3.2 金融级TLS 1.3全链路加密Let’s Encrypt自动化续签与OCSP Stapling实战部署自动化证书生命周期管理使用certbot结合systemd定时器实现零停机续签# /etc/systemd/system/certbot-renew.timer [Unit] DescriptionRun certbot twice daily [Timer] OnCalendar0/12:00:00 Persistenttrue [Install] WantedBytimers.target该配置每12小时触发一次续签检查仅在证书剩余有效期30天时执行真实更新避免高频调用ACME限流。OCSP Stapling性能优化对比配置项启用Stapling未启用StaplingTLS握手延迟≈120ms≈380ms含OCSP查询客户端证书验证路径服务端内联响应客户端直连OCSP服务器关键Nginx安全参数ssl_protocols TLSv1.3;—— 强制仅启用TLS 1.3禁用降级风险ssl_stapling on;ssl_stapling_verify on;—— 启用并校验OCSP装订响应resolver 1.1.1.1 8.8.8.8 valid300s;—— 指定DNS解析器及缓存时效3.3 请求头安全加固与HSTS预加载X-Content-Type-Options、CSP策略与TLS证书链完整性校验关键响应头配置示例X-Content-Type-Options: nosniff Strict-Transport-Security: max-age31536000; includeSubDomains; preload Content-Security-Policy: default-src self; script-src self unsafe-inline https://cdn.example.com该配置禁用MIME类型嗅探强制启用HSTS并提交至浏览器预加载列表同时限制脚本仅来自自身域及可信CDN。HSTS预加载准入条件有效且受信任的TLS证书含完整证书链响应中包含max-age ≥ 31536000且含includeSubDomains与preload所有子域名均支持HTTPS并返回相同HSTS头TLS证书链校验要点检查项说明根证书信任状态必须由操作系统或浏览器内置信任库签发中间证书完整性服务器需在TLS握手时发送全部中间证书不含根第四章OAuth2.0认证网关集成4.1 OAuth2.0授权码模式对接Keycloak/OpenID Connect Provider集成与PKCE增强实践PKCE挑战生成与验证流程const codeVerifier crypto.randomUUID().replace(/-/g, ); const codeChallenge await crypto.subtle.digest(SHA-256, new TextEncoder().encode(codeVerifier)); const codeChallengeB64 btoa(String.fromCharCode(...new Uint8Array(codeChallenge))) .replace(/\/g, -).replace(/\//g, _).replace(//g, ); // RFC 7636 Base64URL encoding该代码生成符合RFC 7636的S256 PKCE挑战值。codeVerifier为高熵随机字符串codeChallenge经SHA-256哈希后转为Base64URL编码用于防止授权码拦截攻击。Keycloak关键配置项配置项推荐值说明Valid Redirect URIshttps://app.example.com/callback必须精确匹配客户端回调地址Access Typeconfidential启用客户端密钥校验Standard Flow EnabledON启用授权码模式安全增强要点始终启用PKCE即使在非公共客户端中防御授权码重放设置code_challenge_methodS256禁用弱哈希方法plain使用response_modequery确保参数完整性校验4.2 JWT令牌解析与上下文注入NGINX Lua模块解析claims并透传用户身份至后端服务JWT解析核心流程NGINX通过lua-resty-jwt库在access_by_lua_block中完成校验与解析避免将未认证请求转发至上游。access_by_lua_block { local jwt_obj require(resty.jwt) local jwt jwt_obj:new() local token ngx.req.get_headers()[Authorization] local verified, err jwt:verify_jwt_obj(token) if not verified then ngx.exit(401) end -- 提取sub、roles等claim ngx.var.user_id jwt.payload.sub ngx.var.user_roles cjson.encode(jwt.payload.roles or {}) }该代码块执行JWT签名验证、过期检查及payload解码jwt.payload.sub映射为NGINX变量user_id供后续阶段使用。透传策略对比方式安全性后端兼容性HTTP Header注入高仅透传必要字段通用无需修改鉴权逻辑Query参数附加低易泄露、可篡改弱需额外解析关键变量注入清单ngx.var.user_id唯一用户标识subclaimngx.var.user_scopes权限范围数组scopeclaimngx.var.auth_time认证时间戳auth_timeclaim4.3 细粒度RBAC策略实施基于scope声明的API级权限控制与审计日志埋点scope声明与API路由绑定通过OpenID Connect标准中的scope字段动态映射权限边界每个API端点声明最小必要scope如api:users:read、api:orders:write:own避免粗粒度角色泛化。// Gin中间件校验scope func ScopeMiddleware(requiredScope string) gin.HandlerFunc { return func(c *gin.Context) { scopes : c.GetString(auth_scopes) // 从JWT claims提取 if !strings.Contains(scopes, requiredScope) { c.AbortWithStatusJSON(403, gin.H{error: insufficient scope}) return } c.Next() } }该中间件在请求上下文中校验JWT中携带的scope字符串是否包含当前API所需的权限标识auth_scopes为预解析的空格分隔字符串支持高效子串匹配。审计日志结构化埋点字段说明event_idUUIDv4唯一标识每次鉴权事件scope_used实际匹配的scope值如api:reports:exportresource_pathHTTP路径如/v1/reports/export4.4 认证会话生命周期管理Refresh Token轮转、短期Access Token颁发与吊销接口集成Refresh Token安全轮转策略每次使用Refresh Token获取新Access Token时旧Refresh Token应立即失效并签发全新Token含新jti与短有效期func issueRotatedTokens(refresh string) (newAT, newRT string, err error) { if !validateAndInvalidate(refresh) { // 验证并原子化吊销 return , , errors.New(invalid or revoked refresh token) } newAT jwt.Sign(accessClaims{Exp: time.Now().Add(15 * time.Minute)}) newRT jwt.Sign(refreshClaims{Exp: time.Now().Add(7 * 24 * time.Hour), JTI: uuid.New()}) return newAT, newRT, nil }该函数确保Refresh Token单次使用、不可重放并通过JTI实现精确吊销追踪。令牌状态同步表后端需维护轻量级吊销记录支持毫秒级查询字段类型说明jtiVARCHAR(128)Refresh Token唯一标识revoked_atTIMESTAMP吊销时间戳UTCexpires_atTIMESTAMP原始过期时间用于GC第五章合规性验证与生产就绪清单自动化合规扫描集成在CI/CD流水线中嵌入OpenSCAP与Trivy实现容器镜像与Kubernetes清单的实时策略校验。以下为GitLab CI中关键作业片段scan-compliance: image: docker:stable script: - apk add --no-cache openscap-utils - oscap xccdf eval --profile cis-k8s --report report.html k8s-cis-benchmark.xml核心生产就绪检查项所有Pod必须配置resource requests/limitsCPU/MemorySecrets不得以明文形式存在于ConfigMap或Helm values.yaml中Ingress资源必须启用TLS并引用有效Certificate资源StatefulSet需配置podManagementPolicy: OrderedReady且启用volumeClaimTemplates持久化校验权限最小化验证表组件预期RBAC scope实测发现风险metrics-servercluster-wide read-only on nodes/metrics误配为cluster-admin绑定已修复log-forwardernamespaced read on pods/logs越权访问default命名空间外日志拒绝服务网格就绪确认Envoy Sidecar注入验证流程检查namespace是否启用istio-injectionenabled标签验证Deployment spec.template.metadata.annotations包含sidecar.istio.io/inject: true通过kubectl get pod -o jsonpath{.spec.containers[*].name} 确认envoy容器存在

相关文章:

DeepSeek模型服务化终极方案:Docker + NGINX + TLS + OAuth2.0认证(金融级合规配置手册)

更多请点击: https://intelliparadigm.com 第一章:DeepSeek模型服务化终极方案概览 将 DeepSeek 系列大模型(如 DeepSeek-V2、DeepSeek-Coder)高效部署为生产级 API 服务,需兼顾低延迟推理、弹性扩缩容、细粒度权限控…...

FDS火灾模拟完整指南:从零开始掌握建筑消防安全分析

FDS火灾模拟完整指南:从零开始掌握建筑消防安全分析 【免费下载链接】fds Fire Dynamics Simulator 项目地址: https://gitcode.com/gh_mirrors/fd/fds 你是否曾想知道火灾发生时,烟雾如何在建筑中扩散?或者如何科学评估人员疏散的安全…...

为什么30+文档平台的一键下载神器让技术爱好者疯狂?因为你能看到多少,就能下载多少

为什么30文档平台的一键下载神器让技术爱好者疯狂?因为你能看到多少,就能下载多少 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才…...

Perplexity APA格式生成漏洞深度审计(2024实测版):92.6%用户忽略的DOI与作者名缩写陷阱

更多请点击: https://intelliparadigm.com 第一章:Perplexity APA格式生成漏洞深度审计(2024实测版):92.6%用户忽略的DOI与作者名缩写陷阱 APA第7版核心校验失效现象 Perplexity 在2024年Q2版本中仍沿用过时的APA引用…...

如何用BallonsTranslator在15分钟内完成专业级漫画翻译?终极免费解决方案

如何用BallonsTranslator在15分钟内完成专业级漫画翻译?终极免费解决方案 【免费下载链接】BallonsTranslator 深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning …...

高性能虚拟显示器驱动架构解析:Parsec VDD核心技术实现与优化

高性能虚拟显示器驱动架构解析:Parsec VDD核心技术实现与优化 【免费下载链接】parsec-vdd ✨ Perfect virtual display for game streaming 项目地址: https://gitcode.com/gh_mirrors/pa/parsec-vdd Parsec Virtual Display Driver (VDD) 是基于Windows Id…...

5分钟快速上手:ZenTimings终极AMD内存监控工具完全指南

5分钟快速上手:ZenTimings终极AMD内存监控工具完全指南 【免费下载链接】ZenTimings 项目地址: https://gitcode.com/gh_mirrors/ze/ZenTimings ZenTimings是一款专门为AMD Ryzen平台设计的专业内存时序监控软件,能够实时显示内存的关键时序参数…...

3步高效解决方案:Calibre电子书元数据自动化管理

3步高效解决方案:Calibre电子书元数据自动化管理 【免费下载链接】calibre-douban Calibre new douban metadata source plugin. Douban no longer provides book APIs to the public, so it can only use web crawling to obtain data. This is a calibre Douban p…...

Mysql JOIN 的物理执行流程

一、关联字段在两个表中都没有索引 当两个参与 join 的表在关联字段上都没有索引时,MySQL 无法使用高效的索引树搜索,而是被迫采用 Block Nested-Loop Join (BNL) 算法。 为了清晰讲解物理流程,我们设定如下 SQL 示例 : 表 t1t1t1…...

Hermes Agent用户如何快速接入Taotoken的多模型服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Hermes Agent用户如何快速接入Taotoken的多模型服务 基础教程类,面向使用Hermes Agent的开发者,详细说明在…...

9.2%年复合增长!2032年全球电子束曝光系统市场冲刺36.13亿美元

电子束曝光系统(EBL)是一种依托电子束照射光敏材料实现微细图案加工的高精度设备,核心原理是在真空环境中将电子束精准聚焦于待加工表面,刻写纳米级精细图案,凭借极高的分辨率与操作灵活性,广泛应用于半导体…...

2026届必备的六大AI写作神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 目前学术环境情形下,对于知网文献里生成性AI创作遗留痕迹的合规优化事宜&#xf…...

乙烯基甲苯市场深度洞察:年复合增长率(CAGR)为5.7%(2026-2032)

乙烯基甲苯(VT)是乙烯基甲苯单体(间位与对位混合物),分子式C9H10,是一种低挥发、低毒性的环保型单体,可作为苯乙烯的替代物,用于制备不饱和树脂、涂料、绝缘漆及特种橡胶等。QYResea…...

MySQL 8.0隐藏特性实战:隐藏列、隐藏索引与生成主键的应用与避坑

1. 项目概述:深入挖掘MySQL 8.0的“隐身术”干了这么多年数据库运维和开发,我见过太多因为表结构变更而引发的线上事故。开发同学在代码里写个SELECT *,当时是省事了,等到哪天要加个字段,特别是往中间插一列&#xff0…...

LeetCode 单词搜索II题解

LeetCode 单词搜索II题解 题目描述 给定一个二维字符网格和一个字符串数组,找出所有在网格中出现的单词。 示例: 输入:board [["o","a","a","n"],["e","t","a",&quo…...

告别ST-LINK Utility:一文详解STM32CubeProgrammer在Win10下的新特性与高效用法

STM32CubeProgrammer全面指南:解锁Win10下高效开发的六大核心能力 在嵌入式开发领域,工具链的每一次迭代都意味着效率的跃升。当STMicroelectronics宣布STM32CubeProgrammer正式取代经典的ST-LINK Utility时,许多开发者还在犹豫是否要迁移到这…...

微信网页版访问技术方案:wechat-need-web扩展的智能实现

微信网页版访问技术方案:wechat-need-web扩展的智能实现 【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 在当今数字化办公环境中&#xff…...

研一新生必看!文献管理软件到底要不要用?Scholaread vs Zotero新手友好度对比

刚进入研究生阶段,你可能会听到师兄师姐反复强调"一定要用文献管理软件",但心里却充满疑问:我就几十篇文献,真的需要专门的工具吗?市面上那么多软件,Zotero、EndNote、Scholaread…到底哪个适合零基础的我? **研一新生面临的最大困境:**电脑里200篇PDF文件散落在下…...

别再装Hash工具了!用7-Zip v21.07一键校验下载文件,保姆级图文教程

7-Zip隐藏技能:用右键菜单3秒完成文件校验的终极指南 当你从网上下载了一个重要文件,如何确认它没有被篡改或损坏?大多数人的第一反应是寻找专门的哈希校验工具,但你可能不知道,电脑里早已安装的7-Zip就能完美解决这个…...

瑞德克斯平台:全球金融市场的可靠选择

瑞德克斯平台:全球金融市场的可靠选择在评估金融服务平台时,监管合规、技术能力、客户服务等维度构成了重要的观察方向。瑞德克斯平台作为业内较为活跃的服务机构,其在这些方面的实践具有一定的参考价值。本文将围绕评测视角,对其…...

终极指南:如何用Tinke轻松提取和修改任天堂NDS游戏资源

终极指南:如何用Tinke轻松提取和修改任天堂NDS游戏资源 【免费下载链接】tinke Viewer and editor for files of NDS games 项目地址: https://gitcode.com/gh_mirrors/ti/tinke 还在为无法访问NDS游戏内部资源而烦恼吗?Tinke是一款免费开源的NDS…...

性能测试工程师的春天来了?深度解析2026年就业趋势

一、冰火两重天:测试就业市场的结构性裂变 2026年的技术招聘市场,回暖与寒意并存。脉脉高聘人才智库报告显示,春招新经济行业新发岗位量同比增长22.6%,AI领域岗位量更是暴涨8.7倍。然而,这轮红利并非雨露均沾。传统功…...

国央企备考求职精灵和粉笔APP哪个靠谱

每年国央企和事业单位招聘季,数百万求职者竞争激烈。面对庞大的招录名额、繁琐的笔试流程,选择合适的备考工具至关重要。市场上,粉笔是公考领域的老牌选手,而求职精灵 Genielink 作为 AI 原生工具也在改变着求职赛道格局。下面就对…...

如何快速部署微信网页版浏览器扩展:终极完整指南

如何快速部署微信网页版浏览器扩展:终极完整指南 【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 还在为无法在浏览器中直接使用微信而烦恼…...

乔治亚理工等联手:让AI大模型“自学成才“,不再依赖更强大的老师

这项由佐治亚理工学院、加州大学洛杉矶分校、卡内基梅隆大学以及威廉与玛丽学院联合开展的研究,以预印本形式发布于2026年5月,论文编号为arXiv:2605.06597。感兴趣的读者可通过该编号在arXiv平台查阅完整论文。 一、问题从哪里来:大模型的&qu…...

终极指南:如何让Photoshop支持AVIF格式并实现图像体积减半

终极指南:如何让Photoshop支持AVIF格式并实现图像体积减半 【免费下载链接】avif-format An AV1 Image (AVIF) file format plug-in for Adobe Photoshop 项目地址: https://gitcode.com/gh_mirrors/avi/avif-format 想让你的Photoshop支持最新的AVIF图像格式…...

谷歌与新加坡国立大学联手打造“视频导演AI“

这项由谷歌云AI研究院与新加坡国立大学联合完成的研究,于2026年5月以预印本形式公开发布,论文编号为arXiv:2605.06924v1。有兴趣深入阅读原文的读者可通过该编号在arXiv平台检索到完整论文。**研究背景:AI拍视频为何总是"记性不好"…...

LangChain 第一课:核心架构与组件(前端友好版)

一、先一句话搞懂:LangChain 到底是什么?LangChain 是一个大模型应用开发框架,专门帮你把「大模型、RAG、Agent、工具调用」这些功能,像搭积木一样快速拼起来,不用从零写复杂逻辑。前端类比秒懂你写 Vue 要用到 Vue、V…...

银行AI大模型应用火爆!小白也能学会的数智转型秘籍,速收藏!

文章阐述了银行业在金融行业AI转型中的领先地位,AI大模型已从试点探索进入规模化落地阶段。银行采用自研与合作模式发展大模型,应用场景覆盖智能客服、信贷风控、运营自动化、财富管理及合规审计等核心业务。文章通过多个银行案例展示了AI大模型在降本增…...

ES数据库安装

ES数据库安装 # 拉取 Elasticsearch 镜像 docker pull public-docker-virtual.artsz.zte.com.cn/elasticsearch:8.8.2创建宿主机挂载目录# 统一放在 /data/es,便于管理mkdir -p /mnt/data/es/{data,config,logs,plugins}# 权限必须给足(否则容器内用户无…...