科技云报道:不卷自研大模型,金山办公如何创新生成式AI?
科技云报道原创。
过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。
“重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落地也就变得遥遥无期。
今年年初金山办公宣布All in AI,将LLM能力全面引入产品,发布基于大语言模型的智能办公助手WPS AI。
相较于大模型玩家普遍把“重做一遍”视为创新路径时,WPS AI带来了另一种大模型创新方法论——与其“重做一遍”,不如去“重新发现”。

据悉,金山办公选择在大模型应用侧下功夫,WPS国内版与WPS海外版同时推进WPS AI研发落地,让每个模型都能充分发挥自身的优势。
正因如此,WPS AI甚至比微软的Microsoft 365 Copilot还快了一步,成了国内第一个将大语言模型(LLM)应用在办公软件领域,并真正交付了可用产品的公司。
自今年4月18日首次亮相以来,WPS AI在短短50天里对多个核心办公场景进行了赋能,用“金山速度”不断刷新着生成式AI的应用边界。
如此惊人的进化速度,WPS AI是如何实现的?
生成式AI的背后是大模型服务的支撑
如果你是WPS的用户,最近可能会观察到一些变化:金山文档「智能文档」的新功能已经能够帮你提供新闻稿、广告文案、教学教案、工作周报等种种文件的起草、改写、总结、润色、翻译、续写等功能。
除此之外,它还可以帮你一键生成幻灯片、一键分析Excel数据、翻译总结文档,自己写日报等等。
通过AI大模型,WPS构建出一个更高效、快捷释放场景能力的智能交互系统,去解决用户多元且碎片化的办公需求。
不可否认,生成式AI本身的能力非常惊艳,但是生成式AI远远不只是以模型和AI这么简单。
基础模型只是在海面上的冰山一角,为了支持好这个冰山一角,冰川的底部有多个服务来支撑,比如说加速芯片、存储优化、数据库、大数据分析、安全服务等等。
不仅如此,支撑生成式AI的每一种技术和基础设施环境,都在发生着快速变化。
以基础模型为例,其发展是按照月甚至按照天的速度来迭的。2019年,最大的预训练模型是3.3亿个参数,但到了2023年,大模型最大的参数已经超过了五千亿个,也就是说短短四年,整个参数的迭代超过了1600倍。
同时,国内外都掀起了“百模大战”,从最开始出现的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,还包括国内正在自研的基础模型如百川、ChatGLM等,每个模型都具备着他们自己独有的场景和优势。
正如亚马逊云科技的CEO Adam Selipsky所说,没有一个基础模型可以适用于所有的业务场景,用户会根据自己的场景去选择最适合自己的基础模型。
这一点放在金山办公身上同样适用。
金山办公AI研发总监刘强在采访中表示,几乎很少有一个模型能涵盖全部的能力,通常一个功能需要多个模型协作,需要考虑不同模型之间的调用方式不一样。
但Amazon Bedrock的模型管理,能把不同大模型底层的API做成透明统一的,这减轻了很大的工作量。

金山办公AI研发总监 刘强
刘强提到的Amazon Bedrock,是亚马逊云科技今年4月发布的一项生成式AI重要产品。
它支持来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等领先人工智能公司的高性能基础模型,并可以轻松安全地进行自定义模型训练。
作为国内第一批Amazon Bedrock的预览版用户,金山办公可以在轻松使用这些高性能基础模型的同时,也能够使用自己的数据构建差异化的应用程序。
与此同时,金山办公通过使用机器学习平台Amazon SageMaker,正在帮助算法科学家快速进行场景实验和算法迭代。
Amazon SageMaker不仅可以避免算法科学家从头搭建模型,还可以通过Amazon SageMaker JumpStart功能帮助客户快速构建和部署模型,从而尝试多种开源模型。
可以说,有了这类大模型管理作为基础服务作为支撑,生成式AI的应用创新事倍功半。
生成式AI要效率也要安全合规
随着大模型的发展,数据的合规性和安全性成为亟待解决的问题。
在生成式AI领域中,数据的获取、加工及利用的方式决定了模型的性能和准确性。数据的非法泄漏、被恶意篡改,可能导致训练出的模型有误导性;非法获取或使用未经授权的数据,不仅违法,还可能使得模型偏离了其原本的目的。
前段时间,OpenAI被指控训练ChatGPT时使用从互联网上抓取的数据,大规模侵犯了无数人的版权和隐私。目前全球各国对于企业使用大模型的数据安全要求已日益提升。
不少企业在构建大模型时也普遍要求私有化部署,即在加密环境中使用私有数据训练模型,以控制相关数据和模型的安全风险。
金山办公AI研发总监刘强表示,WPS非常重视数据安全,有专业的团队及合作伙伴共同打造完善的数据安全体系,在各个国家和地区可以有效的保障用户隐私。
正因对安全合规的重视,金山办公作为一家中国企业得以顺利走向全球。截至2022年底,WPS在海外已拥有超过1亿活跃用户,WPS Office累计获得近4亿次安装。
从与金山办公合作的亚马逊云科技大模型服务来看,Amazon Bedrock在安全合规方面也助力颇多。
据亚马逊云科技解决方案架构师介绍,在开发之初就考虑到安全性和隐私保护,帮助客户保护敏感数据:
首先,Amazon Bedrock从服务设计层面就确保了客户的数据以及客户相关的信息不会被用于进一步训练模型。所有的客户数据都是经过加密的,且只有客户能够访问。
其次,客户可以使用Amazon PrivateLink,在Amazon Bedrock与虚拟私有网络(VPC)之间建立专门的安全连接,确保任何数据传输都不会暴露在公共网络。
最后,对于存在高度监管需求的客户,Amazon Bedrock符合 HIPAA(《健康保险流通与责任法案》)要求,并且可以在 GDPR(欧盟《通用数据保护条例》)合规标准下使用,让更多的客户从生成式AI中获益。
不难发现,金山办公也可以利用它有效提升安全合规工作的效率,并确保客户数据的安全性,让金山办公的实力得以在海外充分释放。
构建生成式AI需要高性价比的基础设施
正如前文所说,开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,需要各种技术和工具来解决挑战,而高性价比的基础设施正是其强有力的支撑。
早在生成式AI创新之前,金山办公就在积极探寻如何利用AI/ML技术为业务赋能。在数据存储、现代化应用开发、AI/ML、芯片等层面,金山办公与亚马逊云科技都有深度合作。
例如,WPS Office通过使用Amazon S3高效低成本地实现了PB级海量数据存储。
通过Amazon S3的智能分层功能,在存储方面获得了40%以上的成本优化效果;利用亚马逊云科技在美国、日本和印度的节点,将终端用户的响应延迟从日常大于1秒减少稳定至500毫秒以下。
在构建精细化运营方面,金山办公基于机器学习平台Amazon SageMaker服务构建了从用户识别、用户转换到流失用户挽回的一整套用户精细化运营路径,通过人工智能预测用户购买,增强用户转化率。
除此之外,金山办公还在尝试利用亚马逊提供的GPU机型和为生成式AI而打造的专门构建的加速芯片(Amazon Inferentia和Amazon Trainium),为海外业务部署开源模型方案,并且尝试利用加速芯片来降低成本。
总的来说,避免重复开发大模型,专注于模型的开发效率、调优以及对底层基础设施的高效利用,金山办公为AI应用带来了新的研发方式,也为AI应用开发者值得借鉴的思路。
未来,金山办公还将以AIGC(内容创作)、Copilot(智慧助理)和Insight(知识洞察)三个战略方向为核心,掀起办公交互方式的新一轮变革。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:
科技云报道:不卷自研大模型,金山办公如何创新生成式AI?
科技云报道原创。 过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。 “重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落…...
3BHE022291R0101 PCD230A 专注于制造卓越人工智能
3BHE022291R0101 PCD230A 专注于制造卓越人工智能 BISTelligence是BISTel的一个分支,BISTel是为全球半导体和FPD制造商提供工程和软件自动化产品的领先供应商。半导体产品集团上个月被卖给了新思科技。在出售给Synopsys之后,Bisetlliegnce成立了两个部门…...
小程序 scroll-view 性能问题
先说使用场景,一次加载很多数据造成小程序卡顿的问题 ,找了好多都没有好的解决办法,要么太过复杂,然后研究了两天通过简单的办法实现,先根据数量把高度撑开,然后根据滚动位置渲染指定的数据就可以了&#x…...
【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG
【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG 文章目录 导入库初始化PWM开启PWMPWM硬件BUG硬件BUG复现原因附录:列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结 py打包 导入库 from misc import PWM_V2或者 from misc import PWM但我觉得…...
OverDraw的优化
在uwa搜寻到的一些overDraw优化方法 透明图片避免绘制来减少overDraw 像一些alpha0的图片,根本没有必要参与绘制。所以留一些可以参与Raycast,但是不绘制 using UnityEngine; using System.Collections;namespace UnityEngine.UI {public class Empty…...
数据结构—字符串
文章目录 7.字符串(1).字符串及其ADT#1.基本概念#2.ADT (2).字符串的基本操作#1.求子串substr#2.插入字符串insert#3.其他操作 (3).字符串的模式匹配#1.简单匹配(Brute-Force方法)#2.KMP算法I.kmp_match()II.getNext() #3.还有更多 小结附录:我自己写的string 7.字符…...
inne所属公司抢注“童年时光”商标仍被冻结
根据中国商标网查询,国家知识产权局已于2023年3月10日裁定,被告inne所属的南京童年时光生物技术有限公司注册的“童年时光”商标无效。随着这起保健品行业品牌资产争夺事件的发酵,更多的细节得到披露,至此,一个从“代理…...
20231106-前端学习加载和视频球特效
加载效果 代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>加载效果</title><!-- 最新…...
Arrays.asList() 和 List.of() 的列表之争
1. 概述 有时在Java中,为了方便,我们需要创建一个小列表或将数组转换为列表。Java 为此提供了一些辅助方法。 在本文中,我们将比较初始化小型临时数组的两种主要方法:List.of()和 Array.asList()。 2. Arrays.asList() Java 自…...
基于51单片机的停车场管理系统仿真电路设计
**单片机设计介绍,基于51单片机的停车场管理系统仿真电路设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 停车场管理系统仿真电路设计介绍 停车场管理系统主要用于自动化管理和控制停车场,以提高停车…...
APIView单一资源的查看更新删除
APIView单一资源的查看更新删除 一、构建路由 re_path("author/(/d)",AuthorDetailView.as_view)), 二、视图类 在views.py中添加AuthorDetailView类 class AuthorDetailView(APIView):def get(self, request, pk):author Author.objects.get(pkpk)serializer A…...
UML--类图的表示
1. 类的表示 1.1 访问属性 : public -: private #: protected 1.2 接口与抽象类 斜体 表示抽象类和抽象方法 <<Interface>> 类表示接口 1.3 类图示意 Mclass- val: int getVal(): int 2. 类关系 2.1 实现关系 空心三角形和虚线组成 B实现A,则三角形尖尖朝…...
JVM字节码文件浅谈
文章目录 版权声明java虚拟机的组成字节码文件打开字节码文件的姿势字节码文件的组成魔数(基本信息)主副版本号(基本信息)主版本号不兼容的错误解决方法基本信息常量池方法 字节码文件的常用工具javap -v命令jclasslib插件阿里art…...
DBever 连接trino时区问题 The datetime zone id ‘GMT+08:00‘ is not recognised
DBever连接trino 测试连接成功,但是执行sql报时区不对、如果你默认使用的是大于jdk8的版本 会存在这个问题,因为jdk版本 jdk8 和jdk17 版本默认时区是不同的 trino官网明确说明了时区默认跟jdk走 解决方案 可以先行查看JDK本地时区库版本,执…...
xlua源码分析(二)lua Call C#的无wrap实现
xlua源码分析(二)lua Call C#的无wrap实现 上一节我们主要分析了xlua中C# Call lua的实现思路,本节我们将根据Examples 03_UIEvent,分析lua Call C#的底层实现。例子场景里有一个简单的UI面板,面板中包含一个input fie…...
MySql优化经验分享
一条sql的具体执行过程 连接 我们怎么查看MySQL当前有多少个连接? 可以用show status命令,模糊匹配Thread, Show global status like "Thread%" show global variables like wait timeout;—非交互式超时时间,如JDBC…...
【Linux】:使用git命令行 || 在github创建项目 || Linux第一个小程序——进度条(进阶版本)
在本章开始之前还是先给大家分享一张图片 这是C的笔试题 感兴趣的同学可以去试一试 有难度的哟 也可以直接在牛客网直接搜索这几道题目哈 好了今天我们正式进入我们的正题部分 🕖1.使用git命令行 安装git yum install git🕠2.在github创建项目 使用…...
Kotlin apply 交换两个数
代码: fun main() {var a 1var b 2a b.apply {b aprintln("$b")println("$this")}println("$a $b") }打印结果: 1 2 2 1原理分析: /*** Calls the specified function [block] with this value as its r…...
Android jetpack : Navigation 导航 路由 、 单个Activity嵌套多个Fragment的UI架构方式
Android Navigation 如何动态的更换StartDestination &&保存Fragment状态 Navigation(一)基础入门 google 官网 : Navigation 导航 路由 讨论了两年的 Navigation 保存 Fragment 状态问题居然被关闭了 Navigation是一种导航的概念,即把Activ…...
【react】在react中祖父、父亲、孙子组件层层解构其余属性props时报错children.forEach is not function
起因 报错children.forEacht is not function 分析原因 由于地址组件本身存在options,此时父组件又传递…otherProps,且解构了父级组件的otherProps,其中others解构后的属性就有options,因此产生了属性冲突,导致属性…...
龙虎榜——20250610
上证指数放量收阴线,个股多数下跌,盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型,指数短线有调整的需求,大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的:御银股份、雄帝科技 驱动…...
盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来
一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...
基于Flask实现的医疗保险欺诈识别监测模型
基于Flask实现的医疗保险欺诈识别监测模型 项目截图 项目简介 社会医疗保险是国家通过立法形式强制实施,由雇主和个人按一定比例缴纳保险费,建立社会医疗保险基金,支付雇员医疗费用的一种医疗保险制度, 它是促进社会文明和进步的…...
React19源码系列之 事件插件系统
事件类别 事件类型 定义 文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...
SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现
摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...
CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...
DeepSeek 技术赋能无人农场协同作业:用 AI 重构农田管理 “神经网”
目录 一、引言二、DeepSeek 技术大揭秘2.1 核心架构解析2.2 关键技术剖析 三、智能农业无人农场协同作业现状3.1 发展现状概述3.2 协同作业模式介绍 四、DeepSeek 的 “农场奇妙游”4.1 数据处理与分析4.2 作物生长监测与预测4.3 病虫害防治4.4 农机协同作业调度 五、实际案例大…...
Android第十三次面试总结(四大 组件基础)
Activity生命周期和四大启动模式详解 一、Activity 生命周期 Activity 的生命周期由一系列回调方法组成,用于管理其创建、可见性、焦点和销毁过程。以下是核心方法及其调用时机: onCreate() 调用时机:Activity 首次创建时调用。…...
浪潮交换机配置track检测实现高速公路收费网络主备切换NQA
浪潮交换机track配置 项目背景高速网络拓扑网络情况分析通信线路收费网络路由 收费汇聚交换机相应配置收费汇聚track配置 项目背景 在实施省内一条高速公路时遇到的需求,本次涉及的主要是收费汇聚交换机的配置,浪潮网络设备在高速项目很少,通…...
【分享】推荐一些办公小工具
1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由:大部分的转换软件需要收费,要么功能不齐全,而开会员又用不了几次浪费钱,借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...
