科技云报道:不卷自研大模型,金山办公如何创新生成式AI?
科技云报道原创。
过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。
“重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落地也就变得遥遥无期。
今年年初金山办公宣布All in AI,将LLM能力全面引入产品,发布基于大语言模型的智能办公助手WPS AI。
相较于大模型玩家普遍把“重做一遍”视为创新路径时,WPS AI带来了另一种大模型创新方法论——与其“重做一遍”,不如去“重新发现”。
据悉,金山办公选择在大模型应用侧下功夫,WPS国内版与WPS海外版同时推进WPS AI研发落地,让每个模型都能充分发挥自身的优势。
正因如此,WPS AI甚至比微软的Microsoft 365 Copilot还快了一步,成了国内第一个将大语言模型(LLM)应用在办公软件领域,并真正交付了可用产品的公司。
自今年4月18日首次亮相以来,WPS AI在短短50天里对多个核心办公场景进行了赋能,用“金山速度”不断刷新着生成式AI的应用边界。
如此惊人的进化速度,WPS AI是如何实现的?
生成式AI的背后是大模型服务的支撑
如果你是WPS的用户,最近可能会观察到一些变化:金山文档「智能文档」的新功能已经能够帮你提供新闻稿、广告文案、教学教案、工作周报等种种文件的起草、改写、总结、润色、翻译、续写等功能。
除此之外,它还可以帮你一键生成幻灯片、一键分析Excel数据、翻译总结文档,自己写日报等等。
通过AI大模型,WPS构建出一个更高效、快捷释放场景能力的智能交互系统,去解决用户多元且碎片化的办公需求。
不可否认,生成式AI本身的能力非常惊艳,但是生成式AI远远不只是以模型和AI这么简单。
基础模型只是在海面上的冰山一角,为了支持好这个冰山一角,冰川的底部有多个服务来支撑,比如说加速芯片、存储优化、数据库、大数据分析、安全服务等等。
不仅如此,支撑生成式AI的每一种技术和基础设施环境,都在发生着快速变化。
以基础模型为例,其发展是按照月甚至按照天的速度来迭的。2019年,最大的预训练模型是3.3亿个参数,但到了2023年,大模型最大的参数已经超过了五千亿个,也就是说短短四年,整个参数的迭代超过了1600倍。
同时,国内外都掀起了“百模大战”,从最开始出现的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,还包括国内正在自研的基础模型如百川、ChatGLM等,每个模型都具备着他们自己独有的场景和优势。
正如亚马逊云科技的CEO Adam Selipsky所说,没有一个基础模型可以适用于所有的业务场景,用户会根据自己的场景去选择最适合自己的基础模型。
这一点放在金山办公身上同样适用。
金山办公AI研发总监刘强在采访中表示,几乎很少有一个模型能涵盖全部的能力,通常一个功能需要多个模型协作,需要考虑不同模型之间的调用方式不一样。
但Amazon Bedrock的模型管理,能把不同大模型底层的API做成透明统一的,这减轻了很大的工作量。
金山办公AI研发总监 刘强
刘强提到的Amazon Bedrock,是亚马逊云科技今年4月发布的一项生成式AI重要产品。
它支持来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等领先人工智能公司的高性能基础模型,并可以轻松安全地进行自定义模型训练。
作为国内第一批Amazon Bedrock的预览版用户,金山办公可以在轻松使用这些高性能基础模型的同时,也能够使用自己的数据构建差异化的应用程序。
与此同时,金山办公通过使用机器学习平台Amazon SageMaker,正在帮助算法科学家快速进行场景实验和算法迭代。
Amazon SageMaker不仅可以避免算法科学家从头搭建模型,还可以通过Amazon SageMaker JumpStart功能帮助客户快速构建和部署模型,从而尝试多种开源模型。
可以说,有了这类大模型管理作为基础服务作为支撑,生成式AI的应用创新事倍功半。
生成式AI要效率也要安全合规
随着大模型的发展,数据的合规性和安全性成为亟待解决的问题。
在生成式AI领域中,数据的获取、加工及利用的方式决定了模型的性能和准确性。数据的非法泄漏、被恶意篡改,可能导致训练出的模型有误导性;非法获取或使用未经授权的数据,不仅违法,还可能使得模型偏离了其原本的目的。
前段时间,OpenAI被指控训练ChatGPT时使用从互联网上抓取的数据,大规模侵犯了无数人的版权和隐私。目前全球各国对于企业使用大模型的数据安全要求已日益提升。
不少企业在构建大模型时也普遍要求私有化部署,即在加密环境中使用私有数据训练模型,以控制相关数据和模型的安全风险。
金山办公AI研发总监刘强表示,WPS非常重视数据安全,有专业的团队及合作伙伴共同打造完善的数据安全体系,在各个国家和地区可以有效的保障用户隐私。
正因对安全合规的重视,金山办公作为一家中国企业得以顺利走向全球。截至2022年底,WPS在海外已拥有超过1亿活跃用户,WPS Office累计获得近4亿次安装。
从与金山办公合作的亚马逊云科技大模型服务来看,Amazon Bedrock在安全合规方面也助力颇多。
据亚马逊云科技解决方案架构师介绍,在开发之初就考虑到安全性和隐私保护,帮助客户保护敏感数据:
首先,Amazon Bedrock从服务设计层面就确保了客户的数据以及客户相关的信息不会被用于进一步训练模型。所有的客户数据都是经过加密的,且只有客户能够访问。
其次,客户可以使用Amazon PrivateLink,在Amazon Bedrock与虚拟私有网络(VPC)之间建立专门的安全连接,确保任何数据传输都不会暴露在公共网络。
最后,对于存在高度监管需求的客户,Amazon Bedrock符合 HIPAA(《健康保险流通与责任法案》)要求,并且可以在 GDPR(欧盟《通用数据保护条例》)合规标准下使用,让更多的客户从生成式AI中获益。
不难发现,金山办公也可以利用它有效提升安全合规工作的效率,并确保客户数据的安全性,让金山办公的实力得以在海外充分释放。
构建生成式AI需要高性价比的基础设施
正如前文所说,开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,需要各种技术和工具来解决挑战,而高性价比的基础设施正是其强有力的支撑。
早在生成式AI创新之前,金山办公就在积极探寻如何利用AI/ML技术为业务赋能。在数据存储、现代化应用开发、AI/ML、芯片等层面,金山办公与亚马逊云科技都有深度合作。
例如,WPS Office通过使用Amazon S3高效低成本地实现了PB级海量数据存储。
通过Amazon S3的智能分层功能,在存储方面获得了40%以上的成本优化效果;利用亚马逊云科技在美国、日本和印度的节点,将终端用户的响应延迟从日常大于1秒减少稳定至500毫秒以下。
在构建精细化运营方面,金山办公基于机器学习平台Amazon SageMaker服务构建了从用户识别、用户转换到流失用户挽回的一整套用户精细化运营路径,通过人工智能预测用户购买,增强用户转化率。
除此之外,金山办公还在尝试利用亚马逊提供的GPU机型和为生成式AI而打造的专门构建的加速芯片(Amazon Inferentia和Amazon Trainium),为海外业务部署开源模型方案,并且尝试利用加速芯片来降低成本。
总的来说,避免重复开发大模型,专注于模型的开发效率、调优以及对底层基础设施的高效利用,金山办公为AI应用带来了新的研发方式,也为AI应用开发者值得借鉴的思路。
未来,金山办公还将以AIGC(内容创作)、Copilot(智慧助理)和Insight(知识洞察)三个战略方向为核心,掀起办公交互方式的新一轮变革。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:

科技云报道:不卷自研大模型,金山办公如何创新生成式AI?
科技云报道原创。 过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。 “重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落…...

3BHE022291R0101 PCD230A 专注于制造卓越人工智能
3BHE022291R0101 PCD230A 专注于制造卓越人工智能 BISTelligence是BISTel的一个分支,BISTel是为全球半导体和FPD制造商提供工程和软件自动化产品的领先供应商。半导体产品集团上个月被卖给了新思科技。在出售给Synopsys之后,Bisetlliegnce成立了两个部门…...

小程序 scroll-view 性能问题
先说使用场景,一次加载很多数据造成小程序卡顿的问题 ,找了好多都没有好的解决办法,要么太过复杂,然后研究了两天通过简单的办法实现,先根据数量把高度撑开,然后根据滚动位置渲染指定的数据就可以了&#x…...

【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG
【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG 文章目录 导入库初始化PWM开启PWMPWM硬件BUG硬件BUG复现原因附录:列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结 py打包 导入库 from misc import PWM_V2或者 from misc import PWM但我觉得…...

OverDraw的优化
在uwa搜寻到的一些overDraw优化方法 透明图片避免绘制来减少overDraw 像一些alpha0的图片,根本没有必要参与绘制。所以留一些可以参与Raycast,但是不绘制 using UnityEngine; using System.Collections;namespace UnityEngine.UI {public class Empty…...

数据结构—字符串
文章目录 7.字符串(1).字符串及其ADT#1.基本概念#2.ADT (2).字符串的基本操作#1.求子串substr#2.插入字符串insert#3.其他操作 (3).字符串的模式匹配#1.简单匹配(Brute-Force方法)#2.KMP算法I.kmp_match()II.getNext() #3.还有更多 小结附录:我自己写的string 7.字符…...

inne所属公司抢注“童年时光”商标仍被冻结
根据中国商标网查询,国家知识产权局已于2023年3月10日裁定,被告inne所属的南京童年时光生物技术有限公司注册的“童年时光”商标无效。随着这起保健品行业品牌资产争夺事件的发酵,更多的细节得到披露,至此,一个从“代理…...

20231106-前端学习加载和视频球特效
加载效果 代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>加载效果</title><!-- 最新…...

Arrays.asList() 和 List.of() 的列表之争
1. 概述 有时在Java中,为了方便,我们需要创建一个小列表或将数组转换为列表。Java 为此提供了一些辅助方法。 在本文中,我们将比较初始化小型临时数组的两种主要方法:List.of()和 Array.asList()。 2. Arrays.asList() Java 自…...

基于51单片机的停车场管理系统仿真电路设计
**单片机设计介绍,基于51单片机的停车场管理系统仿真电路设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 停车场管理系统仿真电路设计介绍 停车场管理系统主要用于自动化管理和控制停车场,以提高停车…...

APIView单一资源的查看更新删除
APIView单一资源的查看更新删除 一、构建路由 re_path("author/(/d)",AuthorDetailView.as_view)), 二、视图类 在views.py中添加AuthorDetailView类 class AuthorDetailView(APIView):def get(self, request, pk):author Author.objects.get(pkpk)serializer A…...

UML--类图的表示
1. 类的表示 1.1 访问属性 : public -: private #: protected 1.2 接口与抽象类 斜体 表示抽象类和抽象方法 <<Interface>> 类表示接口 1.3 类图示意 Mclass- val: int getVal(): int 2. 类关系 2.1 实现关系 空心三角形和虚线组成 B实现A,则三角形尖尖朝…...

JVM字节码文件浅谈
文章目录 版权声明java虚拟机的组成字节码文件打开字节码文件的姿势字节码文件的组成魔数(基本信息)主副版本号(基本信息)主版本号不兼容的错误解决方法基本信息常量池方法 字节码文件的常用工具javap -v命令jclasslib插件阿里art…...

DBever 连接trino时区问题 The datetime zone id ‘GMT+08:00‘ is not recognised
DBever连接trino 测试连接成功,但是执行sql报时区不对、如果你默认使用的是大于jdk8的版本 会存在这个问题,因为jdk版本 jdk8 和jdk17 版本默认时区是不同的 trino官网明确说明了时区默认跟jdk走 解决方案 可以先行查看JDK本地时区库版本,执…...

xlua源码分析(二)lua Call C#的无wrap实现
xlua源码分析(二)lua Call C#的无wrap实现 上一节我们主要分析了xlua中C# Call lua的实现思路,本节我们将根据Examples 03_UIEvent,分析lua Call C#的底层实现。例子场景里有一个简单的UI面板,面板中包含一个input fie…...

MySql优化经验分享
一条sql的具体执行过程 连接 我们怎么查看MySQL当前有多少个连接? 可以用show status命令,模糊匹配Thread, Show global status like "Thread%" show global variables like wait timeout;—非交互式超时时间,如JDBC…...

【Linux】:使用git命令行 || 在github创建项目 || Linux第一个小程序——进度条(进阶版本)
在本章开始之前还是先给大家分享一张图片 这是C的笔试题 感兴趣的同学可以去试一试 有难度的哟 也可以直接在牛客网直接搜索这几道题目哈 好了今天我们正式进入我们的正题部分 🕖1.使用git命令行 安装git yum install git🕠2.在github创建项目 使用…...

Kotlin apply 交换两个数
代码: fun main() {var a 1var b 2a b.apply {b aprintln("$b")println("$this")}println("$a $b") }打印结果: 1 2 2 1原理分析: /*** Calls the specified function [block] with this value as its r…...

Android jetpack : Navigation 导航 路由 、 单个Activity嵌套多个Fragment的UI架构方式
Android Navigation 如何动态的更换StartDestination &&保存Fragment状态 Navigation(一)基础入门 google 官网 : Navigation 导航 路由 讨论了两年的 Navigation 保存 Fragment 状态问题居然被关闭了 Navigation是一种导航的概念,即把Activ…...

【react】在react中祖父、父亲、孙子组件层层解构其余属性props时报错children.forEach is not function
起因 报错children.forEacht is not function 分析原因 由于地址组件本身存在options,此时父组件又传递…otherProps,且解构了父级组件的otherProps,其中others解构后的属性就有options,因此产生了属性冲突,导致属性…...

P9831 [ICPC2020 Shanghai R] Gitignore
P9831 [ICPC2020 Shanghai R] Gitignore - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 只看题意翻译这道题是做不出来的,还要去看英文里面的规定(这里就不放英文了),主要问题是不要公用子文件夹。 例如: 1 / a / 2 2 / a / 3…...

LinkList集合方法(自写)
在使用以下方法时需要定义一个LinkNode类来定义变量,new一个新对象进行调用,输出时需要定义输出方法 public class ListNode {int value;ListNode next;//public ListNode(int value) {this.value value;}public String toString(){return "ListN…...

Ansible playbook自动化运维工具详解
Ansible playbook自动化运维工具详解 一、playbook的相关知识1.1、playbook 的简介1.2、playbook的 各部分组成 二、基础的playbook剧本编写实例三、 playbook的定义、引用变量3.1、基础变量的定义与引用3.2、引用fact信息中的变量 四、playbook中的when条件判断和变量循环使用…...

图像切分:将一张长图片切分为指定长宽的多张图片
1.需求 比如有一张很长的图片其大小为宽度779,高度为122552,那我想把图片切分为779乘以1280的格式。 步骤如下: 使用图像处理库(如PIL或OpenCV)加载原始图片。确定子图片的宽度和高度。计算原始图片的宽度和高度&am…...

ROS学习笔记(5):ros_control
1.ros_control简介 ros_control - ROS Wiki ros_control是为ROS提供的机器人控制包,包含一系列控制器接口、传动装置接口、控制器工具箱等,有效帮助机器人应用功能包快速落地,提高开发效率。 2.ros_control框架 ros_control总体框架: 针对…...

《008.Springboot+vue之自习室选座系统》
[火]《008.Springbootvue之自习室选座系统》 项目简介 [1]本系统涉及到的技术主要如下: 推荐环境配置:DEA jdk1.8 Maven MySQL 前后端分离; 后台:SpringBootMybatisredis; 前台:vueElementUI; [2]功能模块展示: 前端…...

道可云元宇宙每日资讯|5G数智新时代元宇宙发展论坛在厦门举办
道可云元宇宙每日简报(2023年11月6日)讯,今日元宇宙新鲜事有: 5G数智新时代元宇宙发展论坛在厦门举办 3日,由2023年中国金鸡百花电影节执委会主办、厦门电影节有限公司协办的“5G数智新时代元宇宙发展论坛暨‘中国白德…...

使用 Go 写入文件
在本教程中,我们将学习如何使用 Go 将数据写入文件。我们还将学习如何同时写入文件。 本教程有以下部分 将字符串写入文件将字节写入文件逐行将数据写入文件附加到文件同时写入文件 由于 Playground 不支持文件操作,请在本地系统中运行本教程的所有程…...

调用DeleteLocalRef的正确姿势
做安卓jni相关开发的总会在涉及到jni变量释放时怀疑人生,what? where? when? who? why? how? how much? 最近碰到一个比较奇怪的问题,有一个jni方法的耗时在随着调用次数的增加而上涨,但是没有明显的内存泄漏,经过我缜密分…...

抖音小店从0到1起店流程,实操经验分享!
我是电商珠珠 很多人在开店之后,并不知道怎么做。往往会有人跑来问我说,开店之后怎么做啊,流程方面我还不是很熟悉啊等等。 这份起店流程备好了,将来对你有用。 第一步,店铺基础设置 在店铺开好之后,不…...