当前位置: 首页 > news >正文

科技云报道:不卷自研大模型,金山办公如何创新生成式AI?

科技云报道原创。

过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。

“重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落地也就变得遥遥无期。

今年年初金山办公宣布All in AI,将LLM能力全面引入产品,发布基于大语言模型的智能办公助手WPS AI。

相较于大模型玩家普遍把“重做一遍”视为创新路径时,WPS AI带来了另一种大模型创新方法论——与其“重做一遍”,不如去“重新发现”。
在这里插入图片描述

据悉,金山办公选择在大模型应用侧下功夫,WPS国内版与WPS海外版同时推进WPS AI研发落地,让每个模型都能充分发挥自身的优势。

正因如此,WPS AI甚至比微软的Microsoft 365 Copilot还快了一步,成了国内第一个将大语言模型(LLM)应用在办公软件领域,并真正交付了可用产品的公司。

自今年4月18日首次亮相以来,WPS AI在短短50天里对多个核心办公场景进行了赋能,用“金山速度”不断刷新着生成式AI的应用边界。

如此惊人的进化速度,WPS AI是如何实现的?

生成式AI的背后是大模型服务的支撑

如果你是WPS的用户,最近可能会观察到一些变化:金山文档「智能文档」的新功能已经能够帮你提供新闻稿、广告文案、教学教案、工作周报等种种文件的起草、改写、总结、润色、翻译、续写等功能。

除此之外,它还可以帮你一键生成幻灯片、一键分析Excel数据、翻译总结文档,自己写日报等等。

通过AI大模型,WPS构建出一个更高效、快捷释放场景能力的智能交互系统,去解决用户多元且碎片化的办公需求。

不可否认,生成式AI本身的能力非常惊艳,但是生成式AI远远不只是以模型和AI这么简单。

基础模型只是在海面上的冰山一角,为了支持好这个冰山一角,冰川的底部有多个服务来支撑,比如说加速芯片、存储优化、数据库、大数据分析、安全服务等等。

不仅如此,支撑生成式AI的每一种技术和基础设施环境,都在发生着快速变化。

以基础模型为例,其发展是按照月甚至按照天的速度来迭的。2019年,最大的预训练模型是3.3亿个参数,但到了2023年,大模型最大的参数已经超过了五千亿个,也就是说短短四年,整个参数的迭代超过了1600倍。

同时,国内外都掀起了“百模大战”,从最开始出现的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,还包括国内正在自研的基础模型如百川、ChatGLM等,每个模型都具备着他们自己独有的场景和优势。

正如亚马逊云科技的CEO Adam Selipsky所说,没有一个基础模型可以适用于所有的业务场景,用户会根据自己的场景去选择最适合自己的基础模型。

这一点放在金山办公身上同样适用。

金山办公AI研发总监刘强在采访中表示,几乎很少有一个模型能涵盖全部的能力,通常一个功能需要多个模型协作,需要考虑不同模型之间的调用方式不一样。

但Amazon Bedrock的模型管理,能把不同大模型底层的API做成透明统一的,这减轻了很大的工作量。

在这里插入图片描述
金山办公AI研发总监 刘强

刘强提到的Amazon Bedrock,是亚马逊云科技今年4月发布的一项生成式AI重要产品。

它支持来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等领先人工智能公司的高性能基础模型,并可以轻松安全地进行自定义模型训练。

作为国内第一批Amazon Bedrock的预览版用户,金山办公可以在轻松使用这些高性能基础模型的同时,也能够使用自己的数据构建差异化的应用程序。

与此同时,金山办公通过使用机器学习平台Amazon SageMaker,正在帮助算法科学家快速进行场景实验和算法迭代。

Amazon SageMaker不仅可以避免算法科学家从头搭建模型,还可以通过Amazon SageMaker JumpStart功能帮助客户快速构建和部署模型,从而尝试多种开源模型。

可以说,有了这类大模型管理作为基础服务作为支撑,生成式AI的应用创新事倍功半。

生成式AI要效率也要安全合规

随着大模型的发展,数据的合规性和安全性成为亟待解决的问题。

在生成式AI领域中,数据的获取、加工及利用的方式决定了模型的性能和准确性。数据的非法泄漏、被恶意篡改,可能导致训练出的模型有误导性;非法获取或使用未经授权的数据,不仅违法,还可能使得模型偏离了其原本的目的。

前段时间,OpenAI被指控训练ChatGPT时使用从互联网上抓取的数据,大规模侵犯了无数人的版权和隐私。目前全球各国对于企业使用大模型的数据安全要求已日益提升。

不少企业在构建大模型时也普遍要求私有化部署,即在加密环境中使用私有数据训练模型,以控制相关数据和模型的安全风险。

金山办公AI研发总监刘强表示,WPS非常重视数据安全,有专业的团队及合作伙伴共同打造完善的数据安全体系,在各个国家和地区可以有效的保障用户隐私。

正因对安全合规的重视,金山办公作为一家中国企业得以顺利走向全球。截至2022年底,WPS在海外已拥有超过1亿活跃用户,WPS Office累计获得近4亿次安装。

从与金山办公合作的亚马逊云科技大模型服务来看,Amazon Bedrock在安全合规方面也助力颇多。

据亚马逊云科技解决方案架构师介绍,在开发之初就考虑到安全性和隐私保护,帮助客户保护敏感数据:

首先,Amazon Bedrock从服务设计层面就确保了客户的数据以及客户相关的信息不会被用于进一步训练模型。所有的客户数据都是经过加密的,且只有客户能够访问。

其次,客户可以使用Amazon PrivateLink,在Amazon Bedrock与虚拟私有网络(VPC)之间建立专门的安全连接,确保任何数据传输都不会暴露在公共网络。

最后,对于存在高度监管需求的客户,Amazon Bedrock符合 HIPAA(《健康保险流通与责任法案》)要求,并且可以在 GDPR(欧盟《通用数据保护条例》)合规标准下使用,让更多的客户从生成式AI中获益。

不难发现,金山办公也可以利用它有效提升安全合规工作的效率,并确保客户数据的安全性,让金山办公的实力得以在海外充分释放。

构建生成式AI需要高性价比的基础设施

正如前文所说,开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,需要各种技术和工具来解决挑战,而高性价比的基础设施正是其强有力的支撑。

早在生成式AI创新之前,金山办公就在积极探寻如何利用AI/ML技术为业务赋能。在数据存储、现代化应用开发、AI/ML、芯片等层面,金山办公与亚马逊云科技都有深度合作。

例如,WPS Office通过使用Amazon S3高效低成本地实现了PB级海量数据存储。

通过Amazon S3的智能分层功能,在存储方面获得了40%以上的成本优化效果;利用亚马逊云科技在美国、日本和印度的节点,将终端用户的响应延迟从日常大于1秒减少稳定至500毫秒以下。

在构建精细化运营方面,金山办公基于机器学习平台Amazon SageMaker服务构建了从用户识别、用户转换到流失用户挽回的一整套用户精细化运营路径,通过人工智能预测用户购买,增强用户转化率。

除此之外,金山办公还在尝试利用亚马逊提供的GPU机型和为生成式AI而打造的专门构建的加速芯片(Amazon Inferentia和Amazon Trainium),为海外业务部署开源模型方案,并且尝试利用加速芯片来降低成本。

总的来说,避免重复开发大模型,专注于模型的开发效率、调优以及对底层基础设施的高效利用,金山办公为AI应用带来了新的研发方式,也为AI应用开发者值得借鉴的思路。

未来,金山办公还将以AIGC(内容创作)、Copilot(智慧助理)和Insight(知识洞察)三个战略方向为核心,掀起办公交互方式的新一轮变革。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

相关文章:

科技云报道:不卷自研大模型,金山办公如何创新生成式AI?

科技云报道原创。 过去大半年里,很多人对大模型的前景寄予厚望。主流观点认为,每个行业、每款产品都可以通过大模型“重做一遍”。 “重做一遍”听起来想象空间很大,但实际上多数大模型产品需要漫长的训练周期和海量资源投入,落…...

3BHE022291R0101 PCD230A 专注于制造卓越人工智能

3BHE022291R0101 PCD230A 专注于制造卓越人工智能 BISTelligence是BISTel的一个分支,BISTel是为全球半导体和FPD制造商提供工程和软件自动化产品的领先供应商。半导体产品集团上个月被卖给了新思科技。在出售给Synopsys之后,Bisetlliegnce成立了两个部门…...

小程序 scroll-view 性能问题

先说使用场景,一次加载很多数据造成小程序卡顿的问题 ,找了好多都没有好的解决办法,要么太过复杂,然后研究了两天通过简单的办法实现,先根据数量把高度撑开,然后根据滚动位置渲染指定的数据就可以了&#x…...

【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG

【移远QuecPython】EC800M物联网开发板的硬件PWM和PWM输出BUG 文章目录 导入库初始化PWM开启PWMPWM硬件BUG硬件BUG复现原因附录:列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结 py打包 导入库 from misc import PWM_V2或者 from misc import PWM但我觉得…...

OverDraw的优化

在uwa搜寻到的一些overDraw优化方法 透明图片避免绘制来减少overDraw 像一些alpha0的图片,根本没有必要参与绘制。所以留一些可以参与Raycast,但是不绘制 using UnityEngine; using System.Collections;namespace UnityEngine.UI {public class Empty…...

数据结构—字符串

文章目录 7.字符串(1).字符串及其ADT#1.基本概念#2.ADT (2).字符串的基本操作#1.求子串substr#2.插入字符串insert#3.其他操作 (3).字符串的模式匹配#1.简单匹配(Brute-Force方法)#2.KMP算法I.kmp_match()II.getNext() #3.还有更多 小结附录:我自己写的string 7.字符…...

inne所属公司抢注“童年时光”商标仍被冻结

根据中国商标网查询,国家知识产权局已于2023年3月10日裁定,被告inne所属的南京童年时光生物技术有限公司注册的“童年时光”商标无效。随着这起保健品行业品牌资产争夺事件的发酵,更多的细节得到披露,至此,一个从“代理…...

20231106-前端学习加载和视频球特效

加载效果 代码 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>加载效果</title><!-- 最新…...

Arrays.asList() 和 List.of() 的列表之争

1. 概述 有时在Java中&#xff0c;为了方便&#xff0c;我们需要创建一个小列表或将数组转换为列表。Java 为此提供了一些辅助方法。 在本文中&#xff0c;我们将比较初始化小型临时数组的两种主要方法&#xff1a;List.of()和 Array.asList()。 2. Arrays.asList() Java 自…...

基于51单片机的停车场管理系统仿真电路设计

**单片机设计介绍&#xff0c;基于51单片机的停车场管理系统仿真电路设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 停车场管理系统仿真电路设计介绍 停车场管理系统主要用于自动化管理和控制停车场&#xff0c;以提高停车…...

APIView单一资源的查看更新删除

APIView单一资源的查看更新删除 一、构建路由 re_path("author/(/d)",AuthorDetailView.as_view)), 二、视图类 在views.py中添加AuthorDetailView类 class AuthorDetailView(APIView):def get(self, request, pk):author Author.objects.get(pkpk)serializer A…...

UML--类图的表示

1. 类的表示 1.1 访问属性 : public -: private #: protected 1.2 接口与抽象类 斜体 表示抽象类和抽象方法 <<Interface>> 类表示接口 1.3 类图示意 Mclass- val: int getVal(): int 2. 类关系 2.1 实现关系 空心三角形和虚线组成 B实现A,则三角形尖尖朝…...

JVM字节码文件浅谈

文章目录 版权声明java虚拟机的组成字节码文件打开字节码文件的姿势字节码文件的组成魔数&#xff08;基本信息&#xff09;主副版本号&#xff08;基本信息&#xff09;主版本号不兼容的错误解决方法基本信息常量池方法 字节码文件的常用工具javap -v命令jclasslib插件阿里art…...

DBever 连接trino时区问题 The datetime zone id ‘GMT+08:00‘ is not recognised

DBever连接trino 测试连接成功&#xff0c;但是执行sql报时区不对、如果你默认使用的是大于jdk8的版本 会存在这个问题&#xff0c;因为jdk版本 jdk8 和jdk17 版本默认时区是不同的 trino官网明确说明了时区默认跟jdk走 解决方案 可以先行查看JDK本地时区库版本&#xff0c;执…...

xlua源码分析(二)lua Call C#的无wrap实现

xlua源码分析&#xff08;二&#xff09;lua Call C#的无wrap实现 上一节我们主要分析了xlua中C# Call lua的实现思路&#xff0c;本节我们将根据Examples 03_UIEvent&#xff0c;分析lua Call C#的底层实现。例子场景里有一个简单的UI面板&#xff0c;面板中包含一个input fie…...

MySql优化经验分享

一条sql的具体执行过程 连接 我们怎么查看MySQL当前有多少个连接&#xff1f; 可以用show status命令&#xff0c;模糊匹配Thread&#xff0c; Show global status like "Thread%" show global variables like wait timeout;—非交互式超时时间&#xff0c;如JDBC…...

【Linux】:使用git命令行 || 在github创建项目 || Linux第一个小程序——进度条(进阶版本)

在本章开始之前还是先给大家分享一张图片 这是C的笔试题 感兴趣的同学可以去试一试 有难度的哟 也可以直接在牛客网直接搜索这几道题目哈 好了今天我们正式进入我们的正题部分 &#x1f556;1.使用git命令行 安装git yum install git&#x1f560;2.在github创建项目 使用…...

Kotlin apply 交换两个数

代码&#xff1a; fun main() {var a 1var b 2a b.apply {b aprintln("$b")println("$this")}println("$a $b") }打印结果&#xff1a; 1 2 2 1原理分析&#xff1a; /*** Calls the specified function [block] with this value as its r…...

Android jetpack : Navigation 导航 路由 、 单个Activity嵌套多个Fragment的UI架构方式

Android Navigation 如何动态的更换StartDestination &&保存Fragment状态 Navigation(一)基础入门 google 官网 &#xff1a; Navigation 导航 路由 讨论了两年的 Navigation 保存 Fragment 状态问题居然被关闭了 Navigation是一种导航的概念&#xff0c;即把Activ…...

【react】在react中祖父、父亲、孙子组件层层解构其余属性props时报错children.forEach is not function

起因 报错children.forEacht is not function 分析原因 由于地址组件本身存在options&#xff0c;此时父组件又传递…otherProps&#xff0c;且解构了父级组件的otherProps&#xff0c;其中others解构后的属性就有options&#xff0c;因此产生了属性冲突&#xff0c;导致属性…...

**发散创新:用Python + ROS2实现多机器人协同路径规划与避障控制**在现代机器人系统中,**

发散创新&#xff1a;用Python ROS2实现多机器人协同路径规划与避障控制 在现代机器人系统中&#xff0c;多机器人协同控制已成为智能仓储、物流配送和工业自动化的核心技术之一。本文将带你深入一个真实可运行的案例——使用 Python 语言结合ROS2&#xff08;Robot Operating…...

【数电】组合逻辑电路模块:从原理到系统级应用

1. 组合逻辑电路基础入门 第一次接触数字电路时&#xff0c;我被那些密密麻麻的逻辑门符号搞得头晕眼花。直到真正理解了组合逻辑电路的精髓&#xff0c;才发现它就像搭积木一样有趣。组合逻辑电路的特点是输出只取决于当前的输入状态&#xff0c;不像时序电路那样需要考虑历史…...

ICML 2026 开分!投稿群来了!还有IJCAI、CVPR 2026投稿群!

点击下方卡片&#xff0c;关注“CVer”公众号AI/CV重磅干货&#xff0c;第一时间送达点击进入—>【顶会/顶刊】投稿交流群添加微信&#xff1a;CVer2233&#xff0c;助手会拉你进群&#xff01;扫描下方二维码&#xff0c;加入CVer学术星球&#xff01;可获得最新顶会/顶刊上…...

3步解除音乐枷锁:QMCDecode全场景音频解密指南

3步解除音乐枷锁&#xff1a;QMCDecode全场景音频解密指南 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac&#xff0c;qmc0,qmc3转mp3, mflac,mflac0等转flac)&#xff0c;仅支持macOS&#xff0c;可自动识别到QQ音乐下载目录&#xff0c;默认转换结果…...

基于WebSocket与Protobuf协议的抖音直播间实时数据采集方案

基于WebSocket与Protobuf协议的抖音直播间实时数据采集方案 【免费下载链接】DouyinLiveWebFetcher 抖音直播间网页版的弹幕数据抓取&#xff08;2024最新版本&#xff09; 项目地址: https://gitcode.com/gh_mirrors/do/DouyinLiveWebFetcher 技术背景与挑战 在当今直…...

你有多难拒绝别人?免费个人边界感与拒绝能力测试,看清你的“不敢拒绝“根源

你有多难拒绝别人&#xff1f;免费个人边界感与拒绝能力测试&#xff0c;看清你的"不敢拒绝"根源 引言 你有没有过这样的时刻—— 朋友临时约你&#xff0c;你明明很累想休息&#xff0c;却还是答应了同事请你帮忙做不属于你的工作&#xff0c;你不好意思拒绝&…...

CMake+vcpkg环境配置避坑指南:从命令行到GUI的完整流程

CMakevcpkg环境配置避坑指南&#xff1a;从命令行到GUI的完整流程 刚接触C/C开发的工程师们&#xff0c;往往会在环境配置阶段经历"从入门到放弃"的心路历程。面对复杂的依赖库管理、跨平台编译问题&#xff0c;以及各种晦涩的错误提示&#xff0c;不少开发者甚至还没…...

【问题处理】如何解决PSQLException中2-byte值超出范围导致的整数溢出错误

1. 什么是PSQLException中的2-byte值溢出错误 最近在调试一个Java应用时&#xff0c;遇到了一个让人头疼的错误&#xff1a;Tried to send an out-of-range integer as a 2-byte value: 110629。这个错误看起来有点晦涩&#xff0c;但其实理解起来并不复杂。简单来说&#xff0…...

Mac能够连接校园网,但是无法上网

Mac电脑能够正常连接校园网&#xff0c;但是无法上网解决步骤&#xff1a;打开系统设置&#xff0c;网络&#xff0c;WI-FI&#xff0c;DNS把现有的删掉重置它。原因分析&#xff1a;应该是在使用代理时、访问什么网站被自动篡改了 DNS 设置&#xff0c;导致连接的 DNS 无法解析…...

BootstrapBlazor滑块组件:如何实现垂直方向滑动控制

BootstrapBlazor滑块组件&#xff1a;如何实现垂直方向滑动控制 【免费下载链接】BootstrapBlazor 项目地址: https://gitcode.com/gh_mirrors/bo/BootstrapBlazor BootstrapBlazor滑块组件为Blazor开发者提供了强大的数值输入控件&#xff0c;而垂直方向滑块则是构建现…...