生成式AI与大语言模型,东软已经准备就绪
伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。
在这场生成式AI的大潮中,东软集团也正式宣布成立东软魔形科技研究院,持续探索人工智能技术的创新与应用,推动实施大语言模型系统工程战略,全面迎接大模型时代的机遇与挑战。
生成式AI为什么会以如此惊人的速度火爆全球?它会给技术人员带来怎样的变化?东软集团在生成式AI领域又有着怎样的布局?刚刚成立的东软魔形科技研究院又肩负着怎样的使命?近日在东软解决方案论坛2023上,东软集团高级副总裁兼首席技术官、首席信息官陈锡民博士对以上问题给出了详细的解答。
生成式AI为什么如此火爆
陈锡民向趣味科技表示,生成式AI与大语言模型之所以,是因为它们可以做好以前许多人工智能技术做不好的事情,譬如对自然语言的理解,对文章的要点归纳,除此之外,其强大的生成能力也可以极大地提高用户的工作效率,让人们可以把有限的时间精力投入到更具有价值的地方去。
1、渗透力强:与元宇宙等其他技术相比,生成式AI可以更加普遍地渗入到人们的日常生活当中。它不仅仅依赖于特定的设备或装备,而是能够通过各种方式和渠道影响人们的生活。这种普遍性使其更加容易被人们接受,并在社会中产生更加广泛的影响。
2、解决关键技术问题:大语言模型解决了过去人工智能应用中的关键难题,即思维能力和生成能力。过去的人工智能更多地是决策式AI,只能做一些判断和识别,譬如图像识别和语音识别,但是缺乏更深层次的理解和生成能力。而大语言模型的出现填补了这一空白,使得生成式AI能够通过语言交互更加深入地理解用户意图,并产生相应的输出。
3、类似人类大脑中枢:大语言模型的运作方式与人类大脑中枢的运作方式有着一定的相似之处。它可以接受语言输入,理解并产生输出,这种输出可以是文本,也可以是进一步分解的行为、动作和其他指令。这使得大语言模型不仅仅是一个简单的工具,而是一个能够理解、思考和指导各种动作的智能系统。
4、裂变效应与无限可能:结合思维链的方式和提示工程的能力,大语言模型的能力可以被无限放大和嵌套。譬如一个AI可以生成两个子AI,分别执行不同的任务,并能够继续产生更多的子AI。这种裂变效应带来了巨大的想象空间,因为这意味着AI可以自我复制、自我监督、自我协同,实现任务的并行处理和高效完成。
“总的来说,生成式AI与大语言模型,对社会和技术带来了非常巨大的潜在影响。它们不仅仅是一个工具或者一个系统,而且还是一个能够思考、理解、指导和裂变的智能体。这种技术带来的变革可能会超越我们的想象,并给未来的生活和工作方式带来全新的定义和可能性。”陈锡民表示。
大语言模型给技术人员带来的变化
由于新兴的生成式AI与大语言模型,与以往的传统人工智能技术是如此的不同,所以它们的快速普及,也给既有技术人员的岗位分工带来了巨大的震荡。
陈锡民指出,过去在IT行业,代码是否写得漂亮、算法研究是否深入,这些是人们评价一位技术人员能力高低的主要标准。然而随着生成式AI技术的发展,特别是大语言模型的出现,对技术人员的要求已经不仅仅是编程和算法研究的能力,而更重要的是如何与人工智能打交道,如何理解和驾驭知识,并将其活化为对人工智能的指导和应用。
这种对技术人员角色和能力要求的变化,实际上是一种从技术细节驾驭到知识驾驭的转变。技术人员需要更加深入地理解业务、理解知识,才能更好地利用生成式AI与大语言模型等技术为业务赋能。这种转变对技术人员的能力提出了更高的要求,需要他们具备更广泛的知识、更深入的业务理解以及更强大的创新思维。
对于企业来说,如何培养和吸引这种新型的技术人才,也成为了一项非常重要的课题。一方面,企业可以通过培训和内部转岗等方式,帮助现有的技术人员适应这种转变;另一方面,企业也需要从外部引进具有新知识结构和技术能力的人才,以推动自身的技术发展,更好地满足客户的需求。
对于这种新生的变化,技术人员自身也需要积极适应和快速学习。不仅需要提高自己的业务知识和理解能力,也需要学习新的技术和工具,譬如提示工程、微调技术等,以更好地驾驭生成式AI与大语言模型等新兴技术。
“总的来说,生成式AI与大语言模型等技术的发展,正在深刻改变IT行业的技术人员岗位分工和能力要求。而对于技术人员来说,这既是一个挑战,也是一个机遇。只有积极适应这种变化,不断提高自己的能力,才能在新的时代中立足。”陈锡民说道。
东软在生成式AI领域的布局
陈锡民向趣味科技透露,东软在生成式AI领域的布局具有非常清晰的目标和方向,将主要聚焦于行业大模型的构建和应用。由于通用大模型的训练成本非常高,所以东软选择利用开源模型为基础,结合行业数据和行业知识,来训练具备实际应用价值的专业大模型。
目前,东软正在围绕医疗、政府、汽车等三大重要的业务板块,构建生成式AI解决方案。其中,医疗领域的医生助手和问诊助手是两个典型的应用场景。医生助手可以自动生成医嘱和病历,提高医生的工作质量和效率;而问诊助手则可以帮助患者更准确地挂号和描述病情,提高医疗服务的效率和质量。这些应用场景都具有较高的落地可行性和应用价值。
值得注意的是,东软在构建行业大模型时,不仅考虑算法和模型的性能,也非常注重与社会责任和法律责任的结合。陈博士指出:“人工智能只是起到辅助作用的工具,最终的法律责任可能仍然由人来承担,因此我们要对产品更加谨慎。”这种注重社会责任和法律责任的做法,也有助于保障人工智能技术的安全和可持续发展。
值得一提的是,东软最近还面向医疗领域推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景,在AI+医疗行业的创新实践,加速推动了东软“AI+领域应用”的人工智能生态图谱战略布局。
“虽然生成式AI与语言大模型在自然语言理解方面已经有了很大的进步,尤其是百亿、千亿参数规模以上的通用语言大模型。但是在医疗、法律等严谨行业中的应用,我们仍然需要非常谨慎。因为这些行业涉及人的生命、财产等核心利益,一旦出现错误,后果可能会非常严重。这就需要我们通过一系列的系统工程,确保大模型的输出质量和价值观的正确性,从而真正实现人工智能技术的安全和可持续发展。”陈锡民表示。
东软魔形科技研究院的使命
谈到最新成立的东软魔形科技研究院时,陈锡民表示,该研究院的诞生是以“智能化软件生产”和“软件智能化服务”为核心目标,并将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,围绕“专业性、一致性、可解释性、安全性”等企业级应用的核心特性需求,打造东软LLM-SE通用开发平台,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用,完成典型场景落地部署及大规模推广,为东软AI大模型驱动的业务转型提供全面支撑。同时研究院还将积极打造外部合作生态 ,建设东软AI算力中心、AIGC相关技术的应用研究,构建东软完整的人工智能生态体系。
陈锡民指出,东软魔形科技研究院的成立肩负着多个重要使命,并且与东软集团作为行业软件领军企业的战略定位紧密相关:
1、跟踪与消化先进技术:当前大语言模型技术正处于快速发展和演进阶段。东软魔形科技研究院的首要使命是持续跟踪这些先进技术,并进行消化学习,确保东软始终保持在技术前沿。
2、探索行业应用场景与技术方案:作为行业软件厂商,东软需要深入探索大语言模型在各个领域的应用场景和相应的技术方案。特别是在东软关注的医疗等重点领域,由于数据的敏感性和保守性,需要自主研发符合行业需求的大模型。
3、商业化导向的研究:东软魔形科技研究院不仅致力于技术研发,而且还要确保研究成果能够商业化。这就需要研究出的模型在质量上可控,并且在部署成本和运行成本上都要合理,这样才能真正满足客户需求并实现商业化价值。
4、联合各业务单元共同研发:东软魔形科技研究院的特色在于它与各纵向业务单元紧密合作。各行业领域的专家和技术骨干带着课题进入研究院,共享算力、环境等资源,结合通用大模型的认知能力,共同进行相关课题的研发。
5、发挥模型孵化器作用:东软魔形科技研究院还起到了模型孵化器的作用。它负责对未来行业大模型的训练、实践验证及商业化全流程。一旦模型孵化成功,即可进行商业化销售,为东软带来实际的经济效益。
“综上所述,东软魔形科技研究院的定位是一个集先进技术跟踪、行业应用探索、商业化导向研发和模型孵化于一体的综合研究机构,它为东软在未来生成式AI与大语言模型领域的发展,提供了坚实的技术基础和源源不断的创新动力。”陈锡民说道。
相关文章:

生成式AI与大语言模型,东软已经准备就绪
伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。 …...

Python爬虫遇到重定向URL问题时如何解决?
什么是重定向 重定向是指当用户请求一个URL时,服务器返回一个中断请求的URL的响应。这种情况通常发生在网站对URL进行了修改或者重定向到其他页面的情况下。其中,如果处理不当开发,可能会导致爬虫无法获取所需的数据,从而影响爬虫…...

【点云surface】无序点云快速三角化
1 介绍 GreedyProjectionTriangulation 是一种基于局部二维投影的三维点贪婪三角剖分算法的实现。它假定局部表面光滑,不同点密度区域之间的过渡相对平滑。 GreedyProjectionTriangulation算法的基本思想是通过逐步投影点云数据到一个三角化网格上来进行重建。它首…...
el-select多选下拉框实现全选功能
<el-selectv-model"query.web_ids"multiplecollapse-tagscollapse-tags-tooltip:max-collapse-tags"2"filterableplaceholder"网站"><li class"checkAllBox" style"padding: 0 32px 0 20px; border-bottom: 1px solid #…...
Elasticsearch 聚合查询(Aggregation)详解
Elasticsearch中的聚合查询,类似SQL的SUM/AVG/COUNT/GROUP BY分组查询,主要用于统计分析场景。 实例: import org.apache.http.HttpHost; import org.elasticsearch.action.search.SearchRequest; import org.elasticsearch.action.search.…...

数据库其它调优策略
文章目录 1. 优化MySQL服务器2. 优化数据库结构2.1 差分表:冷热数据分离 3. 大表优化3.1 读/写分离3.2 垂直拆分3.3 水平拆分 1. 优化MySQL服务器 电商平台,双十一,CPU使用率达到99%,系统的计算资源已经耗尽,再也无法…...

【AI认证笔记】NO.2人工智能的发展
目录 一、人工智能的发展里程碑 二、当前人工智能的发展特点 1.人工智能进入高速发展阶段 2.人工智能元年 三、人工智能高速发展的三大引擎 1.算法突破 2.算力飞跃 3.数据井喷 四、AI的机遇 五、AI人才的缺口 六、行业AI 人工智能算法,万物互联ÿ…...
Python与设计模式--观察者模式
23种计模式之 前言 (5)单例模式、工厂模式、简单工厂模式、抽象工厂模式、建造者模式、原型模式、(7)代理模式、装饰器模式、适配器模式、门面模式、组合模式、享元模式、桥梁模式、(11)策略模式、责任链模式、命令模式、中介者模…...

Elasticsearch底层原理分析——新建、索引文档
es版本 8.1.0 重要概念回顾 Elasticsearch Node的角色 与下文流程相关的角色介绍: Node Roles配置主要功能说明masternode.roles: [ master ]有资格参与选举成为master节点,从而进行集群范围的管理工作,如创建或删除索引、跟踪哪些节点是…...

ts实现合并数组对象中key相同的数据
背景 在平常的业务中,后端同学会返回以下类似的结构数据 // 后端返回的数据结构 [{ id: 1, product_id: 1, pid_name: "Asia", name: "HKG01" },{ id: 2, product_id: 1, pid_name: "Asia", name: "SH01" },{ id: 3, pro…...

C语言--根据成绩判断等级
一.题目描述 如果学生的成绩小于60分,那么输出不及格 如果学生的成绩大于60分小于85分,那么输出良好 如果学生的成绩大于85分,那么输出优秀 二.代码实现 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> //根据成绩打印等级 //scor…...
Rust多线程任务,发现有些线程一直获取不到锁【已解决】
问题描述 项目中用到rust,其中在多线程中用到了同一个对象的锁,然而发现其中一个线程一直拿不到这个锁。 解决过程 我先是在线程A中加入了sleep方法,这样做的效果就是,比最初好一些,但是拿到锁还是要较长时间…...

【区块链】产品经理的NFT初探
常见的FT如比特币(BTC),以太币(ETH)等,两个代币之间是完全可替换的。而NFT具有唯一性,不可以互相替换。本文作者对NET的发展现状、相关协议、应用场景等方面进行了分析,一起来看一下…...
香港服务器减少延迟的几种方法
我们在租用香港服务器时,总觉得网站程序反应太慢。选择了香港服务器的开发商和企业对香港服务器目前的访问速度不满意 怎么办?第一点是换服务器。更换配置更大、带宽更高的服务器,可以更好的解决网站访问速度。如何减少香港服务器的延时 速度…...
PowerShell命令小记
1. 使用命令删除指定文件或文件夹 在 PowerShell 中,你可以使用 Remove-Item 命令递归删除文件夹下的指定文件。以下是一条命令的示例,该命令删除指定文件夹及其子文件夹中的所有 .txt 文件: Remove-Item -Path "D:\test" -Recur…...
C语言小练
目录 打印斐波那契数列指定位置的值 给定两个数,求这两个数的最大公约数 三个数从大到小输出 模拟用户登陆情况,且只能输如三次 采用二分法查找数组中的指定元素 打印输出九九乘法表 数一下1-100中所有整数出现多少个数字9 打印1-200之间的素数&…...

Webhook端口中的自签名身份验证
概述 有时,可能需要通过 Webhook 端口从交易伙伴处接收数据,但该交易伙伴可能需要更多的安全性,而不仅仅是用于验证入站 Webhook 请求的基本身份验证用户名/密码 – 或者您可能只想在入站 Webhook 消息上添加额外的安全层。 使用 Webhook 端…...
CSS预处理器(如Sass或Less):变量、嵌套规则和混合器等高级功能
在Vue项目中,可以使用CSS预处理器(如Sass或Less)来编写样式。 这些预处理器提供了一些高级功能,如变量、嵌套规则和混合器等。 1. 变量 在Sass中,我们可以使用$符号定义变量。这些变量方便我们在多个地方重复使用&a…...

【Linux】Linux第一个小程序 --- 进度条
👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和Linux还有算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 …...

每日一练:约瑟夫生者死者小游戏
1. 问题描述 约瑟夫问题(Josephus problem)是一个经典的数学和计算机科学问题,源于犹太历史学家弗拉维奥约瑟夫斯(Flavius Josephus)的著作《犹太战记》。问题的描述如下: 在这个问题中,有n…...
vscode里如何用git
打开vs终端执行如下: 1 初始化 Git 仓库(如果尚未初始化) git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...

Lombok 的 @Data 注解失效,未生成 getter/setter 方法引发的HTTP 406 错误
HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误,它们的含义、原因和解决方法都有显著区别。以下是详细对比: 1. HTTP 406 (Not Acceptable) 含义: 客户端请求的内容类型与服务器支持的内容类型不匹…...

【人工智能】神经网络的优化器optimizer(二):Adagrad自适应学习率优化器
一.自适应梯度算法Adagrad概述 Adagrad(Adaptive Gradient Algorithm)是一种自适应学习率的优化算法,由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率,适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...

定时器任务——若依源码分析
分析util包下面的工具类schedule utils: ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类,封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz,先构建任务的 JobD…...
数据链路层的主要功能是什么
数据链路层(OSI模型第2层)的核心功能是在相邻网络节点(如交换机、主机)间提供可靠的数据帧传输服务,主要职责包括: 🔑 核心功能详解: 帧封装与解封装 封装: 将网络层下发…...
【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】
1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种 系统属性定义文件(System Property Definition File),用于声明和管理 Bluetooth 模块相…...
【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)
升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求ÿ…...