当前位置: 首页 > news >正文

凝聚共识,锚定未来 | 第四届OpenI/O 启智开发者大会NLP大模型论坛成功举办!

2023年2月24日下午,第四届OpenI/O启智开发者大会NLP大模型分论坛在深圳人才研修院隆重举办。该论坛以“开源集智创新探索中文NLP大模型生态发展”为主题,众多业内人士和研发者在此共享NLP领域的前沿动态和研发经验,畅想中国NLP领域的发展前景。

NLP大模型论坛会议现场

本次论坛汇集NLP领域顶级专家学者与多家国产NLP大模型开发团队,共同探讨NLP领域前沿资讯与未来技术和应用发展所面临的挑战与机遇,就大模型在可信性、鲁棒性、安全性和应用落地等方面存在的困境进行研讨交流。

1

院士专家齐聚 共话NLP未来

清华大学计算机系教授、欧洲科学院外籍院士、ACL Fellow孙茂松在“大模型:人工智能的大力神与弄潮儿”为主题发言中提到,以大模型为代表的人工智能当前发展基本态势。扼要评介了什么是大模型、大模型的出色性能,并着重探讨了目前国内需要密切关注的、与大模型相关的若干研究与开发问题。

清华大学计算机系教授 孙茂松

华为诺亚方舟实验室语音语义Lab主任蒋欣详细地介绍了华为诺亚方舟实验室在AI基础模型方面的系列工作及研究历程,特别强调了“盘古α”系列基础语言模型和“悟空”系列基础多模态模型的性能及应用优势。

华为诺亚方舟实验室语音语义Lab主任 蒋欣

就当下火爆出圈的“ChatGPT”,IDEA研究院讲席科学家、认知计算与自然语言研究中心负责人张家兴分享自己的见解,他指出ChatGPT对NLP领域的重塑意义在于实现了从专家定义任务到用户定义任务的突破,呼吁在AI模型化、工程化的趋势下国内版ChatGPT的联合创新。

IDEA研究院讲席科学家 张家兴

阿里巴巴达摩院资深算法专家、AliceMind大模型团队负责人黄松芳介绍了AliceMind NLP大模型的相关研发工作,以及如何通过开源开放搭建魔搭社区ModelScope,并邀请研发者分享共建大模型的经验。

阿里巴巴达摩院资深算法专家 黄松芳

清华大学计算机系副教授刘知远围绕大模型值得关注的重要特性展开演讲。他着重介绍了大模型在模型框架、微调适配以及推理计算等方面的重要特性,并分享近期研究发现的大模型相关技术特点,阐述了大模型研究在未来面临的五大挑战。

清华大学计算机系副教授 刘知远

蓝驰创投投资合伙人石建平认为认知智能时代的到来,为实现数字虚拟知识工人带来了可能性,它将无限量地供给、赋能各种行业、企业、个人以任务和场景,使专业的、随时随地、接近人类的认知智能更加触手可得。

蓝驰创投投资合伙人 石建平

鹏城实验室-AITISA联盟算力网推进组组长余跃对“启智飞轮计划”进行了重点阐述。余跃表示,开源开放是解决复杂问题的最好手段。他希望能有更多的模型,有持续终身学习的服务模式,提供更多创新的平台和服务场。

鹏城实验室-AITISA联盟算力网推进组组长

余跃

2

交流中碰撞思想 对话中凝聚共识

在圆桌论坛环节中,孙茂松、徐睿峰、黄松芳、刘知远、石建平、王晖作为嘉宾参与讨论,鹏城实验室云计算所副所长相洋进行主持。与会院士、专家围绕“NLP大模型技术与应用十大挑战”展开系列探讨,发表真知灼见和独到见解。

圆桌讨论环节

王怀民院士也提出问题和大家共同探讨,他提出“随着大模型承载的内容和数据越来越多,它能不能通过训练变得更“智能”,更自主地持续性学习?”

中国科学院院士 王怀民

王怀民院士认为大模型产生后,获得了观察智力或者认知的人造模型,人工构造的结构通过深度网络的学习能够产生人类相似的能力。大模型既然能实现功能分区,还能形成稀疏关系,而不是对全网的破坏性影响。认知本质的问题在于研究观察新手段,按照目前算力网络基础设施继续建设的话,我们可以让网络的连接远超出一个人的神经网络,持续把人类积累的文明都吸纳进去,用工程化的方法进行探索和实践。

发言的最后,王怀民院士升华了问题的讨论,首先他指出我们做的很多事情不应该只看经济成本,而要看对社会、国家、人类的积极拉动作用;其次,像中国算力网这样跨时代基础设施的建成,将会爆炸式的点燃国家创新能力,极大繁荣我国人工智能技术发展,赋能各行各业产生巨大价值。

他表示,在中国我们要有更大的视野,建设算力网,一方面要建设软硬件,另一方面也要建设引爆性要素。开源生态的意义就在于互相成就,通过开源,我们将做到智力融资,我们也将以更低的成本找到通路人和同路人。人类社会的发展,依靠的就是并肩同行。

3

中国NLP大模型总部基地启动

官宣进入“大模型”时代

为了进一步支持中国NLP大模型的发展,鹏城实验室联合国内开展大模型研究的多家单位,携手助力中国NLP大模型生态建设。在本次论坛期间汇聚国内NLP大模型产学研机构共同启动了中国NLP大模型总部基地的建设,期望通过开源开放,给世界一个新的选择。

在万众瞩目的启动仪式环节中,王怀民院士、孙茂松、李革、徐睿峰、刘知远、黄松芳、石建平、余跃等专家作为参与嘉宾共同启动装置。本次启动仪式的举办预示着中国NLP领域正在进入“大模型”时代,基于中国算力网的中国NLP大模型的技术和应用生态未来可期!

中国NLP大模型总部基地启动仪式

中国NLP大模型总部基地未来将基于中国算力网充沛资源支持,凝聚国内中文NLP大模型产学研用各方力量,构建基于国产AI芯片和AI架构的中文NLP大模型持续演化生态,以开源开放集智创新为宗旨,努力为中国NLP大模型技术与应用创新发展做出贡献。

4

CCF开源创新中心授牌仪式举行

打造独具特色“中国方案”

在本次论坛的重磅环节,CCF开源发展委员会副秘书长王涛主持了CCF开源创新中心授牌仪式。作为中国计算机领域最大的学术团体之一,中国计算机学会(CCF)一直致力于推动计算机领域的学术交流和产学研合作,依托学会现代学术阵地体系探索学术共同体开源创新发展新途径。

本次论坛邀请中国科学院王怀民院士、鹏城实验室网络智能部副主任李革完成CCF开源创新中心授牌仪式。“中国计算机学会鹏城开源创新中心”牌匾正式亮相,标志着CCF发展委员会和鹏城实验室正式达成合作,共同推动建立CCF鹏城开源创新中心。

CCF开源创新中心授牌仪式

王怀民院士提到,作为中国计算机学会(CCF)成立的最新委员会,开源发展委员会以一个学术社团的结构来推动开源的发展,通过开源来推动创新模式探索的体制机制建设的参与,共同推进中国开源创新的发展。

鹏城实验室网络智能部副主任李革提到,在过去五年的工作中,启智社区通过开源开放的形式来推动国内人工智能的发展。期待更多年轻开发者能够充分利用好鹏城实验室的算力资源,以及由中国计算机学会(CCF)和鹏城实验室共同开发的工具,实现理论和实践的突破。

未来,CCF开源创新中心将为会员乃至全球开源创新实践者提供更高水平的开源创新服务,更好地助力我国开源生态建设的发展,推动开源人工智能在中国发展的成功实践范例!

本次论坛的成功举办,离不开鹏城实验室、新一代人工智能产业技术创新战略联盟(AITISA)的大力支持。论坛希望通过该领域前沿动态和研发经验的共享,打破技术壁垒,凝聚行业共识,锚定未来方向,全力打造基于中国算力网C2Net的人机协作复杂AI软件系统持续构造与演化飞轮,立足国产AI软硬件环境,通过开源开放,聚智创新中文NLP大模型的技术与应用生态,为世界提供独具特色的“中国方案”!

相关文章:

凝聚共识,锚定未来 | 第四届OpenI/O 启智开发者大会NLP大模型论坛成功举办!

2023年2月24日下午,第四届OpenI/O启智开发者大会NLP大模型分论坛在深圳人才研修院隆重举办。该论坛以“开源集智创新探索中文NLP大模型生态发展”为主题,众多业内人士和研发者在此共享NLP领域的前沿动态和研发经验,畅想中国NLP领域的发展前景…...

99.【Git】

Git(一)、什么是版本控制1.什么是版本控制2、常见的版本控制工具(二)、版本控制分类1、本地版本控制2、集中版本控制 SVN3、分布式版本控制 Git(三)、Git与SVN的主要区别1、Git历史(四)、Git下载与环境配置1.git下载2、启动Git(五)、常用的Linux命令1.Linux常用命令(六)、Git必…...

Linux驱动交叉编译把驱动文件放入开发板,以及printk函数打印级别

上一篇介绍了一个最简单的驱动程序和驱动程序大体结构,但那还是用本地编译只能在Ubuntu上运行,我们该怎么编译一个能加载到开发板上呢,就需要交叉编译,交叉编译通常都是在嵌入式开发中使用到的。 交叉编译 理解交叉编译前先了解…...

力扣(LeetCode)433. 最小基因变化(2023.03.07)

基因序列可以表示为一条由 8 个字符组成的字符串,其中每个字符都是 ‘A’、‘C’、‘G’ 和 ‘T’ 之一。 假设我们需要调查从基因序列 start 变为 end 所发生的基因变化。一次基因变化就意味着这个基因序列中的一个字符发生了变化。 例如,“AACCGGTT”…...

网络基础(2)

目录1. 端口号2. 套接字socket3. 网络通信3.1 sockaddr与sockaddr_in3.2 接口服务端3.2.1 创建套接字,打开网络文件3.2.2 给该服务器绑定端口和ip(特殊处理)3.2.3 初始化相关服务器3.2.4 提供服务客户端3.2.5 绑定3.2.6 使用服务4. makefile实…...

掌握Spring Cloud Gateway:构建高性能API网关的原理和实践

Spring Cloud Gateway 是一个基于 Spring Boot 的 API 网关,用于构建微服务架构中的网关服务。它提供了统一的路由、请求转发、过滤器、负载均衡、熔断等功能,帮助开发者更好地管理和控制微服务系统的请求流量。 本文将介绍 Spring Cloud Gateway 的原理…...

NAST概述

一、NATS介绍 NATS是由CloudFoundry的架构师Derek开发的一个开源的、轻量级、高性能的,支持发布、订阅机制的分布式消息队列系统。它的核心基于EventMachine开发,代码量不多,可以下载下来慢慢研究。 不同于Java社区的kafka,nats…...

【JS知识点】——原型和原型链

文章目录原型和原型链构造函数原型显式原型(prototype)隐式原型(\_\_proto\_\_)原型链总结原型和原型链 在js中,原型和原型链是一个非常重要的知识点,只有理解原型和原型链,才能深刻理解JS。在…...

c盘怎么清理到最干净?有什么好的清理方法

c盘怎么清理到最干净?有什么好的清理方法?清理C盘空间是电脑维护的重要步骤之一。C盘是Windows操作系统的核心部分,保存了许多重要的系统文件,因此空间不足会影响计算机的性能和稳定性。下面是一些清理C盘空间的方法 一.清理临时文件 在使用…...

day26_HTML

今日内容 上课同步视频:CuteN饕餮的个人空间_哔哩哔哩_bilibili 同步笔记沐沐霸的博客_CSDN博客-Java2301 零、 复习昨日 一、二阶段介绍 二、HTML 零、 复习昨日 见代码 一、二阶段介绍 第一阶段: 基础入门 java基本语法编程基础(方法,数组)面向对象编程常用类高级(IO,线程,新…...

深度剖析C语言预处理

致前行的人: 人生像攀登一座山,而找寻出路,却是一种学习的过程,我们应当在这过程中,学习稳定冷静,学习如何从慌乱中找到生机。 目录 1.程序翻译过程: 2.字符串宏常量 3.用宏定义充当注释符号 4…...

【WPF 值转换器】ValueConverter 进阶用法

【WPF 值转换器】ValueConverter 进阶用法介绍基类实现子类实现效果介绍 值转换器在WPF开发中是非常常见的,当然不仅仅是在WPF开发中。值转换器可以帮助我们很轻松地实现,界面数据展示的问题,如:模块隐藏显示、编码数据展示为可读…...

Vue2的基本使用

一、vue的基本使用 第一步 引入vue.js文件 <script src"https://cdn.staticfile.org/vue/2.7.0/vue.min.js"></script> 或者<script src"./js/vue.js"></script> 第二步 在body中设置一个挂载点 {{msg}} <div id"app…...

【云原生kubernetes】k8s数据存储之Volume使用详解

目录 一、什么是Volume 二、k8s中的Volume 三、k8s中常见的Volume类型 四、Volume 之 EmptyDir 4.1 EmptyDir 特点 4.2 EmptyDir 实现文件共享 4.2.1 关于busybox 4.3 操作步骤 4.3.1 创建配置模板文件yaml 4.3.2 创建Pod 4.3.3 访问nginx使其产生访问日志 4.3.4 …...

SerDes---CDR技术

1、为什么需要CDR 时钟数据恢复主要完成两个工作&#xff0c;一个是时钟恢复&#xff0c;一个是数据重定时&#xff0c;也就是数据的恢复。时钟恢复主要是从接收到的 NRZ&#xff08;非归零码&#xff09;码中将嵌入在数据中的时钟信息提取出来。 2、CDR种类 PLL-Based CDROve…...

如何实现在on ethernetPacket中自动回复NDP response消息

对于IPv4协议来说,如果主机想通过目标ipv4地址发送以太网数据帧给目的主机,需要在数据链路层填充目的mac地址。根据目标ipv4地址查找目标mac地址,这是ARP协议的工作原理 对于IPv6协议来说,根据目标ipv6地址查找目标mac地址,它使用的不是ARP协议,而是邻居发现NDP(Neighb…...

CSS清楚浮动

先看看关于浮动的一些性质 浮动使元素脱离文档流 浮动元素可以设置宽高&#xff0c;在CSS中&#xff0c;任何元素都可以浮动&#xff0c;浮动元素会生成一个块级框&#xff0c;而不论其本身是何种元素。 如果没有给浮动元素指定高度&#xff0c;&#xff0c;那么它会以内容的…...

HTTPS详解(原理、中间人攻击、CA流程)

摘要我们访问浏览器也经常可以看到https开头的网址&#xff0c;那么什么是https&#xff0c;什么是ca证书&#xff0c;认证流程怎样&#xff1f;这里一一介绍。原理https就是httpssl&#xff0c;即用http协议传输数据&#xff0c;数据用ssl/tls协议加密解密。具体流程如下图&am…...

EventLoop机制

JavaScript 是单线程的语言 JavaScript 是一门单线程执行的编程语言。也就是说&#xff0c;同一时间只能做一件事情。 单线程执行任务队列的问题&#xff1a; 如果前一个任务非常耗时&#xff0c;则后续的任务就不得不一直等待&#xff0c;从而导致程序假死的问题。 同步任…...

倒立摆建模

前言 系统由一辆具有动力的小车和安装在小车上的倒立摆组成&#xff0c;系统是不稳定&#xff0c;我们需要通过控制移动小车使得倒立摆保持平衡。 具体地&#xff0c;考虑二维情形如下图&#xff0c;控制力为水平力FFF&#xff0c;输出为角度θ\thetaθ以及小车的位置xxx。 力…...

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

定时器任务——若依源码分析

分析util包下面的工具类schedule utils&#xff1a; ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类&#xff0c;封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz&#xff0c;先构建任务的 JobD…...

2021-03-15 iview一些问题

1.iview 在使用tree组件时&#xff0c;发现没有set类的方法&#xff0c;只有get&#xff0c;那么要改变tree值&#xff0c;只能遍历treeData&#xff0c;递归修改treeData的checked&#xff0c;发现无法更改&#xff0c;原因在于check模式下&#xff0c;子元素的勾选状态跟父节…...

[10-3]软件I2C读写MPU6050 江协科技学习笔记(16个知识点)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16...

拉力测试cuda pytorch 把 4070显卡拉满

import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试&#xff0c;通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小&#xff0c;增大可提高计算复杂度duration: 测试持续时间&#xff08;秒&…...

微信小程序云开发平台MySQL的连接方式

注&#xff1a;微信小程序云开发平台指的是腾讯云开发 先给结论&#xff1a;微信小程序云开发平台的MySQL&#xff0c;无法通过获取数据库连接信息的方式进行连接&#xff0c;连接只能通过云开发的SDK连接&#xff0c;具体要参考官方文档&#xff1a; 为什么&#xff1f; 因为…...

NLP学习路线图(二十三):长短期记忆网络(LSTM)

在自然语言处理(NLP)领域,我们时刻面临着处理序列数据的核心挑战。无论是理解句子的结构、分析文本的情感,还是实现语言的翻译,都需要模型能够捕捉词语之间依时序产生的复杂依赖关系。传统的神经网络结构在处理这种序列依赖时显得力不从心,而循环神经网络(RNN) 曾被视为…...

什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同&#xff0c;结合所安装的tensorflow的目录结构修改from语句即可。 原语句&#xff1a; from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后&#xff1a; from tensorflow.python.keras.lay…...