北京科博会 天云数据CEO雷涛谈人工智能技术服务数字资产建设
7月13日,第二十六届中国北京国际科技产业博览会(简称北京科博会)在国家会议中心开幕。本届科博会年度主题为“实施创新驱动发展战略 增强高质量发展动能”。会上,天云数据CEO雷涛发表《人工智能技术服务数字资产建设》主题演讲。
近期非常引人注目的事件:OpenAI宣布终止对中国提供API服务。为了维护服务质量和安全性,将采取额外措施来限制来自当前不支持的国家和地区的API流量。
对国内基于OpenAI的大模型所构建的很多创业应用生态无疑是一个巨大的打击,两个世界正在逐步脱钩,越来越多的商业链条被切断。这不仅仅发生在物理世界,也发生在数字世界的线上连接。与此同时,市场上还存在另外一种声音,把这个信号看成一种巨大的机遇,刚好趁此机遇培养国内的搜索引擎。
从“深蓝”到AlphaGo,再到今天的ChatGPT,人工智能走过了符号主义的知识封装,连接主义的知识学习,和今天的生成式泛化表达能力开始参与到生产实践。OpenAI的PPT式大模型作为人工智能的明星项目,我们听到太多追捧的声音,过度的神秘化和与之伴随的自我矮化,加上7月9日关停面向大陆市场的API服务接口服务,再次加重自我矮化且,失败感扑面而来。
其实在北美市场,基础大模型的发展已经从单一模型训练Trainging发展为Serving多元化工业化基础设施化。中国人工智能的发展如何摆脱依赖、实现优势破局和定义自己的生态位?这需要找到我们技术的独特演进路径。
目前人工智能市场有两条核心路径,一种是无条件相信scalinglaw路径,相信只要把数据喂进去就会有涌现机制。用算力和数据堆积给已有的算法实践Transformer,这种路径就是在已知的知识结构里去寻找未知拼接的方法,能力是有限的,就像在陆地上看着教科书学游泳一样,一定会遇到模型基础理论的天花板。在已知中组合筛选(条件概率)获得的知识,只能是补齐现有的知识拼图,例如通过大量的实验发现新的元素,可以补全门捷列夫发现元素周期表,但是不能诞生量子力学对基本粒子的理论和元素生成公式,更不可能产生牛顿的“加速度”阿拉伯数字“零和无穷大”这样的观念革命的知识。从学外语到学母语到建立认知再到推理和逻辑的路径完全不同。
谷歌、微软、亚马逊、HuggingFace等云厂商开始不再依赖单一大模型,而是跟更多的系统架构配合,来组成一个务实的AGI的工程架构。谷歌上个月发布的大模型成熟度参考架构,定义了从L0到L6 的分级,调用GPT直接使用单一大模型的能力仅仅是L0水平。加入提示词工程,精调模型Lora的意图理解,向量数据库寻回私域数据的记忆,Agent规划拆解,plugin执行和反思等等,逐步完善大模型成熟度到更高等级。这是人工智能市场的第二条路径。
可以这样类比,大模型是西方发明的轮子,而今天中国已经进入了造车的时代。蒸汽机在英国诞生,但在北美被Nobody装到木船上造就了轮船业的辉煌。中国人工智能的发展如何从重新发明轮子到快速引领智能产业的“造车运动”,需要抓住基础ABC问题本质,才能实现实现优势破局和定义自己的生态位。
C算力——自力更生策略:硬件芯片是最早投入布局的,英伟达在生态的垄断和贸易禁运,给了国产芯片独立发展空间。
A算法——跟随融合的缠斗策略:人工智能最底层核心逻辑是以数学的形态在论文上得以表达,包括数据处理的方法和数据集。甚至实践代码都在以科学共享的形式争相发表,科学无国界。为了更多的索引,论文往往会以最快的速度在跨国别的形式传播。陆奇曾经讲过,我们从中关村到硅谷的距离是一个小时的时差。其实指的就是基础算法层级和开源技术框架。数据科学家们为了使自己的研究成果尽快地发表,甚至跳过了像IEEE、CVPR大型顶会论文的审核机制,直接在arXiv网站上注册发表,学术论文开始以天为单位在更新。打破中美科技壁垒的不是拿来主义的开源软件套壳封装,而是高索引引用的论文。论文不仅提供研究的方法路径,依赖的基础模型组件也提供了数据的流动,像指南一样。
B数据——优势破局策略:硬件芯片所遵循的摩尔定律还是一个线性增长逻辑,但生成式合成数据遵循的却是幂律指数型增长,只有抓住数据工程的幂律才能超越硬件的发展速度。
近日,前美军四星上将加入了openAI董事会。毫无疑问他的岗位职责肯定不是指导研发的,那必定是瞄向两年来OpenAI沉淀的提示数据。我们和大模型对话的内容蕴含大量的信息,据SBS等韩媒报道:三星刚引入ChatGPT还不到20 天,就发生了3起机密数据泄漏事件,其中涉及三星半导体设备测量资料、产品良率等信息。
问题往往会导向答案,获得信息的过程本身也是信息。无独有偶,近期,英伟达发布大模型一下子挤到第一阵营,为什么?英伟达没讲算力而是将重点放在了核心数据的介绍上,其模型训练使用了98%是合成数据,是机器生产模型生产的数据。
如何让国内AI领跑世界是一道综合考题,但归根结底必须从骨髓里就是硬核科技企业。在产品线上,不能拿来主义,不能被卡脖子,不能有明显的短板而且要有显著的长板,才有肯能在国际竞争中跑出来。此外,外部环境对于技术成长、人才培养、产业生态的形成也很关键,不单是一家企业的事,也需要政府、生态共同去匹配发展的进程。
人才破局:相关数据显示,2023年就业形势严峻,失业8700万,毕业1158万,是让普通人是无工作还是让这些人群进入新技能蓝海?政府应该提早布局AI版的“蓝翔技校”。AIGC内容生产,培养新技能蓝领改变算法生成的猜盲盒过程,打造人机交互的流水线。
产业链破局:AI Pin、 Vision Pro等可穿戴的个人智能代理Personal Agent的出现,Figure具身机器人的探索,这些EdgeAI的新兴都需要整合全新的智能硬件产业链。AI pin融合了电容触摸、HUD、手势识别、数模唤醒等成熟的硬件技术,大模型服务的载体,可以发挥中国全产业链精密制造的优势,快速跨界发明迭代一批GenAI的智能硬件。要想推动产业变革,实现产业组织的深刻调整,政府部门、教育机构、高校研究机构的角色和商业必须要发生一些变化。
就政府角色而言,充分发挥产业园区的优势,把企业、高校、科研院所等创新资源产业链上下游“整合”在一起,协同攻关科技难题。
相关文章:

北京科博会 天云数据CEO雷涛谈人工智能技术服务数字资产建设
7月13日,第二十六届中国北京国际科技产业博览会(简称北京科博会)在国家会议中心开幕。本届科博会年度主题为“实施创新驱动发展战略 增强高质量发展动能”。会上,天云数据CEO雷涛发表《人工智能技术服务数字资产建设》主题演讲。 近期非常引人注目的事件…...
【Python运维】容器管理新手入门:使用Python的docker-py库实现Docker容器管理与监控
《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 随着容器技术的广泛应用,Docker已经成为开发和运维中的标准工具之一。使用Python语言管理Docker容器,不仅可以自动化繁琐的容器操作,还能…...

小程序解决大问题-物流系统磁盘爆满问题处理
晚上七点,煤矿调运的物流调度系统突然磁盘报名导致服务崩溃。系统用的是微服务,没有详细操作说明,也不敢动,运煤车辆排起了长队,只能联系厂家处理。好在经过30多分钟的处理,服务终于启动,系统运…...

计算机网络基础篇
TCP/IP网络模型 TCP/IP网络模型的作用就是给数据包进行层层封装,帮助数据包能够正确的找到对应的设备接受数据。 一个URL所经历的全部过程 URL所经历的全部过程: HTTP -> DNS ->协议栈-TCP->IP->MAC->网卡->交换机->路由器->服…...

32 从前序与中序遍历序列构造二叉树
32 从前序与中序遍历序列构造二叉树 32.1 从前序与中序遍历序列构造二叉树解决方案 class Solution { public:TreeNode* buildTree(vector<int>& preorder, vector<int>& inorder) {return buildTreeHelper(preorder, inorder, 0, 0, inorder.size() - 1)…...
D82【python 接口自动化学习】- pytest基础用法
day82 pytest初体验 学习日期:20241128 学习目标:pytest基础用法 -- pytest初体验 学习笔记: 文件命名规范 py测试文件必须以test_开头(或_test结尾)测试方法必须以test开头测试类必须以Test开头,并且…...

在开发环境中,前端(手机端),后端(电脑端),那么应该如何设置iisExpress
首先,要想手机端应用能成功请求后端,两个设备至少需在同一个局域网内,且IP地址互通; 因为ajax是http(s)://IP地址端口号的方式请求,但是iisExpress默认是localhost如何解决,并没有IP地址,所以手…...

磁盘/系统空间占满导致黑屏死机无法开机的解决办法
文章目录 起因具体操作1.重启虚拟机,一直按CtrlShitf进入GRUP界面2.选“Ubuntu高级选项”并回车选择第二个,recovery mode3.4.命令查看磁盘情况5.查找和删除文…...

使用zabbix监控k8s
一、 参考文献 小阿轩yx-案例:Zabbix监控kubernetes云原生环境 手把手教你实现zabbix对Kubernetes的监控 二、部署经验 关于zabbix监控k8s,总体来说是分为两块内容,一是在k8s集群部署zabbix-agent和zabbix- proxy。二是在zabbix进行配置。…...

MacOS安装MySQL数据库和Java环境以及Navicat
安装MySQL 去官网下载:MySQL 下载好后安装,在设置里往下滑,出现了这样,就代表安装成功了 接下来配置环境: 首先在我们的设备上找到终端并打开,输入 vim ~/.bash_profile(注意vim后面的空格),输入完成后点击…...

算法的复杂度
1.数据结构前言 下面的概念有的比较难理解,做个了结就行。 1.1数据结构的起源 在现实生活中我们更多地并不是解决数值计算的问题,而是 需要一些更科学的手段如(表,数,图等数据结构),才能更好…...

Linux命令进阶·如何切换root以及回退、sudo命令、用户/用户组管理,以及解决创建用户不显示问题和Ubuntu不显示用户名只显示“$“符号问题
目录 1. root用户(超级管理员) 1.1 用于账户切换的系统命令——su 1.2 退回上一个用户命令——exit 1.3 普通命令临时授权root身份执行——sudo 1.3.1 为普通用户配置sudo认证 2. 用户/用户组管理 2.1 用户组管理 2.2 用户管理 2.2.1 …...

若依项目源码阅读
源码阅读 前端代码分析 代码生成器生成的前端代码有两个,分别是course.js用于向后端发送ajax请求的接口代码,另一个是index.vue,用于在浏览器展示课程管理的视图组件。前端的代码是基于vue3elementplus。 template用于展示前端组件别的标签…...

JVM知识点学习-1
学习视频:狂神说Java 类加载器和双亲委派机制 类加载器 作用:加载Class文件 流程:这里的名字car1。。在栈里面,但是数据在堆里面 类加载器的几个类型: 虚拟机自带的类加载器;启动类(根Boot…...

TypeScript和JavaScript区别详解
文章目录 TypeScript和JavaScript区别详解一、引言二、类型系统1、静态类型检查TypeScript 示例JavaScript 示例 2、类型推断TypeScript 示例JavaScript 示例 三、面向对象编程TypeScript 示例JavaScript 示例 四、使用示例1. 环境搭建2. 创建TypeScript项目3. 安装TypeScript插…...

RVO动态避障技术方案介绍
原文:RVO动态避障技术方案介绍 - 哔哩哔哩 我们在开发游戏的时候经常会遇到这样的问题,当我们寻路的时候,其它人也在寻路,如何避免不从其它人的位置穿过。这个叫做动态避障,目前主流的解决方案就是RVO。本节我们来介绍…...

Vue进阶之单组件开发与组件通信
书接上篇,我们了解了如何快速创建一个脚手架,现在我们来学习如何基于vite创建属于自己的脚手架。在创建一个新的组件时,要在新建文件夹中打开终端创建一个基本的脚手架,可在脚手架中原有的文件中修改或在相应路径重新创建…...

OGRE 3D----5. OGRE和QML事件交互
在现代图形应用程序开发中,OGRE(Object-Oriented Graphics Rendering Engine)作为一个高性能的3D渲染引擎,广泛应用于游戏开发、虚拟现实和仿真等领域。而QML(Qt Modeling Language)则是Qt框架中的一种声明式语言,专注于设计用户界面。将OGRE与QML结合,可以充分利用OGR…...
ARIMA-神经网络混合模型在时间序列预测中的应用
ARIMA-神经网络混合模型在时间序列预测中的应用 1. 引言 1.1 研究背景与意义 时间序列预测在现代数据科学中扮演着越来越重要的角色。从金融市场的价格走势到工业生产的需求预测,从气象数据的天气预报到用电量的负荷预测,时间序列分析无处不在。传统的统计方法和现代深度学习…...

常见靶场的搭建
漏洞靶场 渗透测试(漏洞挖掘)切忌纸上谈兵,学习渗透测试(漏洞挖掘)知识的过程中,我们通常需要一个包含漏洞的测试环境来进行训练。而在非授权情况下,对于网站进行渗透测试攻击,是触及…...
【杂谈】-递归进化:人工智能的自我改进与监管挑战
递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

工业安全零事故的智能守护者:一体化AI智能安防平台
前言: 通过AI视觉技术,为船厂提供全面的安全监控解决方案,涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面,能够实现对应负责人反馈机制,并最终实现数据的统计报表。提升船厂…...

Python爬虫(一):爬虫伪装
一、网站防爬机制概述 在当今互联网环境中,具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类: 身份验证机制:直接将未经授权的爬虫阻挡在外反爬技术体系:通过各种技术手段增加爬虫获取数据的难度…...

HBuilderX安装(uni-app和小程序开发)
下载HBuilderX 访问官方网站:https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本: Windows版(推荐下载标准版) Windows系统安装步骤 运行安装程序: 双击下载的.exe安装文件 如果出现安全提示&…...

莫兰迪高级灰总结计划简约商务通用PPT模版
莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...

数据结构第5章:树和二叉树完全指南(自整理详细图文笔记)
名人说:莫道桑榆晚,为霞尚满天。——刘禹锡(刘梦得,诗豪) 原创笔记:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 上一篇:《数据结构第4章 数组和广义表》…...

JDK 17 序列化是怎么回事
如何序列化?其实很简单,就是根据每个类型,用工厂类调用。逐个完成。 没什么漂亮的代码,只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...
Vue 3 + WebSocket 实战:公司通知实时推送功能详解
📢 Vue 3 WebSocket 实战:公司通知实时推送功能详解 📌 收藏 点赞 关注,项目中要用到推送功能时就不怕找不到了! 实时通知是企业系统中常见的功能,比如:管理员发布通知后,所有用户…...

pgsql:还原数据库后出现重复序列导致“more than one owned sequence found“报错问题的解决
问题: pgsql数据库通过备份数据库文件进行还原时,如果表中有自增序列,还原后可能会出现重复的序列,此时若向表中插入新行时会出现“more than one owned sequence found”的报错提示。 点击菜单“其它”-》“序列”,…...
React父子组件通信:Props怎么用?如何从父组件向子组件传递数据?
系列回顾: 在上一篇《React核心概念:State是什么?》中,我们学习了如何使用useState让一个组件拥有自己的内部数据(State),并通过一个计数器案例,实现了组件的自我更新。这很棒&#…...