当前位置: 首页 > news >正文

ChatGPT 的一些思考

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开始,就已经能够理解较多的上下文信息并给出符合上下文的回复,但是给人的震撼并不如这次 3.5/4.0 版本来的多。就我个人而言,最直接的比较震撼的是更加灵活的代码生成,小说续写改写等等,而且都是从自然语言习惯进行交流的,不用相对来说比较专业的术语或者提问方式就可以实现流畅的沟通。

这次 ChatGPT 的火爆让我重新回顾了下近些年来 AI 究竟在生活当中从哪些方面融入了我们的日常。就我个人而言,能够明显感受到或者了解到的 AI 实际应用的场景有下面几个:

  • 实时字幕/实时翻译;
  • 手机拍照(人像模式);
  • 图像文字提取
  • AI 绘画和人脸替换;

实时字幕的应用有几个细分,比如说双方交流的实时字幕生成,并不包含翻译部分,是把对方的话用对方的语言来实时生成字幕进行显示,特别适用于听力不好但是阅读能力比较好的人使用。典型的产品有WIN11 的全局实时字幕,小米手机的小米闻声实时字幕,当然还有其它的一些 APP,不过感觉一些专门做词典之类的软件反而并不如一些视频会议软件或者小米闻声做得好,讯飞也是做得比较好的。这种的典型应用场景就是春晚或者什么直播节目也可以进行实时字幕的生成,以及不同地区方言到统一官方语言的转换,还有就是需要进行语音实时转录文字,这个文字工作者应该会比较需要。还有一些细分就是同声传译,也就是除了识别对方说的话之外还额外帮你翻译出来转换到自己想用的语言上面去,这个准确度已经比以前提升了非常多了,这个极大的方便了不同国家不同语言口音的人交流,出国游的时候就不用担心会遇到无论如何也搞不懂说什么的状况。

手机拍照这个对于 AI 的应用也是愈来愈广泛,我就说一个比较典型的能够有明显感知的应用,比如说人像模式的拍照或者视频录制,需要进行背景虚化,以前的背景虚化搞得都是非常不准确的,该虚的地方没有虚好,该实的地方没有实,总之就是突出一个不稳定。而以小米为例,小米12s 系列就已经表现出了比较令人满意的背景虚化效果了,大部分情况下都可以得到令人满意的虚化效果。

还有就是图像文字提取,也就是古早时候的 OCR 技术实现的的升级版,比较明显的就是微信的图像文字提取,可以直接把图像当做文本文件进行选择、复制、剪切,十分方便。还有就是用于改作业、做作业的图像识别,直接可以识别出来文字和图形化的题目,并给出解析,这个也是非常能体现生产力的地方,当然还有很多其它的应用我就没过多涉及了,总之都是生产力提升的体现。

AI 绘画也是 AIGC 的一个比较令人震惊的应用,而且从目前来看,AI 绘画已经可以做到添加一些 AI 自己的艺术理解进去,有些情况下的画作已经比人类还要优秀了。最令我震惊的是最近的写实风 AI 图像生成,虽然一直被吐槽 AI 还是无法理解人类的手是什么个存在,但是通过一定的训练之后已经可以画出一些超写实的画作了,基本上乍一看看不出来真假。还有一部分是建模的应用,虽然不清楚具体的实现是不是基于传统 CV 还是改良后的 AI,但是我感觉纯传统 CV 应该做不到那么真实的模拟。而人脸替换则肯定是基于 AI 的实现了,这个在很多的短视频里面、电影里面都有体现了,已经达到相当的实用程度,不在是笨拙的纯玩具的级别。

而最近的 ChatGPT bing 版,我看好多时候回答已经体现出了一些独立人格的迹象,虽然它不一定是真的独立人格,但是给人的感觉已经非常接近了,对我来说已经有点恐怖谷效应了,属于非常接近但是还总是有一点不对劲的感觉。这次的版本更新给人一种强烈的危机感,毕竟离线训练版的就已经可以达到代码生成,超强的语义理解和交流,这些完全可以在不断的训练之中进化达到更强的程度。试想一下 ChatGPT 的接口引入到游戏产业,游戏里面的 NPC 可以产生完全符合现实中自然人类的对话和行为,这将创造一个极度真实的自由世界,只需要赋予每个 NPC 不同的 AI 人格,加之接口数据的指令化标准化就可以做到。

感觉下一次的社会层面技术大升级如初升红日,在远远的海岸线上已经绰约可见了。想象中的下一轮升级是属于 AI+机器人的,也就是把强 AI 录入到不同功用的机器人内生操作系统里面,由 AI 去控制完成一些自然语言指令,工业上或许要更加特殊化一些,但是生活和一些工业门类则可以做到完全使用自然语言去控制 AI+机器人实现真正的实用化的 AI 助手。而「流浪地球2」里面的机器人技术和 550 系列我感觉可能真的已经在不远的将来了,现在能想到的最可能的组合,AI+波士顿动力的机器人/机器狗,经过后续的接口对接和迭代或许可以在有生之年带来一场全新的技术革命,当然技术对于人类社会的冲击也许不可忽视,但是这是另外一个话题了。

目前已经可以看到端倪的,可以被少量或者大量替代的岗位我自己理解可能会有:程序员(UI 设计、互联网等比较标准化软件化的领域);效果调试(自动控制、Tuning);文字工作者(绘画、有一定格式要求的文章写手);语言工作者(翻译、同传);律师(一些民事领域的纠纷处理);服务类型岗位(流程处理、程式化的内容处理);会计(流程报表);司机等等。当然这些不会是完全替代,但是绝对会相当程度上解放其生产力,使得需要的工作岗位大量减少,只保留少部分中低端岗位和高端岗位,剩下的会被全部替代。

面对 AI 的的冲击,也许从个人来讲除了为此感到谨慎兴奋和享受其带来的便利之外,也该更多的去思考下对个人带来的影响。毫无疑问个人生产力会得到更大的解放,个人未来可能不需要再花大量的时间在一些日常家务、无效或者说无必要的人际交往等上面,更多把精力用于自己喜欢的事情和创造力上面去。但是也应警惕自己的可替代性,在向 AI 时代进化的过程初期和中期,肯定会牺牲掉一大部分人从而完成整个的过渡。我个人想到的不可替代的工作类型有:程序员(与硬件绑定较多的、高端理论发明、架构创造);医生(需要进行外科手术的);律师(刑事律师、经济领域、高端领域)等等。我想要特别说明的是教师,无论何种教师,教学工作内容简单与否,我想都是绝对不可替代的,即使 AI 的教学技术或许可以超过人类,但是学生家长是绝对不允许学生处在一个独立的学习环境的,客观条件上来讲义务教育阶段的学生也是绝对不可能适应独立学习环境的,初期学习是一个需要通过人际交往来实现的行为,脱离了人与人之间的交流,从目前的人类构造来讲,义务教育不太可能实现其预定的目标。

AI 的时代或许很快就会到来,个人虽不一定要深度参与其中,但是保持一定的敏感性还是很有必要的。

相关文章:

ChatGPT 的一些思考

最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开…...

GEE学习笔记 六十九:【GEE之Python版教程三】Python基础编程一

环境配置完成后,那么可以开始正式讲解编程知识。之前我在文章中也讲过,GEE的python版接口它是依赖python语言的。目前很多小伙伴是刚开始学习GEE编程,之前或者没有编程基础,或者是没有学习过python。为了照顾这批小伙伴&#xff0…...

大数据全系安装

内容版本号CentOS7.6.1810ZooKeeper3.4.6Hadoop2.9.1HBase1.2.0MySQL5.6.51HIVE2.3.7Sqoop1.4.6flume1.9.0kafka2.8.1scala2.12davinci3.0.1spark2.4.8flink1.13.5 1. 下载CentOS 7镜像 CentOS官网 2. 安装CentOS 7系统——采用虚拟机方式 2.1 新建虚拟机 2.2.1 [依次选择]-&…...

stable-diffusion-webui 安装使用

文章目录1.github 下载,按教程运行2.安装python 忘记勾选加入环境变量,自行加入(重启生效)3.环境变量添加后,清理tmp ,venv重新运行4.运行报错,无法升级pip,无法下载包,5…...

3D点云处理:点云聚类--FEC: Fast Euclidean Clustering for Point Cloud Segmentation

文章目录 聚类结果一、论文内容1.1 Ground Surface Removal1.2 Fast Euclidean Clustering题外:欧几里得聚类Fast Euclidean Clustering二、参考聚类结果 原始代码中采用的是pcl中的搜索方式,替换为另外第三方库,速度得到进一步提升。 一、论文内容 论文中给出的结论:该…...

华为OD机试题 - 射击比赛(JavaScript)| 代码+思路+重要知识点

最近更新的博客 华为OD机试题 - 括号检查(JavaScript) 华为OD机试题 - 最小施肥机能效(JavaScript) 华为OD机试题 - 子序列长度(JavaScript) 华为OD机试题 - 众数和中位数(JavaScript) 华为OD机试题 - 服务依赖(JavaScript) 华为OD机试题 - 字符串加密(JavaScript)…...

流程引擎之Flowable简介

背景Flowable 是一个流行的轻量级的采用 Java 开发的业务流程引擎,通过 Flowable 流程引擎,我们可以部署遵循 BPMN2.0 协议的流程定义(一般为XML文件)文件,并能创建流程实例,查询和访问流程相关的实例与数据…...

AcWing:4861. 构造数列、4862. 浇花(C++)

目录 4861. 构造数列 问题描述: 实现代码: 4862. 浇花 问题描述: 实现代码: 4861. 构造数列 问题描述: 我们规定如果一个正整数满足除最高位外其它所有数位均为 00,则称该正整数为圆数。 例如&…...

进程的概念

进程的概念 程序的概念 这里说的是一个可执行文件,passive的意思可以理解为我们这个执行文件需要我们进行双击才会被被执行。 双击后,程序入口地址读入寄存器,程序加载入主存,成为一个进程 进程是主动去获取想要的资源&#xff0…...

自动化测试5年经验,分享一些心得

自动化测试介绍 自动化测试(Automated Testing),是指把以人为驱动的测试行为转化为机器执行的过程。实际上自动化测试往往通过一些测试工具或框架,编写自动化测试用例,来模拟手工测试过程。比如说,在项目迭代过程中,持…...

independentsoft.de/MSG .NET Framework Crack

MSG .NET 是用于 .NET Framework / .NET Core 的 Microsoft Outlook .msg 文件 API。API 允许您轻松创建/读取/解析/转换 .msg 文件等。API 不需要在机器上安装 Microsoft Outlook 或任何其他第三方应用程序或库即可工作。 以下示例向您展示了如何打开现有文件并显示消息的某些…...

基于Transformer的NLP处理管线

HuggingFace transformers 是一个整合了跨语言、视觉、音频和多模式模态与最先进的预训练模型并且提供用户友好的 API 的AI开发库。 它由 170 多个预训练模型组成,支持 PyTorch、TensorFlow 和 JAX 等框架,能够在代码之间进行互操作。 这个库还易于部署&…...

二叉树OJ(一)二叉树的最大深度 二叉搜索树与双向链表 对称的二叉树

二叉树的最大深度 二叉树中和为某一值的路径(一) 二叉搜索树与双向链表 对称的二叉树 二叉树的最大深度 描述 求给定二叉树的最大深度, 深度是指树的根节点到任一叶子节点路径上节点的数量。 最大深度是所有叶子节点的深度的最大值。 (注:…...

使用Fairseq进行Bart预训练

文章目录前言环境流程介绍数据部分分词部分预处理部分训练部分遇到的问题问题1可能遇到的问题问题1问题2前言 本文是使用 fairseq 做 Bart 预训练任务的踩坑记录huggingface没有提供 Bart 预训练的代码 facebookresearch/fairseq: Facebook AI Research Sequence-to-Sequence…...

n阶数字回转方阵 ← 模拟法

【问题描述】 请编程输出如下数字回旋方阵。 【算法代码】 #include <bits/stdc.h> using namespace std;const int maxn100; int z[maxn][maxn];void matrix(int n) {int num2;z[0][0]1;int i0,j1;while(i<n && j<n) {while(i<j) z[i][j]num;while(j&…...

【人工智能AI】二、NoSQL 基础知识《NoSQL 企业级基础入门与进阶实战》

写一篇介绍 NoSQL 基础知识的技术文章&#xff0c;分5个章节&#xff0c;每个章节细分到3级目录&#xff0c;重点介绍一下NoSQL 数据模型&#xff0c;NoSQL 数据库架构&#xff0c;NoSQL 数据库特性等&#xff0c;不少于2000字。 NoSQL 基础知识 NoSQL&#xff08;Not Only SQ…...

Camera Rolling Shutter和Global Shutter的区别

卷帘快门&#xff08;Rolling Shutter&#xff09;与全局快门&#xff08;Global Shutter&#xff09;的区别 什么是快门 快门是照相机用来控制感光片有效曝光时间的机构。 快门是照相机的一个重要组成部分&#xff0c;它的结构、形式及功能是衡量照相机档次的一个重要因素。 …...

模版之AnyType

title: 模版之AnyType date: 2023-02-19 21:49:53 permalink: /pages/54a0bf/ categories: 通用领域编程语言C tags:C元编程 author: name: zhengzhibing link: https://azmddy.top/pages/54a0bf/ 模版之AnyType 在研究C的编译期反射时&#xff0c;发现了AnyType很有意思。 首…...

【汇编】一、环境搭建(一只 Assember 的成长史)

嗨~你好呀&#xff01; 我是一名初二学生&#xff0c;热爱计算机&#xff0c;码龄两年。最近开始学习汇编&#xff0c;希望通过 Blog 的形式记录下自己的学习过程&#xff0c;也和更多人分享。 这篇文章主要讲述汇编环境的搭建过程。 话不多说~我们开始吧&#xff01; 系统环…...

【博客628】k8s pod访问集群外域名原理以及主机开启了systemd-resolved的不同情况

k8s pod访问集群外域名原理以及使用了systemd-resolved的不同情况 1、不同情况下的linux主机访问外部域名原理 没有使用systemd-resolved的linux主机上访问外部域名一般是按照以下步骤来的&#xff1a; 从dns缓存里查找域名与ip的映射关系 从/etc/hosts里查找域名与ip的映射…...

Linux 文件类型,目录与路径,文件与目录管理

文件类型 后面的字符表示文件类型标志 普通文件&#xff1a;-&#xff08;纯文本文件&#xff0c;二进制文件&#xff0c;数据格式文件&#xff09; 如文本文件、图片、程序文件等。 目录文件&#xff1a;d&#xff08;directory&#xff09; 用来存放其他文件或子目录。 设备…...

rknn优化教程(二)

文章目录 1. 前述2. 三方库的封装2.1 xrepo中的库2.2 xrepo之外的库2.2.1 opencv2.2.2 rknnrt2.2.3 spdlog 3. rknn_engine库 1. 前述 OK&#xff0c;开始写第二篇的内容了。这篇博客主要能写一下&#xff1a; 如何给一些三方库按照xmake方式进行封装&#xff0c;供调用如何按…...

Opencv中的addweighted函数

一.addweighted函数作用 addweighted&#xff08;&#xff09;是OpenCV库中用于图像处理的函数&#xff0c;主要功能是将两个输入图像&#xff08;尺寸和类型相同&#xff09;按照指定的权重进行加权叠加&#xff08;图像融合&#xff09;&#xff0c;并添加一个标量值&#x…...

Java多线程实现之Thread类深度解析

Java多线程实现之Thread类深度解析 一、多线程基础概念1.1 什么是线程1.2 多线程的优势1.3 Java多线程模型 二、Thread类的基本结构与构造函数2.1 Thread类的继承关系2.2 构造函数 三、创建和启动线程3.1 继承Thread类创建线程3.2 实现Runnable接口创建线程 四、Thread类的核心…...

GC1808高性能24位立体声音频ADC芯片解析

1. 芯片概述 GC1808是一款24位立体声音频模数转换器&#xff08;ADC&#xff09;&#xff0c;支持8kHz~96kHz采样率&#xff0c;集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器&#xff0c;适用于高保真音频采集场景。 2. 核心特性 高精度&#xff1a;24位分辨率&#xff0c…...

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

基于Springboot+Vue的办公管理系统

角色&#xff1a; 管理员、员工 技术&#xff1a; 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能&#xff1a; 该办公管理系统是一个综合性的企业内部管理平台&#xff0c;旨在提升企业运营效率和员工管理水…...

Chromium 136 编译指南 Windows篇:depot_tools 配置与源码获取(二)

引言 工欲善其事&#xff0c;必先利其器。在完成了 Visual Studio 2022 和 Windows SDK 的安装后&#xff0c;我们即将接触到 Chromium 开发生态中最核心的工具——depot_tools。这个由 Google 精心打造的工具集&#xff0c;就像是连接开发者与 Chromium 庞大代码库的智能桥梁…...

关于easyexcel动态下拉选问题处理

前些日子突然碰到一个问题&#xff0c;说是客户的导入文件模版想支持部分导入内容的下拉选&#xff0c;于是我就找了easyexcel官网寻找解决方案&#xff0c;并没有找到合适的方案&#xff0c;没办法只能自己动手并分享出来&#xff0c;针对Java生成Excel下拉菜单时因选项过多导…...

在树莓派上添加音频输入设备的几种方法

在树莓派上添加音频输入设备可以通过以下步骤完成&#xff0c;具体方法取决于设备类型&#xff08;如USB麦克风、3.5mm接口麦克风或HDMI音频输入&#xff09;。以下是详细指南&#xff1a; 1. 连接音频输入设备 USB麦克风/声卡&#xff1a;直接插入树莓派的USB接口。3.5mm麦克…...