ChatGPT 的一些思考
最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开始,就已经能够理解较多的上下文信息并给出符合上下文的回复,但是给人的震撼并不如这次 3.5/4.0 版本来的多。就我个人而言,最直接的比较震撼的是更加灵活的代码生成,小说续写改写等等,而且都是从自然语言习惯进行交流的,不用相对来说比较专业的术语或者提问方式就可以实现流畅的沟通。
这次 ChatGPT 的火爆让我重新回顾了下近些年来 AI 究竟在生活当中从哪些方面融入了我们的日常。就我个人而言,能够明显感受到或者了解到的 AI 实际应用的场景有下面几个:
- 实时字幕/实时翻译;
- 手机拍照(人像模式);
- 图像文字提取
- AI 绘画和人脸替换;
实时字幕的应用有几个细分,比如说双方交流的实时字幕生成,并不包含翻译部分,是把对方的话用对方的语言来实时生成字幕进行显示,特别适用于听力不好但是阅读能力比较好的人使用。典型的产品有WIN11 的全局实时字幕,小米手机的小米闻声实时字幕,当然还有其它的一些 APP,不过感觉一些专门做词典之类的软件反而并不如一些视频会议软件或者小米闻声做得好,讯飞也是做得比较好的。这种的典型应用场景就是春晚或者什么直播节目也可以进行实时字幕的生成,以及不同地区方言到统一官方语言的转换,还有就是需要进行语音实时转录文字,这个文字工作者应该会比较需要。还有一些细分就是同声传译,也就是除了识别对方说的话之外还额外帮你翻译出来转换到自己想用的语言上面去,这个准确度已经比以前提升了非常多了,这个极大的方便了不同国家不同语言口音的人交流,出国游的时候就不用担心会遇到无论如何也搞不懂说什么的状况。
手机拍照这个对于 AI 的应用也是愈来愈广泛,我就说一个比较典型的能够有明显感知的应用,比如说人像模式的拍照或者视频录制,需要进行背景虚化,以前的背景虚化搞得都是非常不准确的,该虚的地方没有虚好,该实的地方没有实,总之就是突出一个不稳定。而以小米为例,小米12s 系列就已经表现出了比较令人满意的背景虚化效果了,大部分情况下都可以得到令人满意的虚化效果。
还有就是图像文字提取,也就是古早时候的 OCR 技术实现的的升级版,比较明显的就是微信的图像文字提取,可以直接把图像当做文本文件进行选择、复制、剪切,十分方便。还有就是用于改作业、做作业的图像识别,直接可以识别出来文字和图形化的题目,并给出解析,这个也是非常能体现生产力的地方,当然还有很多其它的应用我就没过多涉及了,总之都是生产力提升的体现。
AI 绘画也是 AIGC 的一个比较令人震惊的应用,而且从目前来看,AI 绘画已经可以做到添加一些 AI 自己的艺术理解进去,有些情况下的画作已经比人类还要优秀了。最令我震惊的是最近的写实风 AI 图像生成,虽然一直被吐槽 AI 还是无法理解人类的手是什么个存在,但是通过一定的训练之后已经可以画出一些超写实的画作了,基本上乍一看看不出来真假。还有一部分是建模的应用,虽然不清楚具体的实现是不是基于传统 CV 还是改良后的 AI,但是我感觉纯传统 CV 应该做不到那么真实的模拟。而人脸替换则肯定是基于 AI 的实现了,这个在很多的短视频里面、电影里面都有体现了,已经达到相当的实用程度,不在是笨拙的纯玩具的级别。
而最近的 ChatGPT bing 版,我看好多时候回答已经体现出了一些独立人格的迹象,虽然它不一定是真的独立人格,但是给人的感觉已经非常接近了,对我来说已经有点恐怖谷效应了,属于非常接近但是还总是有一点不对劲的感觉。这次的版本更新给人一种强烈的危机感,毕竟离线训练版的就已经可以达到代码生成,超强的语义理解和交流,这些完全可以在不断的训练之中进化达到更强的程度。试想一下 ChatGPT 的接口引入到游戏产业,游戏里面的 NPC 可以产生完全符合现实中自然人类的对话和行为,这将创造一个极度真实的自由世界,只需要赋予每个 NPC 不同的 AI 人格,加之接口数据的指令化标准化就可以做到。
感觉下一次的社会层面技术大升级如初升红日,在远远的海岸线上已经绰约可见了。想象中的下一轮升级是属于 AI+机器人的,也就是把强 AI 录入到不同功用的机器人内生操作系统里面,由 AI 去控制完成一些自然语言指令,工业上或许要更加特殊化一些,但是生活和一些工业门类则可以做到完全使用自然语言去控制 AI+机器人实现真正的实用化的 AI 助手。而「流浪地球2」里面的机器人技术和 550 系列我感觉可能真的已经在不远的将来了,现在能想到的最可能的组合,AI+波士顿动力的机器人/机器狗,经过后续的接口对接和迭代或许可以在有生之年带来一场全新的技术革命,当然技术对于人类社会的冲击也许不可忽视,但是这是另外一个话题了。
目前已经可以看到端倪的,可以被少量或者大量替代的岗位我自己理解可能会有:程序员(UI 设计、互联网等比较标准化软件化的领域);效果调试(自动控制、Tuning);文字工作者(绘画、有一定格式要求的文章写手);语言工作者(翻译、同传);律师(一些民事领域的纠纷处理);服务类型岗位(流程处理、程式化的内容处理);会计(流程报表);司机等等。当然这些不会是完全替代,但是绝对会相当程度上解放其生产力,使得需要的工作岗位大量减少,只保留少部分中低端岗位和高端岗位,剩下的会被全部替代。
面对 AI 的的冲击,也许从个人来讲除了为此感到谨慎兴奋和享受其带来的便利之外,也该更多的去思考下对个人带来的影响。毫无疑问个人生产力会得到更大的解放,个人未来可能不需要再花大量的时间在一些日常家务、无效或者说无必要的人际交往等上面,更多把精力用于自己喜欢的事情和创造力上面去。但是也应警惕自己的可替代性,在向 AI 时代进化的过程初期和中期,肯定会牺牲掉一大部分人从而完成整个的过渡。我个人想到的不可替代的工作类型有:程序员(与硬件绑定较多的、高端理论发明、架构创造);医生(需要进行外科手术的);律师(刑事律师、经济领域、高端领域)等等。我想要特别说明的是教师,无论何种教师,教学工作内容简单与否,我想都是绝对不可替代的,即使 AI 的教学技术或许可以超过人类,但是学生家长是绝对不允许学生处在一个独立的学习环境的,客观条件上来讲义务教育阶段的学生也是绝对不可能适应独立学习环境的,初期学习是一个需要通过人际交往来实现的行为,脱离了人与人之间的交流,从目前的人类构造来讲,义务教育不太可能实现其预定的目标。
AI 的时代或许很快就会到来,个人虽不一定要深度参与其中,但是保持一定的敏感性还是很有必要的。
相关文章:
ChatGPT 的一些思考
最近 ChatGPT3.5 在全世界范围内掀起了一次 AI 的潮流,ChatGPT1.0/ChatGPT2.0 当时也是比较火爆,但是那个当时感觉还是比较初级的应用,相当于是一个进阶版的微软小冰,给人的感觉是有一点智能,但不多。其实从早期版本开…...
GEE学习笔记 六十九:【GEE之Python版教程三】Python基础编程一
环境配置完成后,那么可以开始正式讲解编程知识。之前我在文章中也讲过,GEE的python版接口它是依赖python语言的。目前很多小伙伴是刚开始学习GEE编程,之前或者没有编程基础,或者是没有学习过python。为了照顾这批小伙伴࿰…...
大数据全系安装
内容版本号CentOS7.6.1810ZooKeeper3.4.6Hadoop2.9.1HBase1.2.0MySQL5.6.51HIVE2.3.7Sqoop1.4.6flume1.9.0kafka2.8.1scala2.12davinci3.0.1spark2.4.8flink1.13.5 1. 下载CentOS 7镜像 CentOS官网 2. 安装CentOS 7系统——采用虚拟机方式 2.1 新建虚拟机 2.2.1 [依次选择]-&…...
stable-diffusion-webui 安装使用
文章目录1.github 下载,按教程运行2.安装python 忘记勾选加入环境变量,自行加入(重启生效)3.环境变量添加后,清理tmp ,venv重新运行4.运行报错,无法升级pip,无法下载包,5…...
3D点云处理:点云聚类--FEC: Fast Euclidean Clustering for Point Cloud Segmentation
文章目录 聚类结果一、论文内容1.1 Ground Surface Removal1.2 Fast Euclidean Clustering题外:欧几里得聚类Fast Euclidean Clustering二、参考聚类结果 原始代码中采用的是pcl中的搜索方式,替换为另外第三方库,速度得到进一步提升。 一、论文内容 论文中给出的结论:该…...
华为OD机试题 - 射击比赛(JavaScript)| 代码+思路+重要知识点
最近更新的博客 华为OD机试题 - 括号检查(JavaScript) 华为OD机试题 - 最小施肥机能效(JavaScript) 华为OD机试题 - 子序列长度(JavaScript) 华为OD机试题 - 众数和中位数(JavaScript) 华为OD机试题 - 服务依赖(JavaScript) 华为OD机试题 - 字符串加密(JavaScript)…...
流程引擎之Flowable简介
背景Flowable 是一个流行的轻量级的采用 Java 开发的业务流程引擎,通过 Flowable 流程引擎,我们可以部署遵循 BPMN2.0 协议的流程定义(一般为XML文件)文件,并能创建流程实例,查询和访问流程相关的实例与数据…...
AcWing:4861. 构造数列、4862. 浇花(C++)
目录 4861. 构造数列 问题描述: 实现代码: 4862. 浇花 问题描述: 实现代码: 4861. 构造数列 问题描述: 我们规定如果一个正整数满足除最高位外其它所有数位均为 00,则称该正整数为圆数。 例如&…...
进程的概念
进程的概念 程序的概念 这里说的是一个可执行文件,passive的意思可以理解为我们这个执行文件需要我们进行双击才会被被执行。 双击后,程序入口地址读入寄存器,程序加载入主存,成为一个进程 进程是主动去获取想要的资源࿰…...
自动化测试5年经验,分享一些心得
自动化测试介绍 自动化测试(Automated Testing),是指把以人为驱动的测试行为转化为机器执行的过程。实际上自动化测试往往通过一些测试工具或框架,编写自动化测试用例,来模拟手工测试过程。比如说,在项目迭代过程中,持…...
independentsoft.de/MSG .NET Framework Crack
MSG .NET 是用于 .NET Framework / .NET Core 的 Microsoft Outlook .msg 文件 API。API 允许您轻松创建/读取/解析/转换 .msg 文件等。API 不需要在机器上安装 Microsoft Outlook 或任何其他第三方应用程序或库即可工作。 以下示例向您展示了如何打开现有文件并显示消息的某些…...
基于Transformer的NLP处理管线
HuggingFace transformers 是一个整合了跨语言、视觉、音频和多模式模态与最先进的预训练模型并且提供用户友好的 API 的AI开发库。 它由 170 多个预训练模型组成,支持 PyTorch、TensorFlow 和 JAX 等框架,能够在代码之间进行互操作。 这个库还易于部署&…...
二叉树OJ(一)二叉树的最大深度 二叉搜索树与双向链表 对称的二叉树
二叉树的最大深度 二叉树中和为某一值的路径(一) 二叉搜索树与双向链表 对称的二叉树 二叉树的最大深度 描述 求给定二叉树的最大深度, 深度是指树的根节点到任一叶子节点路径上节点的数量。 最大深度是所有叶子节点的深度的最大值。 (注:…...
使用Fairseq进行Bart预训练
文章目录前言环境流程介绍数据部分分词部分预处理部分训练部分遇到的问题问题1可能遇到的问题问题1问题2前言 本文是使用 fairseq 做 Bart 预训练任务的踩坑记录huggingface没有提供 Bart 预训练的代码 facebookresearch/fairseq: Facebook AI Research Sequence-to-Sequence…...
n阶数字回转方阵 ← 模拟法
【问题描述】 请编程输出如下数字回旋方阵。 【算法代码】 #include <bits/stdc.h> using namespace std;const int maxn100; int z[maxn][maxn];void matrix(int n) {int num2;z[0][0]1;int i0,j1;while(i<n && j<n) {while(i<j) z[i][j]num;while(j&…...
【人工智能AI】二、NoSQL 基础知识《NoSQL 企业级基础入门与进阶实战》
写一篇介绍 NoSQL 基础知识的技术文章,分5个章节,每个章节细分到3级目录,重点介绍一下NoSQL 数据模型,NoSQL 数据库架构,NoSQL 数据库特性等,不少于2000字。 NoSQL 基础知识 NoSQL(Not Only SQ…...
Camera Rolling Shutter和Global Shutter的区别
卷帘快门(Rolling Shutter)与全局快门(Global Shutter)的区别 什么是快门 快门是照相机用来控制感光片有效曝光时间的机构。 快门是照相机的一个重要组成部分,它的结构、形式及功能是衡量照相机档次的一个重要因素。 …...
模版之AnyType
title: 模版之AnyType date: 2023-02-19 21:49:53 permalink: /pages/54a0bf/ categories: 通用领域编程语言C tags:C元编程 author: name: zhengzhibing link: https://azmddy.top/pages/54a0bf/ 模版之AnyType 在研究C的编译期反射时,发现了AnyType很有意思。 首…...
【汇编】一、环境搭建(一只 Assember 的成长史)
嗨~你好呀! 我是一名初二学生,热爱计算机,码龄两年。最近开始学习汇编,希望通过 Blog 的形式记录下自己的学习过程,也和更多人分享。 这篇文章主要讲述汇编环境的搭建过程。 话不多说~我们开始吧! 系统环…...
【博客628】k8s pod访问集群外域名原理以及主机开启了systemd-resolved的不同情况
k8s pod访问集群外域名原理以及使用了systemd-resolved的不同情况 1、不同情况下的linux主机访问外部域名原理 没有使用systemd-resolved的linux主机上访问外部域名一般是按照以下步骤来的: 从dns缓存里查找域名与ip的映射关系 从/etc/hosts里查找域名与ip的映射…...
wordpress后台更新后 前端没变化的解决方法
使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...
[2025CVPR]DeepVideo-R1:基于难度感知回归GRPO的视频强化微调框架详解
突破视频大语言模型推理瓶颈,在多个视频基准上实现SOTA性能 一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战 安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度,导致: 梯度抑制:当新旧策略差异过大时梯度消失收敛困难:策略无法充分优化# 传统GRPO的梯…...
iOS 26 携众系统重磅更新,但“苹果智能”仍与国行无缘
美国西海岸的夏天,再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至,这不仅是开发者的盛宴,更是全球数亿苹果用户翘首以盼的科技春晚。今年,苹果依旧为我们带来了全家桶式的系统更新,包括 iOS 26、iPadOS 26…...
云启出海,智联未来|阿里云网络「企业出海」系列客户沙龙上海站圆满落地
借阿里云中企出海大会的东风,以**「云启出海,智联未来|打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办,现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...
(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...
JVM虚拟机:内存结构、垃圾回收、性能优化
1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...
A2A JS SDK 完整教程:快速入门指南
目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库ÿ…...
多模态图像修复系统:基于深度学习的图片修复实现
多模态图像修复系统:基于深度学习的图片修复实现 1. 系统概述 本系统使用多模态大模型(Stable Diffusion Inpainting)实现图像修复功能,结合文本描述和图片输入,对指定区域进行内容修复。系统包含完整的数据处理、模型训练、推理部署流程。 import torch import numpy …...
在 Spring Boot 项目里,MYSQL中json类型字段使用
前言: 因为程序特殊需求导致,需要mysql数据库存储json类型数据,因此记录一下使用流程 1.java实体中新增字段 private List<User> users 2.增加mybatis-plus注解 TableField(typeHandler FastjsonTypeHandler.class) private Lis…...
消防一体化安全管控平台:构建消防“一张图”和APP统一管理
在城市的某个角落,一场突如其来的火灾打破了平静。熊熊烈火迅速蔓延,滚滚浓烟弥漫开来,周围群众的生命财产安全受到严重威胁。就在这千钧一发之际,消防救援队伍迅速行动,而豪越科技消防一体化安全管控平台构建的消防“…...
