当前位置: 首页 > news >正文

一群追星星的人,对AI的盼与怕

18be870d8fb92d576f55e162ff18acc9.gif

7a5cae73e9377e141d51150ba7bb6e58.png

面对AI,有人害怕,有人期盼。

“AI和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化过临界点,我们普通人根本就跟不上,或快或慢被淘汰。看起来,AI正在给人类制造新的困境。

怕AI可以理解,那盼AI的人,到底在期盼什么呢?

前不久我在WAIC 2024上,发现了一个由孤独症儿童的父母、志愿者所组成的普通开发者团体,用AI给“来自星星的孩子”做绘本,这将“星宝”照护者们拉出了困境。

如何平衡AI的利弊,引导其健康发展,是我们这个时代亟需面对的重要课题。那些长期被我们忽略、存量问题待解的“小场景”,或许更需要先一步感受到AI。

20fdb8ea278ae77bac06be53a8a46837.png

c836a15efb8e1ed82f0466c888590ca0.png

“孤独症儿童的照护没有结果(可能无法治愈),能做的就是维持一定的生活质量,仅此而已。”

“每天要绞尽脑汁地给孩子编故事。一旦编不出来了,孩子就不睡觉了,大人孩子都很崩溃。”

“为了照护每天都不能出门、不能睡觉,我有时真的想死。”

孤独症儿童也被称为“来自星星的孩子(星宝)”,在社交、沟通、行为方面有特殊需求,照护难度很大。精力不足,无法充足的睡眠,是“星宝”照护者们普遍的困境。

除了照顾“星宝”们的日常生活,照护者往往还希望提升孩子的生活质量,让他们也能感受到快乐和愉悦。“读绘本”就是一个能给星宝们带来幸福感的事情。

但定制绘本的缺失,让照护者们承受着情感上的痛苦。

b531f7591a1b778cc61cf3d63ade178b.png

孤独症AI绘本项目的发起人之一,就是“星宝”图图的爸爸。他提到:“我家图图特别爱听故事,特别是睡前故事,几乎每天晚上都要听故事入睡。但是由于孤独症孩子他们是有明显的兴趣狭隘和刻板这些特性的,他只喜欢听他感兴趣的几个话题,例如说安全常识,去郊外探险,孙悟空等,或者说这几个元素要融在一起才行,但市面上很难找到这样的绘本故事。”

既然市面上没有满足“星宝”个性化阅读需求的绘本,能不能自己做一个呢? 

以公益产品“追星星的AI”为例,就通过大模型的三种能力,让这件事成为可能。

1.生成能力。“追星星的AI”通过家长或教师输入的一句话故事梗概(提示词),自动生成定制化的、图文并茂的绘本,包括常识认知、社交礼仪、心智解读、趣味故事等。

2.多模态能力。“追星星的AI” 调用了通义大模型的文生图、语音合成等AI多模态能力,可以让一句话变成能被朗读的有声绘本,丰富阅读体验。

3.交互能力。大语言模型的核心技术特点之一,就是能够与人类进行更为自然、流畅的对话。“追星星的AI”APP中,上海美术电影制片厂授权的孙悟空、大耳朵图图等动画形象,可以作为主角给孩子们讲故事,增强交互感。

2af82354f586e06b814ecfdf1a557300.png

20世纪50年代初,AI概念初现曙光之际,人们对技术的愿景是,它能倾听并理解人类的需求,为那些最为亟需的人群伸出援手。

当AIGC之光照进星宝们的世界,让星宝家庭和照护者感受到来自科技的温暖与关怀,才是我们所期待的,技术在现实中的回响。

02014b91b63798439abd396fbfbd5131.png

长期以来,将AI用于社会公益项目的尝试,屡见不鲜。为什么“追星星的AI”会引起我们的注意?

有一个特别的地方是:这个产品的开发,全部是由星宝照护者和志愿者来完成的。

非技术背景的普通人也可以掌握AI吗?跟“追星星的AI”工作人员聊了聊,或许可以给大家提供一些投身AI开发的思路。

首先,垂类应用要深入理解需求。

用AIGC生成绘本,这件事看起来非常简单易操作,几乎所有国产大模型平台都有全栈工具来支持从数据到精调、优化的所有步骤。但难点在于,每个应用所要求的细节都有很大差异。

比如星宝们可能没有办法理解过于复杂的图片信息。

“我们最开始生成出来的那一版图画,画面风格就有些复杂,出来好多星星点点的叶子、小花,被大家提出了意见,现在生成的就是这种比较干净的画面,一张图就是一个主体。”

“有的星宝对某些食物、动物会怕,是不能看见的,我们就设置了一个屏蔽功能,不会生成带有那些内容的图片。”

该项目的参与者既有星宝家庭成员,也有孤独症儿童干预机构,以及多年从事孤独症研究的高校学者。最终,结合星宝的认知水平层级,确定了最简洁的画面形式,突出人物,对话平实直接,确保AIGC生成方便星宝理解的画面。

其次,线上分布式协作方式。

一群家长和志愿者,到底要用多长时间才能做出一个AIGC应用?“追星星的AI”的开发时间是两个月。

坦率来说,这比很多“零门槛AI开发平台”、大模型社区所宣传的时间更长。目前,借助APP Inventor、APPMakr等简化开发工具,一个专业开发者创建一个功能丰富、交互复杂的应用,大概只需要两周甚至更短的时间。为什么“追星星的AI”落地时间要数月呢?

这是一个完全由大量在职志愿者完成的项目。其中有星宝的父母,有特教老师,大多数人以前都没有接触过AI。而且,他们分布在世界各地,平时还有全职工作,利用晚上或周末的时间来沟通和写代码,采用线上分布式协作的方式推动项目。

移动互联网时代有个著名的段子,有创业者说,“创意有了,钱也融到了,就差个程序员了”。AI开发,可能是有史以来第一次“去中心化”,普通人也可以通过线上分布式协作来参与到技术世界当中。

2e5256202fdb2bc2b640810d4699a5c2.png

此外,多机构的支持也必不可少。

一方面,绘本涉及动画形象,需要大量图片作为训练素材。其中上海美术电影制片厂授权并提供了悟空、图图等经典动画形象图库。另外,这些经典动画形象深入人心,要求模型的生成结果不能出现误差,尤其是“身体像面条一样”的悟空形象,一开始训练出来的效果并不理想。工作人员提到,后来上海美术电影制片厂的老师们并没有介意,后续又提供了更多的图库素材来帮助训练。

不难发现,“追星星的AI”是在很多非技术背景的人与机构的帮助下,才一点点搭建起来的。

6794baa404a18aaed894496bc87650f6.png

近期以来,“担心被AI抢走工作”的焦虑已经出现了人传人现象。

尽管很多技术从业者、科普作家会反复强调,技术进步会让一些岗位消失,也会创造一些新的岗位,应该尽快主动地探索与规划未来职业。但客观来说,被AI淘汰的人,未必能快速适配新创造的岗位的技能要求。

难道人类社会就要毫不反思、毫不抵抗地加速迈入高度自动化、无人化阶段吗?我想起一句话:不要温和地走进那个良夜。

一方面,等待AI带来改变的场景很多,类似孤独症儿童照护这样的需求大量存在,以前并没有被很好地解决,智能技术的互动性、个性化等带来了前所未有的解题思路,这是技术应该最先到达的地方。

另一方面,每个人都能用好AI来解决实际问题,但他们需要得到实际的支持。除了科技企业搭建的平台和社区之外,支持有不同需求的国民继续学习、终身学习,已经成为很多国家的共识。

cb45d757e59acf3113effd484934997b.jpeg

“哈佛幸福课”的讲师泰勒·本·沙哈尔说过:“一旦我们意识到自己的选项是什么,就很容易在短时间内作出决定。其中的关键点在于,意识到自己有选择,要比选择本身难得多。”

从这个角度说,“追星星的AI”让我看到了一群人关于AI的选择,或许也是你我更好的选择。

AI与人为敌,还是与人为友,选择权始终都掌握在人的手里。

1308a5392bb31dccb9cd22e35c662549.png

·

·

相关文章:

一群追星星的人,对AI的盼与怕

面对AI,有人害怕,有人期盼。 “AI和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化过临界点,我们普通人根本就跟不上,或快或慢被淘汰。看起来,AI正在给人…...

同步IO、异步IO以及五种网络IO模式

目录 一、同步IO和异步IO 二、五种网络IO模式 1、阻塞IO 2、非阻塞IO 3、IO多路复用 3.1、SELECT 3.2、POLL 3.3、EPOLL 一、同步IO和异步IO 场景1: 小明去打开水,而开水塔此时没有水,小明在现场一直等待开水到来,或者不断…...

IP-Guard日志数据上传至 SYSLOG 服务器操作指南

一、功能简介 服务器支持把日志数据上传到 SYSLOG 服务器。 二、功能配置 2.1 数据目录移交设置 在服务器安装目录下 OServer3.ini 文件中,添加工具启动配置,配置五分钟内生效。 Path:设置移交目录路径,IPG 服务器会把收集完成的…...

线程安全(二)synchronized 的底层实现原理、锁升级、对象的内存结构

目录 一、基础使用1.1 不加锁的代码实现1.2 加锁的代码实现二、实现原理2.1 synchronized 简介2.2 对象监控器(Monitor)2.3 加锁过程第一步:判断 Owner 指向第二步:进入 EntryList 阻塞第三步:主动进入 WaitSet 等待三、锁升级3.1 对象的内存结构3.2 Mark Word 对象头3.3 …...

【学习笔记】无人机(UAV)在3GPP系统中的增强支持(十四)-无人机操控关键绩效指标(KPI)框架

引言 本文是3GPP TR 22.829 V17.1.0技术报告,专注于无人机(UAV)在3GPP系统中的增强支持。文章提出了多个无人机应用场景,分析了相应的能力要求,并建议了新的服务级别要求和关键性能指标(KPIs)。…...

数电基础 - 半导体存储

目录 一. 简介 一. 只读存储器 二. 可编程只读存储器 三. 可擦除的可编程只读存储器 四. 随机存储器 五. 存储器容量的扩展 六. 总结 一. 简介 半导体存储是数字电路中用于存储数据的重要组成部分。 半导体存储器主要分为两大类:随机存取存储器&#xff0…...

校园工会体育报名小程序的设计

管理员账户功能包括:系统首页,个人中心,赛事公告管理,球员管理,球队信息管理,比赛信息,比赛报名管理 微信端账号功能包括:系统首页,比赛信息,比赛报名&#…...

2024Datawhale AI夏令营---基于术语词典干预的机器翻译挑战赛--学习笔记

#Datawhale #NLP 1.背景介绍: 机器翻译(Machine Translation,简称MT)是自然语言处理领域的一个重要分支,其目标是将一种语言的文本自动转换为另一种语言的文本。机器翻译的发展可以追溯到20世纪50年代,经历…...

手机下载APP (uniapp/vue)

一、uniapp <template><view class"content"><view class"appName">{{ formData.appName }}</view><view class"appInfo">{{ formData.appInfo }}</view><image class"logo" :src"formDa…...

python数据可视化(5)——绘制饼图

课程学习来源&#xff1a;b站up&#xff1a;【蚂蚁学python】 【课程链接&#xff1a;【【数据可视化】Python数据图表可视化入门到实战】】 【课程资料链接&#xff1a;【链接】】 Python绘制饼图分析北京天气 饼图&#xff0c;是一个划分为几个扇形的圆形统计图表&#xff…...

实习随笔【iviews的Select实现‘与全部互斥’的多选】

在实习中&#xff0c;遇到了如下需求&#xff0c;要求如下&#xff1a; 上面提到了一个需求为&#xff0c;选择全部与选择一个或者多个互斥&#xff0c;我们来看一下如何解决 核心代码 监听value的变化&#xff0c;如果含有‘全部’&#xff0c;且数组长度>1&#xff0c;则删…...

网站架构核心要素

高性能 技术指标&#xff1a;响应时间、吞吐量、并发数 前端优化手段 页面布局&#xff1a;css在前&#xff0c;js在后通信数据量&#xff1a;数据尽量精简缓存&#xff1a;浏览器缓存、cdn异步&#xff1a;ajax 后端优化手段 缓存&#xff1a;反向代理、redis异步&#x…...

XML 解析异常问题解决

问题描述 The parser has encountered more than "64000" entity expansions in this document; this is the limit imposed by the JDK. 在运行 Java 应用程序时&#xff0c;出现了 XML 解析异常。具体表现为&#xff1a; 报错信息显示无法创建 StAX&#xff08;S…...

C# 匿名方法、Lambda、Linq概念及联系

匿名方法、Lambda表达式与LINQ 匿名方法 概念&#xff1a; 匿名方法是没有名称的方法实现&#xff0c;通常与委托关联使用。它提供了一种在不创建独立命名方法的情况下编写代码块的方式。 语法&#xff1a; delegate void MyDelegate(string message);MyDelegate del dele…...

django ninja get not allowed 能用 put delete

遇到一个奇怪的问题&#xff0c;django-ninja 编写的 get post 方法不能使用 # 获取Material router.get(/material, responseList[MaterialSchemaOut]) paginate(MyPagination) def list_material(request, filters: Filters Query(...)):qs retrieve(request, Material, f…...

服务器操作集合

服务器使用PC作为代理访问外网 1、PC上启动代理&#xff0c;比如nginx 下载nginx&#xff1a;http://nginx.org/en/download.html 修改配置文件&#xff0c;在conf下&#xff1a; http {include mime.types;default_type application/octet-stream;sendfile o…...

论文阅读【时空+大模型】ST-LLM(MDM2024)

论文阅读【时空大模型】ST-LLM&#xff08;MDM2024&#xff09; 论文链接&#xff1a;Spatial-Temporal Large Language Model for Traffic Prediction 代码仓库&#xff1a;https://github.com/ChenxiLiu-HNU/ST-LLM 发表于MDM2024&#xff08;Mobile Data Management&#xf…...

【linux基础】linux远程传输三种免交互方式

linux远程传输三种免交互方式 文章目录 linux远程传输三种免交互方式1、使用sshpass工具2、使用expect脚本来输入密码3、SSH 密钥对 1、使用sshpass工具 建立信任关系的做法是最方便和安全的做法&#xff0c;但是在有些场景下(比如远端的authorized_keys是不能随意更改的)&…...

MySQL篇:事务

1.四大特性 首先&#xff0c;事务的四大特性&#xff1a;ACID&#xff08;原子性&#xff0c;一致性&#xff0c;隔离性&#xff0c;持久性&#xff09; 在InnoDB引擎中&#xff0c;是怎么来保证这四个特性的呢&#xff1f; 持久性是通过 redo log &#xff08;重做日志&…...

处理在 electron 中使用开启了懒加载的 el-image 后,窗口最大化或窗口尺寸变化后图片无法显示的问题

文章目录 1、问题描述2、详情动图3、解决思路4、解决方案5、效果展示 1、问题描述 在 electron 中使用 el-image 时&#xff0c;开启了懒加载后&#xff0c;发现只有当窗口滚动后&#xff0c;图片才会显示&#xff0c;即便图片已经处于窗口的可视区域。当拖动窗口使其尺寸变大…...

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…...

使用VSCode开发Django指南

使用VSCode开发Django指南 一、概述 Django 是一个高级 Python 框架&#xff0c;专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。 本文将创建一个简单的 Django 应用&#xff0c;其中包含三个使用通用基本模板的页面。在此…...

基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容

基于 ​UniApp + WebSocket​实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配​微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...

UDP(Echoserver)

网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法&#xff1a;netstat [选项] 功能&#xff1a;查看网络状态 常用选项&#xff1a; n 拒绝显示别名&#…...

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。 一、环境准备 1、VMware 基于VMware构建Linux虚拟机 是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案 所以VMware虚拟机方案是必须要学习的。 &#xff08;1&#xff09;设置网关 打开VMware虚拟机&#xff0c;点击编辑…...

【磁盘】每天掌握一个Linux命令 - iostat

目录 【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景 注意事项 【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat&#xff08;I/O Statistics&#xff09;是Linux系统下用于监视系统输入输出设备和CPU使…...

React Native在HarmonyOS 5.0阅读类应用开发中的实践

一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强&#xff0c;React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 &#xff08;1&#xff09;使用React Native…...

Python爬虫(二):爬虫完整流程

爬虫完整流程详解&#xff08;7大核心步骤实战技巧&#xff09; 一、爬虫完整工作流程 以下是爬虫开发的完整流程&#xff0c;我将结合具体技术点和实战经验展开说明&#xff1a; 1. 目标分析与前期准备 网站技术分析&#xff1a; 使用浏览器开发者工具&#xff08;F12&…...

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现

摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序&#xff0c;以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务&#xff0c;提供稳定高效的数据处理与业务逻辑支持&#xff1b;利用 uniapp 实现跨平台前…...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

引擎版本&#xff1a; 3.8.1 语言&#xff1a; JavaScript/TypeScript、C、Java 环境&#xff1a;Window 参考&#xff1a;Java原生反射机制 您好&#xff0c;我是鹤九日&#xff01; 回顾 在上篇文章中&#xff1a;CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...