警惕:与ChatGPT共享业务数据可能十分危险
您已经在使用ChatGPT了吗?或者您正在考虑使用它来简化操作或改善客户服务?虽然ChatGPT提供了许多好处,但重要的是,您要意识到与ChatGPT这样的人工智能工具共享敏感业务数据相关的安全风险。下面,我们概述了一些关键问题,并就如何降低与ChatGPT共享公司数据的风险提供了建议。
ChatGPT不存储用户的输入数据,是吗?
聊天机器人从用户输入中记忆和学习的影响可能是深远的:想象一下,您正在做一场内部演示,其中包含了新的企业数据,揭示了一个将在董事会会议上讨论的企业问题。将这些专有信息泄露出去可能会损害股价、消费者态度和客户信心。更糟糕的是,议程上的法律事项被泄露可能会使公司承担真正的责任。但是,仅仅把这些东西输入聊天机器人中,这些事情真的会发生吗?
研究公司Cyberhaven于今年2月就这一问题进行了深入探索,结果指出,如果第三方根据该高管提供的信息向ChatGPT询问某些问题,那么输入ChatGPT的机密数据可能会被泄露给第三方。
英国国家网络安全中心(NCSC)在3月份分享了对此事的进一步见解,指出ChatGPT和其他大型语言模型(LLM)目前不会自动将信息从查询添加到模型中供其他人查询。也就是说,在查询中包含信息不会导致潜在的私有数据被合并到LLM中。然而,提供LLM的组织(就ChatGPT而言,指的是OpenAI)将能看到查询。
这些查询会被存储起来,几乎肯定会在某个时候用于开发和训练LLM服务或模型。这可能意味着LLM提供商(或其合作伙伴/承包商)能够读取查询,并可能以某种方式将它们合并到未来的版本中。
2021年6月,来自苹果、斯坦福大学、谷歌、哈佛大学等的研究人员发表了一篇论文,揭示了类似于ChatGPT的语言学习模型GPT-2可以准确地从训练文档中回忆起敏感信息。
报告发现,GPT-2可以调用具有特定个人标识符的信息,重新创建精确的文本序列,并在提示时提供其他敏感信息。这些“训练数据提取攻击”可能会对机器学习模型研究人员的安全构成越来越大的威胁,因为黑客可能能够访问机器学习研究人员的数据并窃取他们受保护的知识产权。
总而言之,我们有理由担忧与ChatGPT共享敏感业务数据会威胁企业安全,并造成无法挽回的后果。
与ChatGPT共享敏感数据的风险
据数据安全公司Cyberhaven发布的统计数据显示,平均每家公司每周会向ChatGPT发布数百次敏感数据,涉及客户或患者信息、源代码、机密数据和监管信息等等,这些请求引起了严重的网络安全问题。

【ChatGPT在工作场所使用情况】
对于组织来说,理解并缓解与ChatGPT共享敏感数据的风险,以保护其资产、维护客户信任并遵守法规要求是至关重要的。具体来说,这些风险涵盖以下几点:
1. 数据隐私和保密风险
优先考虑公司敏感信息的隐私和机密性是至关重要的。请注意,当您使用ChatGPT时,实际上是在与外部实体共享组织数据。人工智能模型处理这些数据以生成所需的输出,这可能导致意外地将敏感信息暴露给第三方。
您可以始终决定不允许ChatGPT将企业数据用于培训目的。然而,即使在这种情况下,您与ChatGPT分享的任何公司数据都将通过互联网发送,并可能存储在某个地方进行处理,以便回答您的问题。
在将业务数据输入ChatGPT之前,请确保您了解人工智能提供商的数据存储、使用和保留策略,并实施强大的数据保护措施。
2. 知识产权风险
当与ChatGPT共享信息时,企业的知识产权(IP)可能会无意泄露。为了减轻这种风险,请避免与人工智能工具共享专有数据、商业机密或版权材料。最近的一个突出案例是三星员工在ChatGPT中无意泄露了公司的秘密。
3. 数据合规风险
许多国家都有数据保护法规,例如欧盟的《通用数据保护条例(GDPR)》和《加州消费者隐私法案》(CCPA)。这些法案管理企业如何收集、存储和处理个人信息。如果您在ChatGPT中无意地分享了个人数据,可能会让企业暴露于合规风险上。
缓解建议
制定使用政策
ChatGPT的使用和可访问性可以是一把双刃剑,因为它增加了员工滥用或滥用的风险。此外,员工也可能会被诱惑使用人工智能工具来实现非相关的目的。为了解决这些问题,必须建立清晰的使用策略和指导方针,详细规定在使用ChatGPT时可接受和不可接受的行为。
去年年初以来,在发现ChatGPT生成的文本中有疑似商业机密的情况后,不少科技巨头已经开始提醒自己的员工不要在使用ChatGPT时输入敏感信息数据。无独有偶,微软也曾表示,只要员工不与ChatGPT分享机密信息,就可以在工作时使用。
教育员工相关风险
人员始终是攻击链中最薄弱的环节,因此对员工进行教育和培训同样至关重要。组织必须确保他们了解负责任地使用ChatGPT以及滥用ChatGPT的潜在后果。这包括让他们意识到数据隐私问题、知识产权风险和合规要求。
利用先进技术
识别和控制员工提交给ChatGPT的数据并非没有挑战。当员工在ChatGPT中输入公司数据时,他们不是上传文件,而是将内容复制粘贴到他们的网络浏览器中。许多安全产品都是围绕保护文件(被标记为机密)不被上传而设计的,但一旦内容从文件中复制出来,他们将无法跟踪它。
为了提高可见性,组织应该在其安全web网关(SWG)上实施策略,以识别人工智能工具的使用,还可以应用数据丢失预防(DLP)策略来识别哪些数据被提交给这些工具。
结语
虽然ChatGPT提供了非凡的功能,但理解和管理相关的安全风险是至关重要的。通过实施强有力的数据保护措施,遵守数据保护法规,保护知识产权和监控员工使用,组织可以最大限度地降低这些风险,并利用ChatGPT的力量推动业务向前发展。
原文链接:
Are you sharing company data with ChatGPT? - Endare
Sharing sensitive business data with ChatGPT could be risky | CSO Online
相关文章:
警惕:与ChatGPT共享业务数据可能十分危险
您已经在使用ChatGPT了吗?或者您正在考虑使用它来简化操作或改善客户服务?虽然ChatGPT提供了许多好处,但重要的是,您要意识到与ChatGPT这样的人工智能工具共享敏感业务数据相关的安全风险。下面,我们概述了一些关键问题…...
基于MacOS系统Sonoma 14.5的SSH服务禁止密码登录
基于系统Sonoma 14.5,不同系统有所差异。 修改sshd_config文件 sudo vim /etc/ssh/sshd_config找到以下两行取消注释,修改值为 no PasswordAuthentication no KbdInteractiveAuthentication no重启sshd服务 # 关闭服务 sudo launchctl unload -w /System…...
深入理解MySQL中的EXPLAIN及type列
在MySQL中,EXPLAIN是一个强大的工具,它可以帮助我们理解SQL查询的执行计划。通过使用EXPLAIN,我们可以获取到查询的详细信息,包括如何执行查询,以及查询的各个部分如何连接在一起。在本篇博客中,我们将重点…...
LoRaWAN网络协议Class A/Class B/Class C三种工作模式说明
LoRaWAN是一种专为广域物联网设计的低功耗广域网络协议。它特别适用于物联网(IoT)设备,可以在低数据速率下进行长距离通信。LoRaWAN 网络由多个组成部分构成,其中包括节点(终端设备)、网关和网络服务器。Lo…...
ITSS服务经理:WAVE SUMMIT深度学习开发者大会2024在北京召开
在6月28日,由深度学习技术及应用国家工程研究中心主导的WAVE SUMMIT深度学习开发者大会2024于北京隆重举行。 此次盛会由百度飞桨和文心大模型联袂承办。 在大会上,百度震撼发布文心大模型4.0 Turbo版本,并宣布其API接口将向广大开发者开放…...
Keysight 是德 DSAX93204A 高性能示波器
Keysight 是德 DSAX93204A 高性能示波器 DSAX93204A Infiniium 高性能示波器: 33 GHz 高带宽实时示波器 zui佳的 33 GHz 真正模拟带宽80 GSa/s 采样率,2 通道;40 GSa/s 采样率,4 通道zui深的存储深度――高达 2 Gpts 存储器&am…...
oracle逻辑层级详解(表空间、段、区、数据块)
文章目录 逻辑结构的层次如下所述:逻辑结构包括表空间、段、区和数据块。表空间:段:区:数据块: 逻辑结构的层次如下所述: oracle数据库至少包含一个表空间。 表空间包含一个或多个段。(segmen…...
华为OD机试(C卷,200分)- 字符串拼接、田忌赛马
(C卷,200分)- 字符串拼接 题目描述 给定 M(0 < M ≤ 30)个字符(a-z),从中取出任意字符(每个字符只能用一次)拼接成长度为 N(0 < N ≤ 5)的字符串, 要求…...
Windows中配置python3.11环境安装教程
在Windows中配置Python 3.11环境的步骤如下: 第一步:下载 Python 3.11 访问 Python 官方网站:https://www.python.org/导航到 “Downloads” 部分,选择 “Windows”。在 “Windows” 页面中,找到 “Python 3.11.x”&…...
市场趋势的智能预测:Kompas.ai如何洞察未来市场动向
在商业领域,市场趋势预测是企业制定战略规划和做出明智决策的关键。准确把握市场动向能够帮助企业及时调整战略,抓住机遇,规避风险。Kompas.ai,一款先进的人工智能市场分析工具,正通过其深度学习和数据分析能力&#x…...
华南师范大学“大学生校外实践教学基地”授牌仪式暨见习参观活动圆满结束
为促进校企合作的深入发展,培育出具有实际应用技能的人才,7月9日,华南师范大学数学科学院与广东泰迪智能科技股份有限公司联合开展“大学生校外实践教学基地”授牌仪式暨见习参观活动。华南师范大学数学科学院数据科学系主任陈艳男、副主任陈…...
防爆定位信标适合工厂吗?都有哪些优势呢?
防爆定位信标产品可服务的范围非常广,尤其是具有一定危险性的岗位和行业,为了将损失降到最低或是说避免危险发生,一般都会安装这类产品,既是保护工作人员的人身安全,也能保护企业工厂的财产安全,因此这类设…...
行为模式8.状态模式------灯泡状态切换
行为型模式 模板方法模式(Template Method Pattern)命令模式(Command Pattern)迭代器模式(Iterator Pattern)观察者模式(Observer Pattern)中介者模式(Mediator Pattern…...
Linux账户和组管理——账户和工作组分类,用户账号文件,/etc/passwd文件中7个字段,id 命令
## 账户和工作组的分类 ### 用户分为三类: - 超级账户——账户名为root,它具有一切权限,只有进行系统维护(例如:建立用户等)或其他必要情形下才用超级用户登录,以避免系统出现安全问题。 - 系统账户——是Linux系统正常…...
《大明混一图》: 令人叹为观止的古代世界地图
关注我们 - 数字罗塞塔计划 - 《大明混一图》是我国目前保存尺寸最大、最完整、年代最久远,且由中国人自己绘制的世界地图,2003年10月被列入《中国档案文献遗产名录》,现保存于中国第一历史档案馆。据学者们研究,这幅地图大约是…...
Java高级重点知识点-22-缓冲流、转换流、序列化流、打印流
文章目录 缓冲流字节缓冲流字符缓冲流 转换流InputStreamReader类OutputStreamWriter类 序列化ObjectOutputStream类ObjectInputStream类 打印流 缓冲流 缓冲流,也叫高效流,是对4个基本的 FileXxx 流的增强,所以也是4个流 基本原理: 缓冲流的…...
express民族民俗文化分享平台-计算机毕业设计源码22552
基于Vue的民族民俗文化分享平台设计与实现 摘 要 本文介绍了一种基于Vue.js前端框架和Express后端框架的民族民俗文化分享平台的设计和实现。该平台旨在通过线上方式,促进民族民俗文化的传播与分享,增强公众对多元文化的了解和认同。 平台为普通用户提供…...
Web 基础与HTTP 协议
域名的概述 (1 )域名的结构 (2 )域名结构类型 根域:指的是根服务器,要用来管理互联网的主目录,全世界只有13台。1个为 主根服务器,放置在美国。其余12 个均为辅根服务器,其中9个放置在美国;欧 洲2个&…...
C++超市外卖小程序-计算机毕业设计源码62482
摘要 随着社会生活节奏加快和消费习惯的变化,外卖服务成为人们日常生活中不可或缺的一部分。超市外卖作为新兴业态备受关注,然而传统外卖平台在推荐精准度和用户体验方面存在挑战。 本研究旨在基于协同过滤算法,结合C语言和MySQL数据库&#…...
合合信息“大模型加速器”亮相2024世界人工智能大会
文章目录 📑引言一、大模型发展的挑战数据稀缺问题 二、大模型“加速器”解决方案概述文档解析引擎的特征 三、文档解析引擎的优势3.1 高速处理能力3.2 智能理解文档结构3.3 多种数据类型支持3.4 高精度数据提取3.5 应用广泛,适应性强 四、复杂图表解析4…...
Xshell远程连接Kali(默认 | 私钥)Note版
前言:xshell远程连接,私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...
大数据零基础学习day1之环境准备和大数据初步理解
学习大数据会使用到多台Linux服务器。 一、环境准备 1、VMware 基于VMware构建Linux虚拟机 是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案 所以VMware虚拟机方案是必须要学习的。 (1)设置网关 打开VMware虚拟机,点击编辑…...
基础测试工具使用经验
背景 vtune,perf, nsight system等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下 perf 比较基础的用法: 先改这…...
SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现
摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...
ElasticSearch搜索引擎之倒排索引及其底层算法
文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...
云原生玩法三问:构建自定义开发环境
云原生玩法三问:构建自定义开发环境 引言 临时运维一个古董项目,无文档,无环境,无交接人,俗称三无。 运行设备的环境老,本地环境版本高,ssh不过去。正好最近对 腾讯出品的云原生 cnb 感兴趣&…...
让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...
Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战
说明:这是一个机器学习实战项目(附带数据代码文档),如需数据代码文档可以直接到文章最后关注获取。 1.项目背景 在金融市场日益复杂和波动加剧的背景下,风险管理成为金融机构和个人投资者关注的核心议题之一。VaR&…...
人机融合智能 | “人智交互”跨学科新领域
本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...
GruntJS-前端自动化任务运行器从入门到实战
Grunt 完全指南:从入门到实战 一、Grunt 是什么? Grunt是一个基于 Node.js 的前端自动化任务运行器,主要用于自动化执行项目开发中重复性高的任务,例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...
