当前位置: 首页 > article >正文

4 个新的流行 AI 概念及其在数字产品中的潜力

原文towardsdatascience.com/the-4-new-trendy-ai-concepts-and-their-potential-in-digital-products-cf5e1b85bff9https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/79c8534a324cff796ff9200cb0207d8a.png图片由Joshua Coleman在Unsplash上提供标题不断更新有关大型语言模型LLMs如 Gemini、GPT 或 Claude 的最新版本。与所有这些核心人工智能进步并行许多其他公司也在探索如何实际利用这些模型进行创新创造更多价值并降低成本。很容易感到不知所措和压力想要跟上所有这些进步我可以告诉你这种情况经常发生在我身上在这篇博客文章中我将介绍一些最重要的概念及其对产品和公司的潜力帮助你跟上。围绕公司如何将大型语言模型LLMs和其他通用人工智能GenAI模型集成到他们的产品或流程中有一些常见的流行概念。这些概念包括提示prompting、微调fine-tuning、检索增强生成RAG和代理agents。我相信你之前已经听说过这些概念中的几个或全部但我感觉有时这些概念之间的区别并不清楚最重要的是我们仍然不了解它们能为我们公司或产品提供的潜力。在这篇博客文章中我们将概述这些概念中的每一个目的是在文章结束时你能理解它们是什么它们是如何工作的它们之间的区别以及它们对公司或数字产品革命性的潜力。没有比通过分析其在特定例子中的使用更好的方式来理解一项技术的潜力了。这就是为什么我会带你通过围绕一个单一用例——在市场发布广告——的概念来展示每个这些热门概念如何被利用以产生更多的价值和效率。用例在大多数市场平台上用户能够发布广告或产品并且平台提供了一个标准化的发布流程。让我们考虑这样一个场景这个流程涉及多个步骤“发布新项目”按钮表示用户列出项目的意图并启动发布流程信息标签页要求用户提供关于项目的具体细节。让我们假设在这种情况下用户被要求提供标题、描述、类别、图片和价格。“确认发布”按钮完成发布流程将项目提交到平台进行发布。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f8688639d2f23461d24e993a55243a24.png我们“发布新项目”用例的 UI 示例到目前为止用户一直手动导航这些步骤根据需要输入信息。这可能会花费时间甚至对新用户来说可能会感到困惑他们可能会问适当的价格是多少哪个类别最适合我的商品市场有明确的机会使这些发布功能对用户来说更快、更不令人困惑。通过提示使用 LLM提示是将指令结构化以从 LLM 获得所需生成结果的过程。到现在为止许多人已经熟悉了提示在 OpenAI 网站上使用 ChatGPT 是一个很好的例子。作为用户我们向 ChatGPT 输入一个特定的问题比如“为我写一首关于 LLM 将如何改变数字产品的说唱歌曲”。OpenAI 在这个提示中构建了这个输入并将其输入到 GPT-x 模型中以生成响应。这种构建允许 OpenAI 管理响应如何调整语气拒绝回答需要最新信息的问题如果被问及如何制造核武器则警告核武器的危险或者将所有之前的对话连接起来以便在回答时考虑到所有内容而不仅仅是用户的最后输入。那么提示如何增强我们的“发布新项目”用例通过将 LLM 的 API 调用集成到我们的功能中我们可以根据特定的用户输入构建提示。例如我们可以要求用户简单地输入新商品的标题并构建一个提示来生成适当的内容以填充描述和发布的类别。如果提示的模型是多模态的接受多种类型的输入数据文本、图像、声音等构建的提示可以包括产品的图片从而允许更准确的描述和分类。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/7e9df6b13b27a6f2fbe48707a563dd6e.png集成提示到“发布新项目”用例的架构我们需要玩转提示提示工程以获得准确和有用的结果。关于提示工程的一个很好的学习资源可以在这里找到。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/6cd171d91a34d37d03c882d7a6264313.png产品标题获取描述和类别的提示示例图片由作者提供尽管有许多技术可以改进提示例如单次/少量学习、思维链和 ReAct但承认生成的文本永远不会完美是至关重要的。可能出现幻觉、描述或分类不准确、不适当的语气以及从市场和产品本身的普遍缺乏上下文等问题。由于这些限制将非常重要地允许用户审查和编辑系统建议的信息。尽管如此这项新功能已经可以提供额外的价值加速写作过程减轻“白纸综合症”为商品建议相关类别并提高市场列表的质量。通过微调使用 LLM。虽然改进提示可以带来更好的结果但可能存在需要进一步精炼的点。这就是微调可以成为一个好选择的地方因为它允许我们通过从其例如我们平台上发布的产品信息的所有历史中喂养数据来使模型适应我们市场的上下文。这样我们就能使其生成与平台内的语言风格和沟通规范更接近的文本。微调是将预训练模型与特定数据集或任务进一步精炼的过程以更好地适应特定的上下文或领域。微调一个大型语言模型LLM并不像提示那样简单它需要数据科学团队的专家知识来实现微调并在生产环境中部署微调后的模型还需要从上下文中精心挑选的数据来喂养它。由于模型需要内部部署成本也可能并且会与查询 API 相关的成本相比而变化并增长。微调可以通过应用更新初始模型所有权重的方 法来完成。然而也存在更经济有效的方法例如参数高效微调如 LoRA 或 QLoRA。关于微调的深入学习一个非常好的、实用的资源是 deeplearning.ai 提供的课程“使用大型语言模型的生成式 AI”。一旦微调后的模型部署工作流程与之前看到的提示架构相似。唯一的区别是我们现在运行的是微调后的模型而不是基础模型。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/019c5b273a58e08a8b11d8cf7d1d0959.png将微调模型集成到“发布新项目”用例的架构图图片由作者提供通过微调我们为用户带来了额外的价值因为生成的描述和类别可能更准确、更有价值需要更少的手动编辑。由于微调后的模型已经看到了市场数据甚至可能模型能够建议一个有意义的商品价格。然而在这种情况下重要的是要平衡微调的好处与解决方案增加的成本和复杂性。检索增强生成提示和微调都遇到了模型截止点固有的局限性其知识仅限于其训练或微调时的可用数据。这被视为 LLM 的一个巨大限制使得用户在无法实时访问信息或了解其市场当前可用的产品细节时对其效用感到疑惑。检索增强生成RAG解决了这一限制。检索增强生成RAG是一种检索相关信息以丰富提示的技术。在实际应用中想象在我们的例子中用户输入了“哈利·波特书 1几乎全新”。从这个输入中我们的系统会采取以下步骤**“哈利·波特第一本书几乎全新”**在市场上的搜索结果获取最相关的结果。这一步骤可以通过语义搜索完成或者通过市场实施的各种排序逻辑完成。假设这些结果是哈利·波特第一本书的其他示例和一些系列其他书籍的示例。构建提示通过丰富预定义模板包含从检索到的相关结果中获取的所有信息。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/687047cf1d522b45d41392f792891144.png将 RAG 集成到“发布新项目”用例中的架构图作者提供通过这个丰富的提示LLM 现在能够生成更有价值的描述这可能包括从类似产品中获得的哈利·波特书籍的特定特征。由于它还可以访问类似物品的价格数据该模型甚至可能为新物品建议一个合适的价格。它已经被证明 RAG 可以减轻 LLM 的幻觉风险参考。要深入了解如何实现 RAG推荐的一门短期课程是“构建和评估高级 RAG 应用”也来自 deeplearning.ai。代理迄今为止我们已经看到了提示、微调和 RAG 在促进和提高广告发布流程质量方面的潜力。然而仍然存在两个小的局限性价格不可解释性模型自主生成价格对结果几乎没有洞察力或控制权手动过程用户仍然需要手动输入、确认并通过各种步骤进行导航。代理是基于 LLM大型语言模型的进程能够主动做出决策、访问工具并执行操作。通过代理我们能够为我们的系统引入额外的自主层使其能够规划、访问工具并执行操作。这转化为使我们的系统具备计算价格的能力。而不是仅仅依赖模型生成的流程代理可以访问可运行的环境或计算器根据有意义的逻辑例如类似物品所有价格的均值计算建议的价格。此外我们还可以通过让代理直接访问发布 API 来自动化发布过程。关于代理策略的更多信息我建议查看 The Batch 的这些帖子这些帖子。总结在这篇博客文章中我们探讨了塑造当今创新的流行人工智能概念提示prompting、微调fine-tuning、RAG 和代理agents。我们涵盖了每个概念的含义探讨了它们之间的关系和区别、利弊同时关注它们的变革潜力。提示是通过人工智能生成的建议带来价值的最直接方式。微调则更进一步定制模型以更好地适应公司或产品的环境并产生更准确的结果。RAG打破了知识截止的限制使系统能够实时访问信息以丰富生成的建议。最后代理引入了新的自动化和任务执行层次。了解这些功能是否提高了用户满意度减少了用户的痛苦如摩擦、困惑以及影响产品指标对于学习、迭代并通过创新真正带来价值至关重要。用户体验调查可以提供关于用户如何看待新功能的定性反馈。用户是否觉得广告创建过程更直观他们是否觉得建议相关此外A/B 测试和检查特定的产品指标可以帮助量化这种影响。用户需要多少时间来发布新项目有多少用户开始并完成发布过程有多少用户编辑系统放置的建议人工智能生成的内容的质量或转化率是否优于其他内容通过分析和监控这种影响我们可以验证我们人工智能产品的有效性并确定进一步优化和创新的领域。请注意我们只涵盖了机会但并未涵盖这些解决方案的相关风险幻觉、安全问题、偏见、不一致性……在实施通用人工智能GenAI解决方案时了解这些风险非常重要我打算写一篇关于这个话题的文章。这只是公司和个人数字产品可以利用通用人工智能GenAI的开始。希望这篇帖子有助于理解当前这项技术的使用情况并激发一些关于 LLMs 可以发挥价值的关联用例的想法。

相关文章:

4 个新的流行 AI 概念及其在数字产品中的潜力

原文:towardsdatascience.com/the-4-new-trendy-ai-concepts-and-their-potential-in-digital-products-cf5e1b85bff9 https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/79c8534a324cff796ff9200cb0207d8a.png 图片由Joshua Col…...

给SATA硬盘下命令:从Non-Data到DMA Queued,12类命令的实战图解与抓包分析

深入解析SATA硬盘12类命令:从Non-Data到DMA Queued的实战指南 在存储系统的底层交互中,SATA协议扮演着至关重要的角色。对于嵌入式开发工程师和存储系统测试人员而言,理解SATA命令层的运作机制不仅有助于调试硬件问题,更能优化存储…...

自主AI助手Angel:基于大语言模型的多通道智能体部署与实战

1. 项目概述:一个能帮你“跑腿”的自主AI助手如果你和我一样,经常在Discord、Slack、iMessage和Signal这几个聊天软件之间来回切换,同时电脑上还开着十几个终端窗口处理各种杂事,那你肯定幻想过能有一个“数字管家”。它最好能看懂…...

点云配准避坑指南:当ICP把深度图配到‘中心’时,我的自适应阈值调整方案

点云配准避坑指南:动态阈值优化解决ICP中心化失效问题 在三维重建和SLAM项目中,工程师们常常会遇到一个令人头疼的现象:使用标准ICP算法对深度图点云进行配准时,点云会神秘地"滑向"彼此的中心位置。这种看似魔法的行为背…...

Zotero PDF Translate:打破语言壁垒,让外文文献阅读更高效 [特殊字符]

Zotero PDF Translate:打破语言壁垒,让外文文献阅读更高效 🚀 【免费下载链接】zotero-pdf-translate Translate PDF, EPub, webpage, metadata, annotations, notes to the target language. Support 20 translate services. 项目地址: ht…...

Process Explorer|微软官方免费进程神器|吊打系统任务管理器|揪出隐藏恶意软件

电脑莫名卡顿、风扇狂转、文件删不掉?系统任务管理器查不到元凶?试试 Process Explorer—— 微软官方免费进程管理工具,功能碾压自带任务管理器,轻松揪出后台隐藏恶意软件,普通用户也能上手! 备用下载 一…...

AI智能体编排框架实战:构建具备记忆与协作能力的智能系统

1. 项目概述:当AI智能体需要“记忆”与“协作”在AI智能体开发领域,我们常常面临一个核心挑战:如何让智能体不仅能在单次对话中表现出色,还能记住历史、规划未来,并与其他智能体协同工作?这就像组建一支足球…...

终极指南:如何在OBS中集成专业VST插件实现广播级音频处理

终极指南:如何在OBS中集成专业VST插件实现广播级音频处理 【免费下载链接】obs-vst Use VST plugins in OBS 项目地址: https://gitcode.com/gh_mirrors/ob/obs-vst OBS-VST是一个革命性的开源项目,它让OBS Studio用户能够直接加载和使用数千种VS…...

硬件工程师差旅数据安全与设备防护全攻略

1. 一次旅行噩梦引发的硬件工程师深度思考那次在曼彻斯特机场洗手间里,背包从门上一个简陋的金属挂钩上滑落,发出那声令人心悸的“咔嚓”声时,我脑子里闪过的第一个念头不是“我的电脑完了”,而是“完了,我所有的设计文…...

NCE外汇:平台稳定性与用户体验的全面观察

金融服务行业的复杂性决定了平台需要在多个维度上同时具备较高的水准。NCE外汇经过多年的发展,已经在合规、技术、服务、教育等方面形成了一套相互支撑的体系。本文从评测视角出发,对其综合实力进行多维度的解读,呈现一个具有结构感的平台画像…...

LaTeX公式转换终极指南:3分钟搞定Word数学公式的免费Chrome扩展

LaTeX公式转换终极指南:3分钟搞定Word数学公式的免费Chrome扩展 【免费下载链接】LaTeX2Word-Equation Copy LaTeX Equations as Word Equations, a Chrome Extension 项目地址: https://gitcode.com/gh_mirrors/la/LaTeX2Word-Equation 还在为学术论文中复杂…...

如何用XiaoMusic让小爱音箱变身你的私人音乐管家:5个超实用场景解析

如何用XiaoMusic让小爱音箱变身你的私人音乐管家:5个超实用场景解析 【免费下载链接】xiaomusic 使用小爱音箱播放音乐,音乐使用 yt-dlp 下载。 项目地址: https://gitcode.com/GitHub_Trending/xia/xiaomusic 还在为小爱音箱只能播放特定平台的音…...

ClickHouse:开源数据引擎在AI浪潮爆发,挑战传统数据库巨头

ClickHouse:开源数据引擎爆发,在AI浪潮中挑战传统数据库巨头过去18个月,开源数据基础设施里最热的公司除了Supabase可能就是ClickHouse了。ClickHouse Cloud ARR在2025年保持250%的同比增速,第三方估计从2024年中的约1500万美元增…...

如何在Mac上免费实现NTFS磁盘完整读写:终极解决方案指南

如何在Mac上免费实现NTFS磁盘完整读写:终极解决方案指南 【免费下载链接】Free-NTFS-for-Mac Nigate: An open-source NTFS utility for Mac. It supports all Mac models (Intel and Apple Silicon), providing full read-write access, mounting, and management …...

为AI助手打造企业级FTP/SFTP操作引擎:告别重复脚本,实现智能文件部署

1. 项目概述:为AI助手量身打造的FTP/SFTP操作引擎如果你和我一样,经常让AI助手(比如Claude、Cursor、Windsurf)帮忙写代码、部署项目,那你肯定遇到过这个让人哭笑不得的场景:AI能帮你从零开始配置一台VPS&a…...

如何优雅地从九大网盘获取真实下载地址:一个JavaScript工具的深度解析

如何优雅地从九大网盘获取真实下载地址:一个JavaScript工具的深度解析 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国…...

微信小程序逆向工程:wxappUnpacker技术深度解析与实战指南

微信小程序逆向工程:wxappUnpacker技术深度解析与实战指南 【免费下载链接】wxappUnpacker forked from https://github.com/qwerty472123/wxappUnpacker 项目地址: https://gitcode.com/gh_mirrors/wxappu/wxappUnpacker 微信小程序逆向分析是理解小程序架构…...

Android开源生态重构:从中心化控制到社区驱动的技术路径与挑战

1. 从“相对开放”到“真正自由”:Android生态的十字路口作为一名在移动通信和嵌入式系统领域摸爬滚打了十几年的工程师,我亲眼见证了Android从初代HTC Dream上那个略显笨拙的“小绿人”,成长为如今驱动全球数十亿智能设备的庞然大物。最近重…...

新手必看:PCB设计全流程详解

1、画原理图不会画就先抄板子设计-更新转化为PCB2、画PCB(1)大概整理好之后自动布线GND不连(2)铺铜 (顶层和底层都铺)(3)DRC检查解决问题-重建铺铜区3、丝印层添加文字4、最后一步一…...

Logisim-evolution终极指南:从数字电路新手到硬件设计高手

Logisim-evolution终极指南:从数字电路新手到硬件设计高手 【免费下载链接】logisim-evolution Digital logic design tool and simulator 项目地址: https://gitcode.com/gh_mirrors/lo/logisim-evolution 你是否曾经对计算机内部的奥秘感到好奇&#xff1f…...

基于MCP协议与Gemini大模型构建智能命令行AI助手

1. 项目概述:一个连接命令行与AI的“翻译官” 最近在折腾一些自动化脚本和工具链,发现一个挺有意思的痛点:我手头有一堆用Shell、Python写的命令行工具,它们功能强大,但交互方式仅限于传统的参数和标准输入输出。与此…...

魔兽争霸3游戏优化终极指南:3步解决帧率限制与界面显示问题

魔兽争霸3游戏优化终极指南:3步解决帧率限制与界面显示问题 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸3的卡顿画面和界…...

告别CNN!用PyG Temporal和GC-LSTM搞定动态社交网络的好友推荐(附完整代码)

动态社交网络好友推荐的工程实践:基于GC-LSTM与PyG Temporal的完整解决方案 社交网络的动态特性为传统推荐系统带来了巨大挑战。当用户关系每分每秒都在变化时,静态的协同过滤或内容推荐方法往往显得力不从心。本文将分享如何利用PyG Temporal库和GC-LST…...

那些藏在无人机里的秘密

---## 它飞起来了,但问题才刚开始你有没有想过,一架无人机在天上飞,它的"大脑"在哪里?不仅仅是遥控器传回的那个画面——从识别电线杆上的缺陷,到规避突然出现的障碍物,再到把高清视频实时传回地…...

PyInstaller打包PyTorch项目,为什么我最终放弃了单文件exe?

PyInstaller打包PyTorch项目:为什么单文件exe不是最佳选择? 当我们需要将基于PyTorch的AI应用分发给终端用户时,打包工具的选择往往决定了最终用户体验的好坏。许多开发者最初会被PyInstaller的单文件exe方案吸引——毕竟,谁不想给…...

Next.js SEO优化实战:用next-seo库高效管理元标签与结构化数据

1. 项目概述:SEO 优化的现代 React 解决方案 如果你正在用 Next.js 开发一个需要被搜索引擎收录的网站,比如企业官网、博客或者电商平台,那么“SEO”这个词一定让你又爱又恨。爱的是,它意味着流量和用户;恨的是&#…...

2026上海徐汇区新高一名师辅导暑假班必看 | 优师授课、直击重点

初升高是上海学生学业关键拐点,徐汇区名校云集、学习节奏快、考点难度高,选对名师辅导,直接决定孩子能否快速适应高中、抓住重点、少走弯路。2026年徐汇家长选新高一名师班,核心看三点:优师背景、授课精准、直击考点&a…...

如何永久保存微信聊天记录:3步完成专业级数据备份方案

如何永久保存微信聊天记录:3步完成专业级数据备份方案 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 你是否曾因手机丢失、系统升级或更换设备,而…...

golang如何处理PostgreSQL JSONB字段_golang PostgreSQL JSONB字段处理方法

PostgreSQL的jsonb字段在Go中需用json.RawMessage或自定义struct接收,不可直接scan到string或sql.NullString;写入NULL须用nil指针,查询时应避免SELECT 配合[]interface{}。PostgreSQL 的 jsonb 字段在 Go 中不能直接 scan 到 stringPostgreS…...

Grav CMS 组合拳漏洞| CVE-2026-42613CVE-2026-42607复现研究

0x0 背景介绍 Grav是一个基于文件的Web平台。 在2.0.0-beta.2之前版本中,存在两个高危漏洞可导致组合利用权限提升漏洞->CVE-2026-42613 Grav的Login插件在处理用户注册请求时,未对请求数据中的groups/access字段进行服务端校验。当管理员在插件配置中…...