当前位置: 首页 > article >正文

我从一次与人工智能无关的数据会议中学到的三大关键数据经验

原文towardsdatascience.com/three-crucial-data-lessons-that-i-learned-from-a-data-conference-thats-not-related-to-ai-f802f7097d67?sourcecollection_archive---------8-----------------------#2024-10-29在组织中帮助促进分析卓越的被低估概念https://medium.com/nithhyaa_talks_data?sourcepost_page---byline--f802f7097d67--------------------------------https://towardsdatascience.com/?sourcepost_page---byline--f802f7097d67-------------------------------- Nithhyaa Ramamoorthy·发表于 Towards Data Science ·8 分钟阅读·2024 年 10 月 29 日–https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/f0482047adea6e5e6303b831cb4de203.png图片由作者使用微软 Co-pilot 的 AI 提示生成作为一名数据专业人士自职业生涯初期以来参加会议一直是我的常态。数据科学领域广阔而多样。这意味着虽然数据职位和从业者种类繁多但也意味着无论你的细分领域多么小或者你的具体问题多么特殊和深奥总有人在其他公司面临相同的问题。证明这一点的例证就是在 Stack Overflow / Kaggle 讨论区和其他知识库论坛中永无止境的问题和梗图。早期的职业生涯中我与数据社区的连接帮助我学习到新技术将新知识应用到我正在解决的一些旧问题中使我成为一个更加高效的分析师。“许多想法在转移到另一个人的思维中时比在最初产生的地方更加茁壮成长。” — 奥利弗·温德尔·霍尔姆斯。最近我开始参加数据社区的聚会和会议并且作为讲者与专家小组共同参与讨论能够坐在讲者休息区的座位上这对我来说是一个巨大的改变。它极大地帮助我从创造性的角度思考我的工作和在数据管理中的角色并成为一个更好的数据导师和守护者帮助依赖我专业知识的人们。我最近作为讲者参加了 2024 年的数据连接大会。尽管过去几年大部分会议都集中在人工智能AI上但我有幸学到了以下三个关键的数据分析和管理方面的内容这些内容我能够轻松应用到日常工作中。在这篇文章中我将分享我对这些会议的解读和学习心得、行动计划以及作为一名拥有超过 12 年经验的数据从业者对这些关键数据主题的反思。1. 成本控制数据投资回报率Data ROI的概念经常被提到但很少有人对其进行量化也很少成为一个可以持续跟踪和共享的正式指标。成本控制一直是我关注的重点作为一个个体贡献者和团队负责人从我作为分析实习生的日子开始就如此。谁能忘记第一次让未经优化的 SQL 查询包括全外连接运行了几个小时直到接到来自组织数据库管理员DBA的警告电话我可不记得从那时起成本控制就成了一个始终萦绕在我脑海中的概念。许多数据解决方案提供商已经从基于层级的定价模型转变为基于消费的定价模型这使得成本优化成为数据管理和领导力工具箱中的一项必备工具。当查询优化被忽视或存在低效的数据实践时数据团队可能会面临意外的账单。例如除了运行大量查询之外甚至未能归档未使用的数据也可能导致数据存储成本大幅上升。为了管理这些意外开销实施有效的成本管理策略至关重要。这包括监控使用模式、优化查询并设置异常活动的警报。通过了解这些隐藏成本团队可以更好地控制数据工具的定价确保数据投资回报率的可持续性。我还学到了投资培训数据团队以优化他们对分析工具的使用的重要性。教育员工如何编写高效的查询和处理数据确保资源得到充分利用这一点常常被忽视但却是降低成本的低效果实之一。另一个常见的陷阱是数据团队未能准确预测其数据使用量。这种疏忽可能导致大量的意外支出特别是在快速扩展运营时。为了避免这些陷阱企业必须与供应商保持开放的沟通密切监控数据使用情况并定期审查合同条款。通过预见变化并为潜在的成本波动做好准备企业可以更好地管理数据工具定价并确保其数据投资回报率保持正向。可操作的收获管理开支为了有效监控开支数据团队应该实施全面的仪表板提供实时的支出趋势洞察。这些工具应突出每日、每周和每月的成本趋势使团队能够迅速发现异常情况。此外设置自动警报以监测不寻常的使用或支出激增可以进一步防止预算超支。预期波动与供应商保持开放的沟通密切监控数据使用情况并定期审查合同条款。预见变化并为潜在的成本波动做好准备对于准确预测开支至关重要。数据与流程审计定期审计所有与数据相关的开支发现节省机会同时不牺牲数据质量。2. 数据翻译与其他证明数据团队价值的有效方式尽管成本控制是影响数据团队投资回报率ROI的一个重要因素但这枚硬币的另一面是衡量数据分析工作的价值和效果最终衡量数据团队的表现。当我在整理听完与数据分析团队效率相关的讲座笔记时一位主持人引发了一个关于“数据翻译”的有趣讨论强调了为弥合数据团队与业务团队之间的认知差距而进行专门组织努力的必要性。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/774f2a9046ace45b8d0aa409ecc2142a.png弥合数据与业务素养差距图像由作者通过 Microsoft Co-pilot 的 AI 提示生成随着数据基础设施和数据团队招聘成本的持续增加企业必须看到这一投资的回报。高昂的成本只有在数据团队的工作能够转化为推动业务增长、创新和效率的可操作性洞察时才是合理的。如果没有明确的价值这些开支可能会显得沉重。数据领导者需要确保他们的团队与业务目标对齐并专注于那些能够带来可观回报的项目。通过有效管理这些成本组织可以保持竞争优势并将数据作为战略资产加以利用。这要求资源的谨慎分配优先考虑具有影响力的项目并培养数据素养的文化以最大化数据团队在整个组织中的效用和影响力。可操作的收获数据翻译赋能你的数据团队成为优秀的故事讲述者始终记录数据分析、流程效率带来的关键成果并在整个组织内分享成功故事。许多组织设有专门的“数据翻译者”角色负责这些工作。了解你的价值关注团队成本了解薪资趋势并通过激励行动的分析支持你的投资。像专家一样互动使用如利益相关者参与矩阵这样的工具。识别关键人物并建立稳固的关系。你的目标是让每个人与公司的战略目标保持一致。规划路径通过大胆设想、富有创意并挑选那些能够产生重大影响的项目来制定战略计划。记住 80–20 法则——在日常维护与创新空间之间保持平衡。架起桥梁提升整个组织的数据素养。提供有针对性的培训弥补知识差距赋能每个人自信地使用数据。超越孤岛思维推动跨部门合作以同步每个人的优先事项。这将创造一个高效运转的机制让每个人的努力与业务的大局相一致。3. 信息设计与数据故事讲述中的新策略https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2f71320851e0e5ddde41895ff3597978.png作者在 2024 年数据连接大会上展示的图片当我参加演讲教练训练营时我不禁发现公共演讲技巧与我们工作中常常学习的数据故事讲述技巧之间的相似之处。头脑风暴和选择一个全面的主题接受不完美并最终将其整理成一个整体的核心思想的过程使我反思数据故事讲述不仅仅是漂亮的图表和记录模式。我还听了一场关于数据展示中有效视觉沟通技巧的精彩演讲。我了解到通过将叙事与数据可视化结合可以同时调动观众大脑的逻辑和情感两方面使得你的见解更具记忆性。这种方法确保数据不仅仅被视为页面上的数字而是作为战略决策的关键推动力。我还了解到将数据故事与观众的需求和数据素养对齐是鼓励他们根据数据采取有意义行动的最简单方法。可操作的收获明确定义数据故事的目的提前让观众了解学习目标并明确主要的收获。这个核心信息作为你的叙事基础指导你在数据可视化和故事讲述技巧方面的每一个决策。核心理念通过进行数据分析找到你要传递的核心信息并将你的数据故事融入一个引人入胜的情节中。我在演讲中使用的框架是首先识别问题将问题与观众产生共鸣提供解决方案以及支持该解决方案的事实和图表最后以鼓舞人心的结尾并呼吁行动。支持元素使用可视化、度量标准和注释来支持你的数据故事。每一个用来支持故事情节的数据点都能强化核心信息并在加强你信息传达的过程中起到重要作用。确保你使用的数据指标的准确性和相关性也非常重要。这些数据应与核心信息一致并提供对你所讲故事的洞察。战略性地使用颜色突出关键数据点并保持观众的关注。颜色使用中的一致性和对比度是关键要素。结论参加数据会议是跟上当前趋势和学习新概念的绝佳方式。尽管过去几年 AI 相关话题因其非常合理的原因主导了大多数会议议程但我非常感激能够了解这三项关键的数据管理进展它们帮助巩固了我的基础知识、数据沟通技能并让我有机会与经验丰富的数据领域专家共同解决与 AI 一样普遍的问题。注非常感谢数据领域的领袖们 Kathy Koontz、Lindsey Cohen、Akia Obas、Lyndsey Pereira-Brereton 以及其他许多聪明的思想者们与我一起进行这些发人深省的讨论并激发了这篇文章的创作。关于作者Nithhyaa Ramamoorthy 是一位数据领域专家拥有超过 12 年的分析和大数据经验特别是在医疗保健与消费者行为交集领域。她拥有信息科学硕士学位最近还获得了 CSPO 证书并且拥有多个其他专业认证。她热衷于利用自己的分析技能推动商业决策创造出植根于同理心的包容性和公平的数字产品。

相关文章:

我从一次与人工智能无关的数据会议中学到的三大关键数据经验

原文:towardsdatascience.com/three-crucial-data-lessons-that-i-learned-from-a-data-conference-thats-not-related-to-ai-f802f7097d67?sourcecollection_archive---------8-----------------------#2024-10-29 在组织中帮助促进分析卓越的被低估概念 https:/…...

创业团队如何利用Taotoken管理多个AI模型的用量与成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 创业团队如何利用Taotoken管理多个AI模型的用量与成本 对于资源有限的创业团队而言,在快速迭代产品原型时,…...

Windows安卓应用安装器:APK Installer完整使用指南

Windows安卓应用安装器:APK Installer完整使用指南 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 在Windows电脑上直接运行安卓应用,享受大屏幕…...

Cursor Free VIP破解工具终极指南:5分钟实现AI编程助手永久免费使用

Cursor Free VIP破解工具终极指南:5分钟实现AI编程助手永久免费使用 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve rea…...

ModTheSpire终极指南:安全加载杀戮尖塔模组的5大步骤

ModTheSpire终极指南:安全加载杀戮尖塔模组的5大步骤 【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire ModTheSpire是一款专为《杀戮尖塔》设计的Java游戏模组加载器&#xf…...

MeritOpt:动态权重聚合算法在低资源NLP任务中的应用与实现

1. 项目概述与核心挑战在自然语言处理领域,低资源语言任务一直是个棘手的问题。想象一下,你手头只有几千条某个小语种的翻译对,却要训练一个能流畅翻译的模型,这就像试图用几块砖头盖起一栋大楼。传统的做法要么是“闭门造车”&am…...

Rusted PackFile Manager:终极免费工具助你轻松制作全面战争模组

Rusted PackFile Manager:终极免费工具助你轻松制作全面战争模组 【免费下载链接】rpfm Rusted PackFile Manager (RPFM) is a... reimplementation in Rust and Qt6 of PackFile Manager (PFM), one of the best modding tools for Total War Games. 项目地址: h…...

Adobe-GenP终极指南:3分钟解锁Adobe全家桶的完整方案

Adobe-GenP终极指南:3分钟解锁Adobe全家桶的完整方案 【免费下载链接】Adobe-GenP Adobe CC 2019/2020/2021/2022/2023 GenP Universal Patch 3.0 项目地址: https://gitcode.com/gh_mirrors/ad/Adobe-GenP 你是否曾经因为Adobe Creative Cloud的高昂订阅费用…...

ScienceDecrypting:三步永久解锁加密PDF,让学术文献重获自由

ScienceDecrypting:三步永久解锁加密PDF,让学术文献重获自由 【免费下载链接】ScienceDecrypting 破解CAJViewer带有效期的文档,支持破解科学文库、标准全文数据库下载的文档。无损破解,保留文字和目录,解除有效期限制…...

如何快速上手Poppins字体:9种字重+天城文支持的多语言解决方案终极指南

如何快速上手Poppins字体:9种字重天城文支持的多语言解决方案终极指南 【免费下载链接】Poppins Poppins, a Devanagari Latin family for Google Fonts. 项目地址: https://gitcode.com/gh_mirrors/po/Poppins 还在为多语言项目寻找合适的字体而烦恼吗&…...

如何在Mac上实现窗口置顶:Topit完整指南让多任务处理更高效

如何在Mac上实现窗口置顶:Topit完整指南让多任务处理更高效 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 你是否经常需要在多个窗口之间来回切换&…...

Cursor Free VIP:AI编程助手Pro功能永久免费的技术解决方案

Cursor Free VIP:AI编程助手Pro功能永久免费的技术解决方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached you…...

终极指南:如何将STL文件快速转换为STEP格式(免费工具完整教程)

终极指南:如何将STL文件快速转换为STEP格式(免费工具完整教程) 【免费下载链接】stltostp Convert stl files to STEP brep files 项目地址: https://gitcode.com/gh_mirrors/st/stltostp 在现代3D设计与制造流程中,STL到S…...

如何用Xournal++实现跨平台手写笔记:免费开源PDF批注工具完全指南 [特殊字符]

如何用Xournal实现跨平台手写笔记:免费开源PDF批注工具完全指南 🚀 【免费下载链接】xournalpp Xournal is a handwriting notetaking software with PDF annotation support. Written in C with GTK3, supporting Linux (e.g. Ubuntu, Debian, Arch, SU…...

BG3 Mod Manager:轻松管理《博德之门3》模组的高效工具

BG3 Mod Manager:轻松管理《博德之门3》模组的高效工具 【免费下载链接】BG3ModManager A mod manager for Baldurs Gate 3. This is the only official source! 项目地址: https://gitcode.com/gh_mirrors/bg/BG3ModManager BG3 Mod Manager 是一款专为《博…...

Thorium浏览器深度解析:如何通过编译优化实现300%性能提升的技术革命

Thorium浏览器深度解析:如何通过编译优化实现300%性能提升的技术革命 【免费下载链接】thorium Chromium fork named after radioactive element No. 90. Source code and Linux releases. Windows/MacOS/ARM builds served in different repos, links are towards …...

基于RCT数据评估新模型因果效应:边界估计方法与实践

1. 项目概述与核心挑战 在医疗、金融、教育等高风险领域部署机器学习或人工智能模型时,我们面临一个根本性的难题:如何可靠地评估一个 从未在真实世界随机对照试验中测试过的新模型 的因果效应?随机对照试验是评估干预措施因果效应的黄金标…...

79.2万条中文医疗对话数据如何重塑AI医疗问答的未来?

79.2万条中文医疗对话数据如何重塑AI医疗问答的未来? 【免费下载链接】Chinese-medical-dialogue-data Chinese medical dialogue data 中文医疗对话数据集 项目地址: https://gitcode.com/gh_mirrors/ch/Chinese-medical-dialogue-data 在医疗AI快速发展的今…...

抖音下载器终极指南:3分钟学会无损音频提取与批量下载

抖音下载器终极指南:3分钟学会无损音频提取与批量下载 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback suppo…...

从科学哲学到AI:普特南的批判与解释倾向如何映射机器学习预测与可解释性

1. 项目概述:当科学哲学遇见机器学习作为一名长期在人工智能领域摸爬滚打的从业者,我常常思考一个看似跨界的问题:我们训练出的那些“黑箱”模型,它们做出预测的逻辑,与科学家们构建和选择理论的过程,究竟有…...

基于特征图的机器学习模型选择:从静态规则到动态适应

1. 项目概述:从“凭感觉”到“有章法”的模型选择在机器学习项目的实战中,最让人头疼的环节之一,往往不是调参,而是最初那个看似简单的问题:我该用哪个模型?面对Scikit-Learn库里琳琅满目的算法&#xff0c…...

5分钟掌握BOTW存档编辑器:打造你的完美塞尔达传说冒险

5分钟掌握BOTW存档编辑器:打造你的完美塞尔达传说冒险 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想在《塞尔达传说:旷野之息》中自由探…...

终极指南:如何为AKShare财经数据接口库构建完整的技术文档体系

终极指南:如何为AKShare财经数据接口库构建完整的技术文档体系 【免费下载链接】akshare AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 项目地址: https://gitcode.com/gh_mirror…...

Windows与Office智能激活终极指南:KMS_VL_ALL_AIO完整解决方案

Windows与Office智能激活终极指南:KMS_VL_ALL_AIO完整解决方案 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 在数字化工作环境中,稳定可靠的操作系统和办公软件是高效工…...

课题框架设计:认知流形的拓扑缺陷与精神病理学映射(世毫九实验室原创课题)

课题框架设计:认知流形的拓扑缺陷与精神病理学映射(世毫九实验室原创课题) 作者:方见华 单位:世毫九实验室 摘要与核心观点 本课题基于世毫九实验室原创认知几何学框架及GLZ认知拓扑互补理论支撑,核心假设为…...

5分钟掌握MelonLoader:全球首个支持Il2Cpp和Mono的Unity游戏模组加载器

5分钟掌握MelonLoader:全球首个支持Il2Cpp和Mono的Unity游戏模组加载器 【免费下载链接】MelonLoader The Worlds First Universal Mod Loader for Unity Games compatible with both Il2Cpp and Mono 项目地址: https://gitcode.com/gh_mirrors/me/MelonLoader …...

初次使用 Taotoken 的开发者对平台稳定性和延迟的直观感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初次使用 Taotoken 的开发者对平台稳定性和延迟的直观感受 作为一名需要接入大模型服务的开发者,选择一个稳定、响应迅…...

基于高斯过程与多源数据融合的金属增材制造工艺优化

1. 项目概述与核心挑战在激光粉末床熔融这类金属增材制造工艺里,我们这些一线的工程师和研究员最头疼的问题之一,就是工艺参数和最终零件性能之间那“剪不断、理还乱”的复杂关系。你手头有激光功率、扫描速度、扫描间距、铺粉层厚、扫描旋转角度等一大堆…...

行人动力学新视角:用速度、密度、避免数与侵入数量化交叉人流行为

1. 项目概述:当行人流交汇时,我们如何“看懂”人群?想象一下早高峰的地铁换乘通道,或是大型演唱会散场时的十字路口。两股、甚至多股人流以不同的角度交汇、穿插、最终分离。作为城市管理者或空间设计师,你可能会问&am…...

机器学习与熵工程协同设计CuCo纳米合金催化剂,实现高效硝酸盐还原制氨

1. 项目概述:当机器学习遇见熵工程,如何“算”出顶级催化剂?在材料研发这个领域里,我待了十几年,最大的感受就是“试错”两个字有多重。尤其是当我们想合成一些在宏观世界里根本“不兼容”的金属合金时,比如…...