当前位置: 首页 > article >正文

机器学习大师课 第 1 课:什么是机器学习?写出你的第一个 AI 程序

课程承诺每节课只讲 1 个核心概念、1 个核心思想、1 段可运行代码。学完立刻能用绝不讲听不懂的废话。本节课目标彻底搞懂机器学习和普通编程的本质区别亲手写出人生第一个机器学习程序5 分钟内看到 AI 预测结果。 第一个核心概念机器学习到底是什么先忘掉所有你听过的 人工智能、神经网络、大模型 这些高大上的词。我用一句话给你讲明白普通编程人写规则计算机执行规则得到结果机器学习人给数据和结果计算机自己学会规则最通俗的例子区分苹果和橘子普通程序员的做法写一万条 if-else 规则plaintextif 颜色是红色 and 形状是圆形 and 直径10cm: return 苹果 elif 颜色是橙色 and 表皮有坑: return 橘子 ...结果遇到青苹果就错了遇到黄苹果也错了永远写不完所有规则。机器学习工程师的做法给计算机 1000 张苹果的照片标上 苹果。给计算机 1000 张橘子的照片标上 橘子计算机自己学会区分苹果和橘子的规则。核心区别普通编程是 人教计算机做事机器学习是 计算机自己从数据中学习做事。 第一个核心思想机器学习就是 找规律所有机器学习算法本质上都在做同一件事从一堆数据中找到隐藏的规律然后用这个规律去预测未知的事情。就像你小时候学数学老师给你例题数据112224336你找到规律一个数加它自己等于它的 2 倍你用规律做新题预测100100200机器学习也是一模一样的过程给它历史数据例题它找到数据之间的规律公式 / 模型用这个规律预测未来做新题本节课我们要解决的问题预测房子的面积和房价的关系已知5 套房子的面积和对应的价格目标让 AI 学会这个规律然后预测一套 120 平米的房子值多少钱 第一个可运行代码5 行代码写一个房价预测 AI前置要求你已经安装了 Python 和 scikit-learn 库如果没安装先在命令行运行这一行bash运行pip install scikit-learn numpy完整代码复制粘贴就能运行python运行# 1. 导入我们需要的工具 from sklearn.linear_model import LinearRegression # 从scikit-learn库导入线性回归模型类 该模型实现普通最小二乘法(OLS)线性回归算法用于建立特征与目标变量间的线性关系 import numpy as np # 导入NumPy科学计算库提供高效的多维数组操作和数学函数 是机器学习数据处理的基础依赖 # 2. 准备历史数据例题 # X特征矩阵必须是二维数组结构n_samples × n_features # 此处表示5个训练样本每个样本包含1个特征房屋面积单位平米 # 双括号[[50],...]表示列向量格式符合scikit-learn要求的输入规范即使单特征也需保持二维结构 X np.array([[50], [60], [70], [80], [90]]) # y目标向量一维数组结构n_samples, # 对应5个样本的真实房价标签单位万元 # 注意此处数据呈现完美的线性关系y 2x实际业务中数据通常包含噪声 y np.array([100, 120, 140, 160, 180]) # 3. 创建一个AI模型就像一个刚出生的学生 # 初始化线性回归模型实例normalizeFalse表示不进行特征标准化默认使用原始尺度 # fit_interceptTrue默认表示模型将计算截距项即y wx b中的b # 此时模型参数权重w和截距b尚未确定处于未训练状态 model LinearRegression() # 4. 让AI学习数据给它讲课让它找规律 # 执行模型拟合过程通过最小化残差平方和(RSS)计算最优参数 # 数学原理求解正规方程 (X^T X)^{-1} X^T y 或使用梯度下降法 # 训练完成后model.coef_ [2.0]斜率wmodel.intercept_ 0.0截距b model.fit(X, y) # 5. 用学会的规律预测新数据做新题 area 120 # 定义待预测的新样本特征值120平米房屋 # 将单个预测值转换为模型要求的二维输入格式[[120]] # 调用predict方法执行前向传播y_pred w * x b 2.0 * 120 0.0 240.0 predicted_price model.predict([[area]]) # 格式化输出预测结果保留两位小数 # 注意实际业务中需进行预测区间计算和置信度评估此处简化处理 print(f预测{area}平米的房子价格为{predicted_price[0]:.2f}万元)运行结果plaintext预测120平米的房子价格为240.00万元 逐行拆解代码彻底搞懂每一步在做什么我保证这 5 行代码包含了所有机器学习程序的基本结构以后你写的再复杂的 AI都是这个套路。导入工具python运行from sklearn.linear_model import LinearRegression我们不用自己从零写算法scikit-learn 这个库已经帮我们写好了所有经典算法。这里我们导入 线性回归 算法它是最简单、最常用的机器学习算法。准备数据python运行X np.array([[50], [60], [70], [80], [90]]) y np.array([100, 120, 140, 160, 180])X叫 特征就是我们用来预测的依据房子面积y叫 标签就是我们想要预测的结果房价这就是我们给 AI 的 例题创建模型python运行model LinearRegression()这一步就像你招了一个什么都不会的新员工他现在脑子里一片空白。训练模型核心步骤python运行model.fit(X, y)这是最神奇的一步fit就是 学习 的意思。当你运行这行代码时AI 会自动分析 X 和 y 之间的关系找到那个隐藏的规律。在这个例子中它找到了规律房价 面积 × 2预测python运行predicted_price model.predict([[area]])AI 学会了规律之后你给它一个新的面积它就会用刚才找到的规律算出对应的房价。✨ 神奇的实验让 AI 自己发现新规律现在请你动手修改一下代码看看会发生什么把房价数据改成python运行y np.array([150, 170, 190, 210, 230])再运行一次看看 120 平米的房子预测价格是多少你会发现AI 自动发现了新的规律 房价 面积 × 2 50预测结果变成了 290.00 万元你没有修改任何算法没有写任何新的规则只是给了它不同的数据它就自己学会了不同的规律。这就是机器学习的魔力 本节课总结核心概念机器学习是让计算机从数据中自己学习规则而不是人写规则核心思想所有机器学习都是 从数据中找规律用规律做预测核心代码结构导入工具 → 准备数据 → 创建模型 → 训练模型 → 预测你已经做到了写出了一个真正的机器学习程序它能根据历史数据预测未来 课后作业必须做否则等于白学运行上面的代码确保你能得到正确的结果自己造一组新的数据比如预测 学习时间和考试分数 的关系学习时间小时[1, 2, 3, 4, 5]考试分数分[60, 70, 80, 90, 100]预测学习 8 小时能考多少分思考一个问题如果数据不是这么完美的直线关系比如有一个数据点是 学习 5 小时考了 95 分AI 会怎么预测你可以改改代码试试。

相关文章:

机器学习大师课 第 1 课:什么是机器学习?写出你的第一个 AI 程序

课程承诺:每节课只讲 1 个核心概念、1 个核心思想、1 段可运行代码。学完立刻能用,绝不讲听不懂的废话。本节课目标:彻底搞懂机器学习和普通编程的本质区别,亲手写出人生第一个机器学习程序,5 分钟内看到 AI 预测结果。…...

最终收官课:从刷题到实战 —— 数据结构与算法的工业界真相

这是真正的最后一课。前面我们学了所有的知识点和解题模板,但很多人都会有一个疑问:这些东西除了面试,在实际工作中到底有什么用?这一课我会彻底回答这个问题。我会带你跳出刷题的视角,站在工业界大佬的角度&#xff0…...

告别‘震耳欲聋’:5分钟搞定RK3568开发板的系统音量默认值(修改设备树参数)

RK3568开发板音量优化实战:5分钟修改设备树解决默认音量问题 第一次在RK3568开发板上用aplay播放音频时,突如其来的巨大音量差点让我把耳机扔出去——这恐怕是许多开发者共同的"惊悚体验"。不同于传统PC或手机,嵌入式设备的音频系统…...

封海外是否可以阻断海外流量攻击

很多新人GM在租用服务器的时候,经常会问到机器是否可以封海外的问题,觉得流量攻击多数来自海外流量,就认为把海外封了就可以了,这样子海外流量就打不进来,就不用担心流量攻击了。实际上屏蔽海外是无法隔绝海外流量攻击…...

告别取模软件!用Python脚本批量生成STM32墨水屏天气时钟的图标字库

告别取模软件!用Python脚本批量生成STM32墨水屏天气时钟的图标字库 在嵌入式开发中,墨水屏因其低功耗和类纸显示效果,成为天气时钟等项目的热门选择。然而,传统取模软件的手动操作流程繁琐,尤其当项目需要大量天气图标…...

当Ubuntu 22.04遇上老内核:手把手解决野火鲁班猫USB/IP编译安装的“版本冲突”难题

当Ubuntu 22.04遇上老内核:手把手解决野火鲁班猫USB/IP编译安装的“版本冲突”难题 在嵌入式开发领域,版本兼容性问题就像一位不请自来的"老朋友",总在最关键的时刻给我们带来惊喜。最近在调试野火鲁班猫开发板时,我就…...

GPFS 集群运维「神器」:手搓一个 EC 模式可视化监控平台,实现自动化飞书告警!

01 存储运维的「黑盒」之痛 做过大规模 GPFS(IBM Spectrum Scale)集群运维的同学都懂: 集群拓扑全靠 mmlscluster、mmlsnsd 命令脑补;EC(Erasure Coding,纠删码)模式的磁盘、Vdisk、Pdisk 关系错…...

【优化分配】基于遗传算法GA求解多因素加权竞价博弈频谱分配优化问题附Matlab代码

​✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书…...

从《我的世界》到小游戏:用SFML和VS2022开启你的2D图形编程之旅

从《我的世界》到小游戏:用SFML和VS2022开启你的2D图形编程之旅 你是否曾经玩过《我的世界》,被那些简单的方块构建出的无限可能所吸引?或者梦想过亲手打造属于自己的2D小游戏?对于许多编程新手来说,游戏开发似乎是一…...

从电影片尾到创意开场:手把手教你用Aegisub制作竖向滚动字幕(含scroll up代码详解)

从电影片尾到创意开场:手把手教你用Aegisub制作竖向滚动字幕(含scroll up代码详解) 在视频内容爆炸式增长的今天,一个精心设计的字幕效果往往能成为作品的记忆点。想象一下知识类视频开场时如瀑布般上升的引言金句,或是…...

【Matlab代码】基于Stackelberg博弈的光伏用户群优化定价模型(完美复现)

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…...

终极指南:5步快速搭建企业级文档管理系统OpenKM

终极指南:5步快速搭建企业级文档管理系统OpenKM 【免费下载链接】document-management-system OpenKM is a Open Source Document Management System 项目地址: https://gitcode.com/gh_mirrors/do/document-management-system 还在为团队文档管理混乱而头疼…...

想学大模型,一个正确的学习路线真的很重要!

本文作者复盘了在实习中积累的LLM微调、AI-Agent开发及高stars开源项目经验,结合CS336课程理论,将碎片化知识系统化,旨在为想转行同学提供坚实知识框架。学习路线涵盖LLM前置知识、预训练细节、后训练(SFT、LoRA、RLHF&#xff09…...

5步掌握NewTab Redirect!:从零基础到专业级新标签页自定义

5步掌握NewTab Redirect!:从零基础到专业级新标签页自定义 【免费下载链接】NewTab-Redirect NewTab Redirect! is an extension for Google Chrome which allows the user to replace the page displayed when creating a new tab. 项目地址: https://gitcode.co…...

行业内正规的装修公司哪家靠谱

最近后台收到不少南宁业主的提问:装修挑施工公司挑花了眼,连锁品牌贵还怕套路,本地小公司又怕工艺没保障,到底哪家才是真的专业? 我在南宁家装圈摸爬滚打这么多年,见过太多业主花了十几万装修,住…...

Tiled世界编辑器终极指南:如何构建无缝拼接的大型游戏地图

Tiled世界编辑器终极指南:如何构建无缝拼接的大型游戏地图 【免费下载链接】tiled Flexible level editor 项目地址: https://gitcode.com/gh_mirrors/ti/tiled Tiled作为一款专业的2D地图编辑器,其世界(World)功能让开发者…...

NSH-12RH齿轮电机

Bodine Electric NSH-12RH是并励式直流齿轮电机,适用于需要稳定转速和调节特性的工业传动应用。电压等级115V DC,电流0.33A,功率1/50HP。采用并励绕组结构,磁场由独立励磁绕组产生。转速特性较硬,负载变化时转速波动小…...

Pixel Couplet Gen微信小程序实战:Canvas渲染像素春联并支持长按保存

Pixel Couplet Gen微信小程序实战:Canvas渲染像素春联并支持长按保存 1. 项目背景与核心功能 Pixel Couplet Gen是一款将传统春节文化与现代像素艺术相结合的创新应用。通过ModelScope大模型的文本生成能力,结合微信小程序的Canvas渲染技术&#xff0c…...

别再只会用open和close了!Tcl文件读写实战:从读取日志到批量处理文本的5个真实场景

Tcl文件操作实战:5个真实场景提升你的脚本工程能力 如果你已经掌握了Tcl中open和close的基本用法,那么是时候将这些知识应用到实际工作场景中了。本文将带你深入五个真实世界的文件操作案例,从日志分析到批量处理,每个技巧都能立即…...

水冷板散热做不好?FloEFD单管道热仿真一步到位,效率提升肉眼可见

🎓作者简介:科技自媒体优质创作者 🌐个人主页:莱歌数字-CSDN博客 💌公众号:莱歌数字(B站同名) 📱个人微信:yanshanYH 211、985硕士,从业16年 从…...

实测雷达数据处理避坑:用MATLAB手把手教你计算信噪比(附代码与数据)

雷达数据处理实战:信噪比计算中的关键陷阱与MATLAB解决方案 雷达信号处理中,信噪比(SNR)是评估系统性能的核心指标之一。但看似简单的功率比值计算,在实际操作中却暗藏诸多陷阱。本文将从一个工程师的实际项目复盘视角,剖析雷达数…...

JACP-317120电源模块

YASKAWA JACP-317120是一款专为CP-9200SH及CP-317等控制系统设计的工业级电源模块。型号代码PS-01,属于Control Pack系列的核心电源组件输入电压支持100V AC(85-132V AC)或100V DC输入频率47-63Hz(交流输入时)输出电压…...

Postman调试海康ISAPI接口全记录:从鉴权到改设备名,一次搞定

Postman调试海康ISAPI接口实战指南:从零掌握设备管理全流程 海康威视设备的ISAPI接口作为设备管理的核心通道,为开发者提供了丰富的控制能力。但面对复杂的鉴权机制和XML数据交互,不少开发者仍感到无从下手。本文将带你用Postman这把"瑞…...

程序员编程助手科技股份有限责任公司AIRecomandationWebSys技术经理四川大学计算机学院毕业生技术官微软技术工程师12年工作经验后端技术微软工程师

-程序员编程助手科技股份有限责任公司AIRecomandationWebSys技术经理四川大学计算机学院毕业生技术官微软技术工程师12年工作经验后端技术微软工程师创新青年公寓北京大学系统所硕士研究生四川前端技术研发工程师Sunny香港高级前端技术研发工程师Angus_ALHr北京大学本科生Trans…...

如何在Mac上免费实现NTFS完美读写?终极解决方案来了!

如何在Mac上免费实现NTFS完美读写?终极解决方案来了! 【免费下载链接】Free-NTFS-for-Mac Nigate: An open-source NTFS utility for Mac. It supports all Mac models (Intel and Apple Silicon), providing full read-write access, mounting, and man…...

KEYSIGHT N9040B 高端信号与频谱分析仪使用说明书

你关注的KEYSIGHT N9040B是是德科技UXA系列高端信号与频谱分析仪的旗舰型号,代表了当前商用频谱分析仪的性能天花板,在5G/6G毫米波测试、雷达信号分析、电子战测量、前沿通信技术研发等领域属于行业公认的标杆设备,其动态范围、相位噪声和测量…...

PyCharm里用不了mxnet?手把手教你关联Anaconda虚拟环境(图解配置)

PyCharm无法识别mxnet?三步搞定Anaconda环境配置 刚在命令行成功安装了mxnet,打开PyCharm却提示"No module named mxnet"?这种环境配置断层问题困扰过无数Python开发者。本文将彻底解决这个痛点,带你理解虚拟环境与IDE的…...

【2026.4】达利欧清华演讲:投资原则和大周期

达利欧《原则》:https://pan.xunlei.com/s/VOrDKWmluEcWHZdBKcYcGqYrA1?pwdp3e9# 更多:https://pan.xunlei.com/s/VOrDKa3yigihx-Rz0nfd8Wa-A1?pwdtw6g# "当前处于一生仅见的全球货币、格局和地缘秩序的系统性崩溃期。"——瑞达利欧 一、投…...

前端性能监控告警

前端性能监控告警:保障用户体验的关键利器 在当今数字化时代,用户对网页加载速度和交互流畅度的要求越来越高。前端性能的优劣直接影响用户体验、转化率甚至品牌形象。性能问题往往难以通过人工测试全面覆盖,尤其是在复杂的生产环境中。前端…...

用Godot 4做回合制游戏:如何用JSON数据动态生成战斗角色和宠物(附完整代码)

Godot 4数据驱动游戏开发:构建可扩展的回合制战斗系统 在独立游戏开发领域,数据驱动设计正逐渐成为构建复杂游戏系统的首选方法。Godot 4作为一款开源游戏引擎,其灵活的场景系统和强大的脚本支持,使其成为实现数据驱动开发的理想选…...