当前位置: 首页 > article >正文

Week1:机器学习入门

Week1机器学习入门摘要本周完成李宏毅《机器学习》课程第 1 讲的入门学习建立对机器学习的整体认知。首先梳理了人工智能、机器学习与深度学习的层级关系剖析了传统 “人工设定规则” 方法的局限性在此基础上理解了 “机器学习本质是从数据中寻找最优函数” 的核心逻辑。1机器学习基础1.1核心概念层级关系人工智能AI是最终目标旨在让机器具备类人的智能行为机器学习ML是实现人工智能的核心手段通过让机器从数据中学习规律而非依赖硬编码规则来完成任务深度学习DL是机器学习的一个分支以多层神经网络为核心通过非线性模型拟合复杂规律1.2 传统人工规则方法的局限性课程通过多个案例剖析了传统方法的瓶颈以河狸筑坝的本能为例河狸仅能对 “流水声” 这一固定触发条件做出反应无法适应水泥墙播放流水声这类异常场景以聊天机器人为例硬编码 “turn off” 触发 “关闭音乐” 的规则无法处理 “Please don’t turn off the music” 这类带否定词的变体指令这类方法的共性问题① 无法覆盖所有可能性复杂场景下规则编写成本极高② 模型表现永远无法超越人类设定者③ 对复杂任务的适配性差不适合小团队快速落地。1.3 机器学习的本质定义本讲提出了机器学习的核心定义机器学习≈从数据中寻找最优函数。课程通过多个案例具象化这一概念图像识别输入一张图片寻找函数将其映射为 “猫 / 狗 / 猴子” 的类别语音识别输入一段音频波形寻找函数将其映射为对应的文本围棋对弈输入棋盘状态寻找函数输出下一步的落子位置对话系统输入用户的问题寻找函数输出合理的回复。1.4 机器学习的三大核心流程课程将机器学习的实现逻辑简化为三个关键步骤类比 “把大象放进冰箱” 的流程清晰易懂Step 1定义函数集合模型空间预先设定可能的函数范围比如所有可能的线性模型、或所有结构的神经网络Step 2定义函数的 “好坏”评估指标 / 损失函数基于训练数据判断一个函数的预测结果与真实标签的差距差距越小函数表现越好Step 3选出最优函数优化过程通过算法从函数集合中筛选出在训练数据上表现最好的那个函数作为最终模型。2 机器学习的任务类型2.1 监督学习任务监督学习是机器学习中最常见的任务类型核心特点是基于带标签的训练数据学习输入到输出的映射关系。根据输出形式的不同可分为三类2.1.1 回归任务回归任务的输出是连续的标量数值目标是预测一个具体的数值结果。课程以 “预测 PM2.5” 为例输入是过去几天的 PM2.5 监测数据目标是训练一个函数输出未来一天的 PM2.5 浓度值。2.1.2 分类任务分类任务的输出是离散的类别标签根据类别数量可分为两类二分类仅需区分两个类别比如垃圾邮件过滤“是垃圾邮件 / 不是垃圾邮件”多分类需区分三个及以上的类别比如新闻文档分类“政治 / 经济 / 体育 / 科技”课程也以围棋为例说明每一个棋盘位置都是一个类别模型需要输出下一步的落子位置。2.1.3 结构化学习任务结构化学习是分类任务的延伸输出不是简单的标量或单个类别而是结构化的复杂数据课程举例语音识别输入音频波形输出对应的文本序列机器翻译输入中文文本输出对应的英文文本人脸检测输入一张图片输出图片中所有人脸的位置与边界框。3 机器学习的学习范式除了监督学习课程还介绍了其他主流学习范式根据数据是否带标签、数据与任务的相关性可分为以下几类3.1 无监督学习无监督学习的核心特点是使用无标签数据进行学习目标是挖掘数据本身的结构与规律而非直接预测标签。课程举例词向量学习通过阅读大量无标签文本让模型学习单词的语义含义图像生成通过学习大量无标签图片的分布生成新的图片内容。3.2 半监督学习半监督学习结合了少量带标签数据和大量无标签数据主要用于解决 “标注数据稀缺” 的场景。课程以猫狗识别为例仅用少量标注了 “猫 / 狗” 的图片结合大量无标注的猫狗图片训练模型完成识别任务降低数据标注成本。3.3 强化学习强化学习的核心逻辑是让智能体Agent与环境交互通过反馈信号奖励 / 惩罚优化策略与监督学习有明显区别监督学习是 “向老师学习”有明确的标准答案强化学习是 “从批评中学习”没有直接的标准答案仅通过最终结果的好坏比如围棋的输赢、对话的用户反馈来调整模型策略。课程以 AlphaGo 为例说明其结合了监督学习与强化学习先学习人类棋谱再通过自我对弈优化策略。3.4 迁移学习迁移学习的目标是利用与当前任务不直接相关的数据辅助模型学习提升模型的泛化能力。课程以猫狗识别为例除了标注的猫狗图片还可以用大象、老虎、动漫角色等其他数据帮助模型学习通用的图像特征提升对猫狗识别任务的适配能力。总结本周的学习搭建了机器学习的基础框架纠正了 “AI 复杂规则” 的误区理解了 “从数据中学习” 才是机器学习的核心逻辑。同时也对不同任务类型与学习范式有了清晰的认知明确了不同场景下的模型选型思路。后续将继续跟进课程进度补充线性回归的相关学习并尝试通过简单的代码案例将本周的理论知识落地实践。

相关文章:

Week1:机器学习入门

Week1:机器学习入门摘要:本周完成李宏毅《机器学习》课程第 1 讲的入门学习,建立对机器学习的整体认知。首先梳理了人工智能、机器学习与深度学习的层级关系,剖析了传统 “人工设定规则” 方法的局限性;在此基础上&…...

从 ODesign 到分子世界模型:AI 制药真正要学的,不是分子,而是相互作用

AI 制药这些年讲过许多故事。 一开始讲虚拟筛选,后来讲分子生成,再后来讲 AlphaFold、扩散模型、蛋白设计、抗体设计、干湿闭环。每一代故事都有自己的热闹,也有自己的贫乏。热闹在于工具越来越多,贫乏在于许多工具仍然像一排分工…...

5.18~5.24补题

牛客周赛Round 144 A.我是谁?牛客周赛Round 144 B.我是清楚姐姐牛客周赛Round 144 C.其实我是小苯 牛客周赛Round 144 D.骗你的,其实我是小红牛客周赛Round 144 E.好吧,我是BingbongSMU Spring 2026 Round 4 ASMU Spring 2026 Round 4 BSMU S…...

Arm Cortex-M的FP和MVE

Floating-point Support目前Arm architecture支持的floating-point extension版本是FPv5。FPv5提供了以下功能:单精度算术运算;可选的双精度算术运算;整数、双精度、单精度、和半精度格式之间的转换;用于浮点处理的寄存器&#xf…...

收藏|2026 新版大模型入行指南!风口红利期程序员小白均可入局

2026年人工智能行业发展势头迅猛,已然迈入全民争相布局的高速发展阶段。多模态技术持续更新升级,大模型各类商业化项目不断落地投产,市场专业人才缺口不断拉大,对应岗位薪酬待遇也迎来大幅上涨。 不管是毫无技术基础、打算从零起步…...

网盘直链下载助手:彻底告别限速的终极免费解决方案

网盘直链下载助手:彻底告别限速的终极免费解决方案 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘…...

3个理由告诉你为什么选择哔哩下载姬:B站视频下载的终极解决方案

3个理由告诉你为什么选择哔哩下载姬:B站视频下载的终极解决方案 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印…...

LeetCode 每日一题笔记 日期:2026.05.24 题目:1340. 跳跃游戏 V

LeetCode 每日一题笔记 0. 前言 日期:2026.05.24题目:1340. 跳跃游戏 V难度:困难标签:数组、动态规划、记忆化搜索、单调栈 1. 题目理解 问题描述: 给定一个整数数组 arr 和整数 d,从下标 i 出发&#xff0…...

构建内容生成服务时利用Taotoken实现模型降级容灾

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 构建内容生成服务时利用Taotoken实现模型降级容灾 在构建面向用户的在线内容生成服务时,服务的稳定性和可用性是核心考…...

从伪加密ZIP到RSA解密:手把手带你复现BUUCTF那道ACTF新生赛Crypto题

从伪加密ZIP到RSA解密:手把手带你复现BUUCTF那道ACTF新生赛Crypto题 当你第一次接触CTF密码学题目时,面对一个看似普通的ZIP压缩包和一堆加密参数,很容易感到无从下手。本文将带你完整复现BUUCTF平台上那道经典的ACTF新生赛Crypto题目&#x…...

Beyond Compare 5密钥生成技术深度解密:从RSA加密到完整激活解决方案

Beyond Compare 5密钥生成技术深度解密:从RSA加密到完整激活解决方案 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 在软件开发与系统维护领域,Beyond Compare 5作为文件…...

AMD Ryzen隐藏性能调优利器:SMUDebugTool硬件调试工具完全指南

AMD Ryzen隐藏性能调优利器:SMUDebugTool硬件调试工具完全指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: ht…...

导师推荐 AI论文网站测评:2026最新好用工具全解析

2026年真正好用的AI论文网站,核心看生成的论文质量、低AI味、格式正确、学术适配四大指标。综合实测,千笔AI、ThouPen、豆包、DeepSeek、Grammarly 是当前最值得推荐的梯队,覆盖从免费到付费、从中文到英文、从文科到理工的全场景需求。 一、…...

跟着 MDN 学CSS day_17:(深入理解溢出机制与容器控制艺术)

在CSS的世界里,一切皆为盒子。当我们精心设定盒子的宽度和高度,试图构建完美的布局时,一个不可避免的问题就会悄然出现:**如果内容超出了盒子的承载能力,会发生什么?**这就是CSS中一个至关重要的概念——溢…...

跟着 MDN 学CSS day_16:(深入掌握背景与边框的艺术)

在网页设计的视觉语言中,背景与边框是两个最基础也最强大的工具。它们就像舞台的幕布和画框,共同构建了元素的视觉边界与氛围。MDN的技能测试为我们提供了一个绝佳的实践机会,通过两个具体任务,将理论知识转化为实战能力。本文将深…...

Linux网络编程基础(UDP socket编程)

UDP(用户数据报协议)是一种无连接的传输层协议,与TCP不同,它不保证数据包的顺序和可靠性,但其简单性和低延迟特性使其在实时应用中非常有用。一、UDP协议核心特性UDP作为传输层协议,与TCP的“可靠连接”不同…...

c++乱码问题

大家下载vs2026或者更新时,可能会出现乱码问题点击工具,进入选项,在环境列表里找到文档,下滑到底部,勾选使用特定编码保存文件然后退出就可以了。如果还是存在问题,将自己的代码保存,重新新建一…...

Windows安卓子系统终极优化指南:如何通过WSABuilds实现完美Android体验

Windows安卓子系统终极优化指南:如何通过WSABuilds实现完美Android体验 【免费下载链接】WSABuilds Run Windows Subsystem For Android on your Windows 10 and Windows 11 PC using prebuilt binaries with Google Play Store (MindTheGapps) and/or Magisk or Ke…...

终极指南:3步免费搞定Android Studio中文界面,开发效率提升50%!

终极指南:3步免费搞定Android Studio中文界面,开发效率提升50%! 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseL…...

UE5.1实战:用MySQL插件做个游戏内数据查询器(附完整蓝图)

UE5.1实战:构建高性能游戏内MySQL数据查询系统在虚幻引擎5.1中集成数据库功能已经成为现代游戏开发的重要需求。无论是玩家排行榜、道具管理系统还是实时数据分析,直接访问数据库都能显著提升开发效率和游戏体验。本文将带你从零开始构建一个完整的游戏内…...

Windows热键冲突终极指南:3分钟找出偷走你快捷键的“小偷“

Windows热键冲突终极指南:3分钟找出偷走你快捷键的"小偷" 【免费下载链接】hotkey-detective A small program for investigating stolen key combinations under Windows 7 and later. 项目地址: https://gitcode.com/gh_mirrors/ho/hotkey-detective …...

5分钟快速解锁中兴光猫:终极免费工具zteOnu完整指南

5分钟快速解锁中兴光猫:终极免费工具zteOnu完整指南 【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 对于网络管理员和技术爱好者来说,中兴光猫的权限限制常常成…...

量子循环神经网络在混沌时序预测中的参数效率与架构对比

1. 项目概述 最近几年,量子机器学习(QML)的热度持续攀升,大家都想看看,用量子计算那套“叠加”和“纠缠”的玩法来处理经典问题,到底能不能带来点惊喜。时序预测,尤其是混沌系统预测&#xff0c…...

从酒店评论到情感分析:手把手教你用fastText做文本分类(Python实战避坑指南)

从酒店评论到情感分析:fastText文本分类实战全解析 当产品经理甩给你一份未经处理的酒店评论数据集,要求48小时内给出情感倾向分析报告时,作为工程师的你该如何应对?本文将带你用fastText这个轻量级工具,从原始数据到…...

对比直接使用官方API,Taotoken在计费透明性上的实际感受

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接使用官方API,Taotoken在计费透明性上的实际感受 1. 引言:从多模型调用到费用感知的转变 在同时接…...

Wand-Enhancer终极指南:三步免费解锁WeMod专业版所有功能

Wand-Enhancer终极指南:三步免费解锁WeMod专业版所有功能 【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 还在为WeMod免费版的限制而烦恼吗&…...

IDE 重构(Refactoring)详解 + 实例代码

IDE 重构(Refactoring)详解 实例代码 重构是指在不改变代码外部行为的前提下,对代码内部结构进行调整、优化,使代码更易读、易维护、易扩展的过程。IDE(集成开发环境)是重构的最强助手,它能自动…...

深入解析AlienFX Tools:从硬件直连到个性化灯光控制的完整技术方案

深入解析AlienFX Tools:从硬件直连到个性化灯光控制的完整技术方案 【免费下载链接】alienfx-tools Alienware systems lights, fans, and power control tools and apps 项目地址: https://gitcode.com/gh_mirrors/al/alienfx-tools 在Alienware设备生态中&…...

2026国安部重磅披露:境外间谍如何利用民用路由器构建窃密跳板?全链路技术解析与防御指南

一、引言:从"网速变慢"到国家级网络窃密 2026年5月20日,国家安全部官方微信公众号发布紧急通报,披露了一起严重的境外间谍情报机关网络窃密案件。与以往直接攻击政府或企业服务器不同,此次攻击者将目标锁定在了最容易被…...

Python调用WebAssembly破解APP签名算法实战

1. 这不是“调用JS”,而是把WebAssembly当真实CPU来调试你有没有遇到过这样的情况:抓包看到某资讯APP的请求里,sign参数像雪花一样每秒变一个,长度固定32位,全是小写字母加数字;Fiddler里点开响应&#xff…...