当前位置: 首页 > article >正文

从感知机到GPT:一个1957年的“神经元”如何引爆2026年的AI革命?

1958年《纽约时报》曾预言“海军希望电子计算机能够孕育出能走路、会说话、能看会写、还能自我复制并有自我意识的东西。”近70年后的今天我们拥有的AI虽然没有完全实现那个预言但却以另一种方式颠覆了世界。2026年AI正在从“生成式对话”迈入“代理式行动”的全新纪元。这一切的起点是一个叫做“感知机”的简单数学模型。本文将带你从感知机的诞生开始一步步理解这个改变世界的算法并用Python代码亲手实现它。一、1957年当心理学教授造出了“会思考的机器”1957年康奈尔大学的心理学教授弗兰克·罗森布拉特Frank Rosenblatt做了一件疯狂的事——他试图用电子元件模拟人类大脑的神经元。他设计了一台名为Mark I 感知机的硬件设备。这台机器由400个光电探测器组成用电位器模拟神经元的连接权重用电机来完成权重的更新。Mark I的目标很简单识别图像。它在当时引起了轰动甚至让人们产生了一种错觉真正的人工智能即将到来。然而由于当时算力与理论的双重局限它最终只能识别极其简单的图像离“会思考的机器”还差得很远。但罗森布拉特的伟大之处在于他不仅造出了机器还提出了一个影响至今的数学模型——感知机。二、感知机到底是什么——从数学公式到代码实现感知机的核心思想其实非常简单接收多个输入信号乘以各自的权重加起来如果总和超过某个阈值就“激活”否则就“沉默”。下图是接收两个输入信号的感知机结构数学上可以这样表示y{0(w1x1w2x2≤θ)1(w1x1w2x2θ)y{01(w1x1w2x2≤θ)(w1x1w2x2θ)其中x₁、x₂是输入信号0或1w₁、w₂是权重控制各输入的重要性θ是阈值决定激活的难易程度为了编程方便我们通常把阈值改写为偏置by{0(bw1x1w2x2≤0)1(bw1x1w2x20)y{01(bw1x1w2x2≤0)(bw1x1w2x20)代码实现用NumPy打造感知机下面我们用NumPy实现一个完整的感知机先来实现与门AND gate——只有两个输入都为1时输出才为1import numpy as np def AND(x1, x2): x np.array([x1, x2]) # 输入信号 w np.array([0.5, 0.5]) # 权重 b -0.7 # 偏置 tmp np.sum(w * x) b # 加权和 偏置 if tmp 0: return 0 else: return 1 # 测试与门 print(AND(0, 0)) # 输出 0 print(AND(1, 0)) # 输出 0 print(AND(0, 1)) # 输出 0 print(AND(1, 1)) # 输出 1代码解析np.array([x1, x2]) 将两个输入信号封装成NumPy数组便于进行向量化运算。np.sum(w * x) 将权重与对应输入相乘后求和再与偏置相加得到总加权输入。最后通过条件判断决定输出结果。用同样的结构只需要改变权重和偏置的值就能实现不同的逻辑门与非门NAND——与门的输出取反def NAND(x1, x2): x np.array([x1, x2]) w np.array([-0.5, -0.5]) # 权重取负 b 0.7 # 偏置取正 tmp np.sum(w * x) b return 0 if tmp 0 else 1 # 测试与非门 print(NAND(0, 0)) # 输出 1 print(NAND(1, 0)) # 输出 1 print(NAND(0, 1)) # 输出 1 print(NAND(1, 1)) # 输出 0或门OR——只要有一个输入为1就输出1def OR(x1, x2): x np.array([x1, x2]) w np.array([0.5, 0.5]) b -0.2 # 偏置比与门更大 tmp np.sum(w * x) b return 0 if tmp 0 else 1 # 测试或门 print(OR(0, 0)) # 输出 0 print(OR(1, 0)) # 输出 1 print(OR(0, 1)) # 输出 1 print(OR(1, 1)) # 输出 1与门、与非门、或门具有完全相同的构造区别仅在于权重和偏置的值。三、感知机的致命局限为什么一个门都搞不定逻辑门的问题还没完。现在来看异或门XORx₁x₂y000101011110异或门的特点是当两个输入不同时输出1相同时输出0。问题来了单层感知机无论如何都实现不了异或门。3.1 几何视角为什么一条直线不够用把四个输入点0,0、1,0、0,1、1,1画在平面上标记输出值——你会发现没有任何一条直线能把输出为0和输出为1的点完全分开。这个发现就是后来著名的XOR问题。但如果将直线这个限制条件去掉就可以了感知机的局限性就在于它只能表示由一条直线划分的空间而上图中的曲线无法用感知机表示。由曲线划分的空间称为非线性空间由直线划分的空间称为线性空间。3.2 历史转折1969年的“AI寒冬”1969年人工智能领域的泰斗马文·明斯基Marvin Minsky和西摩·佩珀特Seymour Papert出版了《感知机》一书用严格的数学证明了单层感知机无法解决XOR这样的线性不可分问题。这本书的出版加上当时算力的极度匮乏直接导致整个神经网络研究进入了长达十几年的“AI寒冬”。很多人错误地以为多层感知机也存在类似的根本性缺陷事实上多层感知机完全可以解决XOR问题。好消息是感知机学习算法有一个重要的理论保证——收敛定理。如果训练数据是线性可分的感知机算法一定能在有限次迭代后找到正确的分类超平面且错误更新次数有一个上界。这条定理证明了感知机在适用场景下的可靠性。四、破解XOR多层感知机的诞生既然单层不行那就用多层。用两个感知机组合起来将其组合构成异或门具体来说第一层用与非门和或门分别处理输入第二层用与门对两个结果再做一次判断下面是完整的代码实现import numpy as np def AND(x1, x2): x np.array([x1, x2]) w np.array([0.5, 0.5]) b -0.7 return 1 if np.sum(w * x) b 0 else 0 def NAND(x1, x2): x np.array([x1, x2]) w np.array([-0.5, -0.5]) b 0.7 return 1 if np.sum(w * x) b 0 else 0 def OR(x1, x2): x np.array([x1, x2]) w np.array([0.5, 0.5]) b -0.2 return 1 if np.sum(w * x) b 0 else 0 def XOR(x1, x2): s1 NAND(x1, x2) # 第一层与非门 s2 OR(x1, x2) # 第一层或门 y AND(s1, s2) # 第二层与门 return y # 测试异或门 print(XOR(0, 0)) # 输出 0 print(XOR(1, 0)) # 输出 1 print(XOR(0, 1)) # 输出 1 print(XOR(1, 1)) # 输出 0代码解析XOR 函数内部调用了之前实现的 NAND 和 OR 作为第一层它们的输出作为 AND 的输入。通过两层组合XOR 这个单层感知机无法解决的逻辑被完美实现。这就是多层感知机MLP的雏形。为什么多层就能行多层感知机的核心秘密在于通过叠加多个感知机层并引入非线性激活函数模型能够学习极其复杂的非线性映射关系。单层感知机只能学习线性分类边界就像只能用直线分割数据。多层感知机通过隐藏层Hidden Layer对输入数据进行非线性转换让分类边界变成曲线、折线甚至更复杂的形状。本质上MLP将输入特征不断转换到新的特征空间在这个新空间里原本线性不可分的数据变得线性可分。一个典型的MLP结构包含输入层、隐藏层和输出层各层之间的神经元全连接。反向传播让多层网络“学会”参数多层感知机之所以能真正发挥作用离不开反向传播算法Backpropagation的发明。它的核心思路是前向传播输入数据从输入层流向输出层计算预测结果。计算误差用损失函数衡量预测结果与真实标签之间的差距。反向传播从输出层向输入层逐层计算梯度确定每个权重应该如何调整。梯度下降根据梯度更新所有权重和偏置减小误差。整个过程循环迭代直到模型收敛。1986年Geoffrey Hinton等人推广了反向传播算法直接终结了AI寒冬开启了神经网络的复兴时代。五、从感知机到Transformer一条跨越70年的进化之路感知机的故事并没有在1969年终结。恰恰相反它的核心思想——通过加权求和、非线性激活、多层叠加来学习复杂模式——成为整个深度学习大厦的基石。下面这张时间线展示了从感知机到GPT的进化脉络关键里程碑回顾年份里程碑意义1943MP模型神经网络的理论奠基1957感知机Rosenblatt第一个可学习的神经网络1969《感知机》出版揭示单层感知机局限导致AI寒冬1986反向传播普及多层网络可训练AI寒冬结束1998LeNet-5第一个商用卷积神经网络2012AlexNet深度学习在ImageNet竞赛中一战成名2015ResNet152层网络解决梯度消失问题2017Transformer注意力机制架构GPT的基础2023-2024生成式AI爆发ChatGPT引爆全球AI热潮2026代理式AI兴起AI从“对话”走向“行动”2026年的AI正在发生深刻转变如果说2023-2024年是生成式AI的“对话”时代那么2026年将是“行动”时代。代理式AIAgentic AI将成为新的前沿AI系统能够自主感知环境、设定目标、规划步骤并执行复杂的任务序列无需人类持续干预。与此同时前沿研究也在不断突破传统架构的局限。2026年伊始普林斯顿和UCLA提出的Deep Delta LearningDDL新架构通过让残差连接本身具备学习能力突破了传统ResNet“只能累加信息、无法修改状态”的天花板为深度网络的表达能力开辟了新方向。六、总结为什么我们今天还要学感知机感知机是一个极其简单的模型但它的意义远不止于此理解深度学习的基础感知机里“加权求和 → 激活函数 → 输出”的模式是每一个神经网络的基础构建单元。掌握了感知机就掌握了神经网络的核心思想。理解AI的局限与突破XOR问题告诉我们简单的模型有其天然边界。而多层感知机的解法告诉我们组合与叠加可以打破边界。这种思维方式贯穿整个深度学习的发展。理解AI的进化逻辑从感知机到MLP从CNN到RNN从Transformer到GPT每一次突破都是在前人基础上的叠加与组合。理解起点才能理解方向。掌握可运行的代码文中所有感知机代码都是可以直接运行的亲手敲一遍代码远比只看理论来得深刻。感知机是一座桥梁——连接着神经科学的生物灵感与计算机科学的数学严谨连接着1957年的硬件实验与2026年的前沿AI。理解它你就抓住了深度学习的源头。一句话总结感知机是深度学习的“原子”——本身极其简单但正是它的组合与叠加构建了今天整个AI世界的复杂性。

相关文章:

从感知机到GPT:一个1957年的“神经元”如何引爆2026年的AI革命?

1958年《纽约时报》曾预言:“海军希望电子计算机能够孕育出能走路、会说话、能看会写、还能自我复制并有自我意识的东西。”近70年后的今天,我们拥有的AI虽然没有完全实现那个预言,但却以另一种方式颠覆了世界。2026年,AI正在从“…...

WeMod增强工具技术架构实现方案:基于ASAR解包与运行时注入的客户端增强方案

WeMod增强工具技术架构实现方案:基于ASAR解包与运行时注入的客户端增强方案 【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer Wand-Enhancer是…...

为何说逻辑回归是分类任务的“最佳基石”?

提到“回归”,你可能先想到房价预测。但有一个名字里带“回归”、实际却用来做分类的算法,在机器学习界地位极高——逻辑回归(Logistic Regression)。 医学诊断、金融风控、垃圾邮件识别……到处都有它的身影。 原因很简单&#…...

智能网页数据获取:Crawl4AI v1.0.0全攻略

智能网页数据获取:Crawl4AI v1.0.0全攻略 【免费下载链接】crawl4ai 🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Dont be shy, join here: https://discord.gg/jP8KfhDhyN 项目地址: https://gitcode.com/GitHub…...

OpCore-Simplify:黑苹果配置自动化的架构设计与技术实现

OpCore-Simplify:黑苹果配置自动化的架构设计与技术实现 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 传统黑苹果配置面临硬件兼容性判断…...

Ultimaker Cura:3D打印切片软件的5个核心功能深度解析与实战指南

Ultimaker Cura:3D打印切片软件的5个核心功能深度解析与实战指南 【免费下载链接】Cura 3D printer / slicing GUI built on top of the Uranium framework 项目地址: https://gitcode.com/gh_mirrors/cu/Cura Ultimaker Cura作为全球最受欢迎的开源3D打印切…...

暗黑破坏神2存档修改与角色调整工具:安全高效的d2s文件编辑解决方案

暗黑破坏神2存档修改与角色调整工具:安全高效的d2s文件编辑解决方案 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 在《暗黑破坏神2》的冒险旅程中,每个玩家都可能遇到存档损坏、属性点分配错误或稀有装…...

如何选择合理的SEO关键词推广价格_SEO关键词推广一般多少钱

如何选择合理的SEO关键词推广价格_SEO关键词推广一般多少钱 在当今数字化时代,网站的流量和曝光率直接关系到企业的业务发展。而在这个过程中,搜索引擎优化(SEO)扮演着至关重要的角色。其中,选择合理的SEO关键词推广价…...

ESP32S3实战:构建你的WiFi安全防护盾

1. ESP32S3:你的口袋网络安全实验室 第一次拿到ESP32S3开发板时,我完全没想到这个比硬币大不了多少的芯片能成为网络安全利器。直到有次家里的智能门锁突然离线,排查后发现是邻居小孩在用树莓派玩WiFi干扰实验——这让我意识到,与…...

微服务日志追踪实战:traceId在分布式系统中的高效应用

1. 为什么我们需要traceId? 想象一下你正在管理一个大型购物中心,每天有成千上万的顾客进出。突然有个顾客投诉说在某个店铺遇到了问题,但你手头只有整个商场所有店铺的监控录像,没有顾客的行动轨迹记录。这时候要找到问题发生的具…...

AI辅助开发:让快马AI生成能自适应Instagram页面改版的下载脚本

最近在做一个Instagram媒体下载工具时,遇到了一个很头疼的问题:每次Instagram更新页面结构,我的脚本就会失效。后来尝试用InsCode(快马)平台的AI辅助功能,发现可以很好地解决这个问题。今天就来分享一下如何利用AI生成一个能自适应…...

AI赋能开发:让快马平台智能优化与扩展你的openclaw101.dev工具库

AI赋能开发:让快马平台智能优化与扩展你的openclaw101.dev工具库 最近在维护openclaw101.dev项目时,我发现工具函数库需要一次全面的优化升级。传统手动修改不仅耗时,还容易遗漏潜在优化点。这次尝试用InsCode(快马)平台的AI辅助开发功能&am…...

如何随时随地运行任何操作系统?Portable-VirtualBox终极便携虚拟化指南

如何随时随地运行任何操作系统?Portable-VirtualBox终极便携虚拟化指南 【免费下载链接】Portable-VirtualBox Portable-VirtualBox is a free and open source software tool that lets you run any operating system from a usb stick without separate installat…...

Wan2.2-I2V-A14B开源大模型:支持ONNX Runtime跨平台视频生成

Wan2.2-I2V-A14B开源大模型:支持ONNX Runtime跨平台视频生成 1. 模型概述与核心能力 Wan2.2-I2V-A14B是一款开源的文生视频大模型,基于ONNX Runtime实现跨平台部署能力。该模型能够将文本描述直接转化为高质量视频内容,支持多种分辨率和时长…...

手把手教你用昇腾910B部署Qwen3-Reranker-8B,并接入Dify/RAGFlow(附完整代码)

昇腾910B实战:Qwen3-Reranker-8B国产化部署与RAGFlow/Dify集成指南 在国产化AI基础设施加速落地的背景下,华为昇腾NPU正成为替代传统GPU的重要选择。本文将完整演示如何在昇腾910B上部署Qwen3-Reranker-8B重排序模型,并将其无缝集成到Dify和R…...

告别复杂配置!Youtu-VL-4B-Instruct开箱即用,快速搭建视觉语言AI助手

告别复杂配置!Youtu-VL-4B-Instruct开箱即用,快速搭建视觉语言AI助手 1. 为什么选择Youtu-VL-4B-Instruct 在当今多模态AI快速发展的时代,视觉语言模型(VLM)正成为企业智能化转型的重要工具。然而,大多数VLM模型要么需要复杂的部…...

哔哩下载姬downkyi:一站式B站视频解析与处理解决方案

哔哩下载姬downkyi:一站式B站视频解析与处理解决方案 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&#x…...

NPS内网穿透实战:如何为本地站点快速配置HTTPS(含防火墙设置)

NPS内网穿透实战:如何为本地站点快速配置HTTPS(含防火墙设置) 在数字化转型浪潮中,远程访问内网资源的需求日益增长。想象一下这样的场景:你正在开发一个本地Web应用,需要让异地同事实时测试;或…...

ubuntu新手福音:无需配置环境,在快马平台轻松上手openclaw机器人抓取

作为一名刚接触Ubuntu和机器人开发的新手,最近在尝试学习OpenClaw机械臂控制时遇到了不少麻烦。本地环境配置的各种依赖和权限问题让人头疼,直到发现了InsCode(快马)平台,终于找到了零配置的解决方案。这里记录下我的学习过程,希望…...

Pi0 VLA模型快速上手:三视角图像上传+中文指令生成6自由度动作

Pi0 VLA模型快速上手:三视角图像上传中文指令生成6自由度动作 想象一下,你面前有一个机器人,你只需要给它看三张不同角度的照片,然后用中文告诉它“把那个红色的方块拿过来”,它就能自己计算出每个关节该怎么动&#…...

如何用Jasminum插件实现中文文献管理效率翻倍?

如何用Jasminum插件实现中文文献管理效率翻倍? 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 还在为中文文献管理而头…...

SEO_2024年SEO最新趋势与核心策略介绍

2024年SEO最新趋势与核心策略介绍 在数字化时代,搜索引擎优化(SEO)已经成为任何企业在网络上站稳脚跟的关键。2024年,随着互联网技术的不断进步和用户行为的变化,SEO也在不断演变。了解2024年的SEO最新趋势与核心策略…...

15. Doris 系列第15篇:Unique Key 深度精讲|Merge-on-Write(MOW)原理、读写流程、Compaction适配与生产调优全指南

适用人群:数仓开发、Doris运维、实时画像/订单状态更新业务落地、2.0版本升级改造 核心价值:纯干货落地版,含底层结构、全流程拆解、多场景优化、监控告警、常见坑解决方案,直接照搬上线一、Merge-on-Write(MOW)核心概念&#xff…...

百考通:AI全维度覆盖数据分析,让数据价值全流程智能化

在数字化浪潮席卷各行各业的今天,数据已成为核心生产要素,但如何从海量数据中挖掘价值、辅助决策,始终是企业与个人面临的核心难题。传统数据分析流程繁琐、技术门槛高、周期漫长,让许多非专业人士望而却步。百考通(ht…...

如何一键完整导出QQ空间历史说说:GetQzonehistory操作指南

如何一键完整导出QQ空间历史说说:GetQzonehistory操作指南 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否曾想完整保存那些年在QQ空间留下的青春记忆?Get…...

快速原型设计:基于快马平台构建openclaw专业卸载工具的全流程交互demo

今天想和大家分享一个特别实用的开发经验——如何用InsCode(快马)平台快速搭建专业软件卸载工具的原型。最近正好在研究openclaw这款专业软件的卸载流程,发现市面上很多卸载工具都太简单粗暴,于是决定自己动手做个更完善的方案。 原型设计思路 专业软件的…...

PlugY插件:暗黑破坏神2单机模式的终极增强指南

PlugY插件:暗黑破坏神2单机模式的终极增强指南 【免费下载链接】PlugY PlugY, The Survival Kit - Plug-in for Diablo II Lord of Destruction 项目地址: https://gitcode.com/gh_mirrors/pl/PlugY 还在为暗黑破坏神2单机模式的种种限制而烦恼吗&#xff1f…...

BilibiliDown:高效下载B站视频的3步实战指南

BilibiliDown:高效下载B站视频的3步实战指南 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.com/gh_mirrors/bi/Bilibil…...

从Brier Score到Reliability Curve:深度解析概率模型校准的四大核心指标

1. 概率模型校准:为什么我们需要关注预测概率的"诚实度"? 在金融风控、医疗诊断这些关键领域,我们不仅需要模型给出"是或否"的判断,更希望知道这个判断的把握有多大。想象一下,银行拒绝贷款申请时…...

告别下载!File Browser全格式在线预览:PDF/Office文件一键查看指南

告别下载!File Browser全格式在线预览:PDF/Office文件一键查看指南 【免费下载链接】filebrowser 📂 Web File Browser 项目地址: https://gitcode.com/gh_mirrors/fi/filebrowser 还在为查看服务器上的文档反复下载而烦恼吗&#xff…...