当前位置：首页 > news >正文

当JS遇上NLP：开启图片分析的奇幻之旅

news 2026/2/9 0:57:34

前言

在当今科技飞速发展的时代，JavaScript（JS）作为广泛应用的编程语言，展现出了强大的活力与无限的可能性。与此同时，自然语言处理（NLP）领域也正在经历着深刻的变革与进步。

当这两者碰撞在一起时，一个全新的领域就此打开——图片分析。

实现

效果展示

通过点击上传图片按钮上传图片后，通过AI帮助我们对图像进行识别

实现过程

页面

<main class="container"><label for="file-upload" class="custom-file-upload"><!-- <input type="file" id="file-upload" accept="image/*"> --><input type="file" accept="image/*" id="file-upload">上传图片</label><div id="image-container"></div><p id="status"></p></main>

<main class="container">: 这是一个 <main> 元素,表示页面的主要内容区域
<label for="file-upload" class="custom-file-upload">: 这是一个 <label> 元素,它与 file-upload 输入框关联
<input type="file" accept="image/*" id="file-upload">: 这是一个 <input> 元素,类型为 file。accept="image/*" 属性表示只允许上传图片文件。id="file-upload" 属性用于与 <label> 元素关联
<div id="image-container"></div>: 这是一个空的 <div> 元素,其 id 为 image-container。用于显示上传的图片预览

js代码

// transformers库导入pipeline模块 npl 任务 
import { pipeline, env } from "https://cdn.jsdelivr.net/npm/@xenova/transformers@2.6.0"

首先从导入transformers库导入pipeline模块和env

transformers 是一个由 Hugging Face 开发的开源 Python 库,用于快速开发和部署最先进的自然语言处理(NLP)模型，为 NLP 开发者提供了一个强大、灵活和易用的工具集。无论是进行基础的文本分类还是构建复杂的对话系统,transformers 都可以成为开发者的首选。

// 设置当前的环境对象 不要加载本地模型，使用远程加载 transformers库
env.allowLocalModels = false;

设置当前的环境对象不要加载本地模型，使用远程加载 transformers库

        // 通过id获取input元素const fileUpload = document.getElementById('file-upload');const imageContainer = document.getElementById('image-container')// 文件输入框元素添加监听器 事件名称change 指定触发事件执行的函数fileUpload.addEventListener('change', function (e) {// 获取目标事件看看效果 只要获取的第第一张图片（只上传一张图片）// console.log(e.target.files[0]);const file = e.target.files[0];// 新建一个FileReader 对象， 文件的本质是 01 序列 // 图片比较大 const reader = new FileReader();reader.onload = function (e2) {// 读完了， 加载完成const image = document.createElement('img'); // 图片对象console.log(e2.target.result);image.src = e2.target.result;//添加图片src获取图片展示到div中imageContainer.appendChild(image)// 启动ai任务  功能模块化，封装出去detect(image)}reader.readAsDataURL(file)})

获取 HTML 元素:
- const fileUpload = document.getElementById('file-upload');: 通过 ID 获取文件上传的 input 元素。
- const imageContainer = document.getElementById('image-container');: 通过 ID 获取用于显示图片的容器 div。
添加事件监听器:
- fileUpload.addEventListener('change', function (e) { ... });: 给文件上传 input 添加 ‘change’ 事件监听器,当用户选择文件时触发。
处理上传文件:
- const file = e.target.files[0];:获取用户选择的第一个文件。
- const reader = new FileReader();: 创建一个 FileReader 对象,用于读取文件内容。
- reader.onload = function (e2) { ... };: 当文件读取完成时,触发 ‘onload’ 回调函数。
- const image = document.createElement('img');: 创建一个新的 img 元素用于显示图片。
- image.src = e2.target.result;: 将读取到的文件内容设置为 img 元素的 src 属性,显示图片。
- imageContainer.appendChild(image);: 将 img 元素添加到图片容器 div 中,完成图片预览。
触发 AI 检测:
- detect(image);: 在图片加载完成后,调用一个名为 detect 的函数来执行 AI 检测任务。这个函数没有在代码中定义,需要在其他地方实现。

其中将detect单独模块化，体现了封装的思想

const status = document.getElementById('status');// 通过pipeline启动一个检测图片的AI任务并选择合适的模型const detect = async (image) => {status.textContent = "分析中...";const detector = await pipeline("object-detection","Xenova/detr-resnet-50") // 适合对象检测的模型 model 实例化了detector对象const output = await detector(image.src, {threshold: 0.1,percentage: true})// console.log(output);output.forEach(rendesrBox)}

上述代码

const detector = await pipeline("object-detection", "Xenova/detr-resnet-50");: 使用 Hugging Face 的 pipeline 函数加载预训练的对象检测模型。这里选择了 “Xenova/detr-resnet-50” 模型,它适用于对象检测任务。
const output = await detector(image.src, { threshold: 0.1, percentage: true });: 使用加载的对象检测模型对图像进行分析,返回检测结果。这里设置了置信度阈值为 0.1,并将结果以百分比的形式返回。
output.forEach(renderBox);: 遍历检测结果,对每个检测到的对象调用一个名为 renderBox 的函数进行渲染。

function renderBox({ box, label }) {console.log(box, label);const { xmax, xmin, ymax, ymin } = boxconst boxElement = document.createElement("div");boxElement.className = "bounding-box"Object.assign(boxElement.style, {borderColor: '#123123',borderWidth: '1px',borderStyle: 'solid',left: 100 * xmin + '%',top: 100 * ymin + '%',width: 100 * (xmax - xmin) + "%",height: 100 * (ymax - ymin) + "%"})const labelElement = document.createElement('span');labelElement.textContent = label;labelElement.className = "bounding-box-label"labelElement.style.backgroundColor = '#000000'boxElement.appendChild(labelElement);imageContainer.appendChild(boxElement);}

对于每个检测到的对象,都会在图像容器中渲染一个带有标签的边界框,以可视化地显示检测结果

完整js代码

<script type="module">// transformers库导入pipeline模块 npl 任务 import { pipeline, env } from "https://cdn.jsdelivr.net/npm/@xenova/transformers@2.6.0"// 设置当前的环境对象 不要加载本地模型，使用远程加载 transformers库env.allowLocalModels = false;// 通过id获取input元素const fileUpload = document.getElementById('file-upload');const imageContainer = document.getElementById('image-container')// 文件输入框元素添加监听器 事件名称change 指定触发事件执行的函数fileUpload.addEventListener('change', function (e) {// 获取目标事件看看效果 只要获取的第第一张图片（只上传一张图片）// console.log(e.target.files[0]);const file = e.target.files[0];// 新建一个FileReader 对象， 文件的本质是 01 序列 // 图片比较大 const reader = new FileReader();reader.onload = function (e2) {// 读完了， 加载完成const image = document.createElement('img'); // 图片对象console.log(e2.target.result);image.src = e2.target.result;//添加图片src获取图片展示到div中imageContainer.appendChild(image)// 启动ai任务  功能模块化，封装出去detect(image)}reader.readAsDataURL(file)})const status = document.getElementById('status');// 通过pipeline启动一个检测图片的AI任务并选择合适的模型const detect = async (image) => {status.textContent = "分析中...";const detector = await pipeline("object-detection","Xenova/detr-resnet-50") // 适合对象检测的模型 model 实例化了detector对象const output = await detector(image.src, {threshold: 0.1,percentage: true})// console.log(output);output.forEach(rendesrBox)}function renderBox({ box, label }) {console.log(box, label);const { xmax, xmin, ymax, ymin } = boxconst boxElement = document.createElement("div");boxElement.className = "bounding-box"Object.assign(boxElement.style, {borderColor: '#123123',borderWidth: '1px',borderStyle: 'solid',left: 100 * xmin + '%',top: 100 * ymin + '%',width: 100 * (xmax - xmin) + "%",height: 100 * (ymax - ymin) + "%"})const labelElement = document.createElement('span');labelElement.textContent = label;labelElement.className = "bounding-box-label"labelElement.style.backgroundColor = '#000000'boxElement.appendChild(labelElement);imageContainer.appendChild(boxElement);}</script>

总结

AI 技术的发展带来了很多新的可能性，前端技术结合AI将有更广阔的未来

当JS遇上NLP：开启图片分析的奇幻之旅

前言在当今科技飞速发展的时代，JavaScript（JS）作为广泛应用的编程语言，展现出了强大的活力与无限的可能性。与此同时，自然语言处理（NLP）领域也正在经历着深刻的变革与进步。当这两者碰撞在一…...

编程日记 2024/6/14 16:45:40

trpc快速上手

tRPC (Type-safe Remote Procedure Call) 是一个用于构建类型安全的 API 的框架，它能够在前端和后端之间共享类型，确保类型安全性。这对于使用 TypeScript 的项目特别有用，因为它消除了前后端类型不一致的问题，提高了开发效率和代…...

编程日记 2024/6/14 16:44:38

知识图谱存在的挑战---隐私、安全和伦理相关和测试认证相关

文章目录隐私、安全和伦理相关测试认证相关隐私、安全和伦理相关从部署拓扑结构而言，知识图谱技术以数据为核心、数据库为载体的方式来存储，有单机、云平台、集群及其组合的部署方式，结合大数据平台、云平台、业务系统、灾备、网络系统及其…...

编程日记 2024/6/14 16:42:35

课时155：脚本发布_简单脚本_命令罗列

2.1.1 命令罗列学习目标这一节，我们从基础知识、简单实践、小结三个方面来学习基础知识简介目的：实现代码仓库主机上的操作命令功能即可简单实践实践查看脚本内容 #!/bin/bash # 功能：打包代码 # 版本: v0.1 # 作者: 书记 # …...

编程日记 2024/6/14 16:40:33

借助ollama实现AI绘画提示词自由，操作简单只需一个节点！

只需要将ollama部署到本地，借助comfyui ollama节点即可给你的Ai绘画提示词插上想象的翅膀。具体看详细步骤！ 第一步打开ollama官网：https://ollama.com/，并选择models显存太小选择的是llama3\8b参数的instruct-q6_k的这个模型。运…...

编程日记 2024/6/14 16:39:32

PyTorch -- Visdom 快速实践

安装：pip install visdom 注：如果安装后启动报错可能是 visdom 版本选择问题启动：python -m visdom.server 之后打开出现的链接 http://localhost:8097Checking for scripts. Its Alive! INFO:root:Application Started INFO:root:Working…...

编程日记 2024/6/14 16:38:30

基于xilinx FPGA的QSFP调试使用经验

1 概述本文用于记录QSFP在调试使用时遇到的一些经验教训，防止后来者踩相同的坑。参考手册： 《AMQ28-SR4-M1_V1.0》《QSFP-DD-Hardware-rev4p0-9-12-18-clean》 2 QSFP简介 QSFP（Quad Small Form-facor Pluggable）即四通道SFP…...

编程日记 2024/6/14 16:37:29

WPF 使用Image控件显示图片

Source属性 Source属性用来告诉Image组件要展示哪张图片资源的一个入口，通常是图片的路径。也许是本地路径，也许是网络路径。本地图片路径加载方式使用相对路径，相对于工程目录的路径，当设置Width属性时，图片会等…...

编程日记 2024/6/14 16:35:27

合肥工业大学内容安全实验一：爬虫|爬新闻文本

✅作者简介：CSDN内容合伙人、信息安全专业在校大学生🏆 🔥系列专栏：合肥工业大学实验课设 📃新人博主：欢迎点赞收藏关注，会回访！ 💬舞台再大，你不上台，永远是个观众。平台再好，你不参与，永远是局外人。能力再大，你不行动，只能看别人成功！没有人会关心你付…...

编程日记 2024/6/14 16:33:25

自动驾驶---Perception之视觉点云雷达点云

1 前言在自动驾驶领域，点云技术的发展历程可以追溯到自动驾驶技术的早期阶段，特别是在环境感知和地图构建方面。在自动驾驶技术的早期技术研究中，视觉点云和和雷达点云都有出现。20世纪60年代，美国MIT的Roberts从2D图像中提取3D…...

编程日记 2024/6/14 16:32:24

maven 显式依赖包包含隐式依赖包，引起依赖包冲突

问题：FlinkCDC 3.0.1 代码 maven依赖包冲突什么是依赖冲突依赖冲突是指项目依赖的某一个jar包，有多个不同的版本，因而造成类包版本冲突依赖冲突的原因依赖冲突很经常是类包之间的间接依赖引起的。每个显式声明的类包都会依赖于一些其它…...

编程日记 2024/6/14 16:30:22

Spring应用如何打印access日志和out日志（用于分析请求总共在服务耗费多长时间）

我们经常会被问到这样一个问题。你接口返回的好慢呀，能不能提升一下接口响应时间啊？这个时候我们就需要去分析，为什么慢，慢在哪。而这首先应该做的就是确定接口返回时间过长确实是在服务内消耗的时间。而不是我们将请求发给网关或…...

编程日记 2024/6/14 16:29:21

SpringBoot整合SpringDataRedis

目录 1.导入Maven坐标 2.配置相关的数据源 3.编写配置类 4.通过RedisTemplate对象操作Redis SpringBoot整合Redis有很多种，这里使用的是Spring Data Redis。接下来就springboot整合springDataRedis步骤做一个详细介绍。 1.导入Maven坐标首先，需要导…...

编程日记 2024/6/14 16:28:19

电脑怎么录制游戏视频？轻松捕捉每一帧精彩

随着游戏产业的蓬勃发展，越来越多的玩家不仅满足于在游戏世界中的探索与冒险，更希望将自己的游戏精彩瞬间记录下来，分享给更多的朋友。可是电脑怎么录制游戏视频呢？本文旨在为广大游戏爱好者提供一份详细的电脑游戏视频录制攻略&a…...

编程日记 2024/6/14 16:27:18

【Elasticsearch】索引快照并还原到其他集群

【Elasticsearch】索引快照并还原到其他集群前提：es节点的所有用户id和组id都需要相同，最好在新建集群时指定用户id和组id，否则挂载后执行curl时会提示权限报错。解决方法（gpt生成），不敢在生产尝试。点…...

编程日记 2024/6/14 16:26:16

QT--DAY1

不使用图形化界面实现一个登陆界面 #include "widget.h"Widget::Widget(QWidget *parent): QWidget(parent) {//设置窗口标题this->setWindowTitle("登录界面");//设置窗口大小this->resize(535,410);//固定窗口大小this->setFixedSize(535,410)…...

编程日记 2024/6/14 16:21:12

DSP教学实验箱_数字图像处理_操作教程：5-1 图像旋转

一、实验目的学习图像旋转的原理，掌握图像的读取方法，并实现图像旋转。二、实验原理图像旋转图像的旋转是指以图像的某一点为原点以逆时针或顺时针旋转一定的角度。其本质是以图像的中心为原点，将图像上的所有像素都旋转一个相同的角…...

编程日记 2024/6/14 16:16:06

MyBatis总结（2）- MyBatis实现原理（三）

核心配置 JavaBeanMapper.xml（sql映射） 作用 JavaBeanMapper.xml实现： 用来干什么？ 定义Sql语句映射。相对照JDBC的实现，是将原本的Sql代码提取出来，最终根据映射关系执行Sql操作。好处？ 解…...

编程日记 2024/6/14 16:15:04

【保姆级教程】Linux 基于 Docker 部署 MySQL 和 Nacos 并配置两者连接

一、Linux 部署 Docker 1.1 卸载旧版本（如有） sudo yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine1.2 安装 yum-utils 包 sudo yum install -y…...

编程日记 2024/6/14 16:14:03

Dev C++ 安装及使用方法教程-干活多超详细

Dev C 是一款非常好用，简约的C/C开发工具。可以减少很多创建工程的繁琐步骤，很快的进行开发。对于只用于来写代码的人来说，是比较轻量以及极速的。 Dev C 是一个windows下的c和c程序的集成开发环境。它使用mingw32/gcc编译器，遵循…...

编程日记 2024/6/14 16:13:02

golang循环变量捕获问题

在 Go 语言中，当在循环中启动协程（goroutine）时，如果在协程闭包中直接引用循环变量，可能会遇到一个常见的陷阱 - 循环变量捕获问题。让我详细解释一下： 问题背景看这个代码片段： fo…...

编程新知 2026/1/21 14:29:57

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

一.自适应梯度算法Adagrad概述 Adagrad（Adaptive Gradient Algorithm）是一种自适应学习率的优化算法，由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率，适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...

编程新知 2026/2/8 14:57:14

postgresql|数据库|只读用户的创建和删除（备忘）

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

编程新知 2025/9/18 19:34:22

在Ubuntu中设置开机自动运行（sudo）指令的指南

在Ubuntu系统中，有时需要在系统启动时自动执行某些命令，特别是需要 sudo权限的指令。为了实现这一功能，可以使用多种方法，包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法，并提供…...

编程新知 2025/12/23 11:20:24

CocosCreator 之 JavaScript/TypeScript和Java的相互交互

引擎版本： 3.8.1 语言： JavaScript/TypeScript、C、Java 环境：Window 参考：Java原生反射机制您好，我是鹤九日！ 回顾在上篇文章中：CocosCreator Android项目接入UnityAds 广告SDK。我们简单讲…...

编程新知 2026/1/30 12:10:19

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系坐标体系-介绍坐标原点位于左上角，以像素为单位。在Java坐标系中,第一个是x坐标,表示当前位置为水平方向，距离坐标原点x个像素;第二个是y坐标，表示当前位置为垂直方向，距离坐标原点y个像素。坐标体系-像素 …...

编程新知 2025/12/19 20:46:15

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2026/1/31 22:59:12

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念线程安全（Thread Safety） 线程安全是指在多线程环境下，某个函数、类或代码片段能够被多个线程同时调用时，仍能保证数据的一致性和逻辑的正确性&#xf…...

编程新知 2025/12/2 3:35:50

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景随着大语言模型（LLM）的广泛应用，开发者常面临多个挑战：各大模型（OpenAI、Claude、Gemini、Ollama）接口风格不统一；缺乏一个统一平台进行模型调用与测试；本地模型 Ollama 的集成与前…...

编程新知 2026/1/25 3:31:07

Java线上CPU飙高问题排查全指南

一、引言在Java应用的线上运行环境中，CPU飙高是一个常见且棘手的性能问题。当系统出现CPU飙高时，通常会导致应用响应缓慢，甚至服务不可用，严重影响用户体验和业务运行。因此，掌握一套科学有效的CPU飙高问题排查方法&…...

编程新知 2025/11/2 5:30:15

前言

实现

效果展示

实现过程

总结

相关文章：