当前位置：首页 > news >正文

竞赛项目深度学习的动物识别

news 2026/4/29 23:51:25

文章目录

0 前言
1 背景
2 算法原理
- 2.1 动物识别方法概况
- 2.2 常用的网络模型
- - 2.2.1 B-CNN
  - 2.2.2 SSD
3 SSD动物目标检测流程
4 实现效果
5 部分相关代码
- 5.1 数据预处理
- 5.2 构建卷积神经网络
- 5.3 tensorflow计算图可视化
- 5.4 网络模型训练
- 5.5 对猫狗图像进行2分类
6 最后

0 前言

🔥 优质竞赛项目系列，今天要分享的是

基于深度学习的动物识别算法研究与实现

该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

1 背景

目前，由于计算机能力和相关理论的发展获得了重大突破，基于深度学习的图像检测与识别技术已经广泛应用到人们的生产生活中。学长将深度学习的技术应用到野生动物图像识别中，优化了传统的识别方法，形成对野生动物图像更为准确的识别，为实现高效的野生动物图像识别提供了可能。不同于传统的野生动物识别，基于深度学习的野生动物识别技术可以捕获到野生动物更加细致的信息，有利于对野生动物进行更加准确的识别和研究。因此，对基于深度学习的野生动物识别和研究，可以更好的帮助社会管理者和政府全面有效的对野生动物进行保护和监管，这也正是保护和识别野生动物的关键，同时这对整个自然和社会的和谐发展具有极大的推动作用。

2 算法原理

2.1 动物识别方法概况

基于人工特征的野生动物识别方法主要通过人工对野生动物图像中具有辨识度的特征信息进行提取，并通过特征比对的方式就可以对野生动物所属的类别进行识别判断。

在深度学习技术普及之前，传统的数字图像处理技术与传统机器学习技术一直是研究的热点。传统的数字图像处理技术有模块分割、降低噪声点、边缘检测等方法。传统的机器学习技术有支持向量机、随机森林算法、BP
神经网络算法等。

深度学习技术是通过计算机模拟人类大脑的分层表达结构来建立网络模型，从原始数据集中对相关信息逐层提取。之后通过建立相应的神经网络对数据进行学习和分析，从而提高对目标预测和识别的准确率。如今，深度学习技术已经相对成熟，在对目标进行特征提取方面，卷积神经网络技术逐渐取代了传统的图像处理技术，并且在人类的生产生活中得到了广泛应用，这为研究野生动物更高效的识别方法奠定了基础。

2.2 常用的网络模型

图像识别是指对原始图像进行整体分析来达到预测原始图像所属类别的技术。计算机视觉领域中对图像识别技术进行了优化，与此同时，深度学习技术也对图像识别领域展开了突破。目前在图像识别领域中，研究人员开始使用深度学习的技术，并通过在实际应用中发现，基于深度学习的识别技术比传统的识别技术效果更好，且更具有优势。

2.2.1 B-CNN

双线性卷积神经网络(Bilinear
CNN，B-CNN)[34]是用两个卷积神经网络对图像进行特征提取，然后使用相应的函数将得到所有特征进行组合，组合的数据带入到分类器中进行分类。

在这里插入图片描述

2.2.2 SSD

经典的 SSD 模型是由经典网络和特征提取网络组成。

通过引入性能更好的特征提取网络对 SSD
目标检测模型进行了优化。Fu[49]等人提出了增加卷积神经网络层数和深度的方法用于提高识别准确率。通过实际应用之后，发现该方法识别准确率确实得到了一定程度的提高，但是模型结构却越来越复杂，同时对深层次的网络训练也越来越困难。

在这里插入图片描述

3 SSD动物目标检测流程

在这里插入图片描述

学长首先对 DenseNet-169 网络进行初始化，使用 DenseNet-169 网络作为目标检测的前置网络结构，并运用迁移学习的方法对
DenseNet-169 进行预训练，并将Snapshot Serengeti数据集下的权重值迁移到野生动物检测任务中，使数据集的训练速度得到提升。将
DenseNet-169 作为前置网络置于 SSD 中的目标提取检测网络之前，更换完前置网络的 SSD 目标检测网络依然完整。

4 实现效果

在这里插入图片描述

做一个GUI交互界面

在这里插入图片描述

5 部分相关代码

5.1 数据预处理

import cv2 as cv
import os
import numpy as npimport random
import pickleimport timestart_time = time.time()data_dir = './data'
batch_save_path = './batch_files'# 创建batch文件存储的文件夹
os.makedirs(batch_save_path, exist_ok=True)# 图片统一大小：100 * 100
# 训练集 20000：100个batch文件，每个文件200张图片
# 验证集 5000：一个测试文件，测试时 50张 x 100 批次# 进入图片数据的目录，读取图片信息
all_data_files = os.listdir(os.path.join(data_dir, 'train/'))# print(all_data_files)# 打算数据的顺序
random.shuffle(all_data_files)all_train_files = all_data_files[:20000]
all_test_files = all_data_files[20000:]train_data = []
train_label = []
train_filenames = []test_data = []
test_label = []
test_filenames = []# 训练集
for each in all_train_files:img = cv.imread(os.path.join(data_dir,'train/',each),1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)train_data.append(img_data)if 'cat' in each:train_label.append(0)elif 'dog' in each:train_label.append(1)else:raise Exception('%s is wrong train file'%(each))train_filenames.append(each)# 测试集
for each in all_test_files:img = cv.imread(os.path.join(data_dir,'train/',each), 1)resized_img = cv.resize(img, (100,100))img_data = np.array(resized_img)test_data.append(img_data)if 'cat' in each:test_label.append(0)elif 'dog' in each:test_label.append(1)else:raise Exception('%s is wrong test file'%(each))test_filenames.append(each)print(len(train_data), len(test_data))# 制作100个batch文件
start = 0
end = 200
for num in range(1, 101):batch_data = train_data[start: end]batch_label = train_label[start: end]batch_filenames = train_filenames[start: end]batch_name = 'training batch {} of 15'.format(num)all_data = {'data':batch_data,'label':batch_label,'filenames':batch_filenames,'name':batch_name}with open(os.path.join(batch_save_path, 'train_batch_{}'.format(num)), 'wb') as f:pickle.dump(all_data, f)start += 200end += 200# 制作测试文件
all_test_data = {'data':test_data,'label':test_label,'filenames':test_filenames,'name':'test batch 1 of 1'}with open(os.path.join(batch_save_path, 'test_batch'), 'wb') as f:pickle.dump(all_test_data, f)end_time = time.time()
print('制作结束, 用时{}秒'.format(end_time - start_time))

5.2 构建卷积神经网络

cnn卷积神经网络的编写如下，编写卷积层、池化层和全连接层的代码

conv1_1 = tf.layers.conv2d(x, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_1')
conv1_2 = tf.layers.conv2d(conv1_1, 16, (3, 3), padding='same', activation=tf.nn.relu, name='conv1_2')
pool1 = tf.layers.max_pooling2d(conv1_2, (2, 2), (2, 2), name='pool1')
conv2_1 = tf.layers.conv2d(pool1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_1')
conv2_2 = tf.layers.conv2d(conv2_1, 32, (3, 3), padding='same', activation=tf.nn.relu, name='conv2_2')
pool2 = tf.layers.max_pooling2d(conv2_2, (2, 2), (2, 2), name='pool2')
conv3_1 = tf.layers.conv2d(pool2, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_1')
conv3_2 = tf.layers.conv2d(conv3_1, 64, (3, 3), padding='same', activation=tf.nn.relu, name='conv3_2')
pool3 = tf.layers.max_pooling2d(conv3_2, (2, 2), (2, 2), name='pool3')
conv4_1 = tf.layers.conv2d(pool3, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_1')
conv4_2 = tf.layers.conv2d(conv4_1, 128, (3, 3), padding='same', activation=tf.nn.relu, name='conv4_2')
pool4 = tf.layers.max_pooling2d(conv4_2, (2, 2), (2, 2), name='pool4')flatten = tf.layers.flatten(pool4)
fc1 = tf.layers.dense(flatten, 512, tf.nn.relu)
fc1_dropout = tf.nn.dropout(fc1, keep_prob=keep_prob)
fc2 = tf.layers.dense(fc1, 256, tf.nn.relu)
fc2_dropout = tf.nn.dropout(fc2, keep_prob=keep_prob)
fc3 = tf.layers.dense(fc2, 2, None)

5.3 tensorflow计算图可视化

self.x = tf.placeholder(tf.float32, [None, IMAGE_SIZE, IMAGE_SIZE, 3], 'input_data')
self.y = tf.placeholder(tf.int64, [None], 'output_data')
self.keep_prob = tf.placeholder(tf.float32)# 图片输入网络中
fc = self.conv_net(self.x, self.keep_prob)
self.loss = tf.losses.sparse_softmax_cross_entropy(labels=self.y, logits=fc)
self.y_ = tf.nn.softmax(fc) # 计算每一类的概率
self.predict = tf.argmax(fc, 1)
self.acc = tf.reduce_mean(tf.cast(tf.equal(self.predict, self.y), tf.float32))
self.train_op = tf.train.AdamOptimizer(LEARNING_RATE).minimize(self.loss)
self.saver = tf.train.Saver(max_to_keep=1)

最后的saver是要将训练好的模型保存到本地。

5.4 网络模型训练

然后编写训练部分的代码，训练步骤为1万步

acc_list = []
with tf.Session() as sess:sess.run(tf.global_variables_initializer())for i in range(TRAIN_STEP):train_data, train_label, _ = self.batch_train_data.next_batch(TRAIN_SIZE)eval_ops = [self.loss, self.acc, self.train_op]eval_ops_results = sess.run(eval_ops, feed_dict={self.x:train_data,self.y:train_label,self.keep_prob:0.7})loss_val, train_acc = eval_ops_results[0:2]acc_list.append(train_acc)if (i+1) % 100 == 0:acc_mean = np.mean(acc_list)print('step:{0},loss:{1:.5},acc:{2:.5},acc_mean:{3:.5}'.format(i+1,loss_val,train_acc,acc_mean))if (i+1) % 1000 == 0:test_acc_list = []for j in range(TEST_STEP):test_data, test_label, _ = self.batch_test_data.next_batch(TRAIN_SIZE)acc_val = sess.run([self.acc],feed_dict={self.x:test_data,self.y:test_label,self.keep_prob:1.0})test_acc_list.append(acc_val)print('[Test ] step:{0}, mean_acc:{1:.5}'.format(i+1, np.mean(test_acc_list)))# 保存训练后的模型os.makedirs(SAVE_PATH, exist_ok=True)self.saver.save(sess, SAVE_PATH + 'my_model.ckpt')

训练结果如下：

在这里插入图片描述

5.5 对猫狗图像进行2分类

在这里插入图片描述

6 最后

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

竞赛项目深度学习的动物识别

文章目录 0 前言1 背景2 算法原理2.1 动物识别方法概况2.2 常用的网络模型2.2.1 B-CNN2.2.2 SSD 3 SSD动物目标检测流程4 实现效果5 部分相关代码5.1 数据预处理5.2 构建卷积神经网络5.3 tensorflow计算图可视化5.4 网络模型训练5.5 对猫狗图像进行2分类 6 最后 0 前言 &#…...

编程日记 2023/8/11 13:31:23

MySQL相关的SQL语句、数据库、数据表、字段、类型

文章目录前言MySQL整数类型MySQL字符串类型MySQL小数类型MySQL时间类型常用的基本SQL语句前言 1、SQL语句不区分大小写。 MySQL整数类型序号数据类型数据范围1TINYINT-128~1272SMALLINT-32768~327673MEDIUMINT-223~223-14INT-231~231-15BIGINT-263~263-1 MySQL字符串类型 …...

编程日记 2023/8/11 13:30:22

微信个人小程序申请 (AppID 和 AppSecret)

1. 登录微信公众平台 https://mp.weixin.qq.com/cgi-bin/loginpage?url%2Fcgi-bin%2Fhome%3Ft%3Dhome%2Findex%26lang%3Dzh_CN%26token%3D47421820 2. 右上角立即注册 3. 注册类型选择小程序 4. 账号信息 5. 邮箱激活 6. 小程序发布流程 7. 小程序信息 (前往填写) 8. 获取小程…...

编程日记 2023/8/11 13:29:21

使用zap日志替代xorm日志

xorm提供了自定义日志的接口，它的接口定义如下： // Logger is a logger interface type Logger interface {Debug(v ...interface{})Debugf(format string, v ...interface{})Error(v ...interface{})Errorf(format string, v ...interface{})Info(v ..…...

编程日记 2023/8/11 13:28:19

YOLOv5-7.0实例分割+TensorRT部署

一：介绍将YOLOv5结合分割任务并进行TensorRT部署，是一项既具有挑战性又令人兴奋的任务。分割（Segmentation）任务要求模型不仅能够检测出目标的存在，还要精确地理解目标的边界和轮廓，为每个像素分配相应的…...

编程日记 2023/8/11 13:27:18

回归决策树模拟sin函数

# -*-coding:utf-8-*- import numpy as np from sklearn import tree import matplotlib.pyplot as pltplt.switch_backend("TkAgg") # 创建了一个随机数生成器对象 rng rngnp.random.RandomState(1) print("rng",rng) #5*rng.rand(80,1)生成一个80行、1列…...

编程日记 2023/8/11 13:26:17

NeRF基础代码解析

embedders 对position和view direction做embedding。 class FreqEmbedder(nn.Module):def __init__(self, in_dim3, multi_res10, use_log_bandsTrue, include_inputTrue):super().__init__()self.in_dim in_dimself.num_freqs multi_resself.max_freq_log2 multi_resself…...

编程日记 2023/8/11 13:25:16

职场新星：Java面试干货让你笑傲求职路（三）

职场新星：Java面试干货让你笑傲求职路 1、token 为什么存放在 redis 中？2、索引的底层原理是什么？3、Spring IOC和AOP的原理4、接口和抽象类有什么共同点和区别？5、为什么要使用线程池？直接new个线程不好吗&#xff1f…...

编程日记 2023/8/11 13:24:15

获取指定收获地址的信息

目录 1 /// 获取指定收获地址的信息 2 /// 删除指定的收获地址信息 3 /// 取消订单 4 /// 确认订单收货 /// <summary> /// 获取指定收获地址的信息</...

编程日记 2023/8/11 13:23:14

突破笔试：力扣全排列（medium）

1. 题目链接：46. 全排列 2. 题目描述：给定一个不含重复数字的数组 nums ，返回其所有可能的全排列。你可以按任意顺序返回答案。示例 1： 输入：nums [1,2,3] 输出：[[1,2,3],[1,3,2],[2,1,3],[2,3,1],[…...

编程日记 2023/8/11 13:22:13

gitlab 503 错误的解决方案

首先使用 sudo gitlab-ctl status 命令查看哪些服务没用启动 sudo gitlab-ctl status 再用 gitlab-rake gitlab:check 命令检查 gitlab。根据发生的错误一步一步纠正。 gitlab-rake gitlab:check 查看日志 tail /var/log/gitlab/gitaly/current删除gitaly.pid rm /var/opt…...

编程日记 2023/8/11 13:21:12

智能离子风棒联网监控静电消除器的主要功能和特点

智能离子风棒联网监控静电消除器是一种集成了智能化和网络化监控功能的设备，用于监测和消除静电现象。它的工作原理是通过产生大量的正负离子，将空气中的静电中和和消除，从而达到防止静电积累和放电的目的。智能离子风棒联网监控静电消除器的…...

编程日记 2023/8/11 13:20:11

matplotlib 设置legend的位置在轴最上方，长度与图的长度相同

import matplotlib.pyplot as plt import numpy as npx1 np.linspace(0, 10, 50) x2 [6,4,3]ax plt.subplot() ax.plot(x1, label"test1") ax.plot(x2, label"test2") # 设置图例的位置 # 将左下角放置在【0, 1.02】位置处，横为1&#xff0c…...

编程日记 2023/8/11 13:19:09

Docker-Compose 安装rabbitmq

【编写：docker-compose-rabbitmq.yml】创建数据目录： mkdir -p /opt/rabbitmq/data cd /opt/rabbitmq# 创建 docker-compose-rabbitmq.yml vim docker-compose-rabbitmq.yml 输入： version: "3.1" services:rabbitmq:image: rabbit…...

编程日记 2023/8/11 13:18:08

leetcode357- 2812. 找出最安全路径

这个题比较经典，可以用多个算法来求解，分别给出各个算法的求解方法，主要是分为第一部分的多源BFS求每个位置的距离和第二部分求(0,0)到(n-1,n-1)的最短路径（可以用多种方法求） 目录多源BFS求最短路径枚举安全系数判断…...

编程日记 2023/8/11 13:17:07

Oracle连接数据库提示 ORA-12638:身份证明检索失败

ORA-12638 是一个 Oracle 数据库的错误代码，它表示身份验证（认证）检索失败。这通常与数据库连接相关，可能由于以下几个原因之一引起： 错误的用户名或密码： 提供的数据库用户名或密码不正确，导致…...

编程日记 2023/8/11 13:16:05

在 Linux 中使用 systemd 注册服务

Systemd 是一种现代的 Linux 系统初始化系统和服务管理器。它旨在管理系统服务的初始化、配置和控制。Systemd 的一个关键特性是它可以管理服务，这些服务是为系统提供特定功能的后台进程。在本指南中，我们将探讨如何使用 systemd 在 Linux 中注册服务。 …...

编程日记 2023/8/11 13:15:04

（03）Unity HTC VRTK 基于 URP 开发记录

1.简介本篇主要内容为：URP如何与VRTK结合、URP需要注意的地方、VRTK的功能进行阐述。因项目本身要求要渲染出比较好的画质，所以抛弃了Unity默认渲染管线Built-in，使用URP进行渲染，当然也可以选HDRP，但考虑到后期项目…...

编程日记 2023/8/11 13:14:03

.bit域名调研

.bit域名研究问题： .bit域名和ENS域名的相同点？不同点？有什么关系？ .bit的定义 .bit 是基于区块链的，开源的，跨链去中心化账户系统.bit 提供了以 .bit 为后缀的全局唯一的命名体系，可用于加密…...

编程日记 2023/8/11 13:13:01

Vue数组变更方法和替换方法

一、可以引起UI界面变化 Vue 将被侦听的数组的变更方法进行了包裹，所以它们也将会触发视图更新。这些被包裹过的方法包括： push()pop()shift()unshift()splice()sort()reverse() 以上七个数组都会改变原数组，下面来分别讲解它们的区别&…...

编程日记 2023/8/11 13:12:00

别再死记硬背公式了！用Python+SymPy手把手推导状态空间平均法（以Buck电路为例）

用PythonSymPy自动化推导Buck电路的状态空间平均模型电力电子工程师们对状态空间平均法一定不陌生——这个在《Fundamentals of Power Electronics》中被详细阐述的方法，是分析PWM变换器小信号特性的标准工具。但当你真正尝试手工推导一个Buck电路的状态空间模型时…...

编程新知 2026/4/29 23:05:37

流处理引擎：事件时间与处理时间窗口的语义区别

流处理引擎：事件时间与处理时间窗口的语义区别在实时数据处理领域，流处理引擎的核心挑战之一是如何准确处理时间维度。事件时间（Event Time）与处理时间（Processing Time）是两种关键的时间语义&#xff0c…...

编程新知 2026/4/29 21:27:30

GoCaptcha 革命性行为验证码：4种交互方式一站式解决网站安全难题

GoCaptcha 革命性行为验证码：4种交互方式一站式解决网站安全难题【免费下载链接】go-captcha 🖖 GoCaptcha: A high-performance, interactive behavior captcha library for Go. Supporting click, slide, drag-drop, and rotation modes to secure yo…...

编程新知 2026/4/29 21:11:25

企业级LLM评测框架架构设计：DeepEval的5大核心优势与实战部署方案

企业级LLM评测框架架构设计：DeepEval的5大核心优势与实战部署方案【免费下载链接】deepeval The LLM Evaluation Framework 项目地址: https://gitcode.com/GitHub_Trending/de/deepeval 在当今AI应用快速发展的时代，大语言模型的质量评估已成为…...

编程新知 2026/4/29 16:37:54

吃透 Wireshark！全网超详细抓包 + 协议分析实战指南，小白也能快速上手

各位网络安全的小伙伴们，还在对着枯燥的课本和晦涩的官方文档头疼吗？今天，就让我这位在网络安全圈摸爬滚打多年的老司机，带你玩转Wireshark，保证你看完这篇，抓包分析技能直接起飞！ Wireshark&a…...

编程新知 2026/4/29 16:03:51

从一道网鼎杯CTF题‘singal‘，聊聊如何用Python快速构建自定义VM调试器

从网鼎杯CTF题singal实战：Python构建VM调试器的艺术在逆向工程领域，虚拟机（VM）保护机制一直是令人又爱又恨的存在。去年网鼎杯青龙组的这道singal题目，用456字节的opcode数组构建了一个精巧的虚拟机环境。当我第一次看…...

编程新知 2026/4/29 15:15:55

告别命令行恐惧：用ENV工具和menuconfig图形化配置你的第一个RT-Thread工程

告别命令行恐惧：用ENV工具和menuconfig图形化配置你的第一个RT-Thread工程嵌入式开发的世界常常被命令行界面所主导，这让许多刚接触RT-Thread的开发者望而生畏。当面对满屏闪烁的光标和晦涩难记的命令时，那种无从下手的挫败感会迅速消磨初学…...

编程新知 2026/4/29 14:42:31

避坑指南：Allwinner固件打包那些事儿——update_boot0、dragonsecboot等工具的参数陷阱与正确用法

Allwinner固件打包实战：关键工具参数解析与避坑手册当你在深夜的办公室里盯着屏幕上的启动失败日志，第17次尝试打包Allwinner平台的固件时，是否曾怀疑过那些看似简单的打包工具背后藏着什么玄机？本文将带你深入那些官方文档里不…...

编程新知 2026/4/29 14:28:53

从美颜到元宇宙：3D Morphable Model如何悄悄改变你的数字生活？

从美颜到元宇宙：3D Morphable Model如何悄悄改变你的数字生活？ 当你打开手机里的美颜App，滑动捏脸参数时，是否想过屏幕背后是一套怎样的技术在支撑？当你在电商平台试戴虚拟眼镜，或在游戏中创建专属虚拟形象…...

编程新知 2026/4/29 13:37:23

破解工业数据孤岛：DB-GPT与OPC UA的智能融合方案

破解工业数据孤岛：DB-GPT与OPC UA的智能融合方案【免费下载链接】DB-GPT open-source agentic AI data assistant for the next generation of AI Data products. 项目地址: https://gitcode.com/GitHub_Trending/db/DB-GPT 在工业4.0时代，数据…...

编程新知 2026/4/29 11:47:48

文章目录

0 前言

1 背景

2 算法原理

2.1 动物识别方法概况

2.2 常用的网络模型

2.2.1 B-CNN

2.2.2 SSD

3 SSD动物目标检测流程

4 实现效果

5 部分相关代码

5.1 数据预处理

5.2 构建卷积神经网络

5.3 tensorflow计算图可视化

5.4 网络模型训练

5.5 对猫狗图像进行2分类

6 最后

相关文章：