dagongji10-CSDN博客

dagongji10

码龄9年

137,259

总访问量
37

原创
77

粉丝
3

关注

IP 属地：湖北省

加入CSDN时间： 2017-11-15

查看详细资料

个人成就

获得176次点赞
内容获得56次评论
获得729次收藏
代码片获得753次分享
博客总排名709,641名

TA的专栏

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

兴趣领域设置

人工智能

opencv迁移学习

创作活动更多

「谁说嵌入式只是调包和焊板子？」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”？2026嵌入式全栈技术征锋令正式启幕！本次活动专为硬核硬件/软件开发者打造，无论你是刚玩转裸机外设的萌新，还是精通RTOS调度、死磕底层驱动的行业老手，亦或是执掌系统架构的大神，这里都是你证明实力的舞台！拒绝表面功夫，每一行代码，都有撬动硬件的力量！晒出你的硬核工程实战，为嵌入式开发者的全栈硬实力正名！

213人参与去参加

更多

BERT学习笔记

与之前模型的区别：GPT考虑的是一个单向预测，用左边的词预测右边的词；但BERT则是同时利用左边和右边的词，来预测中间的词ELMO用的BiLSTM，但是它使用的是RNN结构，在应用到下游任务时它需要对模型结构做调整；但BERT使用的是transformer，在下游任务中只需要改上层的一小部分就可以了基本效果：11个任务上取得更高的精度GLUE提升7.7%，至80.5%；MultiL1提升4.6%，至86.7%；SQuAD v1.1提升1.5，至93.2；SQuAD v2提升5.1，至83.1。

博文更新于 2024.02.23 ·

C++学习笔记

C++基础知识学习笔记

博文更新于 2022.10.31 ·

分类任务之LeNet-5、AlexNet、VGG、ResNet、GoogLeNet

1、LeNet-5手写体数字识别模型，是一个广为人知的商用的卷积神经网络，当年美国大多数银行用它来识别支票上面的手写数字。Lenet-5 原始结构如下图所示，包括：卷积层，降采样，卷积层，降采样，卷积层（实现全连接），全连接层，高斯连接层（进行分类）。在后期发展中，降采样层被 max_poolingmax\_poolingmax_pooling 所取代，分类也被 softmaxsoftm......

博文更新于 2022.06.30 ·

Pandas基本API集锦

一、pandas 简介pandas 是基于 numpy 的一种工具，该工具是为了解决数据分析任务而创建的。它有两种常见的数据类型：Series，DataFrame。Series 是 pandas 中最基本的对象，类似一维数组，可以自定义标签（也就是索引），通过索引可以访问数组中的数据。DataFrame 是一个二维表结构，能够存储多种不同类型的数据，并且每一个坐标轴都有自己的标签，可以把它当作一个 Series 的字典项。二、Series 对象1、Series 的创建# 通过列表创建，此时会默认从

博文更新于 2022.05.31 ·

Transformer 学习笔记

1 为什么要用 Transformer ？（创新点）1.1 问题来源最开始机器翻译使用的 seq2seq 所存在的问题：encoder 和 decoder 之间的上下文向量长度固定，但输入文本的长度是不固定的，长度不对称固定长度的上下文向量无法对长语句做有效编码，会遇到信息瓶颈，产生信息丢失的情况为了解决上述问题，基于 attention 的 seq2seq 随即被提出（这个 attention 跟 transformer 中的 self-attention 是不一样的），它能很好地利用权

博文更新于 2022.05.18 ·

test_cpn.py

发布资源 2020.09.01 ·

三、OpenCV-python 之图像处理（Ⅰ）——空间转换/阈值/形态学/滤波/边缘检测/图像金字塔

1、空间转换OpenCV的图像颜色空间很多，常见的有BGR、HSV等。cv.cvtColor(input_image, flag) # 空间转换函数，flag参数多达150多种，常用的cv.COLOR_BGR2GRAY、cv.COLOR_BGR2HSV（1）HSV空间中，色调范围Hue range【0,179】，饱和度Saturation range【0,255】，颜色明亮程度Valu...

博文更新于 2021.08.19 ·

matplotlib基本绘图API集锦

一、基本使用流程import matplotlib.pyplot as plt # 导入模块# 画布设置plt.figure(figsize=(12,9)) # 设置图像尺寸大小，参数值乘以100表示分辨率plt.subplot(m,n,j) # 多个图排列plt.figure().tight_layout() # 多个图排列时自动设置间距，消除重叠# 画图plt.plot(x, y)# 图形设置plt.xlabel( 'heigh

博文更新于 2021.08.09 ·

OpenCV 截取任意形状的ROI

规则矩形的ROI提取可以使用 numpy 的数据切片操作，但是真实场景的ROI形状并不规则，可能伴随着旋转角度、多点折线等特征。这里介绍利用 OpenCV 截取任意形状ROI的基本思路。会使用到的几个比较重要的方法有：直线拟合：cv.fitLine旋转矩阵：cv.getRotationMatrix2D仿射变换：cv.warpAffine轮廓绘制：cv.drawContours图像融合：cv.add外接框拟合：cv.minAreaRect一、基本思路这里针对的是一般的 BGR 图像，ROI

博文更新于 2021.07.23 ·

bbox 四个顶点排序

1、问题已知矩形框（或者任意形状框，但必须是凸包）的四个顶点坐标，将其按照 “左上→右上→右下→左下” 的顺序排序。2、思路一般性的解决方案：先计算矩形框对角线的交点坐标 (Cx,Cy)(C_x, C_y)(Cx,Cy)，则：x<Cx,y<Cyx<C_x, y<C_yx<Cx,y<Cy 的是左上，x>Cx,y<Cyx>C_x, y<C_yx>Cx,y<Cy 的是右上，x>Cx,y>Cyx>C_x, y

博文更新于 2021.07.23 ·

ECO-pytorch的模型结构、测试脚本

发布资源 2019.12.25 ·

六、OpenCV-python 之图像处理（Ⅳ）——模板匹配/分水岭/GrabCut

一、模板匹配1、单目标单目标模板匹配的原理：模板图像在输入图像上做滑动操作（类似于 2D 卷积），模板图像与所在原图 patch 做比较，最终返回一个灰度图，每个像素代表该像素的邻域与模板的相似度。当输入图像尺寸为 (W,H)(W, H)(W,H)、模板图像尺寸为 (w,h)(w,h)(w,h) 时，输出图像尺寸为 (W−w+1,H−h+1)(W-w+1, H-h+1)(W−w+1,H−h+1)。一旦得到结果，就可以使用cv.minMaxLoc() 函数来查找最大值/最小值的位置，取它为矩形的左上角，

博文更新于 2020.11.30 ·

四、OpenCV-python 之图像处理（Ⅱ）——轮廓/直方图

1、等高线contourOpenCV中的 contour 计算需要先将图像二值化处理，在二值图中从黑色背景上找到白色前景对象（一个个的闭环区域），该方法可用在在形状分析、目标检测与识别中。# 在二值图上计算 contourcontours, hierarchy = cv.findContours(image, mode, method, offset)# 将 contour 画在图像上c...

博文更新于 2020.11.26 ·

CASIA-HWDB2.x 数据集DGRL文件解析（python）

CASIA-HWDB 数据集是最常见的手写汉字识别数据集，它包含脱机、联机两部分，分单字、文本行两种类型：HWDB1.x：脱机单字，1.0~1.2 三个版本，数据格式为 .gntOLHWDB1.x：联机单字，1.0~1.2 三个版本，HWDB2.x：脱机文本行，1.0~1.2 三个版本，数据格式为 .dgrlOLHWDB1.x：联机文本行，1.0~1.2 三个版本，一般常用的汉字识别多为脱机单字识别，该部分数据格式为 .gnt，网络上针对这种数据的解析文章也很多，这里主要介绍文本行识别数据集，

博文更新于 2020.11.23 ·

五、OpenCV-python 之图像处理（Ⅲ）——傅里叶变换

一、傅里叶变换是啥？1、数学定义若 f(x)f(x)f(x) 为非周期函数，在 xxx 的整个周期内满足狄里赫利条件，则 f(x)f(x)f(x) 可以用叠加积分表示：f(x)=∫−∞∞F(u)ej2πuxduf(x)=\intop_{-\infty}^{\infty}F(u)e^{j2\pi ux}duf(x)=−∞∫∞F(u)ej2πuxdu2、实质从定义可以看到，一个复杂的函数可以表示为很多个简单函数的和（积分就是求和），把它放到信号处理场景中就是：傅里叶变换可以将一个信号分离为无穷多

博文更新于 2020.11.22 ·

ABCNet 论文阅读笔记

一、论文《ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network》二、代码[ABCNet]：初始代码位置[AdelaiDet]：最新代码位置，初始代码不再更新三、创新点之前的文本识别基本分两种类型：基于字符，基于分割。这些方法要么需要花费大量的精力去做字符级的数据标注，要么就是检测与识别分开，需要维护一个复杂的 pipeline。ABCNet 从数据标注、模型规模、推理速度等方面做出优化，主要的贡献有三点：

博文更新于 2020.11.11 ·

一、OpenCV-python 之图像/视频/绘图

1、图像部分图像读取cv.imread(filepath, model)filepath：图片路径model：cv.IMREAD_COLOR读取3通道BGR图像，默认参数 cv.IMREAD_GRAYSCALE 读取灰度图 cv.IMREAD_UNCHANGED 读取4通道rgba图像注意：（1）读取是根据内容，而不是根据文件名...

博文更新于 2020.11.03 ·

OpenCV 常用检测算法

一、直线检测1、直线检测cv.HoughLines：使用标准霍夫变换，找到二值图像中的直线lines = cv.HoughLines( image, # 8-bit、单通道的二值图像 rho, # 累加器的距离分辨率，以像素为单位 theta, # 累加器的角度分辨率，以弧度为单位 threshold, # 累加器的阈值参数，太大会过滤大部分直线，太小则误检测会很多 lines, # srn, # 对于多尺度霍夫变换，

博文更新于 2020.10.16 ·

Video Understanding（3）——Spatio-Temporal Action Localization时空动作定位

《Action Tubelet Detector for Spatio-Temporal Action Localization》，2017，[caffe]《Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos 》，2017，[caffe]

博文更新于 2020.06.24 ·

Video Understanding（1）——Action Recognition动作识别

1.推荐阅读动作识别综述动作识别开源集锦2.何为 Action Recognition这里讨论的动作识别针对的是视频帧，也就是说：对每一帧图像进行动作的分类，然后总结出该序列帧属于哪一类动作。事实上，图像分类已经取得了比较喜人的成绩，但是对于视频分类（video classification）、表征学习（representation learning）来说，深度学习的进展还显得比较缓慢。...

博文更新于 2020.06.16 ·