dagongji10
码龄9年
求更新 关注
提问 私信
  • 博客:137,259
    137,259
    总访问量
  • 37
    原创
  • 77
    粉丝
  • 3
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖北省
加入CSDN时间: 2017-11-15
博客简介:

DaGongJiGuoMaLu09的博客

查看详细资料
个人成就
  • 获得176次点赞
  • 内容获得56次评论
  • 获得729次收藏
  • 代码片获得753次分享
  • 博客总排名709,641名
创作历程
  • 1篇
    2024年
  • 1篇
    2022年
  • 2篇
    2021年
  • 12篇
    2020年
  • 19篇
    2019年
  • 2篇
    2018年
成就勋章
TA的专栏
  • 文本检测与识别
    1篇
  • 图像分类
    1篇
  • C++
    1篇
  • NLP
    2篇
  • 目标检测
    1篇
  • 人体姿态估计
    1篇
  • 语义分割
  • Video Understanding
    3篇
  • OpenCV-Python
    6篇
  • Android开发
    1篇
  • 随手记
    15篇
  • 数据库
    4篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

兴趣领域 设置
  • 人工智能
    opencv迁移学习
创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

213人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

BERT学习笔记

与之前模型的区别:GPT考虑的是一个单向预测,用左边的词预测右边的词;但BERT则是同时利用左边和右边的词,来预测中间的词ELMO用的BiLSTM,但是它使用的是RNN结构,在应用到下游任务时它需要对模型结构做调整;但BERT使用的是transformer,在下游任务中只需要改上层的一小部分就可以了基本效果:11个任务上取得更高的精度GLUE提升7.7%,至80.5%;MultiL1提升4.6%,至86.7%;SQuAD v1.1提升1.5,至93.2;SQuAD v2提升5.1,至83.1。
原创
博文更新于 2024.02.23 ·
1514 阅读 ·
23 点赞 ·
0 评论 ·
26 收藏

C++学习笔记

C++基础知识学习笔记
原创
博文更新于 2022.10.31 ·
1761 阅读 ·
1 点赞 ·
2 评论 ·
4 收藏

分类任务之LeNet-5、AlexNet、VGG、ResNet、GoogLeNet

1、LeNet-5手写体数字识别模型,是一个广为人知的商用的卷积神经网络, 当年美国大多数银行用它来识别支票上面的手写数字。Lenet-5 原始结构如下图所示,包括:卷积层,降采样,卷积层,降采样,卷积层(实现全连接),全连接层,高斯连接层(进行分类)。在后期发展中,降采样层被 max_poolingmax\_poolingmax_pooling 所取代,分类也被 softmaxsoftm......
原创
博文更新于 2022.06.30 ·
2309 阅读 ·
3 点赞 ·
0 评论 ·
9 收藏

Pandas基本API集锦

一、pandas 简介pandas 是基于 numpy 的一种工具,该工具是为了解决数据分析任务而创建的。它有两种常见的数据类型:Series,DataFrame。Series 是 pandas 中最基本的对象,类似一维数组,可以自定义标签(也就是索引),通过索引可以访问数组中的数据。DataFrame 是一个二维表结构,能够存储多种不同类型的数据,并且每一个坐标轴都有自己的标签,可以把它当作一个 Series 的字典项。二、Series 对象1、Series 的创建# 通过列表创建,此时会默认从
原创
博文更新于 2022.05.31 ·
2600 阅读 ·
2 点赞 ·
0 评论 ·
13 收藏

Transformer 学习笔记

1 为什么要用 Transformer ?(创新点)1.1 问题来源最开始机器翻译使用的 seq2seq 所存在的问题:encoder 和 decoder 之间的上下文向量长度固定,但输入文本的长度是不固定的,长度不对称固定长度的上下文向量无法对长语句做有效编码,会遇到信息瓶颈,产生信息丢失的情况为了解决上述问题,基于 attention 的 seq2seq 随即被提出(这个 attention 跟 transformer 中的 self-attention 是不一样的),它能很好地利用权
原创
博文更新于 2022.05.18 ·
2966 阅读 ·
2 点赞 ·
0 评论 ·
17 收藏

test_cpn.py

发布资源 2020.09.01 ·
py

三、OpenCV-python 之 图像处理(Ⅰ)——空间转换/阈值/形态学/滤波/边缘检测/图像金字塔

1、空间转换OpenCV的图像颜色空间很多,常见的有BGR、HSV等。cv.cvtColor(input_image, flag) # 空间转换函数,flag参数多达150多种,常用的cv.COLOR_BGR2GRAY、cv.COLOR_BGR2HSV(1)HSV空间中,色调范围Hue range【0,179】,饱和度Saturation range【0,255】,颜色明亮程度Valu...
原创
博文更新于 2021.08.19 ·
1158 阅读 ·
2 点赞 ·
0 评论 ·
8 收藏

matplotlib基本绘图API集锦

一、基本使用流程import matplotlib.pyplot as plt # 导入模块# 画布设置plt.figure(figsize=(12,9)) # 设置图像尺寸大小,参数值乘以100表示分辨率plt.subplot(m,n,j) # 多个图排列plt.figure().tight_layout() # 多个图排列时自动设置间距,消除重叠# 画图plt.plot(x, y)# 图形设置plt.xlabel( 'heigh
原创
博文更新于 2021.08.09 ·
1069 阅读 ·
0 点赞 ·
0 评论 ·
11 收藏

OpenCV 截取任意形状的ROI

规则矩形的ROI提取可以使用 numpy 的数据切片操作,但是真实场景的ROI形状并不规则,可能伴随着旋转角度、多点折线等特征。这里介绍利用 OpenCV 截取任意形状ROI的基本思路。会使用到的几个比较重要的方法有:直线拟合:cv.fitLine旋转矩阵:cv.getRotationMatrix2D仿射变换:cv.warpAffine轮廓绘制:cv.drawContours图像融合:cv.add外接框拟合:cv.minAreaRect一、基本思路这里针对的是一般的 BGR 图像,ROI
原创
博文更新于 2021.07.23 ·
2392 阅读 ·
1 点赞 ·
3 评论 ·
20 收藏

bbox 四个顶点排序

1、问题已知矩形框(或者任意形状框,但必须是凸包)的四个顶点坐标,将其按照 “左上→右上→右下→左下” 的顺序排序。2、思路一般性的解决方案:先计算矩形框对角线的交点坐标 (Cx,Cy)(C_x, C_y)(Cx​,Cy​),则:x<Cx,y<Cyx<C_x, y<C_yx<Cx​,y<Cy​ 的是左上,x>Cx,y<Cyx>C_x, y<C_yx>Cx​,y<Cy​ 的是右上,x>Cx,y>Cyx>C_x, y
原创
博文更新于 2021.07.23 ·
2279 阅读 ·
1 点赞 ·
1 评论 ·
5 收藏

ECO-pytorch的模型结构、测试脚本

发布资源 2019.12.25 ·
zip

六、OpenCV-python 之图像处理(Ⅳ)——模板匹配/分水岭/GrabCut

一、模板匹配1、单目标单目标模板匹配的原理:模板图像在输入图像上做滑动操作(类似于 2D 卷积),模板图像与所在原图 patch 做比较,最终返回一个灰度图,每个像素代表该像素的邻域与模板的相似度。当输入图像尺寸为 (W,H)(W, H)(W,H)、模板图像尺寸为 (w,h)(w,h)(w,h) 时,输出图像尺寸为 (W−w+1,H−h+1)(W-w+1, H-h+1)(W−w+1,H−h+1)。 一旦得到结果,就可以使用cv.minMaxLoc() 函数来查找最大值/最小值的位置,取它为矩形的左上角,
原创
博文更新于 2020.11.30 ·
1557 阅读 ·
0 点赞 ·
0 评论 ·
17 收藏

四、OpenCV-python 之 图像处理(Ⅱ)——轮廓/直方图

1、等高线contourOpenCV中的 contour 计算需要先将图像二值化处理,在二值图中从黑色背景上找到白色前景对象(一个个的闭环区域),该方法可用在在形状分析、目标检测与识别中。# 在二值图上计算 contourcontours, hierarchy = cv.findContours(image, mode, method, offset)# 将 contour 画在图像上c...
原创
博文更新于 2020.11.26 ·
1800 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

CASIA-HWDB2.x 数据集DGRL文件解析(python)

CASIA-HWDB 数据集是最常见的手写汉字识别数据集,它包含脱机、联机两部分,分单字、文本行两种类型:HWDB1.x:脱机单字,1.0~1.2 三个版本,数据格式为 .gntOLHWDB1.x:联机单字,1.0~1.2 三个版本,HWDB2.x:脱机文本行,1.0~1.2 三个版本,数据格式为 .dgrlOLHWDB1.x:联机文本行,1.0~1.2 三个版本,一般常用的汉字识别多为脱机单字识别,该部分数据格式为 .gnt,网络上针对这种数据的解析文章也很多,这里主要介绍文本行识别数据集,
原创
博文更新于 2020.11.23 ·
6918 阅读 ·
20 点赞 ·
22 评论 ·
39 收藏

五、OpenCV-python 之图像处理(Ⅲ)——傅里叶变换

一、傅里叶变换是啥?1、数学定义若 f(x)f(x)f(x) 为非周期函数,在 xxx 的整个周期内满足狄里赫利条件,则 f(x)f(x)f(x) 可以用叠加积分表示:f(x)=∫−∞∞F(u)ej2πuxduf(x)=\intop_{-\infty}^{\infty}F(u)e^{j2\pi ux}duf(x)=−∞∫∞​F(u)ej2πuxdu2、实质从定义可以看到,一个复杂的函数可以表示为很多个简单函数的和(积分就是求和),把它放到信号处理场景中就是:傅里叶变换可以将一个信号分离为无穷多
原创
博文更新于 2020.11.22 ·
1351 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

ABCNet 论文阅读笔记

一、论文《ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network》二、代码[ABCNet]:初始代码位置[AdelaiDet]:最新代码位置,初始代码不再更新三、创新点之前的文本识别基本分两种类型:基于字符,基于分割。这些方法要么需要花费大量的精力去做字符级的数据标注,要么就是检测与识别分开,需要维护一个复杂的 pipeline。ABCNet 从数据标注、模型规模、推理速度等方面做出优化,主要的贡献有三点:
原创
博文更新于 2020.11.11 ·
1926 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

一、OpenCV-python 之 图像/视频/绘图

1、图像部分图像读取cv.imread(filepath, model)filepath:图片路径model:cv.IMREAD_COLOR读取3通道BGR图像,默认参数 cv.IMREAD_GRAYSCALE 读取灰度图 cv.IMREAD_UNCHANGED 读取4通道rgba图像注意:(1)读取是根据内容,而不是根据文件名...
原创
博文更新于 2020.11.03 ·
1005 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

OpenCV 常用检测算法

一、直线检测1、直线检测cv.HoughLines:使用标准霍夫变换,找到二值图像中的直线lines = cv.HoughLines( image, # 8-bit、单通道的二值图像 rho, # 累加器的距离分辨率,以像素为单位 theta, # 累加器的角度分辨率,以弧度为单位 threshold, # 累加器的阈值参数,太大会过滤大部分直线,太小则误检测会很多 lines, # srn, # 对于多尺度霍夫变换,
原创
博文更新于 2020.10.16 ·
4829 阅读 ·
7 点赞 ·
1 评论 ·
59 收藏

Video Understanding(3)——Spatio-Temporal Action Localization时空动作定位

《Action Tubelet Detector for Spatio-Temporal Action Localization》,2017,[caffe]《Tube Convolutional Neural Network (T-CNN) for Action Detection in Videos 》,2017,[caffe]
原创
博文更新于 2020.06.24 ·
4060 阅读 ·
4 点赞 ·
8 评论 ·
25 收藏

Video Understanding(1)——Action Recognition动作识别

1.推荐阅读动作识别综述动作识别开源集锦2.何为 Action Recognition这里讨论的动作识别针对的是视频帧,也就是说:对每一帧图像进行动作的分类,然后总结出该序列帧属于哪一类动作。事实上,图像分类已经取得了比较喜人的成绩,但是对于视频分类(video classification)、表征学习(representation learning)来说,深度学习的进展还显得比较缓慢。...
原创
博文更新于 2020.06.16 ·
3283 阅读 ·
7 点赞 ·
1 评论 ·
38 收藏
加载更多