chencas
码龄12年
求更新 关注
提问 私信
  • 博客:59,844
    59,844
    总访问量
  • 27
    原创
  • 59
    粉丝
  • 31
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
加入CSDN时间: 2014-07-25
博客简介:

chencas的博客

查看详细资料
个人成就
  • 获得49次点赞
  • 内容获得12次评论
  • 获得0次收藏
  • 博客总排名866,446名
创作历程
  • 12篇
    2020年
  • 17篇
    2019年
成就勋章
TA的专栏
  • 推荐
  • 无监督
    1篇
  • 图数据库
    5篇
  • code
  • 图算法
    2篇
  • 数据结构和算法
  • 排序
  • nlp
    5篇
  • 大数据
    2篇
  • pyhton
  • 数据挖掘
    10篇
  • 算法

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

兴趣领域 设置
  • 人工智能
    机器学习深度学习神经网络自然语言处理tensorflowpytorchnlp
创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

211人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

docker 配置jupyter notebook与vscde调试

环境环境 win7通过toolbox安装docker需要在virtualBox中设置端口转发网络选择NAT地址转换=jupyter中需要执行jupyter notebook --ip=0.0.0.0 --no-browser然后再win7浏览器中中输入127.0.0.1:8888即可vscode 调试需要在本机和docker环境内都安装还有需要本地代码与docker代...
原创
博文更新于 2019.07.07 ·
360 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

catboost原理

文章目录概述原理类别型特征类别型特征的相关工作目标变量统计(Target Statistics)CatBoost处理Categorical features总结梯度偏差/预测偏移为什么会有梯度偏差?梯度偏差造成了什么问题?如何解决梯度偏差/预测偏移?其他特征组合快速评分基于GPU实现快速训练算法流程总结优点缺点概述CatBoost是俄罗斯的搜索巨头Yandex在2017年开源的机器学习库,是B...
原创
博文更新于 2020.02.20 ·
10135 阅读 ·
17 点赞 ·
1 评论 ·
84 收藏

由adboost, gbdt到xgboost,从目标函数说起

Adboost原理Adboost是利用前一轮弱学习器的误差率来更新训练集的权重,这样一轮轮的迭代下去,简单的说是Boosting框架+任意基学习器算法+指数损失函数。它是加法模型,学习的是前向分布学习算法,损失函数为指数函数的分类问题;另外,其基分类器可以为任何学习器,使用最广泛的是决策树和神经网络;对于决策树,使用CART分类回归树目标函数损失函数为指数函数,即定义损失函数为:L=ar...
原创
博文更新于 2019.12.23 ·
1179 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

SpectralNet: Spectral Clustering Using Deep Neural Networks

SpectralNet背景在无监督学习中,谱聚类是一种能够学习非凸流形的方法,然而它有两个局限性:一是可扩展性差,不能适用于数据量较大时场景;二是out-of-sample,即当遇到非训练样本时无法处理。为了解决上述两个问题,该文提出了一种深度学习的方法SpectralNet. 其要点该文提出一种受限随机优化的方法(constrained stochastic optimization),随机优化使其能够扩展到大的数据集;限制(constraints)是通过一个输出层实现,将输出保持正交(orth
原创
博文更新于 2020.08.17 ·
1903 阅读 ·
1 点赞 ·
3 评论 ·
6 收藏

从xgboost, lightgbm 到catboost

首先大致lightgbm和xgboost以及catboostxgboostpre-sorted& Histogram-based algorithmpre-sorted algorithm对于每个节点,遍历所有的特征对于每一个特征,以特征值大小进行排序使用一个线性扫描方式,基于信息增益,选取最佳分隔点在所有的特征中,决定最佳分隔特征及分隔点。Histogra...
原创
博文更新于 2020.04.02 ·
1198 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

图数据库 --- >Janusgraph 基础 (二)

不同图的管理在处理中,会创建并使用不同的图,就想sql中的table一样,Janusgraph这里使用的是不同的配置来管理不同的图。有两个组件:ConfiguredGraphFactory和JanusGraphFactory。他们的区别在于:ConfiguredGraphFactory:只有在服务启动时你已经使用ConfigurationManagementGraph API来配置你的s...
原创
博文更新于 2020.02.22 ·
1309 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

图数据库 --- > spark 和janusgraph组合(四)

例子sbt构建文件organization := "pluradj"name := "janusgraph-scala-example"version := "1.0"scalaVersion := "2.11.8"licenses += "Apache-2.0" -> url("http://www.apache.org/licenses/LICENSE-2.0.html")...
原创
博文更新于 2020.01.20 ·
3234 阅读 ·
0 点赞 ·
2 评论 ·
6 收藏

图数据库 --- > hugegraph (三)

作为服务器时stutio的设置studio.server.port=8088studio.server.host=0.0.0.0 // 设置为0.0.0.0在外部可以正常访问graph.server.host=127.0.0.1graph.server.port=8080graph.name=hugegraph //hugegraph不变,不需要与启动服务器建立的图名称(存储文件夹名...
原创
博文更新于 2020.01.20 ·
791 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

图数据库 --- > JanusGraph可视化之Gephi (五)

概述在本系列的第一篇文章中已经介绍了JanusGraph支持五种可视化工具,分别如下:CytoscapeGephiGraphexpKeyLinesLinkurious今天,我们来看下JanusGraph中的图数据如何使用Gephi可视化工具来呈现。Gephi安装准备进入https://gephi.org/,当前最新版本为gephi-0.9.2-windows,大约73M。安装...
原创
博文更新于 2020.01.19 ·
2831 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

图数据库 --- > Tinkerpop (一)

简介TinkerPop是一个面向实时事务处理(OLAP)以及批量、分析型(OLTP)的开源的图计算框架。TinkerPop是一个可以应用于不同图形数据库的抽象层,避免应用程序与特定数据库高度依赖。目标提供通用的API和工具,使开发人员可以基于不同图数据库轻松创建图形应用程序,使图形数据库与图计算解耦,方便切换不同图形数据库,简化其工作。体系结构Gremlin是TinkerPop图形遍...
原创
博文更新于 2020.01.19 ·
5302 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

基础 --- 优化方法(一)

梯度下降批量梯度下降随机梯度下降牛顿法拟牛顿法trust-regionL1正则化的求解次梯度,次导数
原创
博文更新于 2020.01.18 ·
395 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

序列挖掘 --- >BOSS

Bossbag-of-SFA-symbols它首先从时间序列中提取子结构(substructures)对子结构应用低通滤波和量子化,这能够降低噪声,并使用字符串匹配算法然后比较两个时间序列noise-reduced patterns的差别优点:快应用了降噪(noise reduction)invariance to offsets is treated as a parameter...
原创
博文更新于 2020.01.18 ·
1553 阅读 ·
2 点赞 ·
0 评论 ·
5 收藏

基础算法 --- > 排序

冒泡冒泡排序(Bubble Sort)是一种交换排序,基本思想是:两两比较相邻记录的关键字,如果反序则交换,直到没有反序的记录为止。在最好的情况下,也就是数列本身是排好序的,需要进行 n - 1 次比较;在最坏的情况下,也就是数列本身是逆序的,需要进行 n(n-1)/2 次比较。因此冒泡排序总的时间复杂度是 O(n^2)。# 冒泡排序def bubbleSort(a...
原创
博文更新于 2020.01.18 ·
216 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

GAN --- > 基础

背景GAN全名(Generative Adversarial Nets),即生成对抗网络。它是在什么背景下出现,为了解决什么呢?我们知道在深度学习领域中,判别模型可以利用反向传播算法等来进行求解,也即从建模,到最终的分类预测均能够顺利地实施并取到不错的效果;但在深度学习中,生成模型常用的极大似然估计等,通常对其难以进行有效的概率计算,并且也难以利用在生成的中间内容以进行有效地学习。基于上述在...
原创
博文更新于 2020.01.18 ·
460 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

基础算法 --- > 优化方法(二)

背景这次主要介绍次梯度(subgradient)和近端梯度下降(Proximal gradient descent)算法我们以L1正则化求解为例次梯度对于任一个损失函数,将其简化写为:L(w,λ)=f(w)+λ∣w∣L(w, \lambda) = f(w) + \lambda|w|L(w,λ)=f(w)+λ∣w∣对于第一项求导gw(w,λ)=∂f(w)∂wg_w(w, \lambda)...
原创
博文更新于 2020.01.18 ·
656 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

基础算法 --- > 正则化

文章目录L1, L2正则化贝叶斯先验分布结构风险最小化dropoutearlystoppingbatch normalization数据增强权值共享增加噪声对抗学习模型组合L1, L2正则化贝叶斯先验分布最大似然估计如果有数据集(X, Y),并且Y是有白噪音(就是测量的Y与真实的YrealY_{real}Yreal​有均值为0的高斯分布误差),目的是新产生的X来得到Y,线性模型表示有:f...
原创
博文更新于 2020.01.18 ·
488 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基础算法 --- >EM 模型

背景假设我们需要调查我们学校学生的身高分布。我们先假设学校所有学生的身高服从正态分布N(μ,δ12)N(\mu, \delta_1^2)N(μ,δ12​),但是男女但身高分布是不同的,我们假设他们真实的分布分别为男:N(μ1,δ1)N(\mu_1, \delta_1)N(μ1​,δ1​)和女:N(μ2,δ22)N(\mu_2, \delta_2^2)N(μ2​,δ22​),现在我们怎么估计求得各...
原创
博文更新于 2020.01.18 ·
858 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

基础算法 --- > SVD

奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。奇异值分解(SVD)通俗一点讲就是将一个线性变换分解为两个线性变换,一个线性变换代表旋转,一个线性变换代表拉伸注:SVD是将一个矩阵分解成两个正交矩阵和一个对角矩阵,我们...
原创
博文更新于 2020.01.18 ·
802 阅读 ·
4 点赞 ·
0 评论 ·
12 收藏

graph --- > Graph embedding (一)

背景目前很多机器学习算法都是针对于结构化数据,即每个样本的特征数都固定,这样可将数据按照预定的模式去学习,但也有不少学习场景中,还存在大量的关联性数据,如用户的购买赠送行为,用户的社交关系等等,这些数据很难直接应用目前的算法。Graph representations 学习是一种通过图来学习节点表示向量的方法,通过将其转化为结构化的数据,进而应用我们已有的大量学习算法进行学习。首先将深度学习应...
原创
博文更新于 2020.01.18 ·
886 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多