开发属于你的数据采集器，DataScale Collector详解

最新推荐文章于 2026-06-23 17:19:41 发布

原创

最新推荐文章于 2026-06-23 17:19:41 发布 · 1.7k 阅读

标签

#大数据 #数据库开发 #个人开发

收录于

本文以一个最简单的用于演示的 collector 为例，介绍如何开发 DataScale collector。在此之前，读者可以先浏览以下视频，增进对 DataScale collector（自定义采集器）功能的了解。（若关注视频号【炎凰数据】观看更多视频介绍）

DataScale 自定义采集器功能介绍

Collector安装包

一个最简单的 collector 安装包中只需要包含下列内容：


% unzip ./example_collector-1.0.0-x86_64-linux.zip
% tree ./
./
├── exec
│   └── dummy_log_printer.sh
└── meta.json

1 directory, 2 files

配置文件 ./meta.json

配置文件中设置了 collector 安装包的基本信息、以及 collector 的运行配置
./exec/ 目录下的可执行文件（executable）

Executable 是会在 dataflow 中被运行的程序，可以是编译生成的 binary 文件，也可以是由解释器执行的脚本程序。

信息

DataScale 不会限制安装包中包含其他文件或者目录结构，所以可以将运行 collector 所需要的任何依赖放入安装包，如可执行文件所依赖的 lib 文件、配置文件等。

命名规范

由于 DataScale 支持在多种 CPU 架构和操作系统中运行，同一个 collector 也可能存在多

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

炎凰数据

关注关注

26
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

dataScale

03-27

关于Laravel Laravel是一个具有表达力，优雅语法的Web应用程序框架。我们认为，发展必须是一种令人愉快的，富有创造力的经历，才能真正实现。 Laravel减轻了许多Web项目中使用的常见任务，从而减轻了开发过程中的痛苦，例如：。。用于和存储的多个后端。富有表现力，直观的。 数据库不可知。。。 Laravel易于访问，功能强大，并提供大型，强大的应用程序所需的工具。学习Laravel Laravel拥有所有现代Web应用程序框架中最广泛，最全面的和视频教程库，因此轻而易举地开始使用该框架。如果您不想读书，可以使用帮助。 Laracasts包含1500多个视频教程，涉及各种主题，包括Laravel，现代PHP，单元测试和JavaScript。深入我们全面的视频库，提高您的技能。 Laravel赞助商我们要感谢以下赞助商为Laravel开发

参与评论您还未登录，请先登录后发表或查看评论

自定义收集用户行为统计库 (非常方便可以自己拓展)

07-19

自定义收集用户行为统计库 (非常方便可以自己拓展) 详细信息 http://blog.csdn.net/liudao7994/article/details/75434875

开发属于你的数据采集利器，DataScale自定义采集器

Yhpdata888的博客

12-15

1896

iphone15 pro Max 等大奖等你拿！

Oracle学习之利用sql语句查询数据表中各字段名称，类型，大小

Hiraet_h的博客

08-25

2978

SELECT TABLE_NAME, /*表名*/ COLUMN_NAME, /*字段名*/ DATA_TYPE, /*字段类型*/ DATA_LENGTH, /*字段长度*/ DATA_PRECISION, /*number类型有效位数*/ DATA_SCALE /*number类型小数点后位数*/ FROM ALL_TAB_COLS WHERE TABLE_NAME = '表名'; 因为通过DATA.

ORACLE number

CarloPan的博客

10-27

1083

data_precision -- 整数 data_scale --小数位 1、查询数据类型为number,data_precision 为null，data_scale 为null 的数据 SELECT DISTINCT t1.TABLE_NAME from sys.dba_tab_cols t1 WHERE t1.data_type = 'NUMBER' AND t1.data_scale IS null AND t1.DATA_PRECISION IS null AND t1.OWNER NO..

【oracle】oracle元数据获取用户下的表关键信息

fuyun6363的博客

12-25

1720

目录获取该用户下所有表名和表描述获取查看该用户下所以表字段信息(除字段描述)获取字段描述获取表的主键信息获取用户下表关键信息了解一个业务系统的数据情况，所有要了解该业务系统的表结构信息及ER关系图。本文主要聊聊通过oracle元数据获取该用户下所有表的关键信息，比如：表名、表描述、字段名、字段描述、字段类型、字段长度、是否主键、是否非空、默认值等。获取该用户下所有表名和表描述 user_tab_comments表(视图)，该表存储的是该用户下所有表和描述 select table_name, comme

数据的标准化与中心化以及R实现

古韦的专栏

08-31

4479

数据的标准化与中心化以及R语言中的scale详解

Decimal中Scale和Precision是什么

热门推荐

余璜的技术博客

10-16

3万+

Precision (field length) 精度（字段长度） Scale (decimal places) 范围（小数位数） MySQL要求精度大于等于范围： mysql> create table test (a decimal(1,3)); ERROR 1427 (42000): For float(M,D), double(M,D) or

数据标准化数据归一化数据预处理 data normalization / scale

SuperYR_210的博客

01-02

3623

一、数据归一化的好处：数据标准化和归一化的区别和联系：在进行处理数据的时候，标准化的方法是比较多的，其中数据归一化是一种常见的数据的标准化，只不过标准化只是将数据进行规范到一个范围之内，对于数据的归一化来说，是将数据规范到0到1之间或者是-1到1之间。在使用机器学习或者深度学习的模型的时候，数据预处理的阶段是十分重要的，我们在进行处理的时候，包括缺失值处理、异常值处理、重复值处理等很多方面，当然

海思AI芯片(Hi3519A/3559A)方案学习（二十三）nnie上进行图像数据预处理（Normalize）的五种方式

ltshan139的专栏

10-08

4727

前言大家知道，深度学习算法模型在推理前，都会对图像数据进行预处理，即RGB三个通道上的数据(0~255) normalize成0~1以内的值。值得注意的是，normalize方式有好几种，而且不同的算法模型所采用的预处理方式还不太一样。这就要求在nnie开发中，将caffe算法模型转换成wk文件时，必须选择合适的预处理方式。否则可能会导致识别结果不正常。 normalize方式的解释在使...

oracle data_length和data_precision的区别

产品经理，程序人生

04-08

1万+

这两个属性都属于user_tab_columns视图，他们的含义： data_length:当前列数据类型的字节长度如:EMPNO NUMBER(4) 22 ENAME VARCHAR2(10) 10 data_precision:列相关数据类型(数字类型)的具体长度(有效位数),一个十进制数(NUMBER类型),或一个二进

数据采集程序开发

宇联舟的博客

06-20

1346

数据采集，帮助用户进行数据筛选和集中展示。

记一次数据采集软件（服务器）开发经历（c#，socket，TCP)

qq_27437671的博客

06-30

5954

这次经历大致分为以下几个阶段：一、C#基本操作学习和简单TCP通信实现先前有使用MFC的经历，因此对于C#的控件使用比较容易上手，每次使用之前可通过网络查询到控件使用方法，直接拖拽就OK，唯一不适应的就是C#全部都是类，不过习惯后会觉得比C++更方便调用。TCP的实现主要还是以网络博客为主，这类的博客很多，通过简单的搭建，就可以实现一个服务器。有同事的前车之鉴，建议我们使用异步。我使用的方...

开发模块1——数据采集

澈彻策的博客

12-16

1743

3 模块开发——数据采集 3.1 需求数据采集的需求广义上来说分为两大部分。 1）是在页面采集用户的访问行为，具体开发工作： 1、开发页面埋点js，采集用户访问行为 2、后台接受页面js请求记录日志此部分工作也可以归属为“数据源”，其开发工作通常由web开发团队负责 2）是从web服务器上汇聚日志到HDFS，是数据分析系统的数据采集，此部分工作由数据分析平台建设团队负责，具

记一次WEB数据采集程序开发经历——对付简单的动态加载

软件架构农

03-20

6315

自从学做网站账号批量注册机、图片批量下载器，开始接触HTTP协议，了解了基本的GET/POST请求等知识，于是便开始着手开发一些小东西了。 WEB数据采集，很多人都在搞。据说搞WEB数据采集用JAVA会更方便，有很多现成的类库可用。可以说WEB数据采集这块，是C++的短板。我目前能想到的方法就是利用WinInet，这是一组关于Intelnet三大协议HTTP、FTP、Gopher的windows

Symbol 数据采集器开发 Demo

James的专栏

12-24

2216

一.创建项目打开visual 2005,文件->新建->项目二.设计界面,编写代码首先进行系统界面设计,编写相关逻辑代码处理在初始化窗体时,加载扫描头触发事件 private SymbolScanWood.SymbolScanWood _objScan = new SymbolScanWood.SymbolScanWood(

商品搜索与全渠道可售库存（ATP）深耕技能指南

开发属于你的数据采集器，DataScale Collector详解

Collector安装包

目录结构

命名规范