本文以一个最简单的用于演示的 collector 为例,介绍如何开发 DataScale collector。在此之前,读者可以先浏览以下视频,增进对 DataScale collector(自定义采集器)功能的了解。(若关注视频号【炎凰数据】观看更多视频介绍)
DataScale 自定义采集器功能介绍
Collector安装包
-
目录结构
一个最简单的 collector 安装包中只需要包含下列内容:
% unzip ./example_collector-1.0.0-x86_64-linux.zip
% tree ./
./
├── exec
│ └── dummy_log_printer.sh
└── meta.json
1 directory, 2 files
- 配置文件 ./meta.json
配置文件中设置了 collector 安装包的基本信息、以及 collector 的运行配置
- ./exec/ 目录下的可执行文件(executable)
Executable 是会在 dataflow 中被运行的程序,可以是编译生成的 binary 文件,也可以是由解释器执行的脚本程序。
信息
DataScale 不会限制安装包中包含其他文件或者目录结构,所以可以将运行 collector 所需要的任何依赖放入安装包,如可执行文件所依赖的 lib 文件、配置文件等。
-
命名规范
由于 DataScale 支持在多种 CPU 架构和操作系统中运行,同一个 collector 也可能存在多


1896

被折叠的 条评论
为什么被折叠?



