一、模拟抽取环境准备:
1、两张要抽取的图片
2、一个Excel表格,表格中是照片的序号和照片的存放路径(用txt也可以,主要作用是kettle能读取到图片的路径)
3、创建图片存放的表,创建语句如下SQL。



create table T_ZP
(
xh NUMBER,--序号
path VARCHAR2(2000),--图片存放路径
photo BLOB,--图片
rksj VARCHAR2(20)--入库时间
)
二、抽取模型
1、打开kettle创建一个转换,依次调用EXCEL输入组件、JAVA代码组件和一个表输出组件;

2、EXCEL输入组件设置
打开EXCEL输入组件,依次设置加载Excel路径,sheet页,和sheet页中的列。




2、JAVA代码组件设置
打开JAVA代码组件设置,将带Java代码复制进去,将表输出与java代码组件之间的联系至灰(不可用状态)。


JAVA代码
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.Date;
int outputRowSize;
public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException
{
Object[] r = getRow();
if (r == null) {
setOutputDone();
return false;
}
outputRowSize = data.outputRowMeta.size();
r = createOutputRow(r,outputRowSize);
SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyyMMddHHmmss");
String format = simpleDateFormat.format(new Date());
get(Fields.Out, "RKSJ").setValue(r, format);
String FILE_PATH = get(Fields.In, "PATH").getString(r);
byte[] photo = null;
try {
File file = new File(FILE_PATH);
FileInputStream fileInputStream = new FileInputStream(file);
ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
System.out.print(file.length());
photo = new byte[(int) file.length()];
int len = 0;
while (-1 != (len = fileInputStream.read(photo))) {
byteArrayOutputStream.write(photo, 0, len);
}
photo = byteArrayOutputStream.toByteArray();
byteArrayOutputStream.flush();
byteArrayOutputStream.close();
fileInputStream.close();
} catch (IOException e) {
e.printStackTrace();
}
get(Fields.Out, "PHOTO").setValue(r, photo);
putRow(data.outputRowMeta, r);
return true;
}
3、表输出组件
打开表输出组件,设置输出表名、字段。

三、抽取结果
执行转换,出现如下表示成功,打开数据库查看数据抽取情况。


本文介绍如何使用Kettle将本地图片数据抽取并存入Oracle数据库。首先,准备图片、Excel表格(包含图片路径信息);然后,创建数据库中存放图片的表。在Kettle中创建转换,通过EXCEL输入读取表格,JAVA代码组件处理图片,最后通过表输出组件写入数据库。执行转换成功后,可在数据库中查看图片数据。

3424

被折叠的 条评论
为什么被折叠?



