因开发要求,需要对oracle里的数据与数据文件作比较。如采用客户端连接oracle的方式则显得小题大做,且工作量大,不易维护。直接采用存储过程,调用UTL_FILE包的公共过程,显得方便得多。
首先,需要把数据文件所在的目录注册到oracle中,用create directory。。。语句,然后把此目录的read,write权限grant给develop user account。注意create directory语句所需要的权限,方便得话直接用dba用户创建directory。
其次,文件操作如同C,C++,JAVA等高级语言差不多,主要有这几个方法:
UTL_FILE.fopen(d_output,v_filename,'r',32767);--32767很关键,如果文件一行的字节数过大,不指定这个参数,oracle只会读入最长默认长度的字符串,以至一行文本当成了“两行”读。
UTL_FILE.get_line(FILE_HANDLE,v_text);
UTL_FILE.put_line(FILE_HANDLE,v_text);
UTL_FILE.fclose(FILE_HANDLE);
对于要操作xls文件,一行数据采用chr(13)||chr(10)分割每列的数据。缺点是无法进行xls单元格的一些格式化,以及单元格合并等操作。因此虽然oracle有操作xls的基本功能,但只能完成最基本的功能。
最后,就是字符集的问题了,上面提到的get_line函数,是以字节为单位的,oracle也有按照双字节来处理的。但是对于UTF-8的文本,某些汉字的编码是三个字节,如果其中一个字节为OA,或OD,oracle就会误认为此行已经终止,这样也会把原本一行的内容当成“两行”来读取。oracle的字符集为简体中文,可能是oracle服务端的字符集不是UTF-8才导致这个问题,还是说oracle本身就存在这个问题,还有待确认下!
本文介绍了一种在Oracle数据库中直接对数据与文件进行对比的方法。通过使用存储过程及UTL_FILE包,实现了文件读写操作。文章还讨论了处理大文件、UTF-8编码文本及简单XLS文件的操作技巧。

1038

被折叠的 条评论
为什么被折叠?



