nodejs和npm,这两步网上教程很多,可以参考下网上
2.安装clean-mark
npm install clean-mark --global
该工具可以将我们的博客做一个初步的转markdown,用法如下
clean-mark "https://blog.csdn.net/yyy/article/details/xxx"
双引号内部为某篇具体需要转换的博文链接,转换成功后在当前目录下会出现xxx.md
3.对md文件做进一步的修正
使用clean-mark工具转换的md目前有两个问题
- 图片,使用的图片链接会是csdn服务器上的图片,并带有水印,需要将去除水印的图片下载到本地,并将md文件中的链接替换为本地图片链接
- 乱码,在一些未识别编程语言的代码片中,中文会出现乱码,形如变,这是XML字符实体的一种表示形式,,&#x表示十六进制
由于需要修正的md文件很多,一个个处理很不方便,所以将需要转换的博客通过第二步转换后同一在一个目录,然后编写程序,只要扫描到该目录下的md文件,就进行修正
import java.io.*;
import java.net.HttpURLConnection;
import java.net.URL;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class CsdnHandle {
private final String fileRoot = "H:\\CSDN";
private final String artImgFilePath = "file://D:/Program Files/Gridea/post-images/";
public static void main(String[] args) {
CsdnHandle handle = new CsdnHandle();
handle.process();
}
public void process() {
String imgRoot = fileRoot+"\\img\\";
String tomd = fileRoot+"\\tomd\\";
File file = new File(imgRoot);
if (!file.exists()) {
file.mkdirs();
}
file = new File(tomd);
if (!file.exists()) {
file.mkdirs();
}
file = new File(fileRoot);
File[] fileArray = file


5538

被折叠的 条评论
为什么被折叠?



