[New-2016-3-8] :由于Google Code已经停止服务,最新版代码已经迁移至github https://github.com/kite1988/dblp-parser
运行代码需指定JVM参数 -Xmx1G -DentityExpansionLimit=2500000。 如果有任何问题,请回复此文或者发邮件给我。
因为参考论文使用的实验数据是dblp,所以我的论文也打算使用dblp的数据。在网上没有找到解析dblp.xml
本文介绍了如何解析DBLP的XML文件并将其数据存入数据库,包括XML文件的格式特点,数据库建表建议,解析过程中遇到的问题,Eclipse的配置以及数据写入数据库的实践。针对大文件解析,需要设置JVM参数,并在Eclipse中进行相应配置以避免实体扩展限制错误。
[New-2016-3-8] :由于Google Code已经停止服务,最新版代码已经迁移至github https://github.com/kite1988/dblp-parser
运行代码需指定JVM参数 -Xmx1G -DentityExpansionLimit=2500000。 如果有任何问题,请回复此文或者发邮件给我。
因为参考论文使用的实验数据是dblp,所以我的论文也打算使用dblp的数据。在网上没有找到解析dblp.xml
6016

被折叠的 条评论
为什么被折叠?
