最近在做古诗相关的东西,做一个资源整理。
都是在网上找到的,没时间去搜集。感谢大家~
API:
1. 极速数据api
目前找到最好用的。里面挺详细的,解释、内容都有。够用
接口地址:
http://api.jisuapi.com/tangshi/search apiKEY自己注册一下,python调用的demo:
#!/usr/bin/python# encoding:utf-8import urllib2, json, urllib# 1、唐诗查询data = {}data["appkey"] = "your_appkey_here"data["keyword"] = "白日"data["pagesize"] = 1data["pagenum"] = 1url_values = urllib.urlencode(data)url = "http://api.jisuapi.com/tangshi/search" + "?" + url_valuesrequest = urllib2.Request(url)result = urllib2.urlopen(request)jsonarr = json.loads(result.read())if jsonarr["status"] != u"0": print jsonarr["msg"] exit()result = jsonarr["result"]print result["total"],result["pagesize"],result["pagenum"]for val in result["list"]: print val["title"],val["type"],val["content"],val["explanation"]JSON返回格式:
{ "status": "0", "msg": "ok", "result": { "total": "9", "pagenum": "1", "pagesize": "1", "list": [ { "title": "登鹳雀楼", "type": "五言绝句", "content": "白日依山尽,黄河入海流。<br>欲穷千里目,更上一层楼。", "explanation": "<p> 1.鹳雀楼:旧址在山西永济县,楼高三层,前对中条山,下临黄河。传说常有鹳雀在此停留,故有此名。 </p>", "appreciation": "<p> 这首诗写诗人在登高望远中表现出来的不凡的胸襟抱负,反映了盛唐时期人们积极向上的进取精神。 </p>", "author": "王之涣" } ] }}还是很好明白的,就是一天只能用100次。
数据库如下:
1. chinese-poetry
https://github.com/chinese-poetry/chinese-poetry
包含5.5万首唐诗、26万首宋诗和2.1万首宋词. 唐宋两朝近1.4万古诗人, 和两宋时期1.5K词人. 数据来源于互联网。
古诗数据分发采用繁体字的分组JSON文件, 保留繁体能更大程度地保存原数据. 宋词数据分发采用sqlite数据库, 使用简体字(无原因, 采集源就是简体, 如需繁体请自行转换).
数据内容有:诗名、作者、作者介绍、诗;
缺少 古诗解说。
2. tang_poetry
https://github.com/hxgdzyuyi/tang_poetry
全唐诗,SQL数据集。
只是诗名、
本文介绍了在古诗项目中使用的两个数据来源:chinese-poetry和tang_poetry。chinese-poetry提供了5.5万首唐诗、26万首宋诗和2.1万首宋词的详细信息,而tang_poetry则提供了全唐诗的SQL数据集。极速数据api是一个方便的资源,但每日调用次数有限制。

1157

被折叠的 条评论
为什么被折叠?



