新手使用python生成epub

时间:2013-06-14 09:59:10

标签: python epub

作为我的第一个python编码项目,我想使用python从BMJ等期刊中的文章创建epub文件。

我使用feedparserBMJ RSS中提取链接,使用beautifulsoup捕获我需要的html文件中的组件,然后按照{{3}的说明进行操作创建一个epub文件。

可以创建EPUB文件,但不是一些epub阅读器认为文件已损坏,例如windows和android的coolreader都没有显示,而android版本甚至意外退出程序。

我猜epub的一些“声明”是不对的导致这个问题,但我不知道如何解决它。

我在R中有一些编码经验并使用XML包进行了一些网络抓取,但没有使用EPUB格式的经验。

2 个答案:

答案 0 :(得分:2)

尝试在您的图书上运行epubcheck。这就是它的用途。见https://code.google.com/p/epubcheck/。最新版本非常详细。很难想象一个电子阅读器会扼杀一本通过epubcheck的书。换句话说,如果一个电子阅读器在一本通过epubcheck的书上窒息,那么它可能是电子阅读器中的一个错误。

您可能还想查看https://code.google.com/p/python-epub-builder/。我怀疑它是否会创建破碎的epub。

答案 1 :(得分:0)

calibre的转换设置中,有一项设置可将源文件分成280kb的页面(同一epub存档中的多个小html文件)。 IIRC,它说许多电子书阅读器无法处理太大的html,应拆分为较小的文件。也许您应该检查该字段约束。

相关问题