最近我们遇到一个项目是:用随机不同的样式去打印 csv 里十几万条少数民族语。 我们的想法是:
.csv
中的每一条语句转成.html
中的一个<p>
.html
,得到一个.pdf
。现在遇到的问题是:我们需要得到.csv
里的每一条item
对应的.pdf
页数。
举个例子,.csv
里的第 1000 条句子,最终打印出来在.pdf
的第五十页,那么我们就需要得到一个(1000,50)
。
现在的困惑是:.html
打印成.pdf
的过程似乎是一个黑盒。没有办法深入到底层去得知某一个<p>
最终会落在哪张页面上。
希望有了解 HTML 打印的同学可以帮忙指个路。
亦或者大家有什么更好的思路来实现这个需求。
————————————————————————————————————————
之所以不去用 python 中的reportlab
是因为reportlab
对 RTL (从右到左排版)的支持并不好。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.