Markdown 转 HTML 的轮子很多, HTML 转 Markdown 的工具却不多.
用途: 爬虫爬文章保存到本地为 Markdown 格式
Github 地址: https://github.com/gaojiuli/tomd
Convert HTML to Markdown.
pip install tomd
输入
from tomd import Tomd
Tomd("<h1>h1</h1>").markdown
输出
# h1
from tomd import Tomd
html="""
<h1>h1</h1>
<h2>h2</h2>
<h3>h3</h3>
<h4>h4</h4>
<h5>h5</h5>
<h6>h6</h6>
<p>paragraph
<a href="https://github.com">link</a>
<img src="https://github.com" class="dsad">img</img>
</p>
<ul>
<li>1</li>
<li>2</li>
<li>3</li>
</ul>
<ol>
<li>1</li>
<li>2</li>
<li>3</li>
</ol>
<blockquote>blockquote</blockquote>
<p><code>inline code</code></p>
<pre><code>block code</code></pre>
<p>
<b>bold</b>
<i>italic</i>
<b><i>bold italic</i></b>
</p>
"""
Tomd(html).markdown
# h1
## h2
### h3
#### h4
##### h5
###### h6
paragraph
[link]( https://github.com)
![img]( https://github.com)
- 1
- 2
- 3
1. 1
1. 2
1. 3
> blockquote
`inline code`
**bold**
*italic*
***bold italic***
接收各种 issue 与 pull request, 代码量少容易理解, 大家可以一起参与进来
Github 地址: https://github.com/gaojiuli/tomd
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.