介绍
Pandoc是一个用haskell编写的文本转换工具,小巧迅速且支持格式广泛,堪称文本转换应用的瑞士军刀。
支持格式
输入
- markdown
- reStructuredText
- textile
- HTML
- DocBook
- LaTeX
- MediaWiki markup
- TWiki markup
- OPML
- Emacs Org-Mode
- Txt2Tags
- Microsoft Word docx
- LibreOffice ODT
- EPUB
- Haddock markup
输出
- HTML格式: XHTML, HTML5, 和 HTML slide shows using Slidy, reveal.js, Slideous, S5, 或 DZSlides.
- 字处理格式: Microsoft Word docx, OpenOffice/LibreOffice ODT, OpenDocument XML
- 电子书: EPUB version 2或3, FictionBook2
- 文档格式: DocBook, GNU TexInfo, Groff man pages, Haddock markup
- 页面布局格式: InDesign ICML
- 大纲格式: OPML
- TeX 格式: LaTeX, ConTeXt, LaTeX Beamer slides
- PDF via LaTeX
- 轻量级标记格式: Markdown (including CommonMark), reStructuredText, AsciiDoc, MediaWiki markup, DokuWiki markup, Emacs Org-Mode, Textile
- 自定义格式: custom writers can be written in lua.
安装
安装Pandoc
在此页面上寻找对应平台的二进制安装包
Windows平台需要将Pandoc加入Path目录才能在cmd环境中调用
安装Tex支持(可选,用于编译Tex并输出PDF)
使用
你可以使用在线的DEMO
pandoc x.html -o x.md
pandoc -f html -t markdown http://www.fsf.org
-f
参数用于指定源文件格式-t
参数用于指定输出文件格式-o
参数用于指定输出文件
如果不使用-f
和-t
参数,pandoc将会根据输入文件以及-o
指定的输出文件格式来确定转换的格式类型
注意事项
- Pandoc不支持
.doc
格式,如果需要进行转换,则需要先将.doc
转换为.docx
引用资源
更新日志
- 2015年11月14日 完成初步使用