当前位置: 代码迷 >> python >> html 到 Python 中的 .doc 转换器?
  详细解决方案

html 到 Python 中的 .doc 转换器?

热度:104   发布时间:2023-06-16 10:13:31.0

我正在使用 pisa,这是一个用于 Python 的 HTML 到 PDF 转换库。

Word 文档是否存在相同的东西:Python 的 HTML 到 .doc 转换库?

您可以使用 Windows 的 python 扩展中的 win32com,让 MS Word 为您转换它。 一个简单的例子:

import win32com.client

word = win32com.client.Dispatch('Word.Application')

doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()

word.Quit()

虽然我不知道可以让您转换它的直接模块,但是:

  1. 您可以先使用模块将HTML转换为纯文本
  2. 之后,您可以使用模块将文本转换为docdocx文件。

如果其他人试图以相反的方式进行转换,则上述代码有效,但您需要修改 FileFormat 值。

示例:过滤后的 html 是 10,而不是 0。

使用 python3.x 更新修复此问题:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated
  相关解决方案