TeXでPDFに埋め込んだ数式情報の救出
2022-05-15(日)
LaTeXiTとかTeX2imgでPDFに埋め込んだTeXソースを拾い出したい。
結論から言うと TeX2imgはPyPDF2で読める。LaTeXiTは面倒過ぎて放棄。
tex2imgの場合
PyPDF2でPDFファイルを開いてページを取得する。 前提として1ページもので数式が出力されてるPDFの equation.pdf を扱う。
import PyPDF2
f = open('equation.pdf', 'rb')
reader = PyPDF2.PdfFileReader(f)
page = reader.getPage(0)
pageはPyPDF2._page.PageObjectだがdictと考えて良い …
Category: Memo Tagged: TeX Python
Read More