python教程—从pdf中提取一个页面为jpeg-Python实用宝典

python教程—从pdf中提取一个页面为jpeg

在python代码中,如何有效地将pdf中的某个页面保存为jpeg文件?(用例:我有一个python烧瓶web服务器,其中pdf-s将被上传,与每个页面对应的jpeg-s将被存储。)

在python代码中,如何有效地将pdf中的某个页面保存为jpeg文件?(用例:我有一个python烧瓶web服务器,其中pdf-s将被上传,与每个页面对应的jpeg-s将被存储。)

已经接近,但问题是它没有将整个页面转换为jpeg。

回答

可以使用pdf2image

你可以简单地用,

    pip install pdf2image

安装后,可以使用以下代码获取图像

    from pdf2image import convert_from_path pages = convert_from_path('pdf_file', 500)

保存jpeg格式的页面

    for page in pages: page.save('out.jpg', 'JPEG')

编辑:Github repo pdf2image还提到它使用pdftoppm,需要其他安装:

pdftoppm是一款真正具有魔力的软件。它作为一个更大的包的一部分分发,这个包名为poppler
Windows用户必须安装poppler for Windows
Mac用户必须安装poppler for Mac
Linux用户将pdftoppm预装在发行版中(在Ubuntu和Archlinux上测试过),如果没有,运行sudo apt安装pop -utils。

下面是Windows的正确安装: http://blog.alivate.com.au/popplerwindows/< /a>

​Python实用宝典 (pythondict.com)
不只是一个宝典
欢迎关注公众号:Python实用宝典

本文由 Python实用宝典 作者:Python实用宝典 发表,其版权均为 Python实用宝典 所有,文章内容系作者个人观点,不代表 Python实用宝典 对观点赞同或支持。如需转载,请注明文章来源。
1

发表评论