问题:用python 3解开python 2对象
我想知道是否有一种方法可以加载在Python 2.4和Python 3.4中腌制的对象。
我一直在大量公司遗留代码上运行2to3,以使其保持最新状态。
完成此操作后,在运行文件时出现以下错误:
File "H:\fixers - 3.4\addressfixer - 3.4\trunk\lib\address\address_generic.py"
, line 382, in read_ref_files
d = pickle.load(open(mshelffile, 'rb'))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 1: ordinal
not in range(128)
在争用中查看腌制的对象,它dict
在中dict
,包含键和type值str
。
所以我的问题是:有没有办法用python 3.4加载最初在python 2.4中腌制的对象?
回答 0
您必须告诉pickle.load()
如何将Python字节串数据转换为Python 3字符串,或者可以告诉pickle
将它们保留为字节。
默认设置是尝试将所有字符串数据解码为ASCII,并且解码失败。请参阅pickle.load()
文档:
可选的关键字参数是fix_imports,encoding和errors,用于控制对Python 2生成的pickle流的兼容性支持。如果fix_imports为true,pickle将尝试将旧的Python 2名称映射到Python 3中使用的新名称。编码和错误告诉pickle如何解码Python 2腌制的8位字符串实例;它们分别默认为“ ASCII”和“ strict”。该编码可以是“字节”来读取这些8位串实例作为字节对象。
将编码设置为latin1
可以直接导入数据:
with open(mshelffile, 'rb') as f:
d = pickle.load(f, encoding='latin1')
但是您需要确认没有使用错误的编解码器对所有字符串进行解码;Latin-1适用于任何输入,因为它将字节值0-255直接映射到前256个Unicode代码点。
另一种选择是使用加载数据encoding='bytes'
,然后解码所有bytes
键和值。
请注意,直到使用3.6.8、3.7.2和3.8.0之前的Python版本,除非使用,否则对Python 2 datetime
对象数据的解泄漏都是无效的encoding='bytes'
。
回答 1
encoding='latin1'
当对象中包含numpy数组时,使用会引起一些问题。
使用encoding='bytes'
会更好。
请参阅此答案以获取有关使用的完整说明encoding='bytes'