问题:为什么两个相同的列表具有不同的内存占用量?
我创建了两个列表l1
和l2
,但是每个列表都有不同的创建方法:
import sys
l1 = [None] * 10
l2 = [None for _ in range(10)]
print('Size of l1 =', sys.getsizeof(l1))
print('Size of l2 =', sys.getsizeof(l2))
但是输出使我感到惊讶:
Size of l1 = 144
Size of l2 = 192
使用列表推导创建的列表在内存中的容量更大,但是在Python中,这两个列表是相同的。
这是为什么?这是CPython内部的东西,还是其他解释?
回答 0
当您编写时[None] * 10
,Python知道它将需要一个正好包含10个对象的列表,因此它会精确地分配该对象。
当您使用列表推导时,Python不知道它将需要多少。因此,随着元素的添加,列表逐渐增加。对于每个重新分配,它分配的空间都超过立即需要的空间,因此不必为每个元素重新分配。结果列表可能会比所需的要大一些。
比较具有相似大小的列表时,可以看到此行为:
>>> sys.getsizeof([None]*15)
184
>>> sys.getsizeof([None]*16)
192
>>> sys.getsizeof([None for _ in range(15)])
192
>>> sys.getsizeof([None for _ in range(16)])
192
>>> sys.getsizeof([None for _ in range(17)])
264
您可以看到第一种方法只分配需要的内容,而第二种则周期性地增长。在此示例中,它为16个元素分配了足够的内存,并且在达到第17个元素时不得不重新分配。
回答 1
就像在这个问题中指出的那样,列表理解是list.append
在后台使用的,因此它将调用list-resize方法,该方法将进行整体化。
为了向自己证明这一点,您实际上可以使用反dis
汇编程序:
>>> code = compile('[x for x in iterable]', '', 'eval')
>>> import dis
>>> dis.dis(code)
1 0 LOAD_CONST 0 (<code object <listcomp> at 0x10560b810, file "", line 1>)
2 LOAD_CONST 1 ('<listcomp>')
4 MAKE_FUNCTION 0
6 LOAD_NAME 0 (iterable)
8 GET_ITER
10 CALL_FUNCTION 1
12 RETURN_VALUE
Disassembly of <code object <listcomp> at 0x10560b810, file "", line 1>:
1 0 BUILD_LIST 0
2 LOAD_FAST 0 (.0)
>> 4 FOR_ITER 8 (to 14)
6 STORE_FAST 1 (x)
8 LOAD_FAST 1 (x)
10 LIST_APPEND 2
12 JUMP_ABSOLUTE 4
>> 14 RETURN_VALUE
>>>
注意LIST_APPEND
反汇编<listcomp>
代码对象中的操作码。从文档:
LIST_APPEND(i)
来电
list.append(TOS[-i], TOS)
。用于实现列表推导。
现在,对于列表重复操作,如果考虑以下因素,我们就可以知道发生了什么:
>>> import sys
>>> sys.getsizeof([])
64
>>> 8*10
80
>>> 64 + 80
144
>>> sys.getsizeof([None]*10)
144
因此,它似乎能够准确分配大小。查看源代码,我们看到的就是这样:
static PyObject *
list_repeat(PyListObject *a, Py_ssize_t n)
{
Py_ssize_t i, j;
Py_ssize_t size;
PyListObject *np;
PyObject **p, **items;
PyObject *elem;
if (n < 0)
n = 0;
if (n > 0 && Py_SIZE(a) > PY_SSIZE_T_MAX / n)
return PyErr_NoMemory();
size = Py_SIZE(a) * n;
if (size == 0)
return PyList_New(0);
np = (PyListObject *) PyList_New(size);
即,这里:size = Py_SIZE(a) * n;
。其余函数仅填充数组。
回答 2
没有一个是内存块,但是它不是预先指定的大小。除此之外,数组元素之间的数组还有一些额外的间距。您可以通过运行以下命令自己查看:
for ele in l2:
print(sys.getsizeof(ele))
>>>>16
16
16
16
16
16
16
16
16
16
它的总和不是l2的大小,而是更小。
print(sys.getsizeof([None]))
72
而且这远远大于的十分之一l1
。
您的数字应该有所不同,具体取决于您的操作系统的详细信息和操作系统中当前内存使用情况的详细信息。[None]的大小永远不能大于将变量设置为存储的可用相邻内存,并且如果以后将其动态分配为更大,则可能必须移动该变量。