首先让我们从from import在python中的工作原理开始:
那么首先让我们看一下字节码:
>>> def foo():
... from foo import bar
>>> dis.dis(foo)
2 0 LOAD_CONST 1 (-1)
3 LOAD_CONST 2 (('bar',))
6 IMPORT_NAME 0 (foo)
9 IMPORT_FROM 1 (bar)
12 STORE_FAST 0 (bar)
15 POP_TOP
16 LOAD_CONST 0 (None)
19 RETURN_VALUE
hmm 很有趣 :),所以 from foo import bar 首先被翻译成 IMPORT_NAME foo,相当于 import foo,然后是 IMPORT_FROM bar。
现在IMPORT_FROM 做什么?
看看python找到IMPORT_FROM后做了什么:
TARGET(IMPORT_FROM)
w = GETITEM(names, oparg);
v = TOP();
READ_TIMESTAMP(intr0);
x = import_from(v, w);
READ_TIMESTAMP(intr1);
PUSH(x);
if (x != NULL) DISPATCH();
break;
基本上他得到了要导入的名称,在我们的foo()函数中将是bar,然后他从帧堆栈中弹出值v,这是最后执行的操作码的返回值即IMPORT_NAME,然后使用这两个参数调用函数import_from():
static PyObject *
import_from(PyObject *v, PyObject *name)
{
PyObject *x;
x = PyObject_GetAttr(v, name);
if (x == NULL && PyErr_ExceptionMatches(PyExc_AttributeError)) {
PyErr_Format(PyExc_ImportError, "cannot import name %S", name);
}
return x;
}
正如你所看到的import_from()函数很简单,它首先尝试从模块name获取属性v,如果它不存在,则引发ImportError否则返回这个属性。
现在这与相对导入有什么关系?
像from . import b 这样的相对导入等价于例如在OP 问题中与from pkg import b 的情况。
但是这是怎么发生的呢?为了理解这一点,我们应该看一下python的import.c模块,特别是函数get_parent()。如您所见,这里列出的函数很长,但一般来说,当它看到相对导入时,它会尝试用父包替换点 .,具体取决于 __main__ 模块,这又来自OP 问题是包pkg。
现在让我们将所有这些放在一起,并尝试弄清楚为什么我们最终会出现 OP 问题中的行为。
为此,如果我们能看到 python 在进行导入时做了什么,这将对我们有所帮助,这是我们的幸运日,python 已经有了这个功能,可以通过在额外详细模式下运行它来启用它-vv。
所以使用命令行:python -vv -c 'import pkg.b':
Python 2.6.5 (r265:79063, Apr 16 2010, 13:57:41)
[GCC 4.4.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
import pkg # directory pkg
# trying pkg/__init__.so
# trying pkg/__init__module.so
# trying pkg/__init__.py
# pkg/__init__.pyc matches pkg/__init__.py
import pkg # precompiled from pkg/__init__.pyc
# trying pkg/b.so
# trying pkg/bmodule.so
# trying pkg/b.py
# pkg/b.pyc matches pkg/b.py
import pkg.b # precompiled from pkg/b.pyc
# trying pkg/a.so
# trying pkg/amodule.so
# trying pkg/a.py
# pkg/a.pyc matches pkg/a.py
import pkg.a # precompiled from pkg/a.pyc
# clear[2] __name__
# clear[2] __file__
# clear[2] __package__
# clear[2] __name__
# clear[2] __file__
# clear[2] __package__
...
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "pkg/b.py", line 1, in <module>
from . import a
File "pkg/a.py", line 2, in <module>
from . import a
ImportError: cannot import name a
# clear __builtin__._
嗯,ImportError 之前发生了什么?
首先) 调用pkg/b.py 中的from . import a,如前所述将其翻译为from pkg import a,在字节码中又相当于import pkg; getattr(pkg, 'a')。但是等一下a 也是一个模块?!
如果我们有类似from module|package import module 的东西,那么有趣的部分就来了,在这种情况下,将发生第二次导入,即在 import 子句中导入模块。因此,在 OP 示例中,我们现在需要导入pkg/a.py,首先我们在sys.modules 中为我们的新模块设置一个密钥pkg.a,然后我们继续解释模块pkg/a.py,但在模块 pkg/a.py 完成导入之前调用 from . import b。
现在是 Second) 部分,pkg/b.py 将被导入,然后它将首先尝试import pkg,因为pkg 已经导入,所以有一个密钥@987654369 @ 在我们的sys.modules 中,它只会返回该键的值。然后它将import b 设置pkg.b 键在sys.modules 并开始解释。我们到达这条线from . import a!
但是记住pkg/a.py已经被导入,这意味着('pkg.a' in sys.modules) == True所以导入会被跳过,只会调用getattr(pkg, 'a'),但是会发生什么? python没有完成导入pkg/a.py!?所以只会调用getattr(pkg, 'a'),这会在import_from()函数中引发AttributeError,它会被翻译成ImportError(cannot import name a)。
免责声明:这是我自己努力了解解释器内部发生的事情,我离成为专家还很遥远。
编辑:这个答案被改写了,因为当我尝试再次阅读它时,我注意到我的答案是如何表述错误的,希望现在它会更有用:)