Python可以应用于众多领域,如:数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python,如:Youtube、Dropbox、BT、Quora(中国知乎)、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。互联网公司广泛使用Python来做的事一般有:自动化运维、自动化测试、大数据分析、爬虫、Web 等。
Python的种类
- Cpython
Python的官方版本,使用C语言实现,使用最为广泛,CPython实现会将源文件(py文件)转换成字节码文件(pyc文件),然后运行在Python虚拟机上。 - Jyhton
Python的Java实现,Jython会将Python代码动态编译成Java字节码,然后在JVM上运行。 - IronPython
Python的C#实现,IronPython将Python代码编译成C#字节码,然后在CLR上运行。(与Jython类似) - PyPy(特殊)
Python实现的Python,具有JIT(just In time)Compiler , 将Python的字节码字节码再编译成机器码。 - RubyPython、Brython ...
代码常见的执行方式:
(1)编译执行,在程序运行之前,通过编译器将代码转换为CPU指令(机器码),运行的时候就不需要翻译,可以直接执行这些指令,好处当然是非常快,一条多余的指令都没有;坏处则是难以支持许多动态特性。
(2)解释执行,在程序运行时,解释一条,执行一条。也就是对每条语句在运行时用解释器去执行它相应的动作,好处是实现起来非常简单,也很容易添加新特性,坏处则是执行得非常慢,大部分CPU时间花在了解释器运行上面。
(3)JIT编译,是动态编译(运行时编译)的特例,技术是两者的结合,首先让代码解释执行,同时收集信息,当发现某个代码或代码块运行得特别频繁时,会把这些代码认定为热点代码,在收集到足够信息的时候,(通过检查栈顶代码,或者计数器检测等)将这些热点代码动态编译成CPU指令,然后用CPU指令替代解释执行的过程,因为编译发生在马上要执行之前,所以叫做Just-In-Time Compiler。编译之后速度就是编译执行的速度了,自然比解释执行要快得多,所以运用JIT的PyPy要比CPython快不少。
Python和Java、C#一样,是一门基于虚拟机的语言,在程序运行之前先编译成字节码,然后通过解释器解释执行。
PyCodeObject是Python编译器真正编译成的结果,当程序运行时,编译的结果放在内存中的PyCodeObject中,当程序运行结束时,Python解释器将PyCodeObject写回到pyc文件中;
当程序第二次执行时,会首先寻找pyc文件,判断pyc文件与py文件的修改时间,决定是否直接执行pyc文件。可以说pyc文件是PyCodeObject的一种持久化保存方式。
安装Python
windows:
1、下载安装包
https://www.python.org/downloads/
2、安装
默认安装路径:C:\python27
3、配置环境变量
【右键计算机】--》【属性】--》【高级系统设置】--》【高级】--》【环境变量】--》【在第二个内容框中找到 变量名为Path 的一行,双击】 --> 【Python安装目录追加到变值值中,用 ; 分割】
如:原来的值 ;C:\python27 切记前面有分号!!
Linux:
无需安装,原装Python环境 ps:如果自带2.6,请更新至2.7
更新Python:
Windows:
卸载重装即可
Linux:
Linux的yum依赖自带Python,为防止错误,此处更新其实就是再安装一个Python
查看默认Python版本
python -V
1、安装gcc,用于编译Python源码
yum install gcc
2、下载源码包,https://www.python.org/ftp/python/
3、解压并进入源码文件
4、编译安装
./configure
make all
make install
5、查看版本
/usr/local/bin/python2.7 -V
6、修改默认Python版本
mv /usr/bin/python /usr/bin/python2.6
ln -s /usr/local/bin/python2.7 /usr/bin/python
7、防止yum执行异常,修改yum使用的Python版本
vi /usr/bin/yum
将头部 #!/usr/bin/python 修改为 #!/usr/bin/python2.6
Python 入门
一、解释器
我们经常在py脚本的第一行 看到如下的代码:
#!/usr/bin/python 或者 #!/usr/bin/env python 那么它的作用是?
#!/usr/bin/Python 是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器;
#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。
当系统看到这一行的时候,首先会到env设置里查找python的安装路径,再调用对应路径下的解释器程序完成操作。推荐这种写法
如此一来,我们就可以通过: ./hello.py 执行即可。
ps:执行前需给予 hello.py 执行权限,chmod 755 hello.py
二、内容编码
python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill)
显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,注:此处说的的是最少2个字节,可能更多
UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...
所以,python解释器在加载 .py 文件中的代码时,会对内容进行编码(默认ascill),如果是如下代码的话:
报错:ascii码无法表示中文
#!/usr/bin/env python print "你好,世界"
改正:应该显示的告诉python解释器,用什么编码来执行源代码,即:
#!/usr/bin/env python # -*- coding: utf-8 -*- print "你好,世界"
Python2 中字符串的类型:
Str:Bytes 类型
Unicode:unicode 类型
# coding:utf8 s = '你好' print len(s) # 6 print type(s) # <str> print repr(s) # utf8格式 : '\xe4\xbd\xa0\xe5\xa5\xbd' # Unicode 形式: s = u'你好' print len(s) # 2 print type(s) # <unicode> print repr(s) # u'\u4f60\u597d' # bytes 与 Unicode 混用拼接 print 'hello'+u'world' # 先把 bytes => unicode print '你好'+u'世界' # 报错, 只能将Ascii码转换,其余字符不行!
Python3 中字符串的类型:
Str:Unicode 类型
Bytes:Bytes 类型
# bytes 与 Unicode 混用拼接 print 'hello'+b'world' # 报错,严格区分str和bytes
Python 编码形式:
Python 编码方式有两种:
s = 'hello' b = b'hello' # 编码 encode Str => Bytes s.encode('utf8') bytes(s,encoding='utf8') # 解码 decode Bytes => Str (需要知道原先的编码格式 utf8 or GBK ..) b.decode('utf8') str(s,encoding='utf8')
cmd 下的字符显示问题:
print('你好') # py2下为bytes 类型,根据cmd的编码形式去显示 修改为:print(u'你好') # py3下为unicode 类型,正常显示,符合ISO统一标准的,
查看.py文件的编码格式:
import sys print sys.getdefaultencoding() # py2: ascii # py3: utf8
print问题:
在py2里
# coding:utf8 print('你好') # 你好 print(['你好','hello']) # ['\xe4\xbd\xa0\xe5\xa5\xbd', 'hello']
在py3里
# coding:utf8 print('你好') # 你好 print(['你好','hello']) # ['你好', 'hello']
Python 中,print语句都会执行了:str()
# python2
sys.stdout.write(str(A) + '\n')
栗子:py3,将中文字符转换成二进制( bytes类型进行 for循环 print,会输出10进制数 ! )
name = "李路"
len(name)
#长度等于2
for i in name:
print(i)
bytes_list = bytes(i , encoding='utf-8')
print(bytes_list )
for b in bytes_list:
print(b,bin(b))
#李
#b'\xe6\x9d\x8e'
#230 0b11100110
#157 0b10011101
#142 0b10001110
#路
#b'\xe8\xb7\xaf'
#232 0b11101000
#183 0b10110111
#175 0b10101111
Str 与 Bytes
x = str() # 功能: # 1.创建字符串 # 2.转换成字符串 编码类型 x = bytes() # 功能: # 1.创建字节 # 2.转换成字节 编码类型
def __init__(self, value='', encoding=None, errors='strict'): # known special case of str.__init__ """ str(object='') -> str str(bytes_or_buffer[, encoding[, errors]]) -> str Create a new string object from the given object. If encoding or errors is specified, then the object must expose a data buffer that will be decoded using the given encoding and error handler. Otherwise, returns the result of object.__str__() (if defined) or repr(object). encoding defaults to sys.getdefaultencoding(). errors defaults to 'strict'. # (copied from class doc) """ pass