【Python之路】第二篇--初识Python

　　Python可以应用于众多领域，如：数据分析、组件集成、网络服务、图像处理、数值计算和科学计算等众多领域。目前业内几乎所有大中型互联网企业都在使用Python，如：Youtube、Dropbox、BT、Quora（中国知乎）、豆瓣、知乎、Google、Yahoo!、Facebook、NASA、百度、腾讯、汽车之家、美团等。互联网公司广泛使用Python来做的事一般有：自动化运维、自动化测试、大数据分析、爬虫、Web 等。

Python的种类

Cpython
Python的官方版本，使用C语言实现，使用最为广泛，CPython实现会将源文件（py文件）转换成字节码文件（pyc文件），然后运行在Python虚拟机上。
Jyhton
Python的Java实现，Jython会将Python代码动态编译成Java字节码，然后在JVM上运行。
IronPython
Python的C#实现，IronPython将Python代码编译成C#字节码，然后在CLR上运行。（与Jython类似）
PyPy（特殊）
Python实现的Python，具有JIT(just In time)Compiler , 将Python的字节码字节码再编译成机器码。
RubyPython、Brython ...

代码常见的执行方式：

　　（1）编译执行，在程序运行之前，通过编译器将代码转换为CPU指令（机器码），运行的时候就不需要翻译，可以直接执行这些指令，好处当然是非常快，一条多余的指令都没有；坏处则是难以支持许多动态特性。

　　（2）解释执行，在程序运行时，解释一条，执行一条。也就是对每条语句在运行时用解释器去执行它相应的动作，好处是实现起来非常简单，也很容易添加新特性，坏处则是执行得非常慢，大部分CPU时间花在了解释器运行上面。

　　（3）JIT编译，是动态编译（运行时编译）的特例，技术是两者的结合，首先让代码解释执行，同时收集信息，当发现某个代码或代码块运行得特别频繁时，会把这些代码认定为热点代码，在收集到足够信息的时候，（通过检查栈顶代码，或者计数器检测等）将这些热点代码动态编译成CPU指令，然后用CPU指令替代解释执行的过程，因为编译发生在马上要执行之前，所以叫做Just-In-Time Compiler。编译之后速度就是编译执行的速度了，自然比解释执行要快得多，所以运用JIT的PyPy要比CPython快不少。

　　Python和Java、C#一样，是一门基于虚拟机的语言，在程序运行之前先编译成字节码，然后通过解释器解释执行。

　　PyCodeObject是Python编译器真正编译成的结果，当程序运行时，编译的结果放在内存中的PyCodeObject中，当程序运行结束时，Python解释器将PyCodeObject写回到pyc文件中；

　　当程序第二次执行时，会首先寻找pyc文件，判断pyc文件与py文件的修改时间，决定是否直接执行pyc文件。可以说pyc文件是PyCodeObject的一种持久化保存方式。

安装Python

　　windows：

1、下载安装包
    https://www.python.org/downloads/

2、安装
    默认安装路径：C:\python27

3、配置环境变量
    【右键计算机】--》【属性】--》【高级系统设置】--》【高级】--》【环境变量】--》【在第二个内容框中找到 变量名为Path 的一行，双击】 --> 【Python安装目录追加到变值值中，用 ； 分割】
    如：原来的值 ;C:\python27 切记前面有分号!!

　　Linux:

无需安装，原装Python环境
ps：如果自带2.6，请更新至2.7

更新Python:

　　Windows:

卸载重装即可

　　Linux:

Linux的yum依赖自带Python，为防止错误，此处更新其实就是再安装一个Python

查看默认Python版本
python -V
  
1、安装gcc，用于编译Python源码
    yum install gcc
2、下载源码包，https://www.python.org/ftp/python/
3、解压并进入源码文件
4、编译安装
    ./configure
    make all
    make install
5、查看版本
    /usr/local/bin/python2.7 -V
6、修改默认Python版本
    mv /usr/bin/python /usr/bin/python2.6
    ln -s /usr/local/bin/python2.7 /usr/bin/python
7、防止yum执行异常，修改yum使用的Python版本
    vi /usr/bin/yum
    将头部 #!/usr/bin/python 修改为 #!/usr/bin/python2.6

Python 入门

一、解释器

我们经常在py脚本的第一行看到如下的代码:

#!/usr/bin/python　　或者　　#!/usr/bin/env python　　那么它的作用是?

　　#!/usr/bin/Python 是告诉操作系统执行这个脚本的时候，调用/usr/bin下的python解释器；

　　#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。

　　当系统看到这一行的时候，首先会到env设置里查找python的安装路径，再调用对应路径下的解释器程序完成操作。推荐这种写法

　　如此一来，我们就可以通过： ./hello.py 执行即可。

　　ps：执行前需给予 hello.py 执行权限，chmod 755 hello.py

二、内容编码

　　python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill）

　　显然ASCII码无法将世界上的各种文字和符号全部表示，所以，就需要新出一种可以代表所有字符和符号的编码，即：Unicode

　　Unicode（统一码、万国码、单一码）是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，规定虽有的字符和符号最少由 16 位来表示（2个字节），即：2 **16 = 65536，注：此处说的的是最少2个字节，可能更多

　　UTF-8，是对Unicode编码的压缩和优化，他不再使用最少使用2个字节，而是将所有的字符和符号进行分类：ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存，东亚的字符用3个字节保存...

　　所以，python解释器在加载 .py 文件中的代码时，会对内容进行编码（默认ascill），如果是如下代码的话：

　　报错：ascii码无法表示中文

#!/usr/bin/env python
  
print "你好，世界"

改正：应该显示的告诉python解释器，用什么编码来执行源代码，即：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
  
print "你好，世界"

Python2 中字符串的类型：

　　Str：Bytes 类型

　　Unicode：unicode 类型

# coding:utf8

s = '你好'
print len(s)     # 6
print type(s)   #  <str>
print repr(s)   #  utf8格式 : '\xe4\xbd\xa0\xe5\xa5\xbd'

# Unicode 形式:

s = u'你好'
print len(s)     # 2
print type(s)   #  <unicode>
print repr(s)   #  u'\u4f60\u597d'

# bytes 与 Unicode 混用拼接
print 'hello'+u'world'      # 先把 bytes => unicode
print '你好'+u'世界'         # 报错, 只能将Ascii码转换，其余字符不行！

Python3 中字符串的类型：

　　Str：Unicode 类型

　　Bytes：Bytes 类型

# bytes 与 Unicode 混用拼接
print 'hello'+b'world'      # 报错，严格区分str和bytes

Python 编码形式：

【Python之路】第二篇--初识Python

Python 编码方式有两种：

s = 'hello'
b = b'hello'

#  编码 encode  Str => Bytes
s.encode('utf8')
bytes(s,encoding='utf8')

#  解码 decode  Bytes => Str  (需要知道原先的编码格式 utf8 or GBK ..)
b.decode('utf8')                 
str(s,encoding='utf8')

cmd 下的字符显示问题：

print('你好')

# py2下为bytes 类型，根据cmd的编码形式去显示 修改为：print(u'你好')
# py3下为unicode 类型，正常显示，符合ISO统一标准的，

查看.py文件的编码格式：

import sys
print sys.getdefaultencoding()

# py2: ascii
# py3: utf8

print问题：

在py2里

# coding:utf8
print('你好')           # 你好
print(['你好','hello']) # ['\xe4\xbd\xa0\xe5\xa5\xbd', 'hello']

在py3里

# coding:utf8
print('你好')            # 你好
print(['你好','hello'])  # ['你好', 'hello']

Python 中，print语句都会执行了：str()

# python2
sys.stdout.write(str(A) + '\n')

栗子：py3，将中文字符转换成二进制（ bytes类型进行 for循环 print，会输出10进制数 ! ）

name = "李路"

len(name)
#长度等于2

for i in name:
    print(i)
    bytes_list = bytes(i , encoding='utf-8')
    print(bytes_list )
    for b in bytes_list:
        print(b,bin(b))

#李
#b'\xe6\x9d\x8e'
#230 0b11100110
#157 0b10011101
#142 0b10001110
#路
#b'\xe8\xb7\xaf'
#232 0b11101000
#183 0b10110111
#175 0b10101111

Str 与 Bytes

x = str()
# 功能:
# 1.创建字符串
# 2.转换成字符串	  编码类型

x = bytes()
# 功能:
# 1.创建字节
# 2.转换成字节	编码类型

def __init__(self, value='', encoding=None, errors='strict'): # known special case of str.__init__
        """
        str(object='') -> str
        str(bytes_or_buffer[, encoding[, errors]]) -> str
        
        Create a new string object from the given object. If encoding or
        errors is specified, then the object must expose a data buffer
        that will be decoded using the given encoding and error handler.
        Otherwise, returns the result of object.__str__() (if defined)
        or repr(object).
        encoding defaults to sys.getdefaultencoding().
        errors defaults to 'strict'.
        # (copied from class doc)
        """
        pass

str