Python 2與Python 3版本和編碼的對比

一、版本對比

首先要說的是,Python的版本,目前主要分為兩大類:

Python 2.x的版本的,被稱為Python2:是目前用的最廣泛的,比如Python 2.7.3。

Python 3.x的版本的,被稱為Python3:是最新的版本的,比如Python 3.1。長遠來看,也算是以后的趨勢。

【Python2和Python3之間的區別】

1.從Python2到Python3,很多基本的函數接口變了,甚至是,有些庫或函數被去掉了,改名了

 Python2和Python3,在很多基本的,最常用的函數方面,接口都變了,最典型的就要數大家最常用的print函數了。

2.第三方庫的支持方面,目前來說,還是Python2支持的最好,Python3支持的不太夠

 Python強大的原因之一是第三方的庫很多,功能很強大。

 而目前很多Python的第三方的庫,很多只提供Python2的。

 或者是即使提供了Python3的,但是也不一定很成熟。

二、編碼對比

在 Python 中,不論是 Python2 還是 Python3 中,總體上說,字符都只有兩大類:

  1. 通用的 Unicode 字符;
  2. (unicode 被編碼后的)某種編碼類型的字符,比如 UTF-8,GBK 等類型的字符。

Python2 中字符的類型:

  • str: 已經編碼后的字節序列
  • unicode: 編碼前的文本字符

Python3 中字符的類型:

  • str: 編碼過的 unicode 文本字符
  • bytes: 編碼前的字節序列

我們可以認為字符串有兩種狀態,即文本狀態和字節(二進制)狀態。Python2 和 Python3 中的兩種字符類型都分別對應這兩種狀態,然后相互之間進行編解碼轉化。編碼就是將字符串轉換成字節碼,涉及到字符串的內部表示;解碼就是將字節碼轉換為字符串,將比特位顯示成字符。

在 Python2 中,str 和 unicode 都有 encode 和 decode 方法。但是不建議對 str 使用 encode,對 unicode 使用 decode, 這是 Python2 設計上的缺陷。Python3 則進行了優化,str 只有一個 encode 方法將字符串轉化為一個字節碼,而且 bytes 也只有一個 decode 方法將字節碼轉化為一個文本字符串。

Python2 的 str 和 unicode 都是 basestring 的子類,所以兩者可以直接進行拼接操作。而 Python3 中的 bytes 和 str 是兩個獨立的類型,兩者不能進行拼接。

Python2 中,普通的,用引號括起來的字符,就是 str;此時字符串的編碼類型,對應著你的 Python 文件本身保存為何種編碼有關,最常見的 Windows 平臺中,默認用的是 GBK。Python3 中,被單引號或雙引號括起來的字符串,就已經是 Unicode 類型的 str 了。

對于 str 為何種編碼,有一些前提:

  1. Python 文件開始已經聲明對應的編碼
  2. Python 文件本身的確是使用該編碼保存的
  3. 兩者的編碼類型要一樣(比如都是 UTF-8 或者都是 GBK 等)

這樣 Python 解析器才能正確的把文本解析為對應編碼的 str。

總體來說,在 Python3 中,字符編碼問題得到了極大的優化,不再像 Python2 那么頭疼。在 Python3 中,文本總是 Unicode, 由 str 類型進行表示,二進制數據使用 bytes 進行表示,不會將 str 與 bytes 偷偷的混在一起,使得兩者的區別更加明顯。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家學習或使用python能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。


所屬標簽

無標簽

25选5玩法中奖