也许喜欢怀念你: 一月 2007

2007年1月27日星期六

song

终于结束了

今晚的多媒体考试让我再次觉得花这么多钱进学校就是为了背那些花三块钱进公共图书馆就能查到的资料是多么没有意义。

有点乱，本想总结一下。很乱。桌上很乱，资料一堆。

明天去ibm培训，学习aix，原定计划取消。

昨晚见到赵本山。

2007年1月21日星期日

影片未分级天堂电影院

这个国家将性爱下流化了，将性爱踢出日常生活，做一个毫无性欲的人。

突然想起天堂电影院，ToTo回到故乡看着阿尔弗多留给他的胶片，泪流满面。屏幕上是那些无穷无尽的曾经被剪掉的接吻镜头。

我知道这不是一个好的例子。我喜欢天堂电影院。

2007年1月18日星期四

早起

NBA某两队正在激烈对战，袁承志连续三次从不同角度不同手法地投篮，都被李连杰以相同手法从后面会盖了。袁承志一脸怒气。李连杰还是少林五祖般的面无表情。空气中充满了火药味，仿佛一切，一触即发。大屏幕上的时间显示的是00.70秒。

“叮铃铃，叮铃铃......”急促的电话声一阵接着一阵，有如夺命书生的剑。谁会在凌晨8：39打电话阿。是zhao的。梦醒时分，科学社会主义慢慢拉开帷幕，工人阶级第一次以独立的政治面目出现在历史舞台上。

又是一年秋收时，于无声处听惊雷。哪里有压迫，哪里就有反抗。

丙戌狗年十一月三十日考试于北航。

是为记。

2007年1月15日星期一

离散数学

离散数学：page 49

48. 分析电影评论家Roger Ebert的一段话：没有一个好的影片让人觉得很长，也没有一个差的影片让人觉得很短。“Love Actually”是个好影片，但是它很长.

答：我看过，影片很不错。好多明星，歌也很动听。

看网络看烦了，翻了一下《离散数学》（Richard Johnsonbaugh）。这本书还是在“第三热”和Zhongzhuo、Yuangui他们一起买的呢。不要告诉我中关村那个书店不叫“第三热”，我就不信那个也叫“极”字。

apihelper.py

def info(object, spacing=10, collapse=1):
    """Print methods and doc strings.
    
    Takes module, class, list, dictionary, or string."""
    methodList = [method for method in dir(object) if callable(getattr(object, method))]
    processFunc = collapse and (lambda s: " ".join(s.split())) or (lambda s: s)
    print "\n".join(["%s %s" %
                      (method.ljust(spacing),
                       processFunc(str(getattr(object, method).__doc__)))
                     for method in methodList])

if __name__ == "__main__":
    print info.__doc__

现在还不能看得很明白。一步一步来。

2007年1月14日星期日

连接 list 与分割字符串

3.7.1. 字符串方法的历史注解

您有了一个形如 = 的 key-value 对 list, 并且想将它们合成为单个字符串。为了将任意包含字符串的 list 连接成单个字符串, 可以使用字符串对象的 join 方法。

下面是一个在 buildConnectionString 函数中连接 list 的例子:

return ";".join(["%s=%s" % (k, v) for k, v in params.items()])

在我们继续之前有一个有趣的地方。我一直在重复函数是对象, 字符串是对象, 每个东西都是对象的概念。您也许认为我的意思是说字符串值是对象。但是不对, 仔细地看一下这个例子, 您将会看到字符串 ";" 本身就是一个对象, 您在调用它的 join 方法。

总之, join 方法将 list 中的元素连接成单个字符串, 每个元素用一个分号隔开。分隔符不必是一个分号；它甚至不必是单个字符。它可以是任何字符串。


	`join` 只能用于元素是字符串的 list; 它不进行任何的类型强制转换。连接一个存在一个或多个非字符串元素的 list 将引发一个异常。

例 3.27. `odbchelper.py` 的输出结果

>>> params = {"server":"mpilgrim", "database":"master", "uid":"sa", "pwd":"secret"}
>>> ["%s=%s" % (k, v) for k, v in params.items()]
['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> ";".join(["%s=%s" % (k, v) for k, v in params.items()])
'server=mpilgrim;uid=sa;database=master;pwd=secret'

上面的字符串是从 odbchelper 函数返回的, 被调用块打印出来, 这样就给出了您开始阅读本章时令人感到吃惊的输出结果。

您可能在想是否存在一个适当的方法来将字符串分割成一个 list。当然有, 它叫做 split。

例 3.28. 分割字符串

>>> li = ['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s = ";".join(li)
>>> s
'server=mpilgrim;uid=sa;database=master;pwd=secret'
>>> s.split(";")    
['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']
>>> s.split(";", 1) 
['server=mpilgrim', 'uid=sa;database=master;pwd=secret']

	`split` 与 `join` 正好相反, 它将一个字符串分割成多元素 list。注意, 分隔符 (“`;`”) 被完全去掉了, 它没有在返回的 list 中的任意元素中出现。
	`split` 接受一个可选的第二个参数, 它是要分割的次数。 (“哦, 可选参数...”, 您将会在下一章中学会如何在您自己的函数中使用它。)


	`.split(, 1)` 是一个有用的技术, 在您想要搜索一个子串, 然后处理字串前面的东西 (即 list 中第一个元素) 和其后的东西 (即 list 中第二个元素) 时, 使用这个技术。

进一步阅读

Python Knowledge Base 回答了关于字符串的常见问题 , 并且有许多使用字符串的例子代码。
Python Library Reference 总结了所有字符串方法。
Python Library Reference 提供了 string 模块的文档。
The Whole Python FAQ 解释了为什么 join 是字符串方法而不是 list 方法。

3.7.1. 字符串方法的历史注解

当我开始学 Python 时, 我以为 join 是 list 的方法, 它会使用分隔符作为一个参数。很多人都有同样的感觉, 在 join 方法的背后有一段故事。在 Python 1.6 之前, 字符串完全没有这些有用的方法。有一个独立的string 模块包含所有的字符串函数, 每个函数使用一个字符串作为它的第一个参数。这些函数被认为足够重要, 所以它们移到字符串中去了, 这就使得诸如 lower, upper 和 split 之类的函数是有意义的。但许多核心的Python 程序员反对新的 join 方法, 争论说应该换成是 list 的一个方法, 或不应该移动而仅仅保留为旧的string 模块 (现仍然还有许多有用的东西在里面) 的一部分。我只使用新的 join 方法, 但是您将会看到代码的其它写法, 并且如果它真的使您感到麻烦, 您可以使用旧的 string.join 函数来替代。

映射 list

Python 的强大特性之一是其对 list 的解析, 它提供一种紧凑的方法, 可以通过对 list 中的每个元素应用一个函数, 从而将一个 list 映射为另一个 list。

例 3.24. List 解析介绍

>>> li = [1, 9, 8, 4]
>>> [elem*2 for elem in li]      
[2, 18, 16, 8]
>>> li                           
[1, 9, 8, 4]
>>> li = [elem*2 for elem in li] 
>>> li
[2, 18, 16, 8]

	为了便于理解它, 让我们从右向左看。 `li` 是一个将要映射的 list。Python 循环遍历 `li` 中的每个元素。对于每个元素均执行如下操作, 首先临时将其值赋给变量 `elem`, 然后 Python 应用函数 `elem*2` 进行计算, 最后将计算结果追加到要返回的 list 中。
	需要注意是, 对 list 的解析并不改变原始的 list。
	将一个 list 的解析结果赋值给对其映射的变量是安全的。不用担心存在竞争情况或任何古怪事情的发生。Python 会在内存中创建新的 list, 当对 list 的解析完成时, Python 将结果赋给变量。(线程安全？不知道是不是这个意思？)

声明位于第 2 章的函数 buildConnectionString 对 list 的解析:

["%s=%s" % (k, v) for k, v in params.items()]

首先, 注意到您调用了dictionary params 的 items 函数。这个函数返回一个 dictionary 中所有数据的 tuple 的 list。

例 3.25. `keys`, `values` 和 `items` 函数

>>> params = {"server":"mpilgrim", "database":"master", "uid":"sa", "pwd":"secret"}
>>> params.keys()   
['server', 'uid', 'database', 'pwd']
>>> params.values() 
['mpilgrim', 'sa', 'master', 'secret']
>>> params.items()  
[('server', 'mpilgrim'), ('uid', 'sa'), ('database', 'master'), ('pwd', 'secret')]

	Dictionary 的 `keys` 方法返回一个所有键的 list。这个 list 没按 dictionary 定义的顺序输出 (记住, 元素在 dictionary 中是无序的), 但它是一个 list。
	`values` 方法返回一个所有值的 list。这个 list 以 `keys` 返回的 list 顺序输出, 所以对于所有的 `n`, `params.values()[n] == params[params.keys()[n]]` 。
	`items` 方法返回一个形如 `(, )` 的 tuple 的 list。这个 list 包括 dictionary 中所有的数据。

现在让我们看一看 buildConnectionString 做了些什么。它接收一个 list, params.items(), 通过对每个元素应用字符串格式化将其映射为一个新 list。这个新 list 将拥有与 params.items() 相同的元素数量, 在新 list 中的每个元素都将包含从 dictionary params 来的一个键和与其关联值的字符串。

例 3.26. `buildConnectionString` 中的 list 解析

>>> params = {"server":"mpilgrim", "database":"master", "uid":"sa", "pwd":"secret"}
>>> params.items()
[('server', 'mpilgrim'), ('uid', 'sa'), ('database', 'master'), ('pwd', 'secret')]
>>> [k for k, v in params.items()]                
['server', 'uid', 'database', 'pwd']
>>> [v for k, v in params.items()]                
['mpilgrim', 'sa', 'master', 'secret']
>>> ["%s=%s" % (k, v) for k, v in params.items()] 
['server=mpilgrim', 'uid=sa', 'database=master', 'pwd=secret']

	请注意我们正在使用两个变量对 list `params.items()` 进行遍历。这是多变量赋值的另一种用法。`params.items()` 的第一个元素是 `('server', 'mpilgrim')`, 所以在 list 解析的第一次遍历中, `k` 将为 `'server'`, `v` 将为 `'mpilgrim'`。在本例中, 我们忽略了返回 list 中 `v` 的值, 而只包含了 `k` 的值, 所以这个 list 解析最后等于 `params.keys()`。
	这里我们做着相同的事情, 但是忽略了 `k` 的值, 所以这个 list 解析最后等于 `params.values()`。
	用一些简单的字符串格式化将前面两个例子合并起来 , 我们就得到一个包括了 dictionary 中每个元素的 key-value 对的 list。这个看上去有点象程序的输出结果，剩下的就只是将这个 list 中的元素接起来形成一个字符串了。附： >>> freshfruit = [' banana', ' loganberry ', 'passion fruit '] >>> [weapon.strip() for weapon in freshfruit] ['banana', 'loganberry', 'passion fruit'] >>> vec = [2, 4, 6] >>> [3x for x in vec] [6, 12, 18] >>> [3x for x in vec if x > 3] [12, 18] >>> [3x for x in vec if x < 2] [] >>> [[x,x2] for x in vec] [[2, 4], [4, 16], [6, 36]] >>> [x, x2 for x in vec] # error - parens required for tuples File "", line 1, in ? [x, x2 for x in vec] ^ SyntaxError: invalid syntax >>> [(x, x2) for x in vec] [(2, 4), (4, 16), (6, 36)] >>> vec1 = [2, 4, 6] >>> vec2 = [4, 3, -9] >>> [xy for x in vec1 for y in vec2] [8, 6, -18, 16, 12, -36, 24, 18, -54] >>> [x+y for x in vec1 for y in vec2] [6, 5, -7, 8, 7, -5, 10, 9, -3] >>> [vec1[i]*vec2[i] for i in range(len(vec1))] [8, 12, -54]

2007年1月13日星期六

字符串的格式化

Python 支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式, 但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。


	在 Python 中, 字符串格式化使用与 C 中 `sprintf` 函数一样的语法。

例 3.21. 字符串的格式化

>>> k = "uid"
>>> v = "sa"
>>> "%s=%s" % (k, v) 
'uid=sa'

整个表达式计算结果为一个字符串。第一个 %s 被变量 k 的值替换；第二个 %s 被 v 的值替换。在字符串中所有其它的字符 (在这个例子中, 是等号) 按原样打印输出。

注意 (k, v) 是一个 tuple。我说过它们对某些东西有用。

您可能一直在想做了这么多工作只是为了做简单的字符串连接, 您想的不错, 只不过字符串格式化不只是连接。它甚至不仅仅是格式化。它也是强制类型转换。

例 3.22. 字符串格式化与字符串连接的比较

>>> uid = "sa"
>>> pwd = "secret"
>>> print pwd + " is not a good password for " + uid      
secret is not a good password for sa
>>> print "%s is not a good password for %s" % (pwd, uid) 
secret is not a good password for sa
>>> userCount = 6
>>> print "Users connected: %d" % (userCount, )            
Users connected: 6
>>> print "Users connected: " + userCount                 
Traceback (innermost last):
  File "", line 1, in ?
TypeError: cannot concatenate 'str' and 'int' objects

	`+` 是字符串连接操作符。
	在这个简单例子中, 字符串格式化实现与连接一样的结果。
	`(userCount, )` 是一个只包含一个元素的 tuple。是的, 语法有一点奇怪, 但是使用它的理由就是：显示地指出它是一个 tuple, 而不是其他。实际上, 当定义一个 list, tuple 或 dictionary 时, 您可以总是在最后一个元素后面跟上一个逗号, 但是当定义一个只包含一个元素的 tuple 时逗号是必须的。如果省略逗号, Python 不会知道 `(userCount)` 究竟是一个只包含一个元素的 tuple 还是变量 `userCount` 的值。
	字符串格式化通过将 `%s` 替换成 `%d` 即可处理整数。
	试图将一个字符串同一个非字符串连接会引发一个异常。与字符串格式化不同, 字符串连接只能在被连接的每一个都是字符串时起作用。

如同 printf 在 C 中的作用, Python 中的字符串格式化是一把瑞士军刀。它有丰富的选项, 不同的格式化格式符和可选的修正符用于不同的数据类型。

例 3.23. 数值的格式化

>>> print "Today's stock price: %f" % 50.4625   
50.462500
>>> print "Today's stock price: %.2f" % 50.4625 
50.46
>>> print "Change since yesterday: %+.2f" % 1.5 
+1.50

	`%f` 格式符选项被认为是一个十进制浮点数, 不指定精度时打印 6 位小数。
	使用包含 ".2" 精度修正符的 `%f` 格式符选项将只打印 2 位小数。
	您甚至可以混合使用各种修正符。添加 `+` 修正符用于在数值之前显示一个正号或负号。注意 ".2" 精度修正符仍旧在他原来的位置, 用于只打印 2 位小数。链接中是更详细的说明 http://www.python.org/doc/current/lib/typesseq-strings.html

变量声明

现在您已经了解了有关 dictionary, tuple, 和 list 的相关知识 (哦, 我的老天！), 让我们回到第 2 章的例子程序 odbchelper.py。

Python 与大多数其它语言一样有局部变量和全局变量之分, 但是它没有明显的变量声明。变量通过首次赋值产生, 当超出作用范围时自动消亡。

例 3.17. 定义 `myParams` 变量


if __name__ == "__main__":
    myParams = {"server":"mpilgrim", \
                "database":"master", \
                "uid":"sa", \
                "pwd":"secret" \
                }

首先注意缩进。 if 语句是代码块, 需要像函数一样缩进。

其次, 变量的赋值是一条被分成了多行的命令, 用反斜线 (“\”) 作为续行符。


	当一条命令用续行符 (“`\`”) 分割成多行时, 后续的行可以以任何方式缩近, 此时 Python 通常的严格的缩近规则无需遵守。如果您的 Python IDE 自由对后续行进行了缩近, 您应该把它当成是缺省处理, 除非您有特别的原因不这么做。

严格地讲, 在小括号, 方括号或大括号中的表达式 (如定义一个 dictionary) 可以用或者不用续行符 (“\”) 分割成多行。甚至在不是必需的时候, 我也喜欢使用续行符, 因为我认为这样会让代码读起来更容易, 但那只是风格的问题。

第三, 您从未声明过变量 myParams, 您只是给它赋了一个值。这点就象是 VBScript 没有设置 option explicit 选项一样。幸运的是, 与 VBScript 不同的是, Python 不允许您引用一个未被赋值的变量, 试图这样做会引发一个异常。

3.4.1. 变量引用

例 3.18. 引用未赋值的变量

>>> x
Traceback (innermost last):
  File "", line 1, in ?
NameError: There is no variable named 'x'
>>> x = 1
>>> x
1

迟早有一天您会为此而感谢 Python 。

3.4.2. 一次赋多值

Python 中比较 “酷” 的一种编程简写是使用序列来一次给多个变量赋值。

例 3.19. 一次赋多值

>>> v = ('a', 'b', 'e')
>>> (x, y, z) = v     
>>> x
'a'
>>> y
'b'
>>> z
'e'

v 是一个三元素的 tuple, 并且 (x, y, z) 是一个三变量的 tuple。将一个 tuple 赋值给另一个 tuple, 会按顺序将 v 的每个值赋值给每个变量。

这种用法有许多种用途。我经常想要将一定范围的值赋给多个变量。在 C 语言中, 可以使用 enum 类型, 手工列出每个常量和其所对应的值, 当值是连续的时候这一过程让人感到特别繁琐。而在 Python 中, 您可以使用内置的 range 函数和多变量赋值的方法来快速进行赋值。

例 3.20. 连续值赋值

>>> range(7)                                                                    
[0, 1, 2, 3, 4, 5, 6]
>>> (MONDAY, TUESDAY, WEDNESDAY, THURSDAY, FRIDAY, SATURDAY, SUNDAY) = range(7) 
>>> MONDAY                                                                      
0
>>> TUESDAY
1
>>> SUNDAY
6

	内置的 `range` 函数返回一个元素为整数的 list。这个函数的简化调用形式是接收一个上限值, 然后返回一个初始值从 0 开始的 list, 它依次递增, 直到但不包含上限值。 (如果您愿意, 您可以传入其它的参数来指定一个非 `0` 的初始值和非 `1` 的步长。也可以使用 `print range.__doc__` 来了解更多的细节。)
	`MONDAY`, `TUESDAY`, `WEDNESDAY`, `THURSDAY`, `FRIDAY`, `SATURDAY` 和 `SUNDAY` 是我们定义的变量。 (这个例子来自`calendar` 模块。它是一个很有趣的打印日历的小模块, 象 UNIX 的 `cal` 命令。这个 `calendar` 模块定义了一星期中每天的整数常量表示。)
	现在每个变量都拥有了自己的值: `MONDAY` 的值为 `0`, `TUESDAY` 的值为 `1`, 等等。

您也可以使用多变量赋值来创建返回多个值的函数, 只要返回一个包含所有值的 tuple 即可。调用者可以将其视为一个 tuple, 或将值赋给独立的变量。许多标准的 Python 库都是这样做的, 包括 os 模块, 将在第 6 章中讨论。

附：

range( [start,] stop[, step])

This is a versatile function to create lists containing arithmetic progressions. It is most often used in for loops. The arguments must be plain integers. If the step argument is omitted, it defaults to 1. If the start argument is omitted, it defaults to 0. The full form returns a list of plain integers [start, start + step, start + 2 * step, ...]. If step is positive, the last element is the largest start + i * step less than stop; if step is negative, the last element is the smallest start + i * step greater than stop. step must not be zero (or else ValueError is raised). Example:

>>> range(10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> range(1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> range(0, 30, 5)
[0, 5, 10, 15, 20, 25]
>>> range(0, 10, 3)
[0, 3, 6, 9]
>>> range(0, -10, -1)
[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]
>>> range(0)
[]
>>> range(1, 0)
[]

订阅：评论 (Atom)