1importre 2cjkReg = re.compile(u'[\u1100-\uFFFDh]+?') 3trimedCJK = cjkReg.sub( ' a ', inputString, 0)# replace the CJK with the word a 4returnlen(trimedCJK.split())
做过一部分测试,与Word里面的字数统计数目一样,不过不知道是不是还有问题。
1.1. 反馈
MicroProj/2007-05-08 (last edited 2009-12-25 07:10:03 by localhost)