首页 > python如何处理中英文混排的最长公共前缀?

python如何处理中英文混排的最长公共前缀?

比如:
str1 = "我是a good boy" str2 = "我是a bad boy"

两者的公共前缀为:我是a

def longestprefix(str1, str2):
    if str1 == str2:
        return str1
    return '' if str1[0] != str2[0] else str1[0] + longestprefix(str1[1:], str2[1:])

Python 3.4 测试可以, 2.x 没尝试


其实我想说,如果楼主强调的是“中英文混排”这件事的话,那么如果两个字符串的同为unicode,或者采用了相同的字节编码方式的话,应该中英文混排这件事其实是没有区别的。

采用unicode时,每个汉字或者每个英文都是一个完整的字符;采用比如utf-8编码时,每个汉字是3个字节,每个英文是一个字节,那么依然不影响前缀的比较


os.path.commonprefix((str1, str2))


引自 os.path.commonprefix,参数可以是任意数量的list

def commonprefix(m):
    if not m: return ''
    s1 = min(m)
    s2 = max(m)
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1

commonprefix(['我是a good boy', '我是a bad boy'])

如果只需要两个字符串,可以简化为

def commonprefix(s1, s2):
    for i, c in enumerate(s1):
        if c != s2[i]:
            return s1[:i]
    return s1

转化為list

【热门文章】
【热门文章】