在自然语言处理界,模式匹配可以说是最常用的技术。甚至可以说,将NLP技术作为真实生产力的项目都少不了模式匹配。
什么是模式匹配呢?在计算机科学中,往往是检查给定的序列或字符串中是否有符合某种模式的片段。比如说:“啊,你的AK-47打得真准”,如果我们将 “啊,你的_____打得真准 ” 作为一种模式,则会将AK-47匹配出来。
实现模式匹配往往都是用正则表达式,但是如果你想识别特别复杂的模式,编写正则表达式就会变得非常非常麻烦。而Pampy这个项目能解决你不少的烦恼。
1.安装
赶紧让我们来试一下,安装Pampy前,你要确保Python和pip已经成功安装在电脑上噢,如果没有,请访问这篇文章:超详细Python安装指南。
打开Cmd(开始—运行—CMD)或Terminal(command+空格输入Terminal). 输入以下命令安装Pampy:
pip install pampy
看到 Successfully installed pampy-0.3.0 则说明安装成功。
2.使用
特性1: HEAD 和 TAIL
HEAD和TAIL能代表某个模式的前面部分或后面部分。
比如将特定模式后的元素都变成元组:
from pampy import match, HEAD, TAIL, _ x = [-1, -2, -3, 0, 1, 2, 3] print(match(x, [-1, TAIL], lambda t: [-1, tuple(t)])) # => [-1, (-2, -3, 0, 1, 2, 3)]
将特定模式前的元素设为集合,后面的元素设为元组:
from pampy import match, HEAD, TAIL, _ x = [-1, -2, -3, 0, 1, 2, 3] print(match(x, [HEAD, _, _, 0, TAIL], lambda h, a, b, t: (set([h, a, b]), tuple(t)))) # => ({-3, -1, -2}, (1, 2, 3))
特性2:甚至能匹配字典中的键
在你不知道哪个键下有某个值的时候,这招非常好用:
from pampy import match, HEAD, TAIL, _ my_dict = { 'global_setting': [1, 3, 3], 'user_setting': { 'face': ['beautiful', 'ugly'], 'mind': ['smart', 'stupid'] } } result = match(my_dict, { _: {'face': _}}, lambda key, son_value: (key, son_value)) print(result) # => ('user_setting', ['beautiful', 'ugly'])
特性3: 搭配正则
不仅如此,它还能搭配正则一起使用哦:
import re from pampy import match, HEAD, TAIL, _ def what_is(pet): return match(pet, re.compile('(\w+),(\w)\w+鳕鱼$'), lambda mygod, you: you + "像鳕鱼", ) print(what_is('我的天,你长得真像鳕鱼')) # => '你像鳕鱼'
我们的文章到此就结束啦,如果你希望我们今天的Python 教程,请持续关注我们,如果对你有帮助,麻烦在下面点一个赞/在看哦
Python实用宝典 (pythondict.com)
不只是一个宝典
欢迎关注公众号:Python实用宝典