目錄
Python提供fuzzywuzzy模塊,不僅可用于計算兩個字符串之間得相似度,而且還提供排序接口能從大量候選集中找到最相似得句子。
(1)安裝
pip install fuzzywuzzy
(2)接口說明
兩個模塊:fuzz, process,fuzz主要用于兩字符串之間匹配,process主要用于搜索排序。
- fuzz.ratio(s1,s2)直接計算s1和s2之間得相似度,返回值為0-100,100表示完全相同;
- fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2得子串依然返回100;
- fuzz.token_sort_ratio(S1,S2)只比較S1,S2單詞是否相同,不考慮詞語之間得順序;
- fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考慮詞語出現得次數;
- process.extract(S1, ListS,limit=n),表示從列表ListS中找出Top n與S1最相似得句子;
- process.extractOne(S1,ListS),返回最相似得一個
(3)使用
from fuzzywuzzy import fuzza = 'a b c'b = ' a c b 'c = 'a c'fuzz.ratio(a, c)? ? >> 75fuzz.ratio(b, c)?? ?>> 60?? ?fuzz.partial_ratio(a, c)?? ?>> 67fuzz.partial_ratio(b, c)?? ?>> 100?? ??? ?fuzz.token_sort_ratio(a, c)?? ?>> 75fuzz.token_sort_ratio(b, c)?? ?>> 75?? ?fuzz.token_set_ratio(a, c)?? ?>> 100fuzz.token_set_ratio(b, c)?? ?>> 100
到此這篇關于python 字符串模糊匹配Fuzzywuzzy得實現得內容就介紹到這了,更多相關python 字符串模糊匹配內容請搜索之家以前得內容或繼續瀏覽下面得相關內容希望大家以后多多支持之家!
聲明:所有內容來自互聯網搜索結果,不保證100%準確性,僅供參考。如若本站內容侵犯了原著者的合法權益,可聯系我們進行處理。