字符串相似度
计算两个字符串之间的相似度(编辑距离算法),实时计算
字符串 1
字符串 2
输入两个字符串后自动计算
功能介绍
基于 Levenshtein 编辑距离算法的字符串相似度计算工具,计算两个字符串的相似度百分比和编辑距离。支持中英文混合,适用于模糊匹配、拼写纠错、数据去重和查重检测。
关键特点
- 支持多种相似度算法
- 显示相似度百分比
- 显示编辑距离
- 支持中英文混合计算
- 显示编辑距离
- 纯前端运行
常见问题
什么是 Levenshtein 距离?
Levenshtein 距离是将一个字符串转换为另一个字符串所需的最少编辑操作次数(插入、删除、替换)。
编辑距离算法适用于中文吗?
适用于中文。编辑距离对中文每个字符同样计算插入、删除、替换的次数。配合分词技术可以更精确地计算中文文本相似度。
相似度多少算高?
一般 80% 以上表示两段文本高度相似,60-80% 表示部分相似,60% 以下表示差异较大。具体阈值因应用场景而异。