加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

C#字符串相似度比较

发布时间:2020-12-15 17:56:38 所属栏目:百科 来源:网络整理
导读:今天PHP站长网 52php.cn把收集自互联网的代码分享给大家,仅供参考。 C#字符串相似度比较 编辑距离算法最先是由俄国科学家Levenshtein提出的,所以这个算法也叫做Levenshtein Distance算法。用最简单的一句话来说明这个算

以下代码由PHP站长网 52php.cn收集自互联网

现在PHP站长网小编把它分享给大家,仅供参考

C#字符串相似度比较
编辑距离算法最先是由俄国科学家Levenshtein提出的,所以这个算法也叫做Levenshtein Distance算法。用最简单的一句话来说明这个算法就是:通过插入、删除、替换方法将字符串A变成字符串B所有的步骤就是算法中提到的编辑距离,最简 单的相似度即编辑距离的倒数。
public class LevenshteinDistance 
{ 
    #region 私有变量 
    /// <summary> 
    /// 字符串1 
    /// </summary> 
    private char[] _ArrChar1; 
    /// <summary> 
    /// 字符串2 
    /// </summary> 
    private char[] _ArrChar2; 
    /// <summary> 
    /// 统计结果 
    /// </summary> 
    private Result _Result; 
    /// <summary> 
    /// 开始时间 
    /// </summary> 
    private DateTime _BeginTime; 
    /// <summary> 
    /// 结束时间 
    /// </summary> 
    private DateTime _EndTime; 
    /// <summary> 
    /// 计算次数 
    /// </summary> 
    private int _ComputeTimes; 
    /// <summary> 
    /// 算法矩阵 
    /// </summary> 
    private int[,] _Matrix; 
    /// <summary> 
    /// 矩阵列数 
    /// </summary> 
    private int _Column; 
    /// <summary> 
    /// 矩阵行数 
    /// </summary> 
    private int _Row; 
    #endregion 
    #region 属性 
    public Result ComputeResult 
    { 
        get { return _Result; } 
    } 
    #endregion 
    #region 构造函数 
    public LevenshteinDistance(string str1,string str2) 
    { 
        this.LevenshteinDistanceInit(str1,str2); 
    } 
    public LevenshteinDistance() 
    { 
    } 
    #endregion 
    #region 算法实现 
    /// <summary> 
    /// 初始化算法基本信息 
    /// </summary> 
    /// <param name="str1">字符串1</param> 
    /// <param name="str2">字符串2</param> 
    private void LevenshteinDistanceInit(string str1,string str2) 
    { 
        _ArrChar1 = str1.ToCharArray(); 
        _ArrChar2 = str2.ToCharArray(); 
        _Result = new Result(); 
        _ComputeTimes = 0; 
        _Row = _ArrChar1.Length + 1; 
        _Column = _ArrChar2.Length + 1; 
        _Matrix = new int[_Row,_Column]; 
    } 
    /// <summary> 
    /// 计算相似度 
    /// </summary> 
    public void Compute() 
    { 
        //开始时间 
        _BeginTime = DateTime.Now; 
        //初始化矩阵的第一行和第一列 
        this.InitMatrix(); 
        int intCost = 0; 
        for (int i = 1; i < _Row; i++) 
        { 
            for (int j = 1; j < _Column; j++) 
            { 
                if (_ArrChar1[i - 1] == _ArrChar2[j - 1]) 
                { 
                    intCost = 0; 
                } 
                else 
                { 
                    intCost = 1; 
                } 
                //关键步骤,计算当前位置值为左边+1、上面+1、左上角+intCost中的最小值  
                //循环遍历到最后_Matrix[_Row - 1,_Column - 1]即为两个字符串的距离 
                _Matrix[i,j] = this.Minimum(_Matrix[i - 1,j] + 1,_Matrix[i,j - 1] + 1,_Matrix[i - 1,j - 1] + intCost); 
                _ComputeTimes++; 
            } 
        } 
        //结束时间 
        _EndTime = DateTime.Now; 
        //相似率 移动次数小于最长的字符串长度的20%算同一题 
        int intLength = _Row > _Column ? _Row : _Column; 
        _Result.Rate = (1 - (double)_Matrix[_Row - 1,_Column - 1] / intLength).ToString().Substring(0,6); 
        if (_Result.Rate.Length > 6) 
        { 
            _Result.Rate = _Result.Rate.Substring(0,6); 
        } 
        _Result.UseTime = (_EndTime - _BeginTime).ToString(); 
        _Result.ComputeTimes = _ComputeTimes.ToString() + " 距离为:" + _Matrix[_Row - 1,_Column - 1].ToString(); 
    } 
    /// <summary> 
    /// 计算相似度 
    /// </summary> 
    /// <param name="str1">字符串1</param> 
    /// <param name="str2">字符串2</param> 
    public void Compute(string str1,str2); 
        this.Compute(); 
    } 
    /// <summary> 
    /// 初始化矩阵的第一行和第一列 
    /// </summary> 
    private void InitMatrix() 
    { 
        for (int i = 0; i < _Column; i++) 
        { 
            _Matrix[0,i] = i; 
        } 
        for (int i = 0; i < _Row; i++) 
        { 
            _Matrix[i,0] = i; 
        } 
    } 
    /// <summary> 
    /// 取三个数中的最小值 
    /// </summary> 
    /// <param name="First"></param> 
    /// <param name="Second"></param> 
    /// <param name="Third"></param> 
    /// <returns></returns> 
    private int Minimum(int First,int Second,int Third) 
    { 
        int intMin = First; 
        if (Second < intMin) 
        { 
            intMin = Second; 
        } 
        if (Third < intMin) 
        { 
            intMin = Third; 
        } 
        return intMin; 
    } 
    #endregion 
} 
/// <summary> 
/// 计算结果 
/// </summary> 
public struct Result 
{ 
    /// <summary> 
    /// 相似度 
    /// </summary> 
    public string Rate; 
    /// <summary> 
    /// 对比次数 
    /// </summary> 
    public string ComputeTimes; 
    /// <summary> 
    /// 使用时间 
    /// </summary> 
    public string UseTime; 
}  

以上内容由PHP站长网【52php.cn】收集整理供大家参考研究

如果以上内容对您有帮助,欢迎收藏、点赞、推荐、分享。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读