最近在做文本匹配，想到了特征值的算法，自己写了一个文本计算算法。求批判。

之前有个需求，就是比较2个文本是否相近。

最牛逼的方法就是用语义去分析，然后比较结果。可是这个性能是在不敢恭维，于是想起了以前做过的人脸识别，使用特征值去操作。

人脸识别当是时把图片转变为一维向量，然后计算特征值。最终发现，如果是文本计算特征值，把文本的字符串输入后，简单的简化为每个char自相乘，再相加 = 向量的模的平方。

例如：

HI = (char 72)(char 73).

eigenValue = 72*72+73*73.

这样，IH的结果和HI就是一样了。而且另外一个问题就是char的取值范围是0~255。如果对文本检测，那么很快就会超过了double的长度了。针对这些问题，我自己想到了一个算法。

        public static double GetStringEigenValue(string value)
        {
            if (string.IsNullOrEmpty(value))
                return 0;

            double length = value.Length;

            double eigenvalue = 0;

            int index = 1;

            foreach (char str in value)
            {
                double strnum = (double)str;

                eigenvalue += (strnum * strnum) / 100000 * index++;
            }

            //计算由于每个位置添加了权重，导致最终值增加的值

            double weightfactor = (length - 1) * 255 * 255 / 100000 + (length - 1) * (length - 2) * 255 * 255 / 2 / 100000;

            if (weightfactor == 0)
                weightfactor = 1;

            weightfactor = Math.Ceiling(Math.Log10(weightfactor));

            if (weightfactor == 0)
                weightfactor = 1;

            eigenvalue /= weightfactor;

            eigenvalue /= length;

            return length + eigenvalue;
        }