NCF参数化建筑论坛

标题: Text Distance电池的解释 [打印本页]

作者: 露水2    时间: 2016-10-18 14:17
标题: Text Distance电池的解释
前言:Text Distance比较费解并且用的少。通过搜索测试大概知道用法。让月月看过说有点费解,不发就浪费了。
[attach]45362[/attach]
解释:就是一个字符串A到字符串B的最短转换。
过程:移动为0,替换为1,插入为1,添加为1。
例子如下:a-》a 移动为0;b-》d替换为1;c-》e替换1;f为添加1。
[attach]45363[/attach]
上图返回结果:0+1+1+1=3
参数C:布尔值,当为False时不区分大小写,当为True时区分大小写。
[attach]45364[/attach][attach]45365[/attach]
用法:DNA分析 拼字检查 语音辨识 抄袭侦测。前三个是从程序用的。
C#字符串相似度算法Levenshtein Distance
假如上述的过程还不明白,那就来一个清晰更看不懂的算法:
1、如果两个字符相等,左,上,左上三个位置中取出最小的值;
2、如果两个字符不等,左,上,左上三个位置中取出最小的值加1

上面不懂看下图:
[attach]45366[/attach]
用法测试下图:
[attach]45367[/attach]
值小就是相似度高,抄的。


作者: ly871108    时间: 2016-10-18 17:24
很赞……                                                   
作者: 回眸丶心已醉    时间: 2016-10-18 18:04
很赞。。。。。。
作者: skywoolf    时间: 2016-10-18 19:04
挺奇葩的,可以用来论文查重哈
作者: 露水2    时间: 2016-10-19 01:57
skywoolf 发表于 2016-10-18 19:04
挺奇葩的,可以用来论文查重哈

测试了一篇文章,加空格,符号后,可以通过去掉这些,再比较,变换距离短,相似度比较高,基本可行。
作者: skywoolf    时间: 2016-10-19 13:32
露水2 发表于 2016-10-19 01:57
测试了一篇文章,加空格,符号后,可以通过去掉这些,再比较,变换距离短,相似度比较高,基本可行。

挺有意思,还没想到这个运算器应用的案例。
作者: Martini    时间: 2016-11-16 10:32
不能理解出工程应用的情况,有望楼主能多多研发,期待后续更新。
作者: haorenn    时间: 2016-11-21 16:48
这也行啊。太厉害了。给跪。
作者: lzeaf    时间: 2016-12-7 14:57
这个很不错啊!!!!!!!!!!!!!!!!




欢迎光临 NCF参数化建筑论坛 (http://bbs.ncf-china.com/) Powered by Discuz! X3.2