ITKeyword,专注技术干货聚合推荐

注册 | 登录

数学之路(3)-机器学习(4)-综合应用-余弦相似度

u010255642 分享于 2013-06-15

推荐:数学之路(3)-机器学习(3)-机器学习算法-余弦相似度(3)

我们将余弦相似度应用于风景图片类型自动分类,我们为每个类型准备了2个样本图片,如果样本图片数量适当,分类精度将更高。 蓝天白云风景我们设为第一类 森林设为

2019阿里云全部产品优惠券(新购或升级都可以使用,强烈推荐)
领取地址https://promotion.aliyun.com/ntms/yunparter/invite.html

我用VB.NET制作了一个小程序,程序的功能是根据源图比较2张图哪张与源图更相似,完成对图片特征码的计算后,使用余弦相似度对2个图片进行比较,比较代码如上,两个向量间的余弦值可以很容易地通过使用欧几里得点积和量级公式推导:

\mathbf{a}\cdot\mathbf{b}=\left\|\mathbf{a}\right\|\left\|\mathbf{b}\right\|\cos\theta

鉴于两个向量的属性, A 和B的余弦相似性θ用一个点积形式来表示其大小,如下所示:

\text{similarity} = \cos(\theta) = {A \cdot B \over \|A\| \|B\|} = \frac{ \sum\limits_{i=1}^{n}{A_i \times B_i} }{ \sqrt{\sum\limits_{i=1}^{n}{(A_i)^2}} \times \sqrt{\sum\limits_{i=1}^{n}{(B_i)^2}} }

产生的相似性范围从-1到1:-1意味着两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0通常表示它们之间是独立的,而在这之间的值则表示中度的相似性或相异性。

本博客所有内容是原创,未经书面许可,严禁任何形式的转载。

http://blog.csdn.net/u010255642

 

转自我的另一个ITEYE的博客

推荐:数学之路(3)-机器学习(4)-综合应用-塔尼莫特系数

 "塔尼莫特"系数 事实上,这个代数形式在计算Jaccard系数时以位向量作为被比较的集的机制首次被塔尼莫特定义。虽然公式扩展到一般的向量 '计算相似度,




 

 

 

    '计算相似度,使用余弦公式
        Dim tzbj_fz_2 As Double = 0.0
        Dim tzbj_fma_2 As Double = 0.0
        Dim tzbj_fmb_2 As Double = 0.0
        For myii As Integer = 0 To pic1tz.GetUpperBound(0)
            If IsNothing(pic1tz(myii)) Then
                Exit For
            End If
            tzbj_fz_2 += pic1tz(myii) * pic2tz(myii)
            tzbj_fma_2 += pic1tz(myii) * pic1tz(myii)
            tzbj_fmb_2 += pic2tz(myii) * pic2tz(myii)
        Next
        xsd = tzbj_fz_2 / (tzbj_fma_2 + tzbj_fmb_2 - tzbj_fz_2)
        xsd1.Text = xsd.ToString("P")

,

本博客所有内容是原创,未经书面许可,严禁任何形式的转载。

http://blog.csdn.net/u010255642

推荐:数学之路(3)-机器学习(4)-综合应用-候选消除法

候选消除法用于收集和归纳样本的特征,得出变型空间 ,然后可以对未知样本进行分类方法,它建立在对样本属性集的分析上总结基础上,基本原理是:  1、设立2个假设

我用VB.NET制作了一个小程序,程序的功能是根据源图比较2张图哪张与源图更相似,完成对图片特征码的计算后,使用余弦相似度对2个图片进行比较,比较代码如上,两个向量间的余弦值可以很容易地通

相关阅读排行


用户评论

游客

相关内容推荐

最新文章

×

×

请激活账号

为了能正常使用评论、编辑功能及以后陆续为用户提供的其他产品,请激活账号。

您的注册邮箱: 修改

重新发送激活邮件 进入我的邮箱

如果您没有收到激活邮件,请注意检查垃圾箱。