余弦于相似度cos similarity

发布时间:2021-11-27 09:15:57

    Motivation
    在计算两个特征之间的相似程度的时候经常会用到余弦相似度公式,这个公式以前在高中学过,不高好像已经基本还给老师了,今天再这里补充一下。在NLP中经常需要对特征表征之后的高维向量之间计算相似度,有向量




    a



    mathrm a


    a和向量




    b



    mathrm b


    b,




    a


    =


    (



    x


    1



    ,



    x


    2



    ,


    .


    .


    .


    ,



    x


    n



    )



    mathrm a=(x_1,x_2,...,x_n)


    a=(x1?,x2?,...,xn?),




    b


    =


    (



    x


    1






    ,



    x


    2






    ,


    .


    .


    .


    ,



    x


    n






    )



    mathrm b=(x'_1,x'_2,...,x'_n)


    b=(x1′?,x2′?,...,xn′?),则向量




    a



    mathrm a


    a和




    b



    mathrm b


    b之间的余弦相似度为





    c


    o


    s


    <


    a


    ,


    b


    >


    =




    a


    ?


    b




    ?


    a


    ?


    ?


    b


    ?




    =





    x


    1




    x


    1






    +



    x


    2




    x


    2






    +


    ,


    .


    .


    .


    ,


    +



    x


    n




    x


    n











    x


    1



    ?


    +



    x


    2



    ?


    +


    ,


    .


    .


    .


    ,


    +



    x


    n



    ?







    x


    1






    ?


    +



    x


    2






    ?


    +


    ,


    .


    .


    .


    ,


    +



    x


    n






    ?






    =





    u


    T



    v




    ?


    ?


    u


    ?



    ?


    2



    ?


    ?


    v


    ?



    ?


    2






    cos<mathrm a,mathrm b>=frac{mathrm a?mathrm b}{|mathrm a||mathrm b|}=frac{x_1x'_1+x_2x'_2+,...,+x_nx_n'}{sqrt{x_1?+x_2?+,...,+x_n?}sqrt{x'_1?+x'_2?+,...,+x'_n?}}=frac{u^Tv}{||u||_2||v||_2}


    cos=?a??b?a?b?=x1??+x2??+,...,+xn??
    ?x1′??+x2′??+,...,+xn′??
    ?x1?x1′?+x2?x2′?+,...,+xn?xn′??=??u??2???v??2?uTv?

2.Derivation proof
首先需要该公式来之于两向量的数量积公式




a


?


b


=


?


a


?


?


b


?


c


o


s


<


a


,


b


>



mathrm a?mathrm b=|mathrm a||mathrm b|cos<mathrm a,mathrm b>


a?b=?a??b?cos该公式的推导如下:

在图片中有




c


=


a


?


b



mathrm c = mathrm a - mathrm b


c=a?b,(注:为了表示的方便我们在二维的*面上表示向量,实际上特征的维度一般可以达到几百甚至几千维)由余弦定理可以得到如下公式





c


?


=


a


?


+


b


?


?


2


?


a


?


?


b


?


c


o


s


<


a


,


b


>






c?=mathrm a?+mathrm b?-2|mathrm a||mathrm b|cos<mathrm a,mathrm b>①


c?=a?+b??2?a??b?cos





c


=


a


?


b



mathrm c = mathrm a - mathrm b


c=a?b带入到公式①中化简之后便可以得到数量积公式。





a


?


b


=


?


a


?


?


b


?


c


o


s


<


a


,


b


>



mathrm a?mathrm b=|mathrm a||mathrm b|cos<mathrm a,mathrm b>


a?b=?a??b?cos
补充:
关于余弦定理的几何证明方法如下:


如图所示,在△ABC中,BC=a,AC=b,AB=c,
作AD⊥BC于D,则AD=c*sinB,DC=a-BD=a-c*cosB
在Rt△ACD中,
b?=AD?+DC?=(c*sinB)?+(a-c*cosB)?
=c?sin?B+a?-2ac*cosB+c?cos?B
=c?(sin?B+cos?B)+a?-2ac*cosB
=c?+a?-2ac*cosB

相关文档

  • 工商管理属于哪个系
  • 吃什么对心血管好
  • ali arthas 火焰图_Alibaba Arthas 3.1.5版本支持火焰图,快速定位应用热点
  • 2014年6月英语六级作文模板汇总
  • 儿童影楼员工管理制度汇编
  • 初为人父的唯美句子初为人父的朋友圈短句怎么写
  • 为什么电脑总是死机
  • 从零开始搭建一套lorawan网关(二)
  • 地毯用洗衣机洗会不会不卫生 洗衣机洗了地毯后很脏怎么处理
  • citypicker简单使用
  • 常吃泡菜会危害健康吗
  • matlab产生方波脉冲和周期性方波信号
  • 中秋节周记作文五则
  • 职场新人应该怎样说话
  • 为什么西方国家城市里的鸟基本不怕人
  • 不同的新年作文
  • 怎一个烦字了得
  • 电脑系统哪个最好用_PDF转word怎么转?哪个PDF转换器最好用?
  • 2.1 数学基础、大O表示法、洛必达法则相对增长率、T(N) = O( f(N) )、Ω( g(N) )、Ω( h(N) )、o( p(N) )
  • 请问大学生的学生证里面有什么内容
  • debian 重启命令_WSL 升级 Debian 到 10 (Buster)
  • 美发行业的前景
  • 老人与海主要内容概括50字
  • 逻辑回归损失函数推导及求导
  • 参与宪法日纪念活动总结
  • 送给女朋友的早安祝福语
  • 武汉到庐山自驾游攻略
  • 四年级优秀叙事作文-“乒乒乓乓”的时光
  • 手机被摔了出现黑屏怎么办
  • 用c语言输出* *** ***** ******* ********* *********** ************* *********** ********* ******* *****
  • 猜你喜欢

  • 国旗下的讲话弘扬雷锋精神演讲稿
  • 秋天的枫叶红了,可你却走了_小学六年级作文100字
  • 高原地区老年消化性溃疡225例临床分析
  • 2018年高考化学经典模拟题专题汇编:物质分离提纯、检验实验
  • 2019-2020年三年级数学下册 小数的初步认识2教案 青岛版五年制
  • 2010年江西省心理咨询师(二级)考试技巧、答题原则
  • 绩效管理过程中的沟通技巧.
  • 小学生写粗心的我作文
  • 权威的现金流量表分析教程20111210
  • 论文交流初探污染场地的土壤修复工作过程与修复技术
  • 写家乡大海的作文550字
  • 沪科版八年级下册物理第六章力与运动测试题及答案
  • 煤矿火灾事故应急演练方案设计
  • 小学生三年级暑假日记
  • 物流有限公司管理规章节--图书馆借书管理办法(doc)资料
  • 脑筋急转弯禾打个歌名
  • Debian 系统安装,小白教程
  • 描写校园的作文3篇
  • 正确的减肥方式
  • [K12学习]安徽省阜阳市2017-2018学年七年级历史上学期第四次月考试题(扫描版) 新人教版
  • 最新整理景观设计扩初方案.docx
  • (2016年秋季版)一年级语文下册11.2想飞的乌龟课件北师大版
  • 糖尿病人的运动疗法分析
  • 编写一个函数,要求输入年月日时分秒,输出该年月日时分秒的下一秒
  • 【7A文】财务顾问协议模板
  • 电影《夺冠》(原名:中国女排)经典台词、语录
  • 中考数学总复* 滚动小专题(七)解直角三角形的实际应用试题
  • 新概念英语第二册Lesson73剖析
  • 关于批处理的学*
  • 次北固山下课后反思
  • 景兴纸业:风险投资管理制度(2017年9月)
  • 关于除夕之夜的古诗
  • 北师大版七年级数学上4.1线段、射线、直线课件
  • 经典爱情感悟的句子
  • 人教版八年级数学下册 第17章 勾股定理单元综合检测(二)(新版)新人教版
  • 宁波捷隼电梯配件有限公司(企业信用报告)- 天眼查
  • 企业廉洁文化建设经验材料—经验材料
  • 西门子全集成节能解决方案_final(2)汇编
  • “夜光云”,了解一下?
  • 常用抗菌药的特点
  • 部编版五年级语文下册11.军神(教案)
  • 扶壁式挡土墙在广宁县城防洪工程中的应用
  • 电脑版