Bert向量表示不能直接用于相似度问题的分析

Bert本身得出的sentence embeddings是包含句子信息的,余弦相似本本身是具有鲜明的几何意义,如果这组基是标准正交基,那么对应的向量应该表现出“各向同性”来,在使用余弦相似度来进行句子相似度的计算时候,其效果本身并不理想,那问题可能就是bert生成的向量并非为标准正交基下的向量。

  • 2022-01-20
  • 收藏0
  • 阅读36
  • 下载0
  • 5页
  • docx
  • 911.67M

评价

评分 :
   *