余弦相似

两个向量的夹角,夹角越小,表示两个向量越相似

公式

$ \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. $
import numpy as np

def cosine_similarity_manual(a, b):
    dot_product = np.dot(a, b)
    norm_a = np.linalg.norm(a)  # 计算向量 a 的模
    norm_b = np.linalg.norm(b)  # 计算向量 b 的模
    return dot_product / (norm_a * norm_b)

vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])

cos_sim = cosine_similarity_manual(vector_a, vector_b)
print("余弦相似度:", cos_sim)


from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

# 定义两个向量
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])

# 公式计算余弦相似度
# 1*4 + 2*5 + 3*6 = 32
# sqrt(1^2 + 2^2 + 3^2) = sqrt(14)
# sqrt(4^2 + 5^2 + 6^2) = sqrt(77)
# 32 / (sqrt(14) * sqrt(77)) = 0.9746318461970762

# 计算余弦相似度
cos_sim = cosine_similarity([vector_a], [vector_b])
print("余弦相似度:", cos_sim[0][0])

推荐阅读: