ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Advanced Issues - (2)
    CS/SimilaritySearch 2023. 5. 29. 14:01

    Proximity of Metric Ball Regions

     

    주어진 두 ball region 

    에 대하여, proximity는 다음과 같이 정의된다.

     

    실제 사용되는 데이터셋에서, distance distribution이 특정한 object에 의존하지 않는다.

    또한 실제 데이터셋은 높은 homogeneity의 인덱스를 가진다. (homogeneity에 대해서는 직전 포스팅에서 다뤘다)

     

    따라서 overall proximity를 유용하게 사용할수 있고, 그 수식은 아래와 같다.

     

    즉 임의의 거리에 있는 두 점을 찍고, 그 두 점에게 각각의 반지름 r1과 r2를 지정해 주었을 때,

    두 영역이 얼마나 겹치느냐를 나타내는 것이다.

    데이터셋이 높은 homogeneity를 가지기 때문에, 어떤 두 점이 주어지든 그 사이의 거리만 알면 proximity를 구할 수 있는것이다.

     

     

    - 계산의 어려움

    D1= d(p1, o), D2= d(p2, o), Dz= d(p1, p2 )를 랜덤 변수라 할 때, overall proximity는 다음과 같다.

     

    여기서

    위 계산식은 접합부 조건부 밀도의 해석식(An analytic formula for the joint conditional density)

    으로 일반적인 거리 공간(Metric space)에서는 사용할 수 없는 식이다.

    '접합부 조건 밀도'를 '접합부 밀도'로 대체하여 사용하게 된다.

    하지만, 이 두 밀도는 엄연히 다르다.

    따라서 근사 값이 도출되기 때문에, 근사 함수이다.

     

     

     

     

     

     

     

     

     

     

     

     

    'CS > SimilaritySearch' 카테고리의 다른 글

    Ball Partitioning Methods  (0) 2023.06.01
    Tree Quality Measures  (0) 2023.06.01
    Advanced Issues - (1)  (0) 2023.05.29
    Principles of Approximate Similarity Search - (2)  (0) 2023.05.28
    Principles of Approximate Similarity Search - (1)  (0) 2023.05.27
Designed by Tistory.