ML/etc
-
Classes, properties, and instances 차이점ML/etc 2023. 9. 29. 13:35
https://www.ibm.com/docs/en/cdfsp/7.6.0?topic=schemas-classes-properties-instances Classes, properties, and instances In Integration Composer, data schemas organize data into classes, which are groups of objects that share common properties. Properties are attributes or features that characterize classes. While classes are groups of objects, an instance is a specific obje www.ibm.com Classes, pr..
-
Meaning of x^TAxML/etc 2022. 12. 14. 21:48
https://math.stackexchange.com/questions/2792103/meaning-of-xt-a-x
-
Hubness Phenomena in feature spaceML/etc 2022. 4. 21. 13:41
모든 데이터에서 만연하게 등장하는 특징에 대한 feature vectors는 rich하다. 반면 전체 데이터에서 일부만 존제하는 feature vector는 sparce하다. 따라서 cosine similarity는 만연하게 등장하는 특징에 대한 유사성을 측정하게 될것같다. 높은 차원의 feature 일때 hubness 현상이 발생한다. hub샘플은 다른 샘플들과 유사성이 높다. 이 때문에 knn의 모델 성능에 영향을 끼친다. 모든 데이터에 등장하므로 knn의 분류 결과에 영향을 끼침 이러한 hub는 데이터의 중심점과 가깝다는 특징을 가지고 있다. Reference Ikumi Suzuki, The Effect of Data Centering for k-nearest neighbor, National In..
-
[Training] Mini Batch를 왜 사용할까?ML/etc 2022. 4. 4. 13:03
사진 100장으로 개와 고양이(각각 50장 씩)를 분류하는 모델을 학습하고자한다. 모든 사진을 한번에 모델에 넣고 학습하면 1. 모형은 데이터에서 개와 고양이를 잘 분류할 수 있는 특징을 찾을 것이다. - 그것이 수염이 될 수 있고, 뾰족한 귀가 될 수 있고, 눈이 될 수 있을것같다. - 간혹 개를 찍은 사진은 모두 잔디 들판이고, 고양이를 찍은 사진은 모두 도심이면 그것을 기준으로 나눌 위험도 있다. 가지고있는 100장에서, 모델이 학습을 하는데. 수염만 특징으로 잡고 학습해도 거의 정확하게 분류가 된다면 다른 특징을 학습할 이유가 있을까?(Local optimum) - 모형 입장에서 loss를 떨어뜨리는 목적(아주 같은 말은 아니지만; error를 낮게하는)만 있는것이고 현재의 결과들이 global한..
-
[평가지표 정리] F1-score, Macro f1-score, Micro f1-scoreML/etc 2022. 4. 3. 22:39
각 지표는 처음 보는 분들에게 혼돈이 될 것입니다. 글로 설명된 내용을 읽어서 이해하기 보다는 간단한 예제를 따라 풀어보면서 지표를 이해하는 것이 도움이 될 것입니다. - Multilabel classification Task의 경우 각 범주(class)별 f1score를 구하여 평균하여 사용합니다. - Micro, weighted F1 score의 경우 각 범주 (class)가 불균형 할때, 사용할수 있습니다. 다 범주에서 실제값, 예측값의 Match결과 sklearn.metrics.classification_report을 사용한 결과 정리 각 범주별 Precision, Recall, F1 Score Macro Average F1 Score Weighted Average F1 Score Micro Av..