본문 바로가기

Footstep . 발자취

2020/05/6 Foot step

About Artificial Intelligence

Learned about ML processing

-표준 상관 계수 Standard correlation coefficient

한 column과 다른 columns과의 상관 관계가 얼마나 되는지 확인 가능한 기능이며 corr() mathod로 쉽게 계산 가능합니다. 선형적인 상관 관계만 측정합니다. 범위는 -1 ~ +1입니다. 산점도로 확인했을 때, 수평선이 보이면 algorithm이 잘못된 내용을 학습할 수 있으므로 제가 하는 것이 좋습니다.

-factorize()

카테고리를 텍스트에서 정숫값으로 매핑해줍니다.

-OneHotEncoder OrdinalEncoder

OneHotEncoder OrdinalEncoder를 사용하면 텍스트 카테고리를 숫자 카테고리로, 숫자 카테고리를 원-핫 벡터로 바꿀 수 있습니다. 이는 기본적으로 Sparse matrix를 출력하지만 Dense matrix를 원할 경우 'sparse=False'로 지정할 수 있습니다.

-Scaling 2가지 방법

정규화Normalization : min-max 스케일링이라고도 불리며 MinMaxScaler 변환기를 사용하여 모든 특성을 0과 1사이에 위치하도록 하고 scale을 조정합니다. 

표준화Standardization : StandardScaler 변환기를 사용하고 먼저 평균을 뺀 후 표준 편차로 나누어 분포 분산이 1이 되도록 만듭니다. 이상치에 영향을 덜 받습니다.

-Pipeline

DataFrameSelecter로 numpy array로 바꾸는 변환기를 만든 후, 이 두 pipeline을 하나로 합치기 위해 FeatureUnion으로 pipeline을 병렬로 실행하고 결과를 합쳐서 반환합니다.

-Performance measure

회귀의 성능 지표는 RMSE와 MAE가 주로 사용되며 RMSE는 모델의 예측값과 실체값 차이의 면적의 합입니다. MAE는 모델의 예측값과 실체값의 차이를 모두 더한 값입니다.

-Cross-validation

모델을 평가할 때 사용하며 훈련 세트를 더 작은 훈련세트와 검증 세트로 나누고 모델을 다시 훈련 하는데 대표적인 방법은 K-겹 교차 검증 K-fold cross-validation이 있습니다.

-모델 세부 튜닝

훌륭한 하나의 algorithm을 찾는 것보다 data preprocessing에 더 투자하고 적당한 algorithms을 2~5개 정도 훈련해 세부 튜닝을 함으로써 더 좋은 모델을 만들 수 있습니다. 세부 튜닝의 종류로는 그리드 탐색, 랜덤 탐색, 앙상블 방법등이 있습니다.

-제품 시스템에 적용.

런칭을 앞두고 입력 data source를 우리 시스템에 연결하고 test code를 작성합니다. 일정한 시간을 두고 성능을 체크하며, 모니터링 코드를 만듭니다. 시스템의 예측과 data의 quality 을 평가하며 잦은 모델 훈련이 필요합니다.

 

 

본 내용은 'Hands-On Machine Learning with Scikit-Learn and TensorFlow' 도서를 참고하였습니다.


About something new


To-do list

  • [x] Get up at 7 10
  • [x] Organize the blanket
  • [x] Put the flower on the windowsill
  • [x] Ask Bill
  • [x] Do machine learning
  • [x] One day One commit
  • [x] Get the supplements and the chocolate, make some water.
  • [x] Drink coffee, Do the diary about sleeping and thoughts
  • [x] Stretch your body for 20 min
  • [x] Do Eng words
  • [x] Go for cardio
    • [x] Have time to think about something new
  • [x] 미숫가루
  • [x] Brush up on
  • [x] Do blogging
  • [x] Do out-put, Skim through again
  • [x] Read AI news And the news
  • [x] walnut and almonds
  • [x] Do Intermittent fasting at 7
  • [x] Stretch Ulnar nerve with 원동력 exercise
  • [x] Put the flower back from the windowsill
  • [x] Read books
  • [x] Organize the day and create the next day's plan

'Footstep . 발자취' 카테고리의 다른 글

2020/05/8 Foot step  (0) 2020.05.08
2020/05/7 Foot step  (0) 2020.05.07
2020/05/5 Foot step  (0) 2020.05.05
2020/05/4 Foot step  (0) 2020.05.04
2020/05/3 Foot step  (0) 2020.05.03