About Artificial Intelligence
Learned about Practical training
-K-fold cross-validation
tsetData를 확보하지 않으면 평가를 할 수 없고, testData를 확보하면 학습데이터가 줄어드는 딜레마에 빠지는데 이를 대응하기 위해 나왔습니다. 대상 data를 k개로 분할하고 그중 1개를 testData, 나머지 k-1개를 학습 data로 학습하는 방법입니다. testData를 변경하면서 학습과 검증을 k번 반복합니다. 이 k번 검증 결과를 평균으로 한 결과를 많이 사용합니다.
-수신기 조작 특성 Receiver operating characteristic (ROC) 곡선도
이진 분류에서 널리 사용하는 도구입니다. 정밀도/재현율 곡선과 매우 비슷하지만, ROC 곡선은 거짓 양성 비율 false positive rate (FPR )에 대한 진짜 양성 비율 true positive rate (TPR, 재현율의 다른 이름)의 곡선입니다.
AdaBoost는 난이도가 높은 data(분할선 근처에 있는 data)를 재대로 분류할 수 있는 약한 학습기의 분류 결과를 중시하므로 약한 학습기에 가중치를 주어서 정확도를 높입니다.
-Train with various models(RandomForestClassifier, SVC, DecisionTreeClassifier, SGDClassifier, AdaBoostClassifier)
결과적으로 SVC가 제일 좋은 성적을 내주었습니다. 다음 시간에는 오류 분석과 필요하다면 scaling을 더하고 data를 더 탐색하는 시간을 가져보겠습니다.
data를 저장하는 한 방식입니다. 데이터를 리스트의 목록으로 파싱할 필요 없이 ‘표’ 형태로 만들어 저장합니다.
-.index로 row를 확인 가능하고, .columns로 columns를 확인 가능합니다.
labels은 columns에 있는 항목들과 row에 있는 각 항목들을 가르킵니다.
본 내용은 '머신러닝 부트캠프 with 파이썬' 도서를 참고하였습니다.
To-do list
- [x] Get up at 7 10
- [x] Organize the blanket
- [x] Put the flower on the windowsill
- [x] Ask Bill
- [x] Do machine learning
- [x] One day One commit
- [x] Get the supplements and the chocolate, make some water.
- [x] Drink coffee, Do the diary about sleeping and thoughts
- [x] Stretch your body for 20 min
- [x] Do Eng words
- [x] walnut and almonds
- [x] Go for cardio
- [x] Have time to think about something new
- [x] 미숫가루
- [x] Brush up on
- [x] Do blogging With data
- [x] Do out-put, Skim through again
- [x] Do coursera, EdX
- [x] Read AI news And the news
- [x] Do Intermittent fasting at 7
- [x] Stretch Ulnar nerve with 원동력 exercise
- [x] Put the flower back from the windowsill
- [x] Read books
- [x] Organize the day and create the next day's plan
'Footstep . 발자취' 카테고리의 다른 글
2020/05/15 Foot step (0) | 2020.05.15 |
2020/05/14 Foot step (0) | 2020.05.14 |
2020/05/12 Foot step (0) | 2020.05.12 |
2020/05/11 Foot step (0) | 2020.05.11 |
2020/05/10 Foot step (0) | 2020.05.10 |