2020/6/5 Foot step Spanish High Speed Train Service (Renfe AVE) EDA와 Exploration을 진행했습니다. Tech review time series를 num으로 바꿔줍니다.(찾느라 애좀 먹었습니다.) df['start_date'] = pd.to_datetime(df['start_date'], errors='coerce') df['start_date'].apply(lambda x: x.strftime('%Y%m%d %H%M%S')) SQL Agritech 녹색혁명이 일어나고 사라지는 종자와 그 농산업의 현주소에 대해 말해주는 책을 읽었습니다. 2020/06/4 Foot step About Artificial Intelligence Training a model for Titanic 어제까지 EDA하고 오늘은 Preprocessing과 Training a model을 진행했습니다. github Preprocessing String to numeric Ageband Spanish High Speed Train Service (Renfe AVE) EDA 확률 변수 -이산 확률 변수 : 무작위로 선택된 값을 열거해 헤아릴 수 있음을 의미합니다. 평균 몸무게가 70에서 72로 상승했다면 이는 동떨어져 있는 값이 아니라 연속적으로 값이 상승했음을 말합니다. -연속 확률 변수 : 임의의 값을 갖습니다. 공분산(covariance) : 두 확률 변수의 상관 관계를 파악해 하나의 일직선상에 표.. 2020/06/3 Foot step About Artificial Intelligence Learned about Vertical indoor farming 견학 Titanic EDA(Reference : Tech review) table(by pivoting)로 빠르게 data를 훑어 보았습니다. 시각화를 중점으로 EDA를 오늘까지 진행했습니다. SQL statistic 귀무 가설과 대립 가설 : 만약 어떤 것을 '맞다고' 증명하고자 할때는 그 반대인 '틀렸다'는 것을 거짓으로 증명해 '맞다'는 논리적으로 확정하는 것을 말하는데 '맞다고' 주장하는 것을 대립 가설이라고 하고 '틀렸다'는 것을 거짓으로 주장하는 것을 귀무 가설이라고 합니다. t-검증은 두 집단 간 평균에 차이가 있는지를 비교해 검정하는 것입니다. 데이터의 양이 적을때 진행.. 2020/06/2 Foot step About Artificial Intelligence Visualization pie plot, hex plot, kde plot, jointplot, countplot EDA를 위한 Visualization연습했는데 다양하고 화려한 plot이 많았습니다. (tech review참조) SQL Did learning about SQL again 2020/06/1 Foot step About Artificial Intelligence Learned about TDA TDA의 핵심은 통계적 이론을 먼저 대입하기 전에 Data의 형태를 먼저 살펴보는 것입니다. 형태에 따라 유의미한 Insight을 얻을 수도 있습니다. Agriculture data 흥미있는 data로 insight를 찾아보고 싶어 Agriculture data를 보고 EDA를 해보았습니다. 2020/05/29 Foot step About Artificial Intelligence * EDA, Visualization(boxplot,Scatter) data 탐색(correlation) data 설명서를 더 자세히 읽으려고 노력하고 있습니다. Target value와 상관관계가 큰 variable을 찾는데 노력하고 있습니다. * Preprocessing Missing value processing Columns이 너무 많았지만 각 col마다 적합한 값('none', 0, median)을 넣어주었습니다. cat과 num으로 나누는 손쉬운 방법을 찾았습니다~. * Feature engineering 2020/05/25 Foot step About Artificial Intelligence Learned about Azure ML, Tableau, Trim down data in another way split train / test set in another way Tableau(EDA) Google trends 검색을 통해 data 확보(주로 나라 비교) make Globe suicide graph(Tech review 참고) Auto ML studio tutorial 간단한 모델로 Azure ML tutorial을 진행했습니다. (Tech review)참고 -EDA 아직 부족한 점이 많아 Data preprocessing을 확실히 안하고 EDA하는 경향이 있습니다. 앞으로는 Variables 하나하나 친해져야겠습니다. 2020/05/24 Foot step About Artificial Intelligence Learned about AutoML, Azure ML