Kaggle, Dacon, 공모전 (19) 썸네일형 리스트형 # Globe suicide rates (tableau) 2005부터 11년간 세계의 자살률을 graph로 보여줍니다. Eastern Mediterranean은 다른 대륙보다 자살률이 낮은 것을 확인할 수 있고, Europe의 자살률은 특히 남성이 월등히 높은 것을 확인할 수 있습니다. # split Train and Test data sample 함수로 data를 shuffle하고 n을 기준으로 100k까지 train, 나머지는 test data로 나눕니다. df_filterd = df_filterd.drop('Date', axis=1).sample(frac=1).reset_index(drop=True) n = 100000 # Split train- & testset df_train = df_filterd[:-n] df_test = df_filterd[-n:] # To trim down data Movie recommender ststem을 구현하기 위해 방대한 data에 정보가 부족한 data를 잘라내는 작업을 합니다. min_movie_ratings = 10000 filter_movies = (cust_id['Movie_Id'].value_counts()>min_movie_ratings) filter_movies = filter_movies[filter_movies].index.tolist() min_user_ratings = 200 filter_users = (cust_id['Cust_Id'].value_counts()>min_user_ratings) filter_users = filter_users[filter_users].index.tolist() df_filterd = cust_id[.. 이전 1 2 3 다음