목록전체 글 (154)
AI·빅데이터 융합 경영학 Study Note
https://yngie-c.github.io/machine%20learning/2020/05/01/val_eval/ 모델 검증과 평가 (Validation & Evaluation) · Data Science 가지고 있는 데이터셋을 학습 데이터와 테스트 데이터로 왜 나누어야 하는 지를 설명했을 때 나왔던 수험생을 다시 데려와 봅시다. 이전 게시물에서는 수능처럼 학생을 최종적으로 평가하기 위 yngie-c.github.io
##### Check missing values & Dropping print(X_train.isnull().sum(), '\n') print(X_test.isnull().sum()) ''' age_oldest 0 age_youngest 0 duration_previous 9318 ''' 이 코드는 'state', 'car_value', 'risk_factor', 'C_previous', 'duration_previous' 열 중 하나라도 누락된 행을 제거하고, 제거된 행들을 제외한 데이터로 새로운 훈련 데이터(X_train_drop)와 테스트 데이터(X_test_drop)를 생성합니다. 이를 통해 누락된 값이 있는 행들을 처리할 수 있습니다. X_train_drop = X_train.dropna(sub..
이 에러는 파일을 불러올때 경로를 / 대신 \ 로 표시하여 경로로 표시한 부분이 유니코드로 인식되어 버려 발생한다. 따라서 위 경로 표시를 아래와 같이 \ 를 / 로 바꾸어주면 된다. 또는 \ 대신 \\ 를 써주면 된다.
import winsound as sd def beepsound(): fr = 2000 # range : 37 ~ 32767 du = 1000 # 1000 ms ==1second sd.Beep(fr, du) # winsound.Beep(frequency, duration) beepsound()
문제 코드 apart_df1['구']= apart_df1['행정구역'].split(' ')[1] csv 파일은 이런 형식이고 '구' 데이터만 필요하다. 오류 코드 'Series' object has no attribute 'split' 해결 apart_df1['구']= str(apart_df1['행정구역']).split(' ')[1]
캐글에 로그인 코드 파일 업로드: 왼쪽에 '코드' > '+ New Notebook' > 'File' > ' Import Notebok ' > 하고 .ipynb 파일을 업로드하면 됨. 데이터 파일 업로드: 왼쪽에 '코드' > '+ New Notebook' > 오른쪽에 'upload data' 또는 'File' > ' upload data ' >하고 .csv 파일을 업로드 하면 됨. shift +enter 하면 실행됨
과제: 이 대학교들을 순서대로 리스트를 입력하는 형식으로 만들기. https://lightblog.tistory.com/21 [엑셀] 셀 내용에 큰따옴표 넣기 (표시 형식) [셀 서식] - [표시 형식]을 이용하면 여러가지를 편리하게 적용할 수 있다. 예를들면 다음과 같이 1부터 10을 적은 후 [형식] 에 #월을 적어 주면 모든 셀에 '월'을 붙일 수 있다. #은 숫자를 의미한 lightblog.tistory.com 를 참고하여 문자열을 모두 따옴표로 감싸보겠습니다. 엑셀을 열고 텍스트 덩어리를 복붙해 넣은 후 드래그 > 우클릭> 셀 서식 > 사용자 지정 > 형식에 '@', 입력 > 확인 *문자는 @, 숫자는 # 성공
오류 코드 unindent does not match any outer indentation level 해석 해당 에러는 들여쓰기가 틀렸다는 뜻의 에러입니다.
그렇다구
https://gmnam.tistory.com/291 [Pandas] UnicodeDecodeError: 'utf-8' codec can't decode byte 해결방법 증상 Pandas api로 csv파일을 읽을 때, 다음과 같은 UnicodeDecodeError가 날 수 있다. df = pd.read_csv('test.csv') 이 에러는 읽어드릴 파일의 포맷이 UTF-8이 아니기 때문에 발생한다. 해결 위의 pandas.read_csv 함수 gmnam.tistory.com 인코딩 포맷을 찾아서 해결하는 방법 두 번째 방법은 csv파일의 포맷을 찾아서 read_csv에 알려주는 것이다. 이것은 chardet이란 모듈을 이용한다. 모듈이 없으면 다음과 같이 설치할 수 있다. pip install ch..
# Authors: Guillaume Lemaitre # Maria Telenczuk https://github.com/maikia># License: BSD 3 clause 1. Download the datasetimport numpy as npfrom sklearn.datasets import fetch_openmlfrom sklearn.utils import shuffledef load_ames_housing(): df = fetch_openml(name="house_prices", as_frame=True, parser="pandas") X = df.data y = df.target features = [ "YrSold", "H..
1. 수치형 피처 - 결측값처리: SimpleImputer(strategy=`???`) - 이상값처리: FunctionTransformer() - 스케일링: StandardScaler()2. 범주형 피처 - 결측값처리: SimpleImputer(strategy="most_frequent") - 인코딩: OneHotEncoder(handle_unknown="ignore") - 차원축소: `MyPCATransformer()` # Custom PCA 3. 공통 - Feature Selection: SelectPercentile(percentile=`???`) - Modeling: Logistic Regression(C=`???`) - Hyperparametor Optimization: `OptunaSea..