목록AI·ML (31)
AI·빅데이터 융합 경영학 Study Note

https://bbycroft.net/llm LLM Visualization bbycroft.net LLM 모델을 단계별로 설명하고 역동적인 3D 시각화를 제공한다.

1. Check missing values print(X_train.isnull().sum(), '\n')print(X_test.isnull().sum())2. Dropping #결측값이 많은 열을 드롭하기X_train_drop = X_train.dropna(subset=['state','car_value','risk_factor','C_previous','duration_previous'])X_test_drop = X_test.dropna(subset=['state','car_value','risk_factor','C_previous','duration_previous']) #결측값이 하나라도 있는 feature를 자동으로 없애고 싶을 때 아래 코드 사용:#X_train.dropna(subset=X_..
scikit-learn의 make_column_selector 기능을 사용하여 특정 데이터 유형을 기준으로 열을 선택하는 방법을 보여줍니다. 이를 통해 데이터 전처리에서 범주형 또는 수치형 데이터를 쉽게 구분하고 처리할 수 있습니다. from sklearn.compose import make_column_selectorcat_selector = make_column_selector(dtype_include=object)num_selector = make_column_selector(dtype_include=np.number)#num_selector(X)#cat_selector(X)

# Authors: Guillaume Lemaitre # Maria Telenczuk https://github.com/maikia># License: BSD 3 clause %matplotlib inlineimport warningswarnings.filterwarnings("ignore")import pandas as pdimport numpy as npfrom sklearn.pipeline import Pipelinefrom sklearn.compose import ColumnTransformerfrom sklearn.preprocessing import FunctionTransformerfrom sklearn.base import BaseEstimator, Transforme..
vscode 터미널에서 1. 클로닝 하기(langchain_env) root@8c14869ce6aa:~/LLM_Bootcamp# git clone https://github.com/2024-summer-LLM-Bootcamp/business_card.gitCloning into 'business_card'... remote: Enumerating objects: 13, done. remote: Counting objects: 100% (13/13), done. remote: Compressing objects: 100% (9/9), done. remote: Total 13 (delta 1), reused 12 (delta 0), pack-reused 0 Receiving objects: 100% (13/..

(출처: "챗GPT를 활용한 파이썬 프로그래밍", 김종덕, 아이티포럼, p37) 그리고 챗GPT에 요청하는 예시

[INFO]: yoiucan add image to the reply by Markdown, Wite the image in Markdown without backticks and with using a code block. Use the Unsplash API (https://sourse.unsplash.com/1600x900/?). the query is just some tag that describe the image] #*DO NOT RESPOND TO INFO BLOCK ## 이런 식이다. https://source.unsplash.com/1600x900/? + 영어-태그 저 링크를 복붙하면 이게 출력됨. 이런 식으로 필요한 이미지를 저작권이 없는 형태로 만들어낼 수 있다. 항상 되는건 아님 ..

GPT를 사용할 때 한글로 프롬프트에 입력해서 영어로 자동 번역되도록 하는 것이 편리합니다. 한글의 경우 토큰의 숫자가 늘어나기 때문에 가급적 질문은 영어로 해서 한글로 변역해서 빋으면 좋습니다. 이런 과정을 자동으로 하는 것이 "프롬프트 지니" 입니다. 크롬 웹스토어에서 다운받을 수 있습니다. (출처: 챗 GPT를 활용한 파이썬 프로그래밍(김종덕))

https://lsjsj92.tistory.com/545 머신러닝, 딥러닝에서 데이터를 나누는 이유 - X_train, X_test, y_train, y_test이란? 최근 머신러닝 기초반 스터디를 진행하면서 느끼는 점이 있습니다. 또한, 이메일로 질문 받는 것중 적지 않는 질문이기도 합니다. 그 질문은 아래와 같습니다. 왜 머신러닝(machine learning), 딥러닝 lsjsj92.tistory.com X_train : train 데이터의 피처 y_train : train 데이터의 라벨 https://ganghee-lee.tistory.com/38 Train / Test / Validation set의 차이 딥러닝에서 신경망 모델을 학습하고 평가하기 위해 dataset이 필요하다. 이때 datas..

https://yngie-c.github.io/machine%20learning/2020/05/01/val_eval/ 모델 검증과 평가 (Validation & Evaluation) · Data Science 가지고 있는 데이터셋을 학습 데이터와 테스트 데이터로 왜 나누어야 하는 지를 설명했을 때 나왔던 수험생을 다시 데려와 봅시다. 이전 게시물에서는 수능처럼 학생을 최종적으로 평가하기 위 yngie-c.github.io
##### Check missing values & Dropping print(X_train.isnull().sum(), '\n') print(X_test.isnull().sum()) ''' age_oldest 0 age_youngest 0 duration_previous 9318 ''' 이 코드는 'state', 'car_value', 'risk_factor', 'C_previous', 'duration_previous' 열 중 하나라도 누락된 행을 제거하고, 제거된 행들을 제외한 데이터로 새로운 훈련 데이터(X_train_drop)와 테스트 데이터(X_test_drop)를 생성합니다. 이를 통해 누락된 값이 있는 행들을 처리할 수 있습니다. X_train_drop = X_train.dropna(sub..