목록분류 전체보기 (18)
Learner's Log님의 블로그
import osimport librosaimport numpy as npimport globimport pickleimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.model_selection import KFoldfrom sklearn.svm import SVCfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.metrics import accuracy_score, confusion_matriximport pandas as pd# 데이터 경로 설정DATA_PATH = "voice_data"# 감정 레이블 매핑target_emotions = {'A': 'angry', 'H': 'hap..
음성 데이터 EDA 분석1. 데이터 로드 및 준비librosa, numpy, matplotlib, seaborn 등의 라이브러리를 사용하여 데이터 분석 진행voice_data 폴더에서 .wav 파일을 불러옴감정별로 데이터를 정리하고, 무작위로 하나씩 샘플링하여 분석을 진행함import osimport librosaimport librosa.displayimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.fftpack import fftvoice_data_path = "voice_data"wav_files = [f for f in os.listdir(voice_data_path) if f.endswith(".wav..
필요한 모듈 임포트import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns데이터 셋 준비및 수치형,범주형,타겟 데이터 정의df = pd.read_csv('content/xAPI-Edu-Data.csv')df.head() genderNationalITyPlaceofBirthStageIDGradeIDSectionIDTopicSemesterRelationraisedhandsVisITedResourcesAnnouncementsViewDiscussionParentAnsweringSurveyParentschoolSatisfactionStudentAbsenceDaysClass0MKWKuwaITlowerlevelG-..
# 필요한 라이브러리 불러오기import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score, classification_reportfrom xgboost import XGBClassifier# 데이터 로드file_p..
심부전증 예측 모델 개발1. 데이터 프레임 각 컬럼 분석import matplotlib.pyplot as pltimport seaborn as snsimport pandas as pd# pd.read_csv()로 csv파일 읽어들이기df = pd.read_csv('content/heart_failure_clinical_records_dataset.csv') 컬럼명 설명 age 환자의 나이 anaemia 환자의 빈혈증 여부 (0: 정상, 1: 빈혈) creatinine_phosphokinase 크레아틴키나제 검사 결과 diabete..
사이킷런을 이용하여 붓꽃(lris) 데이터 품족 예측1. 필요한 모듈로딩 및 데이터 세트 로딩, 저장import sklearnprint(sklearn.__version__)결과값:1.6.1붓꽃 예측을 위한 사이킷런 필요 모듈 로딩from sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_split데이터 세트를 로딩import pandas as pdfrom sklearn.datasets import load_iris# 붓꽃 데이터 세트를 로딩합니다.iris = load_iris()# iris.data는 Iris 데이터 세트에서 피처..
import matplotlib.font_manager as fmimport matplotlib.pyplot as pltimport pandas as pdpd.set_option('future.no_silent_downcasting', True)plt.rcParams['font.family'] ='Malgun Gothic'plt.rcParams['axes.unicode_minus'] =FalseDF = pd.read_excel('notExercise.xls')DF.head() 기간대분류분류운동을 할 충분한 시간이 없어서함께 운동을 할 사람이 없어서운동을 할 만한 장소가 없어서운동을 싫어해서기타02017서울시서울시49.78.15.834.71.712017성별남자55.27.95.529.81.622017성별여자..

1️⃣ 머신러닝의 정의‘기계학습’으로도 불리는 인공지능의 한 분야인간의 학습 능력을 컴퓨터로 실현하려는 기법“프로그램을 명시적으로 작성하지 않고 컴퓨터에 학습할 수 있는 능력을 부여하기 위한 연구 분야이다.”‘머신(machine)’은 컴퓨터, ‘러닝(learning)’은 학습 따라서 머신러닝이란 ‘컴퓨터를 통한 학습’을 나타냄전통적인 프로그래밍과는 다르게, 머신러닝은 데이터를 보고 스스로 규칙을 찾아냅니다.2️⃣ 머신러닝 vs 전통적인 프로그래밍전통적인 프로그래밍에서는 모든 규칙들을 작성함만약 규칙들이 추가로 작성될 경우 유지 관리가 어려운 문제점그러나 머신러닝은 시간에 따라 점차 효율이 향상됨입출력 데이터의 관계를 학습하여 규칙을 생성구분전통적인 프로그래밍머신러닝규칙사람이 직접 코딩데이터에서 학습예시i..