[BDA 11기] 데이터 분석 모델링(ML1) - 1주차

2026. 1. 4. 00:17·BDA-11th

BDA 학회에 대하여

📍BDA 학회를 선택한 이유

나는 컴퓨터공학과에서 4학기를 마치고 휴학 중이다. 휴학을 한 이유는 학부에서 배울 수 없는 내용을 추가로 공부하거나 나에게 잘 맞는 분야를 탐색해 보기 위해서이다. 최대한 다양한 분야의 활동을 찾아보던 중 BDA학회의 인스타그램 광고를 보게 되었다.

BDA 학회는 (사)한국빅데이터학회 산하 기관으로 전국 대학생 연합 빅데이터 학회 및 실무 연계 학회이다. 특히, BDA 학회는 현재 빅데이터 분석 학회 중 학회원 수 1위를 기록하며, 전국 70개 이상 대학에 네트워크를 가지고 있다.

사실 더 끌린 건 실질적인 활동들이다. 신뢰도 있는 강사님의 정규 강의를 통해 개념을 배우고 과제를 통해 스스로 학습할 수 있도록 한다. 또한, 원데이 클래스, 현직자 강의, 공모전 등등 다양한 활동을 단순히 이론으로 끝나는 게 아니라 실제 경험으로 이어질 수 있다는 점이 매력적이었다. 매주 진행되는 분반별 정규 수업은 비대면(zoom)으로 1시간 동안 진행되며, 일주일간 녹화 영상을 시청하며 복습할 수도 있다.

25년 후반기에 진행하는 정규 수업의 종류가 굉장히 많았지만, 그중에서 나는 "데이터 분석 모델링(ML1)"을 신청하였다. 이 분반은 다양한 머신러닝 알고리즘을 실습하며 모델링 실무 역량을 키우는 중급 데이터 분석 강의이다. 나는 대학교에서 들었던 첫 강의인 ‘기초인공지능프로그래밍’을 통해 파이썬을 활용한 기본적인 모델 학습을 경험하였다. 하지만 전공 수업만으로는 다양한 알고리즘을 실습해보기 어렵다는 한계가 있었다.

그래서 학회를 통해 더 많은 모델을 직접 다뤄보고 싶었다. 또한, BDA 학회는 일주일에 한시간 온라인 수업에 참여하면 되기 때문에 다른 아르바이트와 동아리를 병행하는 데 부담이 없을 것으로 생각했다.

📍얻어가고 싶은 점 & 기대되는 점

이번에 듣는 "데이터 분석 모델링" 정규 수업을 통해 데이터를 내가 원하는 방향으로 다루고 분석해서 스스로 모델을 만들 수 있는 능력을 키우고 싶다. 학교에서 배우는 내용보다 조금 더 실무에 가까운 흐름을 직접 경험해보는 것이 목표이다.

또한 학회의 현직자 강의, 원데이 강의를 통해 평소에 잘 접하지 못하는 분야들도 가능한 한 많이 체험해보고 싶다. 가능하다면 공모전에도 참여하여 다양한 사람들과 네트워킹하며 성장하고 싶다. 대학생 학회인 만큼 다른 학교의 학생들도 만날 수 있는 기회가 생긴다는 것도 기대가 된다.

#BDA학회 #데이터분석 #대학생학회 #취업 #취업준비 #대외활동 #대학생활 #수업후기




머신러닝 모델링과 절차 이해

CRISP-DM Process

1. Business Understanding

  • 해결하려는 문제를 비지니스 관점에서 정의

2. Data Understanding

  • 원본 식별, 분석을 위한 구조 만들기
  • 사용할 데이터를 탐색하고 데이터 특성 파악
  • 데이터의 분포, 결측지, 이상치 등을 분석

3. Data Preparation

  • 모든 셀에는 값이 있어야 하고, 모든 값은 숫자이어야 함
  • 값의 범위를 일치
  • 수행되는 내용
    • 결측치 조치
    • 가변수화(Dummy variable): 범주형 변수를 0과 1의 값을 가지는 변수로 변환 -> e.g. one-hot-encoding
    • 스케일링
    • 데이터 분할

4. Modeling

  • Model: 데이터로부터 패턴을 찾아 수학식으로 정리
  • Modeling: 가능한 오차가 적은 모델을 만드는 과정
  • 목적: 샘플을 가지고 전체를 추정 (과저의 데이터를 바탕으로 미래의 데이터를 추론)
  • 알고리즘 선택, 파리미터 조정, 교차 검증 등

5. Evaluation

  • 모델 성능 평가 및 비지니스 목적과 맞는지 판단

6. Deployment

  • 완성된 모델을 실제 환경에 적용

지도학습 vs 비지도 학습

지도학습(Supervised Learning)

  • 정답(Label)이 있는 데이터로 학습
  • 입력값(x)와 출력값(y)이 쌍으로 주어짐

비지도 학습(Unsupervised Learning)

  • 정답이 없는 데이터로 학습
  • 데이터의 숨겨진 패턴, 구조를 찾아서 스스로 구별

강화학습(Reinforcement Learning) - 지도학습

정답이 있는 문제 - 답을 알려주면서 패턴을 찾게 함
-> 정답의 2가기 종류

Regression (회귀분석)

  • "얼마나?"라는 질문을 예측
  • 출력값: 정확한 수치, 숫자(실수)

Classification (분류)

  • "어떤 종류인가?"를 예측하여 분류
  • 출력값: 범주(Category)

머신러닝 코드 구조 - 모델링

  1. 모델 선언
    모델 준비하기: 모델에 대한 설정

  2. 학습
    모델 만들기: 학습 데이터를 이용해서 모델링

  3. 예측
    모델 사용하기: 검증 데이터로 예측

  4. 평가
    모델 평가하기: 예측 결과 점수 계산




실습

1. 환경 준비

라이브러리 불러오기

#기본 라이브러리들
import numpy as np   # 수치연산
import pandas as pd  # 데이터프레임(2차원)
import matplotlib.pyplot as plt  # 그래프

from sklearn.model_selection import train_test_split  # 데이터 분할 -> 싸이킷런 모델

2. 학습

1. 필요한 함수 불러오기

# 알고리즘 불러오기 : 선형회귀
from sklearn.linear_model import LinearRegression

# 회귀 모델 평가 함수 불러오기
from sklearn.metrics import mean_absolute_error 

2. 모델 선언하기

model = LinearRegression()

3. 학습

model.fit(x_train, y_train)

4. 예측

pred = model.predict(x_test) 

pred  # 예측 명령문 

5. 평가 - 평균오차

mean_absolute_error(y_test, pred)



'BDA-11th' 카테고리의 다른 글

[BDA 11기] 데이터 분석 모델링(ML1) - 6주차  (0) 2026.01.04
[BDA 11기] 데이터 분석 모델링(ML1) - 5주차  (0) 2026.01.04
[BDA 11기] 데이터 분석 모델링(ML1) - 4주차  (0) 2026.01.04
[BDA 11기] 데이터 분석 모델링(ML1) - 3주차  (0) 2026.01.04
[BDA 11기] 데이터 분석 모델링(ML1) - 2주차  (0) 2026.01.04
'BDA-11th' 카테고리의 다른 글
  • [BDA 11기] 데이터 분석 모델링(ML1) - 5주차
  • [BDA 11기] 데이터 분석 모델링(ML1) - 4주차
  • [BDA 11기] 데이터 분석 모델링(ML1) - 3주차
  • [BDA 11기] 데이터 분석 모델링(ML1) - 2주차
choisio2
choisio2
sio2-dev 님의 블로그 입니다.
  • choisio2
    SiO2 for Developer
    choisio2
  • 전체
    오늘
    어제
    • 분류 전체보기 (46) N
      • TAVE-16th (14)
      • BDA-11th (16)
      • C++ (5)
      • 개인 프로젝트 (4)
      • 백준 (4) N
      • 컴퓨터 그래픽스 (1)
      • 잡담 (1)
  • 블로그 메뉴

    • 태그
    • 방명록
  • 링크

    • github.com/choisio2
  • 공지사항

  • 인기 글

  • 태그

    BDA
    데시벨측정
    kotin
    androidstudio
    playconsole
    백준1463
    geminicli
    Tave
    BDAI
    백준
    kotlin
    개발자
    알고리즘
    개발자미래
    프론트엔드
    바이브코딩
    calculator
    AI시대
    데이터분석모델링
    SpotifyAPI
    spotify
    알고리즘스터디
    KakaoOauth
    frontend
    코딩테스트
    polling
    viewpager2
    C++
    BDA #데이터분석모델링
    코테
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
choisio2
[BDA 11기] 데이터 분석 모델링(ML1) - 1주차
상단으로

티스토리툴바