DevLog: 기록하는 생활

  • 이것이 코딩 테스트이다 공부

데이터불균형해결방법 1

데이터 불균형/ 해결방법

데이터 불균형이란?데이터 불균형은 머신러닝 모델을 훈련할 때 특정 클래스의 데이터 개수가 다른 클래스에 비해 현저히 적거나 많은 경우를 말합니다. 주로 분류(classification) 문제에서 발생하며, 모델이 데이터가 많은 클래스에 편향되어 학습하는 문제가 생깁니다.예를 들어 금융 사기 탐지 모델인 경우, 정상 거래에 비해 사기 거래가 현저히 적으므로 모델이 사기 거래를 거의 탐지하지 못하는 경우가 있습니다. 불균형 데이터에서 다수를 차지하는 범주를 ‘다수 범주(majority class)’라고 하고, 적은 수를 차지하는 범주는 ‘소수 범주 (minority class)’ 라고 합니다. 해결 방법1. 샘플링 방법 ✅ 언더샘플링(Undersampling)데이터가 많은 클래스의 샘플 수를 줄여 균형을 맞..

BigData 2025.02.21
이전
1
다음
더보기
프로필사진

DevLog: 기록하는 생활

코딩 지식이 오버플로우 될 때까지 꾸준히 배우고 기록합니다. githubID: eug2n2

  • 분류 전체보기 (34)
    • Python (4)
      • 이것이 코딩테스트이다 with 파이썬 (3)
    • Java (15)
      • Algorithm (10)
      • CS (3)
      • 자료구조 (2)
    • 트러블슈팅 (5)
    • DB (5)
    • BigData (2)
    • IT 용어 (3)

Tag

araylist linkedlist java, 파이썬공부, 플로이드워셜 java, ai 할루시네이션 정의, CS, hashset 저장원리, ai 할루시네이션 해결방안, arraylist 자바, 플로이드워셜 행렬, linkedlist 자바, 플로이드워셜 선형대수학, araylist와 linkedlist 차이, 캐시지역성, 그리디알고리즘, hashset java, ai 할루시네이션이란, hashset 개념, 알고리즘공부, 도커, ai 할루시네이션 발생 원인,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바