본문 바로가기
카테고리 없음

[ML] Dataset: Bike Sharing

by ds31x 2024. 9. 5.

자전거 공유 데이터셋의 각 컬럼에 대한 간단한 설명:

  1. instant: 기록 인덱스
  2. dteday: 기록 날짜 (date of the record)
  3. season: 계절 (1: 봄, 2: 여름, 3: 가을, 4: 겨울)
  4. yr: 연도 (0: 2011년, 1: 2012년)
  5. mnth: 월 (1월~12월)
  6. hr: 시간 (0시~23시)
  7. holiday: 공휴일 여부 (0: 아니오, 1: 예)
  8. weekday: 요일
  9. workingday: 근무일 여부 (0: 아니오, 1: 예)
  10. weathersit: 날씨 상태
  11. temp: 정규화된 온도 (normalized temperature)
  12. atemp: 체감 정규화된 온도 (normalized feeling temperature)
  13. hum: 정규화된 습도 (normalized humidity)
  14. windspeed: 정규화된 풍속 (normalized wind speed)
  15. casual: 비회원 이용자 수 (`label` 과 관련됨.)
  16. registered: 등록된 이용자 수 (`label` 과 관련됨.)
  17. cnt: 전체 대여 수 (비회원 + 등록 이용자) (`label` 임.)

원본은 UCI 머신러닝 저장소 페이지에서 확인 가능함.

XGBoost 관련 서적에서는 이 데이터를 일부 수정하여 사용했는데, 이 경우 hr이 생략됨.
(그리고 이 경우, sample의 수가 731개만 사용.)