자전거 공유 데이터셋의 각 컬럼에 대한 간단한 설명:
- instant: 기록 인덱스
- dteday: 기록 날짜 (date of the record)
- season: 계절 (1: 봄, 2: 여름, 3: 가을, 4: 겨울)
- yr: 연도 (0: 2011년, 1: 2012년)
- mnth: 월 (1월~12월)
- hr: 시간 (0시~23시)
- holiday: 공휴일 여부 (0: 아니오, 1: 예)
- weekday: 요일
- workingday: 근무일 여부 (0: 아니오, 1: 예)
- weathersit: 날씨 상태
- temp: 정규화된 온도 (normalized temperature)
- atemp: 체감 정규화된 온도 (normalized feeling temperature)
- hum: 정규화된 습도 (normalized humidity)
- windspeed: 정규화된 풍속 (normalized wind speed)
- casual: 비회원 이용자 수 (`label` 과 관련됨.)
- registered: 등록된 이용자 수 (`label` 과 관련됨.)
- cnt: 전체 대여 수 (비회원 + 등록 이용자) (`label` 임.)
원본은 UCI 머신러닝 저장소 페이지에서 확인 가능함.
XGBoost 관련 서적에서는 이 데이터를 일부 수정하여 사용했는데, 이 경우 hr
이 생략됨.
(그리고 이 경우, sample의 수가 731개만 사용.)