티스토리 뷰
728x90
개요
- 손으로 쓴 숫자들로 이루어진 대형 데이터베이스
- 0 부터 9까지의 숫자 이미지 70,000 로 이루어진 데이터로 레이블이 존재
- sklearn 을 이용해서 다운로드 받으면 data 속성에 피처가 존재하고 target 속성으로 레이블을 제공
MNIST 데이터 가져오기
from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784', version=1, as_frame=False)
X, y = mnist['data'], mnist['target']
print(X.shape)
print(y.shape)
#실행 결과
(70000, 784)
(70000,)
이미지 1개 출력
#이미지 데이터 1개 가져오기
some_digit = X[0]
#이미지를 다시 2차원으로 변경
some_digit_image = some_digit.reshape(28, 28)
#출력
import matplotlib.pyplot as plt
import matplotlib as mpl
plt.imshow(some_digit_image, cmap=mpl.cm.binary)
plt.axis('off')
plt.show()
훈련데이터와 테스트 데이터 분리
#레이블의 자료형을 정수로 변경
print(y.dtype)
y = y.astype(np.uint8)
print(y.dtype)
#레이블의 자료형을 정수로 변경
print(y.dtype)
y = y.astype(np.uint8)
print(y.dtype)
#결과
object
uint8
uint8
uint8
728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- django
- 전자회로
- 생성형 AI
- 인프런
- Python
- 티스토리챌린지
- 오블완
- 더오름
- it도서큐레이션
- SSAFY
- 알고리즘이론
- 위니브엠베서더
- 위니브
- 웹
- 파이썬
- 인프런강의후기
- 웹프로그래밍
- dataframe
- 웹개발
- ssafy기자단
- 제주코딩베이스캠프
- 백준알고리즘
- 백준
- PANDAS
- 프로그래머스
- numpy
- 코딩테스트
- 인프런강의
- 알고리즘
- SSAFYcial
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함
250x250