今回は前回のmnistに引き続き、機械学習の勉強で目にするデータセットである「fashion-mnist(以降fmnist)」について中身を調べた話になります。
前回のmnistについて気になる方はこちらになります。
この記事でわかること
ここでは以下を中心に書かれています。
- fmnistとは何かざっくりとわかる。
- fmnistの中身(構成)がどうなっているのかがわかる。
fmnistとは
Tシャツやズボン、ドレス、スニーカーなど10種類のファッション商品の画像データが含まれており、画像とラベル(その画像が何のファッション商品か)のセットでデータが格納されている。
ここで、ラベルデータには数字で格納されていることに注意する。
以下のようにラベルデータが商品に付けられている。
ファッション商品名 | ラベルデータ |
Tシャツ | 0 |
ズボン | 1 |
プルオーバー | 2 |
ドレス | 3 |
コート | 4 |
サンダル | 5 |
シャツ | 6 |
スニーカー | 7 |
バッグ | 8 |
ブーツ | 9 |
機械学習では、画像を入力することでその画像が何のファッション商品なのかを分類する課題を行うときに使われる。
fmnistの呼び出し
今回はpythonで中身を確認した。
以下のようにデータが格納されている。
- 「xtrain」と書かれている部分に6万個の28*28画素の画像データ
- 「ytrain」と書かれている部分に6万個のラベルデータ
- 「xtest」と書かれている部分に1万個の28*28画素の画像データ
- 「ytest」と書かれている部分に1万個のラベルデータ
画像データの中身を見てみると、以下のように0~255の実数値が格納されており、グレースケール画像の輝度値が入っていることが確認できる。
続いてラベルデータの中身を見てみると、以下のようにどの商品なのかそのラベルの数字が入れられていた。
fmnistの構成
mnistの訓練データは6万データあり、それぞれ個数がバラバラだったので、fmnistもそれぞれ数が違うと思いながら数を調べてみた。
mnistと違い、fmnistはそれぞれの数が綺麗に6000個ずつ入っていることが確認できた。
表にまとめると以下になる。
ラベルデータ | データセット数 |
[0] | 6000 |
[1] | 6000 |
[2] | 6000 |
[3] | 6000 |
[4] | 6000 |
[5] | 6000 |
[6] | 6000 |
[7] | 6000 |
[8] | 6000 |
[9] | 6000 |
まとめ
今回はfmnistの中身について見ていった。
mnistと違う点もあるので、どんな構成でデータが作られているのかを知ることは大事だと改めて思いました。