[python]fmnist(ファッション画像)の中身を調べた話

プログラミング
スポンサーリンク

今回は前回のmnistに引き続き、機械学習の勉強で目にするデータセットである「fashion-mnist(以降fmnist)」について中身を調べた話になります。

前回のmnistについて気になる方はこちらになります。

スポンサーリンク

この記事でわかること

ここでは以下を中心に書かれています。

  • fmnistとは何かざっくりとわかる。
  • fmnistの中身(構成)がどうなっているのかがわかる。
スポンサーリンク

fmnistとは

Tシャツやズボン、ドレス、スニーカーなど10種類のファッション商品の画像データが含まれており、画像ラベル(その画像が何のファッション商品か)のセットでデータが格納されている。

ここで、ラベルデータには数字で格納されていることに注意する。

以下のようにラベルデータが商品に付けられている。

ファッション商品名ラベルデータ
Tシャツ0
ズボン1
プルオーバー2
ドレス3
コート4
サンダル5
シャツ6
スニーカー7
バッグ8
ブーツ9

機械学習では、画像を入力することでその画像が何のファッション商品なのかを分類する課題を行うときに使われる。

fmnistの呼び出し

今回はpythonで中身を確認した。

以下のようにデータが格納されている。

  • 「xtrain」と書かれている部分に6万個の28*28画素の画像データ
  • 「ytrain」と書かれている部分に6万個のラベルデータ
  • 「xtest」と書かれている部分に1万個の28*28画素の画像データ
  • 「ytest」と書かれている部分に1万個のラベルデータ

画像データの中身を見てみると、以下のように0~255の実数値が格納されており、グレースケール画像の輝度値が入っていることが確認できる。

続いてラベルデータの中身を見てみると、以下のようにどの商品なのかそのラベルの数字が入れられていた。

fmnistの構成

mnistの訓練データは6万データあり、それぞれ個数がバラバラだったので、fmnistもそれぞれ数が違うと思いながら数を調べてみた。

mnistと違い、fmnistはそれぞれの数が綺麗に6000個ずつ入っていることが確認できた。

表にまとめると以下になる。

ラベルデータデータセット数
[0]6000
[1]6000
[2]6000
[3]6000
[4]6000
[5]6000
[6]6000
[7]6000
[8]6000
[9]6000

まとめ

今回はfmnistの中身について見ていった。

mnistと違う点もあるので、どんな構成でデータが作られているのかを知ることは大事だと改めて思いました。