2018-02-15

ウェブカメラの画像をVGG16で画像認識させる簡単サンプル

Keras 深層学習ウェブカメラ VGG16 Python Jupyter Notebook

Kerasにはダウンロードできる学習済みモデルがあることに気がついて
「あ、これにウェブカムからの画像を入れれば色々認識できるじゃん？」
と思い、作ってみました。

VGG16とは

ImageNetから学習した畳み込みニューラルネットワーク
画像を1000クラスに分類する
入力画像のサイズは224x224

ソースコード

jupiter notebookで作ってます。
ウェブカメラの画像を出したら、上の停止ボタン（■ボタン）を一回押すと写真が撮れるので、そこから再生ボタン（▶︎ボタン）を押して処理を進めてください。

エレキギター、綺麗に認識したなぁ。

いろいろ試してみた

f:id:uchidamax:20180213014600p:plain
象のフィギアがあったんで撮ってみました。
認識結果は微妙に惜しいですね。

f:id:uchidamax:20180213014820p:plain
カメラは上手くいってる。

f:id:uchidamax:20180213014903p:plain
ショベルカーのおもちゃ。
チェンソー、パワードリルと工具系っていうのは系統としてあってる。

f:id:uchidamax:20180213015047p:plain
ハサミ。
ハードディスクと認識。写真の裏にMIDIコントローラーの裏のシルバーを使ってるせいでラップトップとかソレ系と認識してるんだろう。

f:id:uchidamax:20180213015223p:plain
ボールペンは認識成功。

f:id:uchidamax:20180213015247p:plain
SDガンダムのプラモ。warplaneは、ちょっと惜しい。

参考

aidiary.hatenablog.com

無茶参考になりました。ありがとうございます！

Applications - Keras Documentation

ImageNet

2018-02-13

ウェブカメラの画像をCIFAR-10で学習したニューラルネットワークで画像認識させる簡単サンプル

CIFAR-10 Jupyter Notebook Keras Python 深層学習ウェブカメラ

ウェブカムからの画像を識別するのを作ってみるかなと思いやってみました。
CIFAR-10のクラスラベルは次の10クラス。

[0] airplane (飛行機)
[1] automobile (自動車)
[2] bird (鳥)
[3] cat (猫)
[4] deer (鹿)
[5] dog (犬)
[6] frog (カエル)
[7] horse (馬)
[8] ship (船)
[9] truck (トラック)

なので、この10クラスのうちのどれかが認識できるということになります。

ソースコード

jupiter notebookで実行してください。
ウェブカムのプレビューがされたら、写たいものを写して■ボタンを押す。その後▶︎ボタンで先に進んで実行してください。

こちらがミニカーを写して認識させてみた例。

こちらが飛行機のおもちゃを認識させてみた例。
上のミニカーとソースコードは同じ。

GitHub

github.com

このリポジトリに学習済みのモデルデータふくめ一通り入ってます。

参考

medium.com

Thanks!

2018-02-08

Kerasデータセットのロイターニュースワイヤーの元文章を表示する簡単サンプル作ったが、トピックのラベルが謎

Keras 深層学習 Python Jupyter Notebook ロイターニュースワイヤー

ロイターのニュースのデータもKerasに入ってることに気がついたんで、元文章の表示プログラムを書いてみました。

ロイターのニュースワイヤートピックス分類データセットとは

46のトピックにラベル付けされた，11228個のロイターのニュースワイヤーのデータセット
IMDBデータセットと同様、ニュース文言は前処理済みで，各レビューは単語のインデックス（整数）のシーケンスとなっている
単語はデータセットにおいての出現頻度によってインデックスされている。そのため例えば，整数"3"はデータの中で3番目に頻度が多い単語である
トレーニングデータが8982個、テストデータが2246個

ロイターニュースの元文章を表示するソースコード

IMDBと一緒なんで表示自体は瞬間的にできたんですが、ハマったのがラベル。

ロイターデータセットのラベルの数字は何なの？

ラベルの数字(y_train、y_test)を、これが指すトピックの文言に変換して表示するようにしようと思ったんです。なんでネットをいろいろ検索してみたんですが、この数字が何に対応しているのかサッパリわからない。1時間くらい粘ってあきらめました。

stackoverflow.com stackoverflowの質問も、なぜかスルーされてる。

誰か知ってる人、教えてください〜。

参考

データセット - Keras Documentation

uchidama.hatenablog.com

2018-02-05

IMDBを畳み込みニューラルネットワーク他で判定する簡単サンプル

IMDB Keras Python 深層学習 Jupyter Notebook

KerasにはIMDBの学習を行うサンプルが5個も入ってます。
なので、せっかくだから作ってみました。

IMDBの学習方法

Kerasのexamplesの中に

imdb_lstm.py (LSTM)
imdb_fasttext.py (FASTTEXT)
imdb_cnn.py (CNN)
imdb_cnn_lstm.py (LSTM)
imdb_bidirectional_lstm.py (Bidirectional_LSTM)

と5つ、学習を行うコードが入っています。
このコードにモデル保存を追記しIMDBを学習させます。
この部分のコードについては、このブログエントリーでは触れません。
後述のGitHub リポジトリにコードが入っていますので、そちらを参照してください。

学習したモデルを読み込んでIMDBを識別するコード

jupyter notebookで使えます。
コード内のprediction_mode変数の値を切り替えることで、読み込む学習済みモデルを変更することができます。

GitHub リポジトリ

ここに全てのコード、バイナリが入っています。

github.com

学習モデルの比較

学習ログから、テストデータの正答率(val_acc)を比較したところimdb_fasttext, imdb_cnnの順で成績が良かった。

5つの学習モデルのログは、こちらのGoogle スプレッドシートで見ることができる。

Train-Log-IMDB-Prediction-In-Keras

参考

abdel.me

データセット - Keras Documentation

2018-02-01

KerasデータセットのIMDB映画レビューの元文章を表示する簡単サンプル

深層学習 Python Keras Jupyter Notebook IMDB

IMDBは触ったことがなかったんで、とりあえずデータセットの中身をみるところから始めてみました。

IMDB映画レビュー感情分類データセットとは

感情 (肯定/否定) のラベル付けをされた，25,000のIMDB映画レビューのデータセット
レビューは前処理済みで，各レビューは単語のインデックス（整数）のシーケンスとなっている
単語はデータセットにおいての出現頻度によってインデックスされている。そのため例えば，整数"3"はデータの中で3番目に頻度が多い単語である
ラベルが1ならば肯定的な意見。0ならば否定的な意見

さて、コードを書いて実際どのようなデータが入っているか見てみます。

IMDBの元文章を表示するソースコード

x_trainが文章を出現頻度を表す整数のインデックスに変換したもの。
y_trainが感情の肯定、否定ラベルであることがわかる。
x_test、y_testは学習結果のテスト用データだが、このテストデータも25000件用意されていることがわかる。

参考

stackoverflow.com

大筋ここにのってるコードをベースに、自分好みにすり合わせ。
ありがとう！

データセット - Keras Documentation

2018-01-29

畳み込みニューラルネットワークでのFashion-MNISTの学習をひたすら廻してみた結果

Fashion-MNIST Keras 深層学習 Python

f:id:uchidamax:20180129020710p:plain
前回の記事
Fashion-MNISTを畳み込みニューラルネットワークで判定する簡単サンプル - 人工知能プログラミングやってくブログ
に対して
「val_lossがまだ0.2もあるんだから、もっと学習回せば正答率あがんじゃないの？」
という意見をもらったんで、
「じゃ、試しにやってみるか」
と徹底的に学習を回してみました。
その結果を発表します。