株式会社サインウェーブ
ランチ会その2

2016.09.14

ランチ会その2

こんにちは、エンジニアの日下です。

ランチ会について何か書けとの指令がきたのですが、
「おっさんのグルメレビューなんて誰も聞きたくないのでは・・・」
と考えるたびに楽しいランチが憂鬱になってきます。

とはいえ、せっかくなのでエンジニアっぽい切り口で
コンピュータビジョンについて話すことにしました。

コンピュータビジョンは人工知能での成果が著しい分野です。
スマートフォンでカメラを起動すれば被写体の顔にフォーカスが当たりますし、
頂戴した名刺をOCRにかければ電話帳に登録してくれます。

そんな中、人工知能を使って写真の内容を解析するコンピュータビジョンという技術をご存知でしょうか?
何が写っているか、何をしているかを識別し、文字にしたり、自動でキャプションを生成したりします。

理論や手法はさておき、ランチ会で撮った画像を以下のサービスで解析してみました。
・「Google Vision API(https://console.developers.google.com/apis/api/vision.googleapis.com/overview)」
・「Computer Vision API(https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/)」

結果は・・・
-------------------------------------
Google Vision API (ラベルのみ抜粋)
-------------------------------------
"people", "dish", "cooking","food","eating",
"meal","sense","cuisine","supper","baking","cook",

-------------------------------------
Compute Vision API(キャプションのみ抜粋)
-------------------------------------
"text": "a man and woman preparing food on a table", 

惜しい感じで間違ってますね。

さて、現在エンジニア職募集中です。
説明会に是非参加ください。
投稿一覧