画像認識AIのサービス比較

画像認識AIのサービス比較

こんにちは。もはや自分の専門がわからなくなっている、キャレット合同会社の椎原です。

このほど、某社から男性と女性のライブマッチングサイトを受注しました。お客さんも弊社もユーザーが裸になられると困るので、どうするか検討していたのですが、機械学習で画像判定されることにしました。規約に書いておいても、やるユーザーはいるんですよね。Twitterとか裏アカで暴露しまくってる人いるでしょ

で、調べてみた結果、Amazonのサービスを使うか、Googleのサービスを使うかの二択となりました。(Azureは料金体系がよくわかりませんでした)

サービスの区別はAmazon Rekognitionが静止画像 Amazon Rekognition Videoが動画

Google Cloud Vision APIが静止画像 Cloud Video Intelligence APIが動画

どちらもヌードを「不適切な姿」として認識できる。テストしたら、言葉の表現に違いはあってもどちらも検出した。

(どちらも、画像アップロードしてテストすることができます)

ライブなので、動画なんですが、どうせ脱ぐ時間も掛かるだろうしと思ったので数十秒単位で静止画撮って判定させた方がコスト的にも実用的だと推しておきました。まあ、これからどうするか決めるんですけどね。

 Amazon Rekognition VideoGoogle Cloud Video Intelligence APIAzure Computer Vision
ヌードを検出できるか?
ストリームビデオに対応しているか?
対応ビデオファイル形式MP4、MOVMTS、FLV、MP4(MPEG4)、MOV、3GP、MKV、WebMhttp?
Agora対応?×××
料金ビデオ分析$0.10/ 分最初の 1,000 分(無料)               1,000 分超($0.10/分) 
Amazon Rekognitio(静止画像) 処理された 1 か月あたりの画像の最初の 100 万枚まで 画像あたり 0.001 USDGoogle Cloud Vision AP(静止画像) 最初の 1,000 ユニット/月 無料(ラベル検出を利用している場合は超えても無料)0 – 1,000,000 トランザクション — ¥112/1,000 トランザクション

ストリーミングにはAgoraは独自プロトコル(UDP)のため、両者未対応。動画変換して判定させるか、キャプチャして判定させるしかありません。Amazon Rekognition VideoはKVSに対応しているので使うのならこれですけど、KVSは他の記事にも書きましたが敷居高くて断念してます

料金的には静止画像で、不適切な画像の場合、Google Cloud Vision APIは無料となります。Googleのモットー「Don’t be evil(邪悪になるな)」(現在は、「Do the right thing.(正しいことをしよう)」に変わってます) だから、無料なのかなー? と思ってますが、元々両方とも安いので。

と言うわけで、別件でagoraも動画変換が難しいわけでもなさそうだということが分かったので(現在、別のお客さんの為にvirtual背景作っている最中です)後は、料金的な面からGoogleの静止画像判定を推すだけとなりました。

今回思ったのは表現の制限の市場よりもアダルトとかの方が市場がでかいということでした。私、昔、レーティングソフト(アダルト、ナイフ、爆弾などの表現があるサイトにアクセスできなくなるソフト)のローカライズ開発に関わったことがあったのですが、あんまり普及してくれませんでしたね。社長、元気かなぁ。

お問い合わせ

記事の内容についてもっと詳しく知りたい方や キャレットへのお問い合わせ・資料請求はこちらからお気軽にご連絡ください。

Agora.ioカテゴリの最新記事