AI

  • Cognitive Services の音声認識で日本語を利用したい

    [Q] Cognitive Services の Speech to Text で、日本語の音声を入力してテキストに変換する事はできますか? また、Speaker Recognition (話者識別) も日本語に対応していますか?   [A] Speech to Text と Speaker Recognition 共に、日本語の音声入力に対応しております。ロケールは「ja-JP」をご利用下...

  • Custom Vision で作成したAIモデルをエッジで実行する際のサンプルコードが欲しい

    [Q] Custom Vision で作成した画像分類のAIモデルをローカルPC(エッジデバイス)上で実行したいです。必要な手順を教えてください。 また、Pythonのサンプルコードはありますか?   [A] AIモデルをコンパクトドメインに変換した上で、エクスポートする必要があります。既存のモデルのドメインを変換してエクスポートする手順については、下記URLのドキュメントをご参照ください。...

  • Cognitive Services Vision API (OCR/Read) で文字を認識する際の画像サイズやフォントの種類について

    [Q] OCRで文字を読み取る際、AIで処理する画像サイズに制約はありますか?また、最適な画像サイズやフォントサイズ、フォントの種類はありますか? [A] 画像サイズは 50 x 50 ピクセル以上 10,000 x 10,000 ピクセル以下です。 最適な画像サイズやフォントサイズ、フォントの種類については、一定の基準はなく、マイクロソフト社から公開されている情報はございません。実際にお客...

  • 日本語の手書き文字をOCRで読み取りたい Cognitive Services Vision Read API (OCR)

    [Q] Cognitive Services Vision Read API(OCR)で、日本語の手書き文字を読み取る事はできますか?   [A] 2022年2月時点(Read API v3.2)では、日本語の読み取りは活字(印刷されたテキスト)のみ対応していますが、2022年2月14日に、Public Preview版として「手書きテキストのOCR」のサポートが追加されました。 REST ...

  • Cognitive Services Read API のバージョンアップ方法

    [Q]Cognitive Services (Computer Vision)の Read API v2.1 を利用するアプリケーションを開発しました。これを Read API v3.2 に更新しようと考えています。 既存のソースコードでRead APIを呼び出しているパスがあり、このパス内のバージョン番号を変更するだけで動きますか?https://{endpoint}/vision/v2....

  • Custom Vision Service のクイックテストで複数枚の画像を使用して検証したい

    [Q] Custom Vision Service のクイックテストで、同時に複数枚の画像を使って予測の検証を行うことはできますか?   [A] Custom Vision Service のクイックテストでは、1枚ずつの予測しか行う事ができません。複数枚の画像で予測を行うには、Prediction API を使用してプログラムやスクリプト上から予測操作を実行してください。   [参考情報]...