スマホ関連の海外ニュースです。
光学式文字認識、OCR、通称は画像や動画、テキストを検出し、認識された単語を抽出します。OCR を使用して、私たちすることができますユーザーの皆様くらい良いユーザー エクスペリエンスを提供;モバイル デバイスのデータ エントリを手動で実行する代わりに、ユーザーは単に写真を撮ることができ、OCR はユーザーから任意のそれ以上の相互作用を必要とせずに必要な情報を抽出することができます。多くのモバイル アプリケーションは、経費を追跡やビジネス カードを追跡するためのアプリなどのプライマリ ・ ユーザー入力ソースとして OCR を採用しているかでそれを入力するのではなく、クレジット カードの情報を「スキャン」するために使用この機能を見たことがあります。 このブログの記事では、iOS、アンドロイド、Xamarin.Forms と認知マイクロソフト Windows に請求書の追跡アプリを構築することで OCR をわずか数行のコードでモバイル アプリに追加する方法を学びます。 マイクロソフト認知できます 22 コードのほんの数行の強力なアルゴリズムを使用してビルド アプリ私たちは OCR に顔認識からすべてを行うための Api。Api は、5 つの主要なカテゴリに分かれています: ビジョン、音声、言語、知識、検索。コンピューター ビジョン API では、物体認識、OCR でテキストを抽出するなどの画像から豊富な情報を抽出することが出来ます。 原因を追跡するアプリを作ろうお支払い請求書の写真を撮るための日付。開始するには、アプリケーションの初期コードをダウンロードします。これは、新しい請求書を追跡するためのボタンと一緒に、請求書を表示することができます 1 つの画面が含まれています。 マイクロソフト認知サービスは完全に開始する無料です。コンピューター ビジョン API を使用するには、最初にサービスの API キーを取得する必要があります我々。これを行うには、コンピューター ビジョン API ページを訪問し、「取得開始無料」をクリックしてください 製品名として「コンピュータ ビジョン」の行を確認し、「登録」をクリック一度登録すると、API キーなど、コンピューター ビジョン Api への無料購読が必要です。 API キーがあるので、我々 は後に OCR を実行する写真を撮るための機能を追加する時間です。プラットフォーム固有の機能は、写真を撮る、Xamarin の Windows メディア プラグインのおかげで我々 は取るか、迅速かつ簡単に共有コードから写真を選択する機能を追加できます。PCL とプラットフォーム固有のプロジェクトの両方に Xamarin と Windows NuGet パッケージのメディア プラグインを追加します。 写真を撮るにロジックを追加してみましょう。開き、メソッドまでスクロールします。これは、写真を撮る、ocr、および請求書をビューに追加するロジックを追加します。 「カメラのロジックを追加」コメントの下で次のコードを追加します: メディア プラグイン ライブラリを初期化、した後我々 はカメラがコードで実行しているデバイスで利用可能であるかどうかを確認してください。カメラで写真を撮る私たちの場合、されていない場合は、我々 は自分のフォト ライブラリから選択するユーザーを許可します。私たち写真ロジックで行わ今すべての iOS、アンドロイド、およびウィンドウの写真を撮るために必要なコードであります。 OCR を実行するコンピューター ビジョン API に私たちの写真をアップロードする準備ができました。すべての Microsoft の認知サービス Api は RESTful Api だけなので他のサービス同様にそれらへの呼び出しを使用できます。それをマイクロソフト認知サービス Api を使用する可能な限り簡単にするために、チームがクライアント ライブラリを作成し、NuGet でそれらを出荷します。コンピューター ビジョン API をプロジェクトに追加するには、PCL プロジェクトに Microsoft.ProjectOxford.Vision NuGet を追加します。 「OCR ロジックを追加”コメントの下メソッドで次のコードを追加:、コンピューター ビジョン API 自動的にアップロードしたイメージすべて文字を検出および 21 の異なる言語から文字を認識することが可能です。必要、(ユーザーは、完璧な写真を撮る必要があるない) ので、イメージは水平軸回転も。これらの文字は、個別のテキスト行を含む領域が分割されます。 次に、OCR によって返される最大の数値を選択することにより、請求書の合計をましょう。合計を選択した後みましょう新しいを作成し、追加する私たち。 我々 はマイクロソフト認知と Xamarin を使用して請求書を追跡するアプリケーションを構築したばかりだ!このアプリは、コンピューター ビジョン API の OCR 機能を使用して、請求書から合計を抽出します。OCR を使用して日付を抽出し、自動的に請求書が期限のユーザーを思い出させるためにカレンダーにイベントを追加するにも拡張できます。 このブログの記事では、Microsoft 認知サービスを使用する方法を説明しました請求書 OCR を使用してから原因を追跡するアプリケーションを構築する無料のコンピュータ ビジョン API の日付します。マイクロソフト認知、わずか数行のコードで、顔認識などの強力なアルゴリズムでよりスマートなアプリを構築することができます。すべて 21 の完全な一覧についてサービスのポータルをチェックしてください Microsoft 認知サービスの詳細については、Api ドキュメントに加え。OCR の詳細については、InvoiceIt サンプルをダウンロードまたはマニュアルを参照してください。
続きを読む…
Performing OCR for iOS, Android, and Windows with Microsoft Cognitive Services
Optical character recognition, commonly known as OCR, detects the text found in an image or video and extracts the recognized words. By using OCR, we can provide our users a much better user experience; instead of having to manually perform data entry on a mobile device, users can simply take a photo, and OCR can extract the information required without requiring any further interaction from the user.
Read more…