AIは写真を記述できるようになりました。潜在的なビジネスへの影響を見る

GoogleとStanfordの研究者によると、コンピュータビジョンを自然言語処理と組み合わせて画像を表示し、テキストで説明することができるようになりました。

人間の第二の性質であるこの作業は、人工知能および画像認識ソフトウェアにとっては難解です。 Googleとスタンフォードが進歩するにつれて、その努力は、多くの機能に影響を与える可能性があります。 New York Timesの記事で強調された両研究チームは、画像の記述を可能にするためにニューラルネットワークを使用していると述べた。スタンフォード大学の取り組みを見てみましょう

Googleの調査結果

最新のコンピュータビジョンの研究が終わったところで熟考を開始するのは早い時期ですが、インパクトが遅くなく早く到着する可能性がある分野もあります。

アプリケーション

産業

記述を行うことができるコンピュータの欠点は、この技術が監視の分担を上げる可能性があることです。ストーブに座っている2つのピザは一つのことです。労働者と市民を追跡することは、まったく別の項目です。

そうであってもなくても、Appleは本当に時代遅れの技術を排除するために必要な「勇気」を持っている

ビッグデータ:ビデオは構造化されていないデータの式の一部ですが、コンピュータビジョンで何が起こっているのかを英語で記述することができれば、より構造化することができます。セキュリティ:コンピュータビジョンが物事(ピザ、テーブル、椅子)を認識することから人々を特定することに変わることを認識することは、大きな飛躍ではありません。ロボティクス:コンピュータビジョンとより自然な言語処理のロボットは、アイテムを識別し、それらとやりとりする方法をよりよく知ることができるでしょう。たとえば、会社はいつもの午後1時に建物に入ったのを知ります。

アップルのファッションギャンブル失敗

韓国のMinkonetはVRストリーミングサービスの上にネイティブオブジェクト広告を掲載

サムスンとTモバイルが5Gトライアルで協力

メディア:今日、あなたはオンデマンドでショーを持っています。過去5年間にコンピュータ画像の認識がテレビのネットワーク上であなたを追いかけることができたらどうなりますか?ヘルスケア:コンピュータ画像認識をX線やMRI分析に拡張することができます;小売業:コンピュータビジョンを持つカメラが行動を記述できる場合、彼らは理論上、買い物客が何をしているかを概説することができますリアルタイムでこのモニタリングにより、小売店はフロアディスプレイをオンザフライで切り替えることができます。

アップルは本当に “技術革新”、Appleのファッションギャンブル、革新、 “韓国のMinkonetはVRストリーミングサービス、通信事業者、Samsung、T-Mobileの上にネイティブオブジェクト広告を置く” 5G試験で協力する