ディープラーニングとは

URL をコピー

ディープラーニングは、人間の脳をヒントに開発されたアルゴリズムを使用してコンピュータにデータを処理する方法を教える人工知能 (AI) 技法です。 

ディープラーニングは人工知能と機械学習 (AI/ML) を使用して、大量のデータを収集、分析、解釈するデータサイエンティストを支援します。ディープラーニングのプロセスはディープ・ニューラル・ラーニングやディープ・ニューラル・ネットワークとも呼ばれ、観測を通じてコンピュータに学習させるもので、人間が知識を獲得する方法を模しています。

人間の脳には相互につながる多数の神経があり、脳が情報 (つまりデータ) を処理するときに情報の伝達役として機能します。このニューロンは電気信号と化学的物質による信号を使用して相互に通信し、脳のさまざまな部分と情報をやりとりします。

人工ニューラルネットワーク (ANN) はディープラーニングの基盤となるアーキテクチャで、この生体現象に基づいています。ただし、この現象はノードと呼ばれるソフトウェアモジュールから作成される人工ニューロンで形成されています。これらのノードは数理計算 (脳の場合は化学的信号) を使用して情報の通信と転送を行います。このシミュレーションされたニューラルネットワーク (SNN) は、データポイントをクラスタリングし、予測することでデータを処理します。

ディープラーニングを、入力レイヤーから始まって出力レイヤーで終わるフローチャートの一種と考えるとよいでしょう。この 2 つのレイヤーに挟まれているのが「隠れレイヤー」で、さまざまなレベルで情報を処理し、新しいデータを次々と受け取りながら動作を調整し、適応させます。ディープラーニングモデルには数百もの隠れレイヤーがあり、そのそれぞれがデータセット内の関係とパターンを見つけるために機能しています。

複数のノードで構成される入力レイヤーから始めて、データがモデルに流れ込み、分類されてから次のレイヤーに進みます。データが各レイヤーを進む経路は、各ノードで設定された計算に基づきます。その後データが各レイヤーを通過し、その中で観測を取り込み、結果としてデータの出力となる最終分析が作成されます。

Red Hat AI の詳細

ハイブリッドクラウドにおける AI モデルのためのオープン・プラットフォーム

ディープラーニングを活用するアプリケーションはすでに私たちの日常生活に溶け込んでおり、多数の業界で使用されています。生成 AI は今や多数の AI ツールの原動力となっていますが、それを可能にしているのがディープラーニングです。

ディープラーニングのユースケースは進化を続けていますが、現在利用されている最も代表的な 3 大テクノロジーは、コンピュータビジョン、音声認識、自然言語処理 (NLP) です。

  • コンピュータビジョン:コンピュータはディープラーニング技法を使用して、人間と同じ方法で画像を理解できます。これにより、自動コンテンツモデレーション、顔認識、画像分類が可能になります。
  • 音声認識:ピッチ、トーン、言語、アクセントのすべてを、ディープラーニングモデルを利用して分析できます。カスタマーエクスペリエンスの向上に使用できるほか、リアルタイムの文字起こしが必要となる場合に、アクセシビリティの面からも有用です。
  • 自然言語処理 (NLP):コンピュータはディープラーニング・アルゴリズムを使用して、テキストデータやドキュメントを分析し、インサイトを収集します。長い文章の要約、センチメント (肯定的または否定的なコメントなど) を示す主なフレーズのインデックス化、自動バーチャルアシスタントやチャットボット向けインサイトの生成の機能において、支援になります。NLP の領域は広範で、人間の言語を理解し生成するための大規模言語モデル (LLM) の開発と適用が含まれます。
     

ディープラーニングの原則を活用する業界の事例をいくつか紹介します。

  • カスタマーサービス:チャットボット、バーチャルアシスタント、ダイアルイン・カスタマーサービス・ポータルでは、音声認識などのツールを利用しています。
  • 金融サービス:予測分析によって、アルゴリズムによる株取引を促進し、融資承認のビジネスリスクを評価し、不正行為を検出し、信用および投資ポートフォリオの管理を支援します。
  • 医療:医療記録のデジタル化により、医療診断の必要性を示す危険信号を自動的に検出するように学習させて、画像認識アプリケーションで医用画像スペシャリストをサポートできます。 HCA Healthcare が予測分析を使用して、敗血症の検出に対する標準化されたデジタルアプローチを確立した方法をご覧ください。
  • メディアおよびエンターテイメント:オンラインショッピングからメディア・ストリーミング・サービスまで、ディープラーニングはユーザーのアクティビティの追跡や個別化されたお勧めの開発に使用されています。
  • 産業自動化:工場や倉庫において、ディープラーニング・アプリケーションによって、機械から安全な距離をとっていない人間や物があることを自動的に検出したり、品質管理や予防保守で支援したりすることができます。
  • 自動運転車:自動車の研究者はディープラーニングを使用して、停止標識、信号、横断歩道、歩行者などの物体を検出するよう、自動車をトレーニングできます。
  • 法執行:音声認識、コンピュータビジョン、自然言語処理 (NLP) により、大量のデータの分析を支援し、時間とリソースを節約できます。
  • 航空および軍事:広大な地理的領域を監視するために、ディープラーニングを使用して物体を検出し、対象領域を遠隔から特定し、隊にとって安全な区域と危険な区域を確認できます。

AI/ML のユースケースを探索

Red Hat のリソース

ディープラーニングは機械学習の特化された形態で、取り扱うデータの種類や学習する手法において区別されます。

従来の機械学習アルゴリズムには、モデルに取り込む前にデータセットの前処理という形で、何らかの手作業が必要です。これにより、特定の特徴が入力データから定義されてラベル付けされ、機械学習モデルに取り込む前に表形式にまとめられます。逆にディープラーニング・アルゴリズムではこのレベルの前処理は不要で、テキスト文書、ピクセルデータの画像、オーディオデータのファイルなどの構造化されていないデータを理解することができます。 

ディープラーニングは、大量のデータがあって対象に対する背景知識がない場合、または複雑で時間がかかる作業がある場合に、従来の機械学習よりも向いているといえます。

Red Hat OpenShift がどのように機械学習の運用をサポートするかを見る 

私たちは、ディープラーニングが人工ニューラルネットワーク内で相互に通信するノードの構造を利用して機能することを知っています。ANN を作成するには、モデルおよび提供するデータに計算とパラメーターを導入する必要がありますが、これらの計算がバイアスとバリアンスに対応するように注意が必要です。 

機械学習の分野では、バイアスとは、ターゲット機能を学習しやすくするために、データについてモデルが仮定や汎化を行う程度を指します。バイアスが高いと、情報の処理においてモデルが単純化を行い、(誤りへの) ショートカットを作成することになります。 

バリアンスは、各データポイントの平均からの隔たり、すなわちデータセット内の分散の統計的な測定値を指します。バイアスとは異なり、バリアンスは、モデルがトレーニングデータの影響をどの程度受けるかを示します。バリアンス (感度) が高いと、細部に注意が行き過ぎて、データセットの根底にあるパターンを見逃してしまいます。 

教師付き学習では、バリアンスが高すぎてバイアスが低すぎる場合をオーバーフィッティングと言います。バイアスが高くてバリアンスが低い場合は、アンダーフィッティングと言います。完璧な適合を作り出すのは困難で、この現象を一般にバイアスとバリアンスのトレードオフと呼んでいます。 

パラメーターは境界を定義します。ディープラーニング・アルゴリズムが処理する必要がある膨大な量のデータから有意義な成果を引き出すには境界が重要です。このことから、多くの場合、オーバーフィッティングとアンダーフィッティングをパラメーターを増減させて訂正できることになります。 

人間が関与するバイアスへの対処 

ディープラーニングモデルが統計的に偏りのあるデータや母集団を正確に反映しないデータでトレーニングされると、結果が損なわれます。残念なことに、今ある人間の偏見が人工知能に反映されることがよくあり、差別的なアルゴリズムや偏りのある出力を招くリスクを生じさせています。 

組織では生産性やパフォーマンスの向上に AI を活用しようとし続けていますが、バイアスを最小化するための戦略を適用することが不可欠です。これはインクルーシブデザインのプロセスと、収集したデータ内の代表的な多様性を入念に検討することから始まります。 

ブラックボックスとは

「ブラックボックス」は、AI プログラムがニューラルネットワーク内でタスクを実行し、どのような処理が行われているのかを外部から見ることはできない状態を指します。この状況では、データサイエンティストやアルゴリズムを作成したエンジニアでさえも、モデルが特定の出力にどのようにして至ったかを誰も正確に説明できません。ブラックボックスモデルでは解釈が困難なので、特に医療、刑事司法、金融などの業界では、リスクの高い意思決定に使用すると有害な結論が導かれかねません。 

ブラックボックスをより理解しやすいものにするために、説明可能な AI (XAI) 技術を機械学習のライフサイクル全体に適用できます。説明可能な AI は、その能力と理解を実証できる必要があります。つまり、過去のアクション、進行中のプロセス、今後の手順を説明し、そのアクションの根拠となる関連情報を提示できる必要があります。端的に言うと、説明可能な AI は、AI システムに「その作業内容を見せる」よう促します。

説明可能な AI の詳細

トレーニングと開発

ディープラーニングモデルは、人手を介さなくてもより複雑なコンピューティング・タスクを実行できますが、それと同時に、より多くの処理能力、十分なインフラストラクチャ、大規模なトレーニングデータのセットが必要です。クラウドコンピューティングでは、チームは GPU (グラフィックス処理装置) や CPU (中央処理装置) のクラスタなど、複数のプロセッサーに同時にアクセスでき、複雑な数理演算を実行するには最適な環境となります。

ディープラーニングモデルをクラウドで設計、開発、トレーニングすると、開発チームはすばやく正確にワークロードを拡張して分散でき、同時に運用コストを削減できます。 

推論とデプロイ

モデルのトレーニングが完了すると、推論フェーズに移行します。この時点で、ディープラーニングモデルはライブデータを処理してリアルタイム予測を行うことができます。ここで推論サーバーが重要になります。クラウド・インフラストラクチャ内で稼働する推論サーバーは、ハードウェアとユーザー向けアプリケーションの間の橋渡し役として機能します。 その役割は、リソース要求を管理し、処理が可能な限り迅速に行われるようにすることによって、モデルを最適化することです。 

この分野を牽引するツールが vLLM です。vLLM は、メモリー効率の高い推論サーバー兼エンジンであり、ハイブリッドクラウド環境における大規模言語モデルのスピードと処理能力を向上させるように設計されています。

vLLM の詳細はこちら

エッジ上のディープラーニングと機械学習

クラウドで作業すると、エッジ上で機械学習を利用する可能性が生まれます。パブリッククラウド・リソースに接続されたエッジコンピューティングのハブを確立すると、情報をリアルタイムで取得して分析し、サプライチェーンのステータス更新から災害避難場所の情報まで、さまざまな運用を支援できます。 

Red Hat® AI は、上述したコンピュータビジョン、音声認識、自然言語処理などのテクノロジーのメリットを実現するのに役立ちます。

当社の AI 製品のポートフォリオは、Red Hat のお客様の信頼を得ているソリューションに基づいて構築されています。これを基盤として、当社製品の信頼性、柔軟性、拡張性が維持されます。

Red Hat AI のサポートによって以下のことが可能になります。

  • AI を迅速に導入してイノベーションを実現する
  • AI ソリューションの提供における複雑さを解消できる
  • どこにでもデプロイできる

Red Hat AI の詳細

ディープラーニングを試すためのツールボックス

機械学習アルゴリズムを構築する場合でも、予測モデルをゼロから作成する場合でも、Red Hat OpenShift AI には、作業を開始するのに役立つさまざまなツールが多数用意されています。 

この AI プラットフォームは、JupyterLab をベースとするインタラクティブ・インタフェース、AI/ML のコアライブラリへのシームレスなアクセス、広く使用されているフレームワークなどのツールを提供します。さらに、データサイエンス・パイプラインの作成と自動化を支援するビジュアルエディターも提供します。CI/CD パイプラインと組み合わせることで、MLOps を改善して運用効率を高め、より多くの AI モデルをより迅速にプロダクションに移行できます。

Red Hat OpenShift AI の詳細

Red Hat の AI パートナー

さらに、当社の AI パートナーエコシステムは成長しています。さまざまなテクノロジーパートナーが Red Hat と連携し、Red Hat AI の運用能力に関する認定を受けています。これにより、選択肢を常にオープンに保つことができます。

Red Hat のパートナーの詳細

ブログ投稿

戦略の主権をどの程度保持していますか?Red Hat Sovereignity Readiness Assessment ツールの概要

Red Hat Sovereignty Readiness Assessment ツールは、Web ベースのセルフサービス評価ツールであり、7 つの重要ドメインにわたる組織のデジタル管理についての明確で客観的なベースラインを提供します。

すべての Red Hat 製品のトライアル

Red Hat の無料トライアルは、Red Hat 製品をハンズオンでお試しいただける無料体験版です。認定の取得に向けた準備をしたり、製品が組織に適しているかどうかを評価したりするのに役立ちます。

関連情報

医療 AI とは | Red Hat

医療 AI とは、医療に AI 技術を応用することを指します。機械学習でトレーニングされたアルゴリズムが医療の応用、医療の提供、医療の利用の 3 分野で活用されています。

機械学習とは

機械学習は、明示的にプログラムしなくても、パターンを見つけ、予測し、経験から学習するようにコンピュータをトレーニングする手法です。

生成 AI とは?をわかりやすく解説

生成 AI とは、人工知能テクノロジーの一種であり、大規模なデータセットで訓練されたディープラーニングモデルを使用して新しいコンテンツを作成するものです。

AI/MLリソース

関連記事