Table of Contents

生成AIと不正防止AIの違いを理解する

注目され、頻繁に議論される 2 つの分野は、生成 AI と不正防止システムで使用される AI (予測 AI) です。どちらも高度な機械学習モデルを活用していますが、そのアルゴリズムは、リアルなコンテンツの生成と不正行為の検出および防止という特定の目標に合わせて調整されています。モデル、学習方法、評価基準の選択は、これらの明確な目的を反映しています。

予測 AI と生成 AI は、人工知能の領域内で異なる目的を果たします。予測 AI は、モデルを使用してパターンを識別し、不正行為の検出や顧客行動の予測などの予測を行い、履歴データに基づいて将来のイベントや結果を予測することに重点を置いています。これは、予測結果と実際の結果の差を最小限に抑えることを目的とした教師あり学習手法に大きく依存しています。対照的に、生成 AI は、特定のデータセットの根本的な分布を学習することで、新しい現実的なデータ サンプルを作成するように設計されています。画像、テキスト、音楽などのコンテンツを生成するために、生成的敵対的ネットワーク (GAN) や変分オートエンコーダー (VAE) などの教師なし学習または半教師あり学習手法がよく使用されます。予測 AI は正確な予測を行うことを目的としますが、生成 AI はトレーニング データの特性を模倣した新しいデータを生成することを目的とします。

教師あり学習と教師なし学習の文脈における違いを確認してみましょう。

教師あり学習

教師あり学習は、ラベル付きデータでモデルをトレーニングするタイプの機械学習です。つまり、各トレーニング例に対して、モデルには入力データとそれに対応する正しい出力(ラベルと呼ばれることが多い)が提供されます。教師あり学習の目的は、新しい未知のデータに適用できる入力から出力へのマッピングを学習することです。

不正行為防止の文脈では、教師あり学習は、各インスタンスが不正か非不正かのラベル付けされた履歴データから学習することで不正な取引や活動を識別できるモデルをトレーニングするために使用されます。目標は、トレーニング中に学習したパターンに基づいて、新しい未知のトランザクションを正当なものと不正なものとに正確に分類できるモデルを構築することです。決定木、ランダムフォレスト、ニューラルネットワークなどのアルゴリズムが一般的に使用されます。決定木とランダムフォレストは教師ありモデルですが、ニューラル ネットワークは教師あり学習と教師なし学習の両方のコンテキストで使用できるほか、半教師あり学習と強化学習のシナリオでも使用できます。

決定木とランダムフォレスト

決定木とランダムフォレストは、一般的に生成 AI では使用されません。生成 AI には通常、複雑で高次元のデータ分布を学習し、トレーニング データに似た新しいデータを生成できるモデルが必要です。決定木とランダム フォレストは、入力機能に基づいて決定や予測を行うことを目的とする分類や回帰などのタスクに適しています。

ニューラルネットワーク

生成 AI と予測 AI はどちらも教師ありニューラル ネットワークを活用しますが、それぞれのタスクに合わせて異なる方法で活用します。不正防止のための予測 AI は不正行為の識別と分類に重点を置いており、フィードフォワード ネットワーク、RNN、LSTM を採用することがよくあります。

フィードフォワード ネットワークは、さまざまな入力機能に基づいてトランザクションを不正か正当かに分類するために使用されます。これらの機能には、取引金額、時間、場所、ユーザーの行動パターン、その他の関連データが含まれる場合があります。フィードフォワード ネットワークは、一般的に、生成 AI タスクの主な選択肢ではありません。

リカレント ニューラル ネットワーク (RNN) と長短期記憶ネットワーク (LSTM) は、特に連続データを扱う場合の不正行為防止に使用されます。時間的な依存関係と連続パターンをモデル化する機能により、時間の経過に伴う不正行為の検出に適しています。たとえば、時間の経過に伴うユーザーの取引履歴を分析して、一連の小さな取引の後に突然大きな取引が行われるなどの異常を検出します。RNN と LSTM は、Generative AI でも、テキスト生成、音楽作曲、および順次データの作成を伴うその他のタスクによく使用されます。

教師なし学習

教師なし学習とは、ラベル付けされた応答のないデータでモデルをトレーニングするタイプの機械学習を指します。モデルが入力と出力のペア(出力が既知で提供)から学習する教師あり学習とは異なり、教師なし学習では入力データ自体の中のパターン、構造、または関係を見つけます。

教師なしモデルは、特にラベル付けされたデータが不足しているか入手できない場合に、不正行為の防止に不可欠です。これらのモデルは、トランザクションの通常の動作を学習し、逸脱にフラグを立てることで、不正行為を示す可能性のある異常や異常なパターンを検出できます。一般的な教師なしモデルには、オートエンコーダー、クラスタリング アルゴリズム、分離フォレスト、PCA、1 クラス SVM、ガウス混合モデル、自己組織化マップなどがあります。各手法は、さまざまなデータ タイプと構造における潜在的な不正行為を識別するための独自の利点を提供します。

クラスタリングとオートエンコーダ

クラスタリングと標準的な統計手法は、本質的に生成的ではありませんが、生成モデルの開発、トレーニング、改良において補助的な役割を果たします。オートエンコーダ、特に VAE は、潜在空間表現から学習してサンプリングする能力を活用して、生成モデルとして直接使用されます。

GANs

GAN は、競合フレームワークで一緒にトレーニングされる 2 つのニューラル ネットワーク (ジェネレーターとディスクリミネーター) で構成されます。ジェネレーターはデータ サンプルを作成し、ディスクリミネーターはそれを実際のデータに対して評価します。GAN は、リアルな画像、ビデオ、その他のメディア コンテンツの生成に広く使用されています。彼らは高品質の合成データを生成する能力で知られています。

GAN は新しい合成データを生成することに重点を置いていますが、これは既存のデータ パターンに基づいて不正行為を特定し、軽減するという不正防止の主な目的と一致しません。ただし、GAN は、特に合成データの生成や異常検出モデルの強化など、いくつかの革新的な方法で詐欺防止に適用できます。たとえば、GAN は実際のデータの分布を模倣した現実的な合成トランザクション データを生成できます。これは、特にラベル付けされた不正データが不足している場合に、不正検出モデルのトレーニングとテストに役立ちます。全体的に、GAN は主に生成タスク用に設計されていますが、詐欺防止への応用は可能ですが、一定の課題を伴います。

まとめ

不正防止のための生成 AI と予測 AI はどちらも高度な機械学習の力を活用していますが、その用途、方法、目標はそれぞれ異なります。生成 AI は創造性とシミュレーションの新たな領域を切り開き、不正防止 AI はさまざまな分野の取引と活動を保護します。これらの違いを理解することは、イノベーションを目指す場合でも、保護を目指す場合でも、さまざまな状況で AI を効果的に活用するために不可欠です。

Author

  • Mickey Boodaei

    MickeyはTransmit SecurityのCEO兼共同設立者で、イスラエルのテルアビブで製品・開発チームを情熱的に率いています。パイオニアであり、30年以上にわたって多数の企業を立ち上げてきた起業家です。Imperva(IMPV)やTrusteer(2013年にIBMにより買収)などの大手サイバー企業を共同設立したほか、Armis、Apiiro、Islandなどこの分野の10以上のスタートアップ企業に個人として出資しています。

    View all posts