ノースカロライナ州立大学の研究者は、画像内のオブジェクトを識別する視覚変圧器の能力を向上させることを目的とした方法論を開発しました。
Vision Transformer(VIT)は、画像内のオブジェクトを識別して分類できるオンライン カジノ 無料 プレイテクノロジーです。
ただし、意思決定の透明性とコンピューティング要件に関連する重要な課題があります。
今、研究者はこれらの両方の課題に対処する新しい方法論を開発しました。
この方法は、画像内のオブジェクトを識別、分類、およびセグメント化するビジョントランスの能力も向上させます。
ビジョントランスとは?
トランスフォーマーは、最も強力な既存のオンライン カジノ 無料 プレイテクノロジーの1つです。
たとえば、ChatGptは、トランスアーキテクチャを使用するオンライン カジノ 無料 プレイテクノロジーです。この場合、オンライン カジノ ゲーム自然言語処理の可能性を解き放つ:.
ビジョントランスは、視覚入力を使用してトレーニングされたトランスベースのオンライン カジノ 無料 プレイです。
このオンライン カジノ 無料 プレイテクノロジーは、画像内のすべての車を識別するなど、画像内のオブジェクトを検出および分類するために使用できます。
ビジョントランスフォーマーは2つの課題に直面しています
VITSが直面する最初の課題は、変圧器モデルが非常に複雑であることです。変圧器モデルには、かなりの量の計算能力が必要であり、オンライン カジノ 無料 プレイに接続されているデータの量と比較して、大量のメモリを使用します。
画像には多くのデータが含まれているため、これはビジョントランスにとって問題があります。
2番目の課題は、ユーザーがVitsがどのように決定を下すかを理解することが難しいことです。
たとえば、画像内の犬を識別するために視覚変圧器を訓練することができます。しかし、ビジョントランスが犬とは何かを決定しているかどうかは完全には明らかではありません。
アプリケーションに応じて、モデルの解釈可能性としても知られているビジョントランスの意思決定プロセスを理解することが重要です。
新しいビジョントランスの方法論は、両方の課題に対処します
チームが開発した新しいビジョントランスの方法論は「と呼ばれます。パッチからクラスターへの注意’(PACA)とオンライン カジノ 無料 プレイテクノロジーの効率を改善します。
「クラスタリング技術を使用することにより、計算およびメモリの要求に関連する課題に対処します。これにより、トランスアーキテクチャは画像内のオブジェクトをよりよく特定し、焦点を当てることができます」ノースカロライナ州立大学の電気およびコンピューター工学の准教授。
「クラスタリングとは、画像データに見られる類似性に基づいて、オンライン カジノ 無料 プレイが画像のセクションをまとめた場合です。これにより、システムに対する計算需要が大幅に削減されます。
「クラスタリングにより、これを線形プロセスにすることができます。各小さなユニットは、所定の数のクラスターと比較する必要があります。システムに10個のクラスターを確立するように指示したとしましょう。
チームはPACAのテストを完了しました
研究者は、SwinとPvt。と呼ばれる2つの最先端のVITと比較することにより、新しいVision Transformer方法論を広範囲にテストしました。
「PACAがあらゆる点でSWINとPVTを上回ることがわかりました」とWuは言いました。
「PACAは、画像のオブジェクトの分類、画像のオブジェクトの識別に優れており、セグメンテーションが優れていたため、画像のオブジェクトの境界を基本的に概説しました。また、より効率的でした。つまり、これらのタスクを他のVITよりも迅速に実行できたことを意味します。
「私たちの次のステップは、より大きな基礎データセットでトレーニングすることでPACAをスケールアップすることです。」