ノイズのあるアプリケーションの密度ベースの空間的光沢。
DBSCAN はクラスタリング アルゴリズムです。値のコレクションを与えると、アルゴリズムはそれらを近くの値のグループに編成します。
私たちの多くは、クラスタリング アルゴリズムに少しでも精通していれば、 k平均法クラスタリングについては知っています。ただし、 k平均法に関する課題の 1 つは、それを使用するためにクラスターの数 (「 k 」) を指定する必要があることです。多くの場合、適切なk値が事前にはわかりません。 (実際、それが私たちが最初に知りたいことであることがよくあります。)
DBSCAN の優れた点は、それを使用するためにクラスターの数を指定する必要がないことです。必要なのは、値間の距離を計算する関数と、どの程度の距離が「近い」と見なされるかのガイダンスだけです。また、DBSCAN は、さまざまな分布にわたってk平均法よりも合理的な結果を生成します。
import DBSCAN
import simd
let input : [ SIMD3 < Double > ] = [ [ 0 , 10 , 20 ] ,
[ 0 , 11 , 21 ] ,
[ 0 , 12 , 20 ] ,
[ 20 , 33 , 59 ] ,
[ 21 , 32 , 56 ] ,
[ 59 , 77 , 101 ] ,
[ 58 , 79 , 100 ] ,
[ 58 , 76 , 102 ] ,
[ 300 , 70 , 20 ] ,
[ 500 , 300 , 202 ] ,
[ 500 , 302 , 204 ] ]
let dbscan = DBSCAN ( input )
#if swift(>=5.2)
let ( clusters , outliers ) = dbscan ( epsilon : 10 ,
minimumNumberOfPoints : 1 ,
distanceFunction : simd . distance )
#else // Swift <5.2 requires explicit `callAsFunction` method name
let ( clusters , outliers ) = dbscan . callAsFunction ( epsilon : 10 ,
minimumNumberOfPoints : 1 ,
distanceFunction : simd . distance )
#endif
print ( clusters )
// [ [0, 10, 20], [0, 11, 21], [0, 12, 20] ]
// [ [20, 33, 59], [21, 32, 56] ],
// [ [58, 79, 100], [58, 76, 102], [59, 77, 101] ],
// [ [500, 300, 202], [500, 302, 204] ],
print ( outliers )
// [ [ 300, 70, 20 ] ]
DBSCAN パッケージをPackage.swift
のターゲット依存関係に追加します。
import PackageDescription
let package = Package (
name : " YourProject " ,
dependencies : [
. package (
url : " https://github.com/NSHipster/DBSCAN " ,
from : " 0.0.1 "
) ,
]
)
次に、 swift build
コマンドを実行してプロジェクトをビルドします。
マサチューセッツ工科大学
マット (@mattt)