帶有噪聲的應用程式的基於密度的空間聚類。
DBSCAN 是一種聚類演算法。給它一個值的集合,演算法將它們組織成鄰近值的群組。
對我們許多人來說,如果我們熟悉聚類演算法,我們就會了解k均值聚類。但k -means 的挑戰之一是您需要指定多個集群(「 k 」)才能使用它。很多時候,我們事先並不知道合理的k值是多少。 (事實上,這通常是我們首先想知道的!)
DBSCAN 的優點在於您不必指定多個叢集即可使用它。您所需要的只是一個計算值之間距離的函數以及一些關於什麼距離被視為“接近”的指導。 DBSCAN 還可以在各種不同的分佈上產生比k平均值更合理的結果。
import DBSCAN
import simd
let input : [ SIMD3 < Double > ] = [ [ 0 , 10 , 20 ] ,
[ 0 , 11 , 21 ] ,
[ 0 , 12 , 20 ] ,
[ 20 , 33 , 59 ] ,
[ 21 , 32 , 56 ] ,
[ 59 , 77 , 101 ] ,
[ 58 , 79 , 100 ] ,
[ 58 , 76 , 102 ] ,
[ 300 , 70 , 20 ] ,
[ 500 , 300 , 202 ] ,
[ 500 , 302 , 204 ] ]
let dbscan = DBSCAN ( input )
#if swift(>=5.2)
let ( clusters , outliers ) = dbscan ( epsilon : 10 ,
minimumNumberOfPoints : 1 ,
distanceFunction : simd . distance )
#else // Swift <5.2 requires explicit `callAsFunction` method name
let ( clusters , outliers ) = dbscan . callAsFunction ( epsilon : 10 ,
minimumNumberOfPoints : 1 ,
distanceFunction : simd . distance )
#endif
print ( clusters )
// [ [0, 10, 20], [0, 11, 21], [0, 12, 20] ]
// [ [20, 33, 59], [21, 32, 56] ],
// [ [58, 79, 100], [58, 76, 102], [59, 77, 101] ],
// [ [500, 300, 202], [500, 302, 204] ],
print ( outliers )
// [ [ 300, 70, 20 ] ]
將 DBSCAN 套件加入Package.swift
中的目標依賴項:
import PackageDescription
let package = Package (
name : " YourProject " ,
dependencies : [
. package (
url : " https://github.com/NSHipster/DBSCAN " ,
from : " 0.0.1 "
) ,
]
)
然後執行swift build
命令來建立您的專案。
麻省理工學院
馬特(@mattt)