CRoaringダウンロード - CRoaringソースコードのダウンロード

C轟音

お気に入りのコンパイラ (GNU GCC、LLVM の Clang、Visual Studio、Apple Xcode、Intel oneAPI) を完全にサポートする、C (および C++) のポータブル Roaring ビットマップ。オープンソース C ソフトウェアの Awesome C リストに含まれています。

導入

ビットセット (ビットマップとも呼ばれます) は、高速データ構造として一般に使用されます。残念ながら、メモリを過剰に使用する可能性があります。これを補うために、圧縮されたビットマップがよく使用されます。

Roaring ビットマップは、WAH、EWAH、Concise などの従来の圧縮ビットマップよりも優れたパフォーマンスを発揮する傾向のある圧縮ビットマップです。これらは、Apache Lucene などのいくつかの主要システムや、Solr や Elasticsearch、Metamarkets の Druid、LinkedIn Pinot、Netflix Atlas、Apache Spark、OpenSearchServer、Cloud Torrent、Whoosh、InfluxDB、Pilosa、Bleve、Microsoft Visual Studio Team などの派生システムで使用されています。サービス (VSTS)、および eBay の Apache Kylin。 CRoaring ライブラリは、Apache Doris、ClickHouse、Redpanda、StarRocks などのいくつかのシステムで使用されています。 YouTube SQL エンジンである Google Procella は、インデックス作成に Roaring ビットマップを使用します。

このライブラリの設計と評価に関する査読済みの記事を公開しました。

Roaring Bitmaps: 最適化されたソフトウェアライブラリの実装、ソフトウェア: 実践と経験 48 (4)、2018 arXiv:1709.07821

Roaring ビットマップは、多くの重要なアプリケーションでうまく機能することがわかっています。

ビットマップ圧縮には可能な限り Roaring を使用してください。他のビットマップ圧縮方法は使用しないでください (Wang et al.、SIGMOD 2017)

実装間の相互運用性のためにシリアル化された形式の仕様があります。したがって、C++ から Roaring Bitmap をシリアル化し、Java で読み取り、変更し、再度シリアル化し、Go と Python で読み取ることが可能です。

客観的

CRoaring の主な目標は、最新のハードウェアを最大限に活用する高性能の低レベル実装を提供することです。 Roaring ビットマップは、Java、Go、Rust などの実装を通じて、さまざまなプラットフォームですでに利用可能です。 CRoaring は、最新のハードウェアに近づき、優れたパフォーマンスの実現を目指すライブラリです。

要件

Linux、macOS、FreeBSD、Windows (MSYS2 および Microsoft Visual Studio)。
ARM、x64/x86、および POWER プロセッサーを使用してライブラリをテストします。私たちはリトルエンディアンシステムのみをサポートしています (ビッグエンディアンシステムはほとんどありません)。
C11 標準 (GCC 7 以降、LLVM 8 以降 (clang)、Xcode 11 以降、Microsoft Visual Studio 2022 以降、Intel oneAPI Compiler 2023.2 以降) をサポートする最近の C コンパイラには、必要なオプションの C++ クラスもあります。 C++11 標準をサポートする C++ コンパイラ。
CMake (プロジェクトに貢献するために、ユーザーが CMake を使用したくない場合は、アマルガム/ユニティビルドに依存できます)。
CMake システムは、git が利用可能であることを前提としています。
x64 システムでは、ライブラリはランタイムディスパッチを提供するため、検出された CPU 機能に基づいて最適化された関数が呼び出されます。 GCC、clang (バージョン 9 以降)、および Visual Studio (2017 以降) で動作します。他のシステム (ARM など) はランタイムディスパッチを必要としません。

実際のビッグエンディアンシステムにアクセスできる人はほとんどいません。それにもかかわらず、リトルエンディアンシステムでのみサポートされる IO シリアル化を除き、エミュレータを通じて IBM s390x などのビッグエンディアンシステムをサポートします (問題 423 を参照)。

クイックスタート

CRoaring ライブラリは 1 つのソースファイルに統合できるため、他のプロジェクトへの統合が容易になります。さらに、すべての重要なコードを 1 つのコンパイル単位にコンパイルできるようにすることで、パフォーマンスを向上させることができます。理論的根拠については、SQLite のドキュメント、または対応する Wikipedia エントリを参照してください。このルートを選択するユーザーは、CRoaring のビルドシステム (CMake ベース) に依存する必要はありません。

各リリースの一部として統合されたファイルを提供します。

Linux または macOS ユーザーは、最新の C または C++ コンパイラがインストールされており、標準ユーティリティ ( wget ) がインストールされている場合は、次の手順に従うことができます。

ライブラリをディレクトリにプルします

 wget https://github.com/RoaringBitmap/CRoaring/releases/download/v2.1.0/roaring.c
wget https://github.com/RoaringBitmap/CRoaring/releases/download/v2.1.0/roaring.h
wget https://github.com/RoaringBitmap/CRoaring/releases/download/v2.1.0/roaring.hh

次の内容を含む、 demo.cという名前の新しいファイルを作成します。

 #include <stdio.h>
#include <stdlib.h>
#include "roaring.c"
int main () {
    roaring_bitmap_t * r1 = roaring_bitmap_create ();
    for ( uint32_t i = 100 ; i < 1000 ; i ++ ) roaring_bitmap_add ( r1 , i );
    printf ( "cardinality = %dn" , ( int ) roaring_bitmap_get_cardinality ( r1 ));
    roaring_bitmap_free ( r1 );

    bitset_t * b = bitset_create ();
    for ( int k = 0 ; k < 1000 ; ++ k ) {
            bitset_set ( b , 3 * k );
    }
    printf ( "%zu n" , bitset_count ( b ));
    bitset_free ( b );
    return EXIT_SUCCESS ;
}

次の内容を含む、 demo.cppという名前の新しいファイルを作成します。

# include < iostream >
# include " roaring.hh " // the amalgamated roaring.hh includes roaring64map.hh
# include " roaring.c "
int main () {
    roaring::Roaring r1;
    for ( uint32_t i = 100 ; i < 1000 ; i++) {
        r1. add (i);
    }
    std::cout << " cardinality = " << r1. cardinality () << std::endl;

    roaring::Roaring64Map r2;
    for ( uint64_t i = 18000000000000000100ull ; i < 18000000000000001000ull ; i++) {
        r2. add (i);
    }
    std::cout << " cardinality = " << r2. cardinality () << std::endl;
    return 0 ;
}

コンパイル

 cc -o demo demo.c
c++ -std=c++11 -o demopp demo.cpp

./demo
```
 cardinality = 900
1000
```
./demopp
```
 cardinality = 900
cardinality = 900
```

CPM 依存関係として Roaring を使用する

CMake と CPM が気に入っている場合は、 CMakeLists.txtファイルに数行追加するだけでCRoaringリリースを入手できます。詳細については、CPM のデモをご覧ください。

 cmake_minimum_required ( VERSION 3.10)
project (roaring_demo
  LANGUAGES CXX C
)
set (CMAKE_CXX_STANDARD 17)
set (CMAKE_C_STANDARD 11)

add_executable (hello hello.cpp)
# You can add CPM.cmake like so:
# mkdir -p cmake
# wget -O cmake/CPM.cmake https://github.com/cpm-cmake/CPM.cmake/releases/latest/download/get_cpm.cmake
include (cmake/CPM.cmake)
CPMAddPackage(
  NAME roaring
  GITHUB_REPOSITORY "RoaringBitmap/CRoaring"
  GIT_TAG v2.0.4
  OPTIONS "BUILD_TESTING OFF"
)

target_link_libraries (hello roaring::roaring)

FetchContent での CMake 依存関係としての使用

CMake が気に入った場合は、 CMakeLists.txtファイルに数行を追加するだけでCRoaringリリースを入手できます。詳細については、デモをご覧ください。

CRoaring ライブラリをローカルにインストールした場合は、次の例のように CMake のfind_package関数でそれを使用できます。

 cmake_minimum_required ( VERSION 3.15)

project (test_roaring_install VERSION 0.1.0 LANGUAGES CXX C)

set (CMAKE_CXX_STANDARD 11)
set (CMAKE_CXX_STANDARD_REQUIRED ON )


set (CMAKE_C_STANDARD 11)
set (CMAKE_C_STANDARD_REQUIRED ON )

find_package (roaring REQUIRED)

file (WRITE main.cpp "
#include <iostream>
#include " roaring/roaring.hh "
int main() {
  roaring::Roaring r1;
  for (uint32_t i = 100; i < 1000; i++) {
    r1.add(i);
  }
  std::cout << " cardinality = " << r1.cardinality() << std::endl;
  return 0;
}" )

add_executable (repro main.cpp)
target_link_libraries (repro PUBLIC roaring::roaring)

融合する

結合されたファイルを自分で生成するには、bash スクリプトを呼び出すことができます...

./amalgamation.sh

サイレント出力を希望する場合は、次のコマンドを使用してstdoutリダイレクトできます。

./amalgamation.sh > /dev/null

(Bash シェルは、Linux および macOS では標準です。Bash シェルは、Windows ではGit Shellという名前で GitHub デスクトップの一部として利用できます。したがって、GitHub デスクトップ内からCRoaring GitHub リポジトリのクローンを作成した場合は、 CRoaringを右クリックできます、 Git Shellを選択し、上記のコマンドを入力します。)

CRoaring ディレクトリ内のスクリプトを呼び出す必要はありません。これは、統合ファイルを書き込む任意のディレクトリから呼び出すことができます。

C ユーザー向けに、 roaring.h 、 roaring.c 、 amalgamation_demo.cという 3 つのファイルと、いくつかの簡単な手順が生成されます。 amalgamation_demo.cファイルは短い例ですが、 roaring.hとroaring.cは「結合された」ファイル (プロジェクトのすべてのソースファイルとヘッダーファイルを含む) です。つまり、ファイルroaring.hとroaring.cプロジェクトにコピーするだけで準備完了です。ライブラリを作成する必要はありません。 amalgamation_demo.cファイルを参照してください。

API

C インターフェイスはファイル内にあります。

轟音.h、
轟音64.h。

C++ インターフェイスもあります。

うなり声。
轟音64マップ.hh。

大量の処理

一部のユーザーは大量のデータを処理する必要があります。可能であればバッチで値を追加するほうがはるかに高速で経済的であるため、これらのユーザーはaddMany (C++) のroaring_bitmap_or_many (C) 関数を認識することが重要になる場合があります。さらに、 runOptimize (C++) 関数またはroaring_bitmap_run_optimize (C) 関数を定期的に呼び出すと効果がある場合があります。

マイクロベンチマークの実行

Google ベンチマークを使用して構築されたマイクロベンチマークがあります。 Linux または macOS では、次のように実行できます。

 cmake -B build -D ENABLE_ROARING_MICROBENCHMARKS=ON
cmake --build build
./build/microbenchmarks/bench

デフォルトでは、ベンチマークツールは 1 つのデータセットを選択します (例: CRoaring/benchmarks/realdata/census1881 )。いくつかのデータセットがあり、他のデータセットを選択することもできます。

 ./build/microbenchmarks/bench benchmarks/realdata/wikileaks-noquotes

ベンチマークの目的で一部の機能を無効にすることができます。たとえば、x64 プロセッサを使用していると仮定すると、プロセッサとコンパイラの両方が AVX-512 をサポートしている場合でも、AVX-512 を使用せずにコードのベンチマークを実行できます。

 cmake -B buildnoavx512 -D ROARING_DISABLE_AVX512=ON -D ENABLE_ROARING_MICROBENCHMARKS=ON
cmake --build buildnoavx512
./buildnoavx512/microbenchmarks/bench

AVX または AVX-512 を使用せずにベンチマークを実行することもできます。

 cmake -B buildnoavx -D ROARING_DISABLE_AVX=ON -D ENABLE_ROARING_MICROBENCHMARKS=ON
cmake --build buildnoavx
./buildnoavx/microbenchmarks/bench

カスタムメモリアロケータ

一般ユーザーの場合、CRoaring は追加のコードなしでデフォルトのアロケーターを適用します。ただし、カスタムメモリアロケータが必要な場合は、グローバルメモリフックも提供されます。以下に例を示します。

 #include <roaring.h>

int main (){
    // define with your own memory hook
    roaring_memory_t my_hook { my_malloc , my_free ...};
    // initialize global memory hook
    roaring_init_memory_hook ( my_hook );
    // write you code here
    ...
}

デフォルトでは以下を使用します。

 static roaring_memory_t global_memory_hook = {
    . malloc = malloc ,
    . realloc = realloc ,
    . calloc = calloc ,
    . free = free ,
    . aligned_malloc = roaring_bitmap_aligned_malloc ,
    . aligned_free = roaring_bitmap_aligned_free ,
};

free / aligned_free関数は、 free(NULL) / aligned_free(NULL)が影響を及ぼさない C 規約に従う必要があります。

例(C)

この例では、CRoaring が構築されており、対応するライブラリに対してリンクしていることを前提としています。デフォルトでは、CRoaring はそのヘッダーファイルをroaringディレクトリにインストールします。アマルガムスクリプトから作業している場合、事前に構築された CRoaring ライブラリにリンクしていない場合は#include "roaring.c"という行を追加し、 #include <roaring/roaring.h>を#include "roaring.h"に置き換えることができます。。

 #include <roaring/roaring.h>
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

bool roaring_iterator_sumall ( uint32_t value , void * param ) {
    * ( uint32_t * ) param += value ;
    return true;  // iterate till the end
}

int main () {
    // create a new empty bitmap
    roaring_bitmap_t * r1 = roaring_bitmap_create ();
    // then we can add values
    for ( uint32_t i = 100 ; i < 1000 ; i ++ ) roaring_bitmap_add ( r1 , i );
    // check whether a value is contained
    assert ( roaring_bitmap_contains ( r1 , 500 ));
    // compute how many bits there are:
    uint32_t cardinality = roaring_bitmap_get_cardinality ( r1 );
    printf ( "Cardinality = %d n" , cardinality );

    // if your bitmaps have long runs, you can compress them by calling
    // run_optimize
    uint32_t expectedsizebasic = roaring_bitmap_portable_size_in_bytes ( r1 );
    roaring_bitmap_run_optimize ( r1 );
    uint32_t expectedsizerun = roaring_bitmap_portable_size_in_bytes ( r1 );
    printf ( "size before run optimize %d bytes, and after %d bytesn" ,
           expectedsizebasic , expectedsizerun );

    // create a new bitmap containing the values {1,2,3,5,6}
    roaring_bitmap_t * r2 = roaring_bitmap_from ( 1 , 2 , 3 , 5 , 6 );
    roaring_bitmap_printf ( r2 );  // print it

    // we can also create a bitmap from a pointer to 32-bit integers
    uint32_t somevalues [] = { 2 , 3 , 4 };
    roaring_bitmap_t * r3 = roaring_bitmap_of_ptr ( 3 , somevalues );

    // we can also go in reverse and go from arrays to bitmaps
    uint64_t card1 = roaring_bitmap_get_cardinality ( r1 );
    uint32_t * arr1 = ( uint32_t * ) malloc ( card1 * sizeof ( uint32_t ));
    assert ( arr1 != NULL );
    roaring_bitmap_to_uint32_array ( r1 , arr1 );
    roaring_bitmap_t * r1f = roaring_bitmap_of_ptr ( card1 , arr1 );
    free ( arr1 );
    assert ( roaring_bitmap_equals ( r1 , r1f ));  // what we recover is equal
    roaring_bitmap_free ( r1f );

    // we can go from arrays to bitmaps from "offset" by "limit"
    size_t offset = 100 ;
    size_t limit = 1000 ;
    uint32_t * arr3 = ( uint32_t * ) malloc ( limit * sizeof ( uint32_t ));
    assert ( arr3 != NULL );
    roaring_bitmap_range_uint32_array ( r1 , offset , limit , arr3 );
    free ( arr3 );

    // we can copy and compare bitmaps
    roaring_bitmap_t * z = roaring_bitmap_copy ( r3 );
    assert ( roaring_bitmap_equals ( r3 , z ));  // what we recover is equal
    roaring_bitmap_free ( z );

    // we can compute union two-by-two
    roaring_bitmap_t * r1_2_3 = roaring_bitmap_or ( r1 , r2 );
    roaring_bitmap_or_inplace ( r1_2_3 , r3 );

    // we can compute a big union
    const roaring_bitmap_t * allmybitmaps [] = { r1 , r2 , r3 };
    roaring_bitmap_t * bigunion = roaring_bitmap_or_many ( 3 , allmybitmaps );
    assert (
        roaring_bitmap_equals ( r1_2_3 , bigunion ));  // what we recover is equal
    // can also do the big union with a heap
    roaring_bitmap_t * bigunionheap =
        roaring_bitmap_or_many_heap ( 3 , allmybitmaps );
    assert ( roaring_bitmap_equals ( r1_2_3 , bigunionheap ));

    roaring_bitmap_free ( r1_2_3 );
    roaring_bitmap_free ( bigunion );
    roaring_bitmap_free ( bigunionheap );

    // we can compute intersection two-by-two
    roaring_bitmap_t * i1_2 = roaring_bitmap_and ( r1 , r2 );
    roaring_bitmap_free ( i1_2 );

    // we can write a bitmap to a pointer and recover it later
    uint32_t expectedsize = roaring_bitmap_portable_size_in_bytes ( r1 );
    char * serializedbytes = malloc ( expectedsize );
    // When serializing data to a file, we recommend that you also use
    // checksums so that, at deserialization, you can be confident
    // that you are recovering the correct data.
    roaring_bitmap_portable_serialize ( r1 , serializedbytes );
    // Note: it is expected that the input follows the specification
    // https://github.com/RoaringBitmap/RoaringFormatSpec
    // otherwise the result may be unusable.
    // The 'roaring_bitmap_portable_deserialize_safe' function will not read
    // beyond expectedsize bytes.
    // We also recommend that you use checksums to check that serialized data corresponds
    // to the serialized bitmap. The CRoaring library does not provide checksumming.
    roaring_bitmap_t * t = roaring_bitmap_portable_deserialize_safe ( serializedbytes , expectedsize );
    if ( t == NULL ) { return EXIT_FAILURE ; }
    const char * reason = NULL ;
    // If your input came from an untrusted source, then you need to validate the
    // resulting bitmap. Failing to do so could lead to undefined behavior, crashes and so forth.
    if (! roaring_bitmap_internal_validate ( t , & reason )) {
        return EXIT_FAILURE ;
    }
    // At this point, the bitmap is safe.
    assert ( roaring_bitmap_equals ( r1 , t ));  // what we recover is equal
    roaring_bitmap_free ( t );
    // we can also check whether there is a bitmap at a memory location without
    // reading it
    size_t sizeofbitmap =
        roaring_bitmap_portable_deserialize_size ( serializedbytes , expectedsize );
    assert ( sizeofbitmap ==
           expectedsize );  // sizeofbitmap would be zero if no bitmap were found
    // We can also read the bitmap "safely" by specifying a byte size limit.
    // The 'roaring_bitmap_portable_deserialize_safe' function will not read
    // beyond expectedsize bytes.
    // We also recommend that you use checksums to check that serialized data corresponds
    // to the serialized bitmap. The CRoaring library does not provide checksumming.
    t = roaring_bitmap_portable_deserialize_safe ( serializedbytes , expectedsize );
    if ( t == NULL ) {
        printf ( "Problem during deserialization.n" );
        // We could clear any memory and close any file here.
        return EXIT_FAILURE ;
    }
    // We can validate the bitmap we recovered to make sure it is proper.
    // If the data came from an untrusted source, you should call
    // roaring_bitmap_internal_validate.
    const char * reason_failure = NULL ;
    if (! roaring_bitmap_internal_validate ( t , & reason_failure )) {
        printf ( "safely deserialized invalid bitmap: %sn" , reason_failure );
        // We could clear any memory and close any file here.
        return EXIT_FAILURE ;
    }
    assert ( roaring_bitmap_equals ( r1 , t ));  // what we recover is equal
    roaring_bitmap_free ( t );

    free ( serializedbytes );

    // we can iterate over all values using custom functions
    uint32_t counter = 0 ;
    roaring_iterate ( r1 , roaring_iterator_sumall , & counter );

    // we can also create iterator structs
    counter = 0 ;
    roaring_uint32_iterator_t * i = roaring_iterator_create ( r1 );
    while ( i -> has_value ) {
        counter ++ ;  // could use    i->current_value
        roaring_uint32_iterator_advance ( i );
    }
    // you can skip over values and move the iterator with
    // roaring_uint32_iterator_move_equalorlarger(i,someintvalue)

    roaring_uint32_iterator_free ( i );
    // roaring_bitmap_get_cardinality(r1) == counter

    // for greater speed, you can iterate over the data in bulk
    i = roaring_iterator_create ( r1 );
    uint32_t buffer [ 256 ];
    while ( 1 ) {
        uint32_t ret = roaring_uint32_iterator_read ( i , buffer , 256 );
        for ( uint32_t j = 0 ; j < ret ; j ++ ) {
            counter += buffer [ j ];
        }
        if ( ret < 256 ) {
            break ;
        }
    }
    roaring_uint32_iterator_free ( i );

    roaring_bitmap_free ( r1 );
    roaring_bitmap_free ( r2 );
    roaring_bitmap_free ( r3 );
    return EXIT_SUCCESS ;
}

圧縮された 64 ビット Roaring ビットマップ (C)

C での効率的な 64 ビット圧縮ビットマップもサポートしています。

  roaring64_bitmap_t *r2 = roaring64_bitmap_create();
  for ( uint64_t i = 100 ; i < 1000 ; i++) roaring64_bitmap_add(r2, i);
  printf ( " cardinality (64-bit) = %d n " , ( int ) roaring64_bitmap_get_cardinality(r2));
  roaring64_bitmap_free (r2);

API は従来の 32 ビットビットマップと同様です。ヘッダーファイルroaring64.hを参照してください ( roaring.hと比較してください)。

従来のビットセット (C)

ライブラリの一部として規約ビットセット (非圧縮) をサポートします。

簡単な例:

 bitset_t * b = bitset_create ();
bitset_set ( b , 10 );
bitset_get ( b , 10 ); // returns true
bitset_free ( b ); // frees memory

より高度な例:

 bitset_t * b = bitset_create ();
for ( int k = 0 ; k < 1000 ; ++ k ) {
    bitset_set ( b , 3 * k );
}
// We have bitset_count(b) == 1000.
// We have bitset_get(b, 3) is true
// You can iterate through the values:
size_t k = 0 ;
for ( size_t i = 0 ; bitset_next_set_bit ( b , & i ); i ++ ) {
    // You will have i == k
    k += 3 ;
}
// We support a wide range of operations on two bitsets such as
// bitset_inplace_symmetric_difference(b1,b2);
// bitset_inplace_symmetric_difference(b1,b2);
// bitset_inplace_difference(b1,b2);// should make no difference
// bitset_inplace_union(b1,b2);
// bitset_inplace_intersection(b1,b2);
// bitsets_disjoint
// bitsets_intersect

場合によっては、Roaring ビットマップを従来の (非圧縮) ビットセットに変換したい場合があります。実際、ビットセットには、場合によってはクエリのパフォーマンスが向上するなどの利点があります。次のコードは、その方法を示しています。

 roaring_bitmap_t * r1 = roaring_bitmap_create ();
for ( uint32_t i = 100 ; i < 100000 ; i += 1 + ( i % 5 )) {
     roaring_bitmap_add ( r1 , i );
}
for ( uint32_t i = 100000 ; i < 500000 ; i += 100 ) {
     roaring_bitmap_add ( r1 , i );
}
roaring_bitmap_add_range ( r1 , 500000 , 600000 );
bitset_t * bitset = bitset_create ();
bool success = roaring_bitmap_to_bitset ( r1 , bitset );
assert ( success ); // could fail due to memory allocation.
assert ( bitset_count ( bitset ) == roaring_bitmap_get_cardinality ( r1 ));
// You can then query the bitset:
for ( uint32_t i = 100 ; i < 100000 ; i += 1 + ( i % 5 )) {
    assert ( bitset_get ( bitset , i ));
}
for ( uint32_t i = 100000 ; i < 500000 ; i += 100 ) {
    assert ( bitset_get ( bitset , i ));
}
// you must free the memory:
bitset_free ( bitset );
roaring_bitmap_free ( r1 );

場合によっては、規約ビットセット ( bitset_t * ) が Roaring ビットマップよりも多くのメモリを使用する可能性があることに注意してください。ベンチマークを実行して、ビットセットへの変換によってパフォーマンス上の利点があるかどうかを判断する必要があります。

例 (C++)

この例では、CRoaring が構築されており、対応するライブラリに対してリンクしていることを前提としています。デフォルトでは、CRoaring はヘッダーファイルをroaringディレクトリにインストールするため、 #include "roaring.hh"を#include <roaring/roaring.hh>に置き換える必要がある場合があります。アマルガムスクリプトから作業している場合、CRoaring の事前構築済みライブラリに対してリンクしていない場合は、 #include "roaring.c"という行を追加できます。

# include < iostream >

# include " roaring.hh "

using namespace roaring ;

int main () {
    Roaring r1;
    for ( uint32_t i = 100 ; i < 1000 ; i++) {
        r1. add (i);
    }

    // check whether a value is contained
    assert (r1. contains ( 500 ));

    // compute how many bits there are:
    uint32_t cardinality = r1. cardinality ();

    // if your bitmaps have long runs, you can compress them by calling
    // run_optimize
    uint32_t size = r1. getSizeInBytes ();
    r1. runOptimize ();

    // you can enable "copy-on-write" for fast and shallow copies
    r1. setCopyOnWrite ( true );

    uint32_t compact_size = r1. getSizeInBytes ();
    std::cout << " size before run optimize " << size << " bytes, and after "
              << compact_size << " bytes. " << std::endl;

    // create a new bitmap with varargs
    Roaring r2 = Roaring::bitmapOf ( 5 , 1 , 2 , 3 , 5 , 6 );

    r2. printf ();
    printf ( " n " );

    // create a new bitmap with initializer list
    Roaring r2i = Roaring::bitmapOfList ({ 1 , 2 , 3 , 5 , 6 });

    assert (r2i == r2);

    // we can also create a bitmap from a pointer to 32-bit integers
    const uint32_t values[] = { 2 , 3 , 4 };
    Roaring r3 ( 3 , values);

    // we can also go in reverse and go from arrays to bitmaps
    uint64_t card1 = r1. cardinality ();
    uint32_t *arr1 = new uint32_t [card1];
    r1. toUint32Array (arr1);
    Roaring r1f (card1, arr1);
    delete[] arr1;

    // bitmaps shall be equal
    assert (r1 == r1f);

    // we can copy and compare bitmaps
    Roaring z (r3);
    assert (r3 == z);

    // we can compute union two-by-two
    Roaring r1_2_3 = r1 | r2;
    r1_2_3 |= r3;

    // we can compute a big union
    const Roaring *allmybitmaps[] = {&r1, &r2, &r3};
    Roaring bigunion = Roaring::fastunion ( 3 , allmybitmaps);
    assert (r1_2_3 == bigunion);

    // we can compute intersection two-by-two
    Roaring i1_2 = r1 & r2;

    // we can write a bitmap to a pointer and recover it later
    uint32_t expectedsize = r1. getSizeInBytes ();
    char *serializedbytes = new char [expectedsize];
    r1. write (serializedbytes);
    // readSafe will not overflow, but the resulting bitmap
    // is only valid and usable if the input follows the
    // Roaring specification: https://github.com/RoaringBitmap/RoaringFormatSpec/
    Roaring t = Roaring::readSafe (serializedbytes, expectedsize);
    assert (r1 == t);
    delete[] serializedbytes;

    // we can iterate over all values using custom functions
    uint32_t counter = 0 ;
    r1.iterate(
        []( uint32_t value, void *param) {
            *( uint32_t *)param += value;
            return true ;
        },
        &counter);

    // we can also iterate the C++ way
    counter = 0 ;
    for (Roaring::const_iterator i = t. begin (); i != t. end (); i++) {
        ++counter;
    }
    // counter == t.cardinality()

    // we can move iterators to skip values
    const uint32_t manyvalues[] = { 2 , 3 , 4 , 7 , 8 };
    Roaring rogue ( 5 , manyvalues);
    Roaring::const_iterator j = rogue. begin ();
    j. equalorlarger ( 4 );  // *j == 4
    return EXIT_SUCCESS;
}

cmake を使用したビルド (Linux および macOS、Visual Studio ユーザーは以下を参照してください)

CRoaring は標準の cmake ワークフローに従います。プロジェクト (CRoaring) のルートディレクトリから始めて、次のことができます。

 mkdir -p build
cd build
cmake ..
cmake --build .
# follow by 'ctest' if you want to test.
# you can also type 'make install' to install the library on your system
# C header files typically get installed to /usr/local/include/roaring
# whereas C++ header files get installed to /usr/local/include/roaring

( buildディレクトリは他のディレクトリ名に置き換えることができます。) デフォルトでは、すべてのテストはすべてのプラットフォームでビルドされます。テストのビルドと実行をスキップするには、コマンドラインに-DENABLE_ROARING_TESTS=OFFを追加します。

すべてのcmakeプロジェクトと同様に、(たとえば) -DCMAKE_C_COMPILER=gcc -DCMAKE_CXX_COMPILER=g++ cmakeコマンドラインに追加することで、使用するコンパイラを指定できます。

Clang または GCC を使用していて、ターゲットアーキテクチャがわかっている場合は、 -DROARING_ARCH=archを指定してアーキテクチャを設定できます。たとえば、多数のサーバーがあり、最も古いサーバーが Intel haswellアーキテクチャを実行している場合は、 - DROARING_ARCH=haswellを指定できます。このような場合、生成されたバイナリは haswell プロセスの特性を持つプロセッサ向けに最適化され、古いアーキテクチャでは動作しない可能性があります。 man gccと入力すると、有効なアーキテクチャ値のリストを確認できます。

 mkdir -p build_haswell
cd build_haswell
cmake -DROARING_ARCH=haswell ..
cmake --build .

デバッグリリースの場合は、プロジェクトのルートディレクトリ (CRoaring) から開始して、次のことを試してください。

 mkdir -p debug
cd debug
cmake -DCMAKE_BUILD_TYPE=Debug -DROARING_SANITIZE=ON ..
ctest

コードがスタイル規則に従っていることを確認するには ( clang-formatがインストールされていることを確認してください):

 ./tools/clang-format-check.sh

スタイル規則に従ってコードを再フォーマットするには ( clang-formatがインストールされていることを確認してください):

 ./tools/clang-format.sh

ビルド (Windows 上の Visual Studio)

ここでは、少なくとも Visual Studio 2015 と x64 プロセッサを搭載した一般的な Windows PC を使用していることを前提としています。

コマンドラインから Visual Studio 2015 以上を使用してビルドするには:

GitHub Desktop を使用してクローンを作成するなどして、GitHub から CRoaring コードを取得します。
CMakeをインストールします。インストールするときは、コマンドラインからcmake使用できるようにするように依頼してください。
CRoaring 内にVisualStudioなどのサブディレクトリを作成します。
シェルを使用して、この新しく作成されたディレクトリに移動します。たとえば、GitHub Desktop 内で、GitHub リポジトリリストのCRoaringを右クリックし、 Open in Git Shellを選択し、新しく作成したシェルにcd VisualStudioと入力します。
VisualStudioリポジトリ内で、シェルにcmake -DCMAKE_GENERATOR_PLATFORM=x64 ..と入力します。 (あるいは、静的ライブラリをビルドする場合は、コマンドラインcmake -DCMAKE_GENERATOR_PLATFORM=x64 -DROARING_BUILD_STATIC=ON ..を使用することもできます。)
この最後のコマンドにより、新しく作成されたディレクトリに Visual Studio ソリューションファイルが作成されました (例: RoaringBitmap.sln )。このファイルを Visual Studio で開きます。これで、プロジェクトをビルドしてテストを実行できるようになります。たとえば、 Solution Explorerウィンドウ ( Viewメニューから利用可能) で、 ALL_BUILDを右クリックし、 Buildを選択します。コードをテストするには、 Solution ExplorerウィンドウでRUN_TESTSを選択し、 Buildを選択します。

少なくとも Visual Studio 2017 を使用して IDE で直接ビルドするには:

GitHub Desktop を使用してクローンを作成するなどして、GitHub から CRoaring コードを取得します。
Visual Studio 内に C++ 開発ワークロードをインストールするときに、 Visual C++ tools for CMake選択します。
Visual Studio 内でFile > Open > Folder...を使用して CRoaring フォルダーを開きます。
Solution Explorer内の親ディレクトリにあるCMakeLists.txtを右クリックし、 [ビルド] を選択してプロジェクトをBuildします。
テストの場合は、標準ツールバーでSelect Startup Item...メニューをドロップし、テストの 1 つを選択します。ドロップダウンの左側にあるボタンを押してテストを実行します。

コードには AVX2 および AVX-512 に固有の最適化があり、実行時に検出されたハードウェアに基づいて動的に最適化されます。

使い方（ `conan`の使い方）

roaring用に事前にビルドされたバイナリをインストールすることも、Conan を使用してソースからビルドすることもできます。最新バージョンをインストールするには、次のコマンドを使用します。

 conan install --requires="roaring/[*]" --build=missing

コナンの使用方法の詳細については、コナンのドキュメントを参照してください。

roaringコナンのレシピは、コナンのメンテナーとコミュニティの貢献者によって最新の状態に保たれています。バージョンが古い場合は、ConanCenterIndex リポジトリで問題を作成するか、プルリクエストを作成してください。

使用法 (Windows、Linux、macOS での`vcpkg`の使用)

Windows、Linux、macOS 上の vcpkg ユーザーは、お気に入りのシェルから 1 つのコマンドでroaringダウンロードしてインストールできます。

Linux および macOS の場合:

 $ ./vcpkg install roaring

roaring静的ライブラリとしてビルドしてインストールします。

Windows (64 ビット) の場合:

 .vcpkg.exe install roaring:x64-windows

共有ライブラリとしてroaringビルドしてインストールします。

 .vcpkg.exe install roaring:x64-windows-static

roaring静的ライブラリとしてビルドしてインストールします。

これらのコマンドは、MSBuild または CMake ベースのプロジェクトからライブラリを使用する方法に関する指示も出力します。

vcpkgに同梱されているroaringのバージョンが古いことに気付いた場合は、問題を送信するか PR を作成して、 vcpkgコミュニティに遠慮なく報告してください。

SIMD 関連のスロットリング

当社の AVX2 コードは浮動小数点数や乗算を使用しないため、メニーコア Intel プロセッサ上のターボ周波数スロットルの影響を受けません。

当社の AVX-512 コードは、SIMD 固有の周波数スロットルが観察されない最近のハードウェア (Intel Ice Lake 以降および AMD Zen 4) でのみ有効です。

スレッドの安全性

たとえば、STL コンテナーと同様、CRoaring ライブラリにはスレッドサポートが組み込まれていません。したがって、あるスレッドでビットマップを変更するたびに、他のスレッドでそれをクエリするのは安全ではありません。ただし、ビットマップを安全にコピーし、両方のコピーを使用することはできます。

拡大する

CRoaring

C轟音

導入

客観的

要件

クイックスタート

CPM 依存関係として Roaring を使用する

FetchContent での CMake 依存関係としての使用

融合する

API

大量の処理

マイクロベンチマークの実行

カスタムメモリアロケータ

例(C)

圧縮された 64 ビット Roaring ビットマップ (C)

従来のビットセット (C)

例 (C++)

cmake を使用したビルド (Linux および macOS、Visual Studio ユーザーは以下を参照してください)

ビルド (Windows 上の Visual Studio)

使い方（ `conan`の使い方）

使用法 (Windows、Linux、macOS での`vcpkg`の使用)

SIMD 関連のスロットリング

スレッドの安全性

ケータリング管理システム

C# 病院管理システム

traildb

opensurge

mdns

RetrOS 32

chat.petals.dev

GPT Prompt Templates

GPTyped

ケータリング管理システム

C# 病院管理システム

traildb

waymo open dataset

termwind

wp functions

CRoaring

C轟音

導入

客観的

要件

クイックスタート

CPM 依存関係として Roaring を使用する

FetchContent での CMake 依存関係としての使用

融合する

API

大量の処理

マイクロベンチマークの実行

カスタム メモリ アロケータ

例(C)

圧縮された 64 ビット Roaring ビットマップ (C)

従来のビットセット (C)

例 (C++)

cmake を使用したビルド (Linux および macOS、Visual Studio ユーザーは以下を参照してください)

ビルド (Windows 上の Visual Studio)

使い方（ conanの使い方）

使用法 (Windows、Linux、macOS でのvcpkgの使用)

SIMD 関連のスロットリング

スレッドの安全性

カスタムメモリアロケータ

使い方（ `conan`の使い方）

使用法 (Windows、Linux、macOS での`vcpkg`の使用)