이 파일이나 H2O-3 문서에 답변이 없는 질문이 있는 경우 다음을 사용하세요.
H2O는 분산되고 확장 가능한 기계 학습을 위한 인메모리 플랫폼입니다. H2O는 R, Python, Scala, Java, JSON 및 Flow 노트북/웹 인터페이스와 같은 친숙한 인터페이스를 사용하며 Hadoop 및 Spark와 같은 빅 데이터 기술과 원활하게 작동합니다. H2O는 GLM(Generalized Linear Models), Gradient Boosting Machines(XGBoost 포함), Random Forests, Deep Neural Networks, Stacked Ensembles, Naive Bayes, Generalized Additive Models(GAM), Cox Proportional Hazards, K-와 같은 널리 사용되는 다양한 알고리즘의 구현을 제공합니다. PCA, Word2Vec은 물론 완전 자동 기계 학습 알고리즘(H2O AutoML)을 의미합니다.
H2O는 개발자가 원하는 데이터 변환 및 사용자 지정 알고리즘을 추가하고 모든 클라이언트를 통해 액세스할 수 있도록 확장 가능합니다. H2O 모델을 다운로드하여 H2O 메모리에 로드하여 점수를 매기거나 POJO 또는 MOJO 형식으로 내보내 생산 시 매우 빠른 점수를 매길 수 있습니다. 자세한 내용은 H2O 사용자 가이드에서 확인할 수 있습니다.
H2O-3(이 저장소)는 H2O의 세 번째 버전이자 H2O-2의 후속 버전입니다.
이 README의 대부분은 자체 빌드를 수행하는 개발자를 위해 작성되었지만 대부분의 H2O 사용자는 사전 빌드된 버전을 다운로드하여 사용합니다. Python 또는 R 사용자인 경우 H2O를 설치하는 가장 쉬운 방법은 PyPI, Anaconda(Python용) 또는 CRAN(R용)을 사용하는 것입니다.
pip install h2o
install.packages( " h2o " )
안정적인 최신 Nightly Hadoop(또는 Spark/Sparkling Water) 릴리스 또는 독립형 H2O jar를 보려면 https://h2o.ai/download를 방문하세요.
H2O 다운로드 및 설치에 대한 자세한 내용은 H2O 사용자 가이드에서 확인할 수 있습니다.
대부분의 사람들은 GitHub (이미 찾았음), GitHub 문제 (버그 보고서 및 문제 추적용), H2O 코드/소프트웨어 관련 질문용 Stack Overflow , h2ostream (Google 그룹) 등 3~4개의 기본 오픈 소스 리소스와 상호작용합니다. / 이메일 토론 포럼) Stack Overflow에 적합하지 않은 질문에 대해서는 Gitter H2O 개발자 채팅 그룹도 있지만 보관 목적과 접근성 극대화를 위해 표준 H2O Q&A는 Stack Overflow에서 수행하는 것이 좋습니다.
GitHub 저장소(https://github.com/h2oai/h2o-3)에서 새로운 이슈를 검색하고 생성할 수 있습니다.
Issues
탭을 클릭하세요.GitHub
GitHub 문제 - 여기에 버그 보고서를 제출하고 문제를 추적하세요.
스택 오버플로 - 모든 코드/소프트웨어 질문은 여기에서 문의하세요.
교차 검증(스택 교환) - 여기에서 알고리즘/이론 질문을 물어보세요.
h2ostream Google 그룹 -- 코드와 관련되지 않은 질문은 여기에서 문의하세요.
Gitter H2O 개발자 채팅
선적 서류 비치
다운로드(사전 빌드된 패키지)
웹사이트
Twitter - 업데이트 및 H2O 뉴스를 보려면 팔로우하세요!
멋진 H2O - H2O로 만든 창작물을 우리와 공유하세요
모든 야간 빌드는 R, Python, Java 및 Scala 아티팩트를 빌드별 저장소에 게시합니다. 특히, maven/repo 디렉터리에서 Java 아티팩트를 찾을 수 있습니다.
다음은 h2o-3을 종속성으로 사용하는 Gradle 빌드 파일의 예제 조각입니다. x, y, z 및 nnnn을 유효한 숫자로 바꿉니다.
// h2o-3 dependency information
def h2oBranch = 'master'
def h2oBuildNumber = 'nnnn'
def h2oProjectVersion = "x.y.z.${h2oBuildNumber}"
repositories {
// h2o-3 dependencies
maven {
url "https://s3.amazonaws.com/h2o-release/h2o-3/${h2oBranch}/${h2oBuildNumber}/maven/repo/"
}
}
dependencies {
compile "ai.h2o:h2o-core:${h2oProjectVersion}"
compile "ai.h2o:h2o-algos:${h2oProjectVersion}"
compile "ai.h2o:h2o-web:${h2oProjectVersion}"
compile "ai.h2o:h2o-app:${h2oProjectVersion}"
}
야간 빌드 아티팩트 설치에 대한 자세한 내용은 최신 H2O-3 최첨단 야간 빌드 페이지를 참조하세요.
Gradle과 함께 Java 아티팩트를 사용하는 방법에 대한 작업 예제는 h2o-droplets GitHub 저장소를 참조하세요.
참고: 안정적인 H2O-3 아티팩트는 정기적으로 Maven Central에 게시되지만(검색하려면 여기를 클릭하세요) H2O-3 Bleeding Edge nightly 빌드보다 상당히 뒤처질 수 있습니다.
H2O 개발을 시작하려면 JDK 1.8+, Node.js, Gradle, Python 및 R이 필요합니다. Gradle 래퍼( gradlew
라고 함)를 사용하여 Gradle의 최신 로컬 버전과 기타 종속 항목이 개발 디렉터리에 설치되어 있는지 확인합니다.
h2o
빌드하려면 필수 패키지가 포함된 R 환경과 다음 패키지가 포함된 Python 환경이 올바르게 설정되어 있어야 합니다.
grip
tabulate
requests
wheel
이러한 패키지를 설치하려면 pip 또는 conda를 사용할 수 있습니다. Windows 에 이러한 패키지를 설치하는 데 문제가 있는 경우 이 가이드의 Windows에서 설정 섹션을 따르십시오.
(참고: 모든 패키지를 설치하려면 VirtualEnv와 같은 일부 가상 환경을 사용하는 것이 좋습니다.)
저장소에서 H2O를 빌드하려면 다음 단계를 수행하십시오.
# Build H2O
git clone https://github.com/h2oai/h2o-3.git
cd h2o-3
./gradlew build -x test
You may encounter problems: e.g. npm missing. Install it:
brew install npm
# Start H2O
java -jar build/h2o.jar
# Point browser to http://localhost:54321
git clone https://github.com/h2oai/h2o-3.git
cd h2o-3
./gradlew syncSmalldata
./gradlew syncRPackages
./gradlew build
참고 사항 :
- 테스트를 실행하면 H2O 클러스터를 형성하고 최소 8GB RAM(16GB RAM 권장)이 필요한 5개의 테스트 JVM이 시작됩니다.
./gradlew syncRPackages
실행은 Windows, OS X 및 Linux에서 지원되며 강력히 권장되지만 필수는 아닙니다../gradlew syncRPackages
테스트 및 빌드에 필요한 사전 승인된 버전의 패키지를 사용하여 완전하고 일관된 환경을 보장합니다. 패키지는 수동으로 설치할 수 있지만 ENV 변수를 설정하고./gradlew syncRPackages
사용하는 것이 좋습니다. ENV 변수를 설정하려면 다음 형식을 사용하십시오(여기서 `${WORKSPACE}는 임의의 경로일 수 있음).mkdir -p ${WORKSPACE}/Rlibrary export R_LIBS_USER=${WORKSPACE}/Rlibrary
git pull
./gradlew syncSmalldata
./gradlew syncRPackages
./gradlew clean
./gradlew build
각 git pull
후에 ./gradlew clean
사용하는 것이 좋습니다.
Gradle 빌드 명령줄 끝에 -x test
추가하여 테스트를 건너뜁니다. 테스트는 일반적으로 4개의 CPU(8개의 하이퍼스레드)와 16GB RAM을 갖춘 Macbook Pro 노트북에서 7~10분 동안 실행됩니다.
가져올 때마다 smalldata 동기화가 필요하지 않지만, 데이터 파일 누락으로 인해 테스트가 실패하는 경우 첫 번째 문제 해결 단계로 ./gradlew syncSmalldata
시도해 보세요. smalldata를 동기화하면 AWS S3의 데이터 파일이 작업 공간의 smalldata 디렉터리로 다운로드됩니다. 동기화는 증분식입니다. 이러한 파일을 체크인하지 마십시오. smalldata 디렉토리는 .gitignore에 있습니다. 테스트를 실행하지 않으면 smalldata 디렉터리가 필요하지 않습니다.
./gradlew syncRPackages
실행은 Windows, OS X 및 Linux에서 지원되며 강력히 권장되지만 필수는 아닙니다. ./gradlew syncRPackages
테스트 및 빌드에 필요한 사전 승인된 버전의 패키지를 사용하여 완전하고 일관된 환경을 보장합니다. 패키지는 수동으로 설치할 수 있지만 ENV 변수를 설정하고 ./gradlew syncRPackages
사용하는 것이 좋습니다. ENV 변수를 설정하려면 다음 형식을 사용하십시오(여기서 ${WORKSPACE}
는 임의의 경로일 수 있음).
mkdir -p ${WORKSPACE}/Rlibrary
export R_LIBS_USER=${WORKSPACE}/Rlibrary
./gradlew clean && ./gradlew build -x test && (export DO_FAST=1; ./gradlew dist)
open target/docs-website/h2o-docs/index.html
Git 저장소의 루트에는 개발에 자주 사용되는 빌드 대상에 대한 편리한 바로 가기가 있는 Makefile이 포함되어 있습니다. 테스트를 건너뛰고 대체 어셈블리를 빌드하는 동안 h2o.jar
빌드하려면 다음을 실행하세요.
make
최소 어셈블리를 사용하여 h2o.jar
빌드하려면 다음을 실행하세요.
make minimal
최소한의 어셈블리는 H2O 기계 학습 알고리즘 개발에 매우 적합합니다. Hadoop과 같은 일부 무거운 종속성을 번들로 묶지 않으며 이를 사용하면 빌드 시간이 절약될 뿐만 아니라 Maven 저장소에서 대규모 라이브러리를 다운로드해야 합니다.
명령줄에서 which python
(또는 sudo which python
)을 사용하여 python
새로 설치된 패키지를 사용하고 있는지 확인합니다. WinPython 경로로 환경 변수를 업데이트합니다.
pip install grip tabulate wheel
Java 1.8 이상을 설치하고 java.exe가 포함된 적절한 디렉터리 C:Program FilesJavajdk1.7.0_65bin
환경 변수의 PATH에 추가합니다. 명령 프롬프트가 올바른 Java 버전을 감지하는지 확인하려면 다음을 실행하세요.
javac -version
CLASSPATH 변수도 JDK의 lib 하위 폴더로 설정해야 합니다.
CLASSPATH=/<path>/<to>/<jdk>/lib
Node.js를 설치하고 설치된 디렉터리 C:Program Filesnodejs
추가합니다. 이 디렉터리는 아직 앞에 추가되지 않은 경우 node.exe 및 npm.cmd를 PATH에 포함해야 합니다.
R을 설치하고 bin 디렉터리가 아직 포함되지 않은 경우 PATH에 추가합니다.
다음 R 패키지를 설치합니다.
R 세션 내에서 이러한 패키지를 설치하려면 다음을 수행하십시오.
pkgs <- c( " RCurl " , " jsonlite " , " statmod " , " devtools " , " roxygen2 " , " testthat " )
for ( pkg in pkgs ) {
if ( ! ( pkg %in% rownames(installed.packages()))) install.packages( pkg )
}
RCurl R 패키지를 설치하려면 libcurl이 필요합니다.
이 패키지는 테스트 실행을 다루지 않으며 H2O 구축에만 사용됩니다.
마지막으로 Windows에서 R 개발을 용이하게 하는 명령줄 도구 모음인 Rtools를 설치합니다.
참고 : Rtools 설치 중에는 Cygwin.dll을 설치하지 마십시오 .
참고 : Cygwin을 설치하는 동안 Python.org 패키지와의 충돌을 방지하려면 Python 패키지를 선택 취소하세요.
Cygwin이 이미 설치된 경우 Python 패키지를 제거하거나 PATH 변수에서 Native Python이 Cygwin 앞에 있는지 확인하십시오.
Git 클라이언트가 아직 없다면 설치하세요. 기본 버전은 http://git-scm.com/downloads에서 찾을 수 있습니다. 설치하기 전에 명령 프롬프트 지원이 활성화되어 있는지 확인하십시오.
h2o-3 소스 코드 다운로드 및 업데이트:
git clone https://github.com/h2oai/h2o-3
cd h2o-3
./gradlew.bat build
오류가 발생하면
--stacktrace
사용하여 다시 실행하여 누락된 종속성에 대한 자세한 지침을 확인하세요.
Homebrew가 없다면 설치하는 것이 좋습니다. OS X의 패키지 관리가 쉬워집니다.
자바 1.8 이상을 설치합니다. 명령 프롬프트가 올바른 Java 버전을 감지하는지 확인하려면 다음을 실행하세요.
javac -version
홈브루 사용:
brew install node
그렇지 않으면 NodeJS 웹사이트에서 설치하세요.
R을 설치하고 bin 디렉터리가 아직 포함되지 않은 경우 PATH에 추가합니다.
다음 R 패키지를 설치합니다.
R 세션 내에서 이러한 패키지를 설치하려면 다음을 수행하십시오.
pkgs <- c( " RCurl " , " jsonlite " , " statmod " , " devtools " , " roxygen2 " , " testthat " )
for ( pkg in pkgs ) {
if ( ! ( pkg %in% rownames(installed.packages()))) install.packages( pkg )
}
RCurl R 패키지를 설치하려면 libcurl이 필요합니다.
이 패키지는 테스트 실행을 다루지 않으며 H2O 구축에만 사용됩니다.
파이썬을 설치합니다:
brew install python
pip 패키지 관리자를 설치합니다:
sudo easy_install pip
다음으로 필요한 패키지를 설치하십시오:
sudo pip install wheel requests tabulate
OS X에는 이미 Git이 설치되어 있어야 합니다. h2o-3 소스 코드를 다운로드하고 업데이트하려면:
git clone https://github.com/h2oai/h2o-3
cd h2o-3
./gradlew build
참고: 일반 컴퓨터에서는 모든 테스트를 실행하는 데 매우 오랜 시간(약 1시간)이 걸릴 수 있습니다.
오류가 발생하면
--stacktrace
사용하여 다시 실행하여 누락된 종속성에 대한 자세한 지침을 확인하세요.
curl -sL https://deb.nodesource.com/setup_0.12 | sudo bash -
sudo apt-get install -y nodejs
Java 8을 설치합니다. 설치 지침은 JDK 설치에서 찾을 수 있습니다. 명령 프롬프트가 올바른 Java 버전을 감지하는지 확인하려면 다음을 실행하세요.
javac -version
설치 지침은 R 설치에서 찾을 수 있습니다. “Linux용 R 다운로드”를 클릭하세요. “우분투”를 클릭하세요. 주어진 지침을 따르십시오.
필수 패키지를 설치하려면 위의 OS X와 동일한 지침을 따르세요.
참고 : 프로세스가 Linux에 RStudio Server를 설치하지 못하는 경우 다음 중 하나를 실행하십시오.
sudo apt-get install libcurl4-openssl-dev
또는
sudo apt-get install libcurl4-gnutls-dev
Git 클라이언트가 아직 없는 경우:
sudo apt-get install git
h2o-3 소스 코드 다운로드 및 업데이트:
git clone https://github.com/h2oai/h2o-3
cd h2o-3
./gradlew build
오류가 발생하면
--stacktrace
사용하여 다시 실행하여 누락된 종속성에 대한 자세한 지침을 확인하세요.
bower
그러한 실행을 거부하므로 루트로 실행하고 있지 않은지 확인하십시오.
curl -sL https://deb.nodesource.com/setup_16.x | sudo bash -
sudo apt-get install -y nodejs
cd /opt
sudo wget --no-cookies --no-check-certificate --header "Cookie: gpw_e24=http%3A%2F%2Fwww.oracle.com%2F; oraclelicense=accept-securebackup-cookie" "http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz"
sudo tar xzf jdk-7u79-linux-x64.tar.gz
cd jdk1.7.0_79
sudo alternatives --install /usr/bin/java java /opt/jdk1.7.0_79/bin/java 2
sudo alternatives --install /usr/bin/jar jar /opt/jdk1.7.0_79/bin/jar 2
sudo alternatives --install /usr/bin/javac javac /opt/jdk1.7.0_79/bin/javac 2
sudo alternatives --set jar /opt/jdk1.7.0_79/bin/jar
sudo alternatives --set javac /opt/jdk1.7.0_79/bin/javac
cd /opt
sudo wget http://dl.fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-5.noarch.rpm
sudo rpm -ivh epel-release-7-5.noarch.rpm
sudo echo "multilib_policy=best" >> /etc/yum.conf
sudo yum -y update
sudo yum -y install R R-devel git python-pip openssl-devel libxml2-devel libcurl-devel gcc gcc-c++ make openssl-devel kernel-devel texlive texinfo texlive-latex-fonts libX11-devel mesa-libGL-devel mesa-libGL nodejs npm python-devel numpy scipy python-pandas
sudo pip install scikit-learn grip tabulate statsmodels wheel
mkdir ~/Rlibrary
export JAVA_HOME=/opt/jdk1.7.0_79
export JRE_HOME=/opt/jdk1.7.0_79/jre
export PATH=$PATH:/opt/jdk1.7.0_79/bin:/opt/jdk1.7.0_79/jre/bin
export R_LIBS_USER=~/Rlibrary
# install local R packages
R -e 'install.packages(c("RCurl","jsonlite","statmod","devtools","roxygen2","testthat"), dependencies=TRUE, repos="http://cran.rstudio.com/")'
cd
git clone https://github.com/h2oai/h2o-3.git
cd h2o-3
# Build H2O
./gradlew syncSmalldata
./gradlew syncRPackages
./gradlew build -x test
H2O 클러스터를 로컬로 시작하려면 명령줄에서 다음을 실행합니다.
java -jar build/h2o.jar
사용 가능한 시작 JVM 및 H2O 옵션(예: -Xmx
, -nthreads
, -ip
) 목록은 H2O 사용자 가이드에서 확인할 수 있습니다.
사전 구축된 H2O-on-Hadoop zip 파일은 다운로드 페이지에서 사용할 수 있습니다. 각 Hadoop 배포 버전에는 h2o-3에 별도의 zip 파일이 있습니다.
Hadoop을 지원하는 H2O를 직접 빌드하려면 먼저 Python용 sphinx를 설치하십시오. pip install sphinx
그런 다음 최상위 h2o-3 디렉토리에서 다음을 입력하여 빌드를 시작하십시오.
export BUILD_HADOOP=1;
./gradlew build -x test;
./gradlew dist;
그러면 'target'이라는 디렉터리가 생성되고 거기에 zip 파일이 생성됩니다. 사용자 이름이 jenkins
일 때 BUILD_HADOOP
는 기본 동작입니다( settings.gradle
참조). 그렇지 않으면 위에 표시된 대로 요청해야 합니다.
선택한 배포판에 대해서만 zip 파일을 빌드하려면 H2O_TARGET
env 변수를 BUILD_HADOOP
와 함께 사용하십시오. 예를 들면 다음과 같습니다.
export BUILD_HADOOP=1;
export H2O_TARGET=hdp2.5,hdp2.6
./gradlew build -x test;
./gradlew dist;
h2o-hadoop
디렉터리에서 각 Hadoop 버전에는 드라이버용 빌드 디렉터리와 fatjar용 어셈블리 디렉터리가 있습니다.
다음을 수행해야 합니다.
h2o-hadoop
에 새 드라이버 디렉터리와 어셈블리 디렉터리(각각 build.gradle
파일 포함)를 추가합니다.h2o-3/settings.gradle
에 새 프로젝트를 추가하세요.make-dist.sh
의 HADOOP_VERSIONS
에 새 Hadoop 버전을 추가합니다.h2o-dist/buildinfo.json
의 목록에 새 Hadoop 버전을 추가합니다.Hadoop은 Java API를 통해 보안 사용자 가장을 지원합니다. Kerberos 인증 사용자는 NameNode의 core-site.xml 파일에 입력된 지정된 기준을 충족하는 모든 사용자 이름을 프록시하도록 허용할 수 있습니다. 이 가장은 Hadoop API 또는 이를 지원하는 Hadoop 관련 서비스의 API와의 상호 작용에만 적용됩니다(원본 시스템에서 해당 사용자로 전환하는 것과는 다릅니다).
보안 사용자 가장 설정(h2o용):
hadoop.proxyuser.<proxyusername>.hosts
: 프록시 사용자가 유효한 사용자를 대신하여 가장된 작업을 수행할 수 있는 호스트입니다.hadoop.proxyuser.<proxyusername>.groups
: 가장이 해당 프록시 사용자와 작동하기 위해 가장된 사용자가 속해야 하는 그룹hadoop.proxyuser.<proxyusername>.users
: 프록시 사용자가 가장할 수 있는 사용자<property> <name>hadoop.proxyuser.myproxyuser.hosts</name> <value>host1,host2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.groups</name> <value>group1,group2</value> </property> <property> <name>hadoop.proxyuser.myproxyuser.users</name> <value>user1,user2</value> </property>
가장된 HDFS 작업은 hdfs 감사 로그에서 볼 수 있습니다('auth:PROXY'는 적용 가능한 항목의 ugi=
필드에 표시되어야 함). 마찬가지로 YARN은 Resource Manager UI 어딘가에 'auth:PROXY'를 표시해야 합니다.
h2o의 Hadoop 드라이버로 보안 가장을 사용하려면:
이 작업을 시도하기 전에 아래의 명의 도용으로 인한 위험을 참조하세요.
h2odriver를 사용할 때(예: hadoop jar ...
로 실행할 때), -principal <proxy user kerberos principal>
, -keytab <proxy user keytab path>
및 -run_as_user <hadoop username to impersonate>
를 지정하십시오. 인수가 필요합니다. 구성이 성공하면 프록시 사용자는 사용자 또는 그룹 구성 속성(위에서 구성)에서 허용하는 한 로그인하고 -run_as_user
를 가장합니다. 이는 h2o의 코드가 아닌 HDFS 및 YARN에 의해 시행됩니다. 드라이버는 보안 컨텍스트를 가장된 사용자로 효과적으로 설정하므로 지원되는 모든 Hadoop 작업이 해당 사용자로 수행됩니다(예: YARN, HDFS API는 가장된 사용자를 안전하게 지원하지만 다른 API는 지원하지 않을 수 있음).
hadoop.proxyuser.<proxyusername>.hosts
속성을 사용하십시오.su
통해)hadoop.proxyuser.<proxyusername>.{hosts,groups,users}
속성을 '*'로 설정하면 보안 위험에 대한 노출이 크게 증가할 수 있습니다. $ git diff
diff --git a/h2o-app/build.gradle b/h2o-app/build.gradle
index af3b929..097af85 100644
--- a/h2o-app/build.gradle
+++ b/h2o-app/build.gradle
@@ -8,5 +8,6 @@ dependencies {
compile project(":h2o-algos")
compile project(":h2o-core")
compile project(":h2o-genmodel")
+ compile project(":h2o-persist-hdfs")
}
diff --git a/h2o-persist-hdfs/build.gradle b/h2o-persist-hdfs/build.gradle
index 41b96b2..6368ea9 100644
--- a/h2o-persist-hdfs/build.gradle
+++ b/h2o-persist-hdfs/build.gradle
@@ -2,5 +2,6 @@ description = "H2O Persist HDFS"
dependencies {
compile project(":h2o-core")
- compile("org.apache.hadoop:hadoop-client:2.0.0-cdh4.3.0")
+ compile("org.apache.hadoop:hadoop-client:2.4.1-mapr-1408")
+ compile("org.json:org.json:chargebee-1.0")
}
Sparkling Water는 Apache Spark와 H2O 기계 학습 플랫폼이라는 두 가지 오픈 소스 기술을 결합합니다. Spark 워크플로에서 액세스할 수 있는 Deep Learning, GLM, GBM, K-Means 및 Distributed Random Forest를 포함한 H2O의 고급 알고리즘 라이브러리를 만듭니다. Spark 사용자는 기계 학습 요구 사항을 충족하기 위해 두 플랫폼 모두에서 최상의 기능을 선택할 수 있습니다. 사용자는 Spark의 RDD API와 Spark MLLib를 H2O의 기계 학습 알고리즘과 결합하거나 모델 구축 프로세스에 Spark와 독립적으로 H2O를 사용하고 Spark에서 결과를 후처리할 수 있습니다.
탄산수 자원 :
주요 H2O 문서는 H2O 사용자 가이드입니다. H2O 프로젝트 문서에 대한 최상위 소개를 보려면 http://docs.h2o.ai를 방문하세요.
REST API 문서를 생성하려면 다음 명령을 사용하십시오.
cd ~/h2o-3
cd py
python ./generate_rest_api_docs.py # to generate Markdown only
python ./generate_rest_api_docs.py --generate_html --github_user GITHUB_USER --github_password GITHUB_PASSWORD # to generate Markdown and HTML
생성된 문서의 기본 위치는 build/docs/REST
입니다.
빌드가 실패하면 gradlew clean
시도한 다음 git clean -f
시도하십시오.
각 최신 야간 빌드에 대한 문서는 야간 빌드 페이지에서 확인할 수 있습니다.
출판물 작업 흐름의 일부로 H2O를 사용하는 경우 다음 BibTex 항목을 사용하여 H2O 리소스를 인용하십시오.
@Manual{h2o_package_or_module,
title = {package_or_module_title},
author = {H2O.ai},
year = {year},
month = {month},
note = {version_information},
url = {resource_url},
}
형식화된 H2O 소프트웨어 인용 예 :
H2O 알고리즘 소책자는 문서 홈페이지에서 구할 수 있습니다.
@Manual{h2o_booklet_name,
title = {booklet_title},
author = {list_of_authors},
year = {year},
month = {month},
url = {link_url},
}
형식화된 소책자 인용 예 :
Arora, A., Candel, A., Lanford, J., LeDell, E. 및 Parmar, V.(2016년 10월). H2O를 이용한 딥러닝 . http://docs.h2o.ai/h2o/latest-stable/h2o-docs/booklets/DeepLearningBooklet.pdf.
Click, C., Lanford, J., Malohlava, M., Parmar, V. 및 Roark, H.(2016년 10월). H2O를 사용한 경사 증폭 모델 . http://docs.h2o.ai/h2o/latest-stable/h2o-docs/booklets/GBMBooklet.pdf.
H2O는 H2O.ai(회사)와 더 큰 오픈 소스 커뮤니티 내에서 수년 동안 수많은 기여자들에 의해 구축되었습니다. Stack Overflow 질문에 답변하거나 버그 보고서를 제출하여 H2O에 기여할 수 있습니다. 우리와 함께해주세요!
SriSatish Ambati
Cliff Click
Tom Kraljevic
Tomas Nykodym
Michal Malohlava
Kevin Normoyle
Spencer Aiello
Anqi Fu
Nidhi Mehta
Arno Candel
Josephine Wang
Amy Wang
Max Schloemer
Ray Peck
Prithvi Prabhu
Brandon Hill
Jeff Gambera
Ariel Rao
Viraj Parmar
Kendall Harris
Anand Avati
Jessica Lanford
Alex Tellez
Allison Washburn
Amy Wang
Erik Eckstrand
Neeraja Madabhushi
Sebastian Vidrio
Ben Sabrin
Matt Dowle
Mark Landry
Erin LeDell
Andrey Spiridonov
Oleg Rogynskyy
Nick Martin
Nancy Jordan
Nishant Kalonia
Nadine Hussami
Jeff Cramer
Stacie Spreitzer
Vinod Iyengar
Charlene Windom
Parag Sanghavi
Navdeep Gill
Lauren DiPerna
Anmol Bal
Mark Chan
Nick Karpov
Avni Wadhwa
Ashrith Barthur
Karen Hayrapetyan
Jo-fai Chow
Dmitry Larko
Branden Murray
Jakub Hava
Wen Phan
Magnus Stensmo
Pasha Stetsenko
Angela Bartz
Mateusz Dymczyk
Micah Stubbs
Ivy Wang
Terone Ward
Leland Wilkinson
Wendy Wong
Nikhil Shekhar
Pavel Pscheidl
Michal Kurka
Veronika Maurerova
Jan Sterba
Jan Jendrusak
Sebastien Poirier
Tomáš Frýda
Ard Kelmendi
Yuliia Syzon
Adam Valenta
Marek Novotny
Zuzana Olajcova
과학 자문위원회
Stephen Boyd
Rob Tibshirani
Trevor Hastie
시스템, 데이터, 파일 시스템 및 Hadoop
Doug Lea
Chris Pouliot
Dhruba Borthakur
Jishnu Bhattacharjee, Nexus Venture Partners
Anand Babu Periasamy
Anand Rajaraman
Ash Bhardwaj
Rakesh Mathur
Michael Marks
Egbert Bierman
Rajesh Ambati