더 멋진 내용을 보려면 를 확인하세요.
이것은 기계 학습 솔루션을 개발하는 데 필요한 모든 것에 대해 선별된 유용한 리소스 목록입니다.
이 목록의 각 항목은 최소한 하나의 독특하고 중요한 기술이나 정보를 가르쳐줍니다.
세 가지 콘텐츠 수준이 있습니다.
? 모든 ML 엔지니어를 위한 필수 자료
? 전문 ML 엔지니어를 위한 고급 자료
? 전문 ML 엔지니어를 위한 전문 자료
설명은 "이 기사를 읽은 후에 알게 될 것입니다 ..."라는 문장을 완성하기 위해 작성되었습니다.
의사소통
소프트웨어 공학
기계 학습
데브옵스
BLUF: 글쓰기를 더욱 강력하게 만들 수 있는 군사 표준 - 의사소통을 더욱 강력하게 만드는 방법(5분)
XY 문제 - 도움을 요청할 때 최종 목표를 설명하는 데 집중하는 방법(5분)
자전거 타기: 엔지니어로서 얼마나 성숙했나요? - 자전거 방치를 방지하고 알리는 방법(5분)
상사처럼 이메일 보내기 - 더 나은 이메일을 작성하는 방법(5분)
Swiss Cheesing your Calendar - 집중할 수 있도록 달력을 관리하는 방법(15분)
평범한 영어로 쓰는 법 - 평범한 영어로 쓰는 법(30분)
프레젠테이션 규칙 - 훌륭한 슬라이드 데크를 만드는 방법(30분)
SMART 기준 - 목표 정의 방법(15분)
MECE 원리 - 문제를 구조화된 목록으로 완전히 분해하는 방법(15분)
SCQA: 이것이 무엇이며, 어떻게 작동하며, 나에게 어떻게 도움이 됩니까? - 프리젠테이션, 제안서, 판매 개요를 구성하는 방법(15분)
더 이상 오해하지 마세요 - 다른 말로 표현하여 잘못된 의사소통을 피하는 방법(15분)
비폭력 의사소통 - 어려운 상황에서 건설적인 피드백을 전달하는 방법(15분)
후광 효과 - 후광 효과를 인식하고 활용하는 방법(15분)
Mythical Man Month - 프로젝트의 개인 일수와 처리 시간 간의 관계(15분)
4면 모델 - 수신자가 메시지를 해석하는 방식을 고려하여 효과적으로 의사소통하는 방법(30분)
의미적 버전 관리 - 앱과 패키지의 버전을 높이는 방법(15분)
__all__
및 Python의 와일드 가져오기 - __all__
이 Python 패키지의 공개 API를 정의하는 방법(15분)
기계 학습용 API - 기계 학습 애플리케이션용 RESTful API를 설계하는 방법(30분)
FastAPI 문서 - OpenAPI 사양과 일대일로 대응하는 RESTful API를 구축하는 방법(1일)
3의 법칙 - 재사용 가능한 구성 요소를 구축해야 하는 경우와 그렇지 않은 경우(15분)
프로그래머가 시간에 대해 믿는 거짓 - 시간에 관한 일반적인 함정을 피하는 방법(15분)
프로그래머가 이름에 대해 믿는 거짓 - 이름에 관한 일반적인 함정을 피하는 방법(15분)
명령줄 인터페이스 지침 - 훌륭한 CLI 작성 방법(1시간)
Zalando의 RESTful API 지침 - RESTful API를 설계하는 방법(1일)
Poetry Cookiecutter - Python 패키지 및 앱을 위한 최신 Poetry 기반 개발 환경을 구축하는 방법(30분)
훌륭한 Git 커밋 메시지의 7가지 규칙 - 훌륭한 Git 커밋 메시지 작성 방법(15분)
Git 분기 배우기 - 초급부터 고급까지 Git 연습(1시간)
변경 로그 유지 - 앱 및 패키지에 대한 변경 로그를 유지하는 방법(30분)
기존 커밋 - 의미 체계 버전 관리를 자동화하고 변경 로그를 유지하기 위해 커밋 메시지 앞에 접두사를 붙이는 방법(15분)
Pytest로 Python 애플리케이션 테스트 - pytest로 패키지를 올바르게 테스트하는 방법(30분)
성공적인 Git 분기 모델 - Git으로 소프트웨어를 출시하는 방법(15분)
코드 검토 모범 사례 - 끌어오기 요청을 검토할 때 찾아야 할 사항(30분)
코드 상태: 존중하는 리뷰 == 유용한 리뷰 - 코드 리뷰 의견을 정중하게 전달하는 방법(15분)
코드 검토 피라미드 - 끌어오기 요청을 검토할 때 찾아야 할 사항과 자동화할 사항(15분)
Poetry 작업 공간 플러그인 - Poetry 기반 모노레포를 만들고 관리하는 방법(15분)
PEP20 "The Zen of Python" - 관용적인 Python을 작성하는 방법(15분)
Python import 문에 대한 최종 가이드 - import 문 작성 방법(30분)
Python의 로깅 모듈 이해 - logging
모듈을 효과적으로 사용하는 방법(30분)
가져오기 시 코드를 실행하지 마세요 - 가져오기 시 코드를 실행하면 안되는 이유
데코레이터를 수정하세요 - 데코레이터를 작성하기 위해 wrapt
사용해야 하는 이유(30분)
기록하지 않음 - 기록 대신 해야 할 일(30분)
The Little Book of Python Anti-Patterns - Python 안티 패턴 모음(X시간)
Effective Python - Python 관용어 모음(X시간)
Python 디자인 패턴 - 소프트웨어 아키텍처 패턴 모음(1시간)
SOLID - 표준 소프트웨어 아키텍처 패턴 세트(1시간)
빌어먹을 파이썬이 뭐야! - Python의 엣지 케이스를 이해하여 Python을 마스터하는 방법(1일)
mypy 종합 가이드 - Python에서 유형 주석을 작성하는 방법(1시간)
Pydantic 개요 - 의미 없는 Dict[str, Any]
대신 복합 유형에 대한 유형 주석을 작성하는 방법(1시간)
매직 넘버 - 매직 값이 안티패턴인 이유(15분)
열거형 - 유형이 안전하지 않은 마법 값 대신 Python에서 Enum
을 작성하는 방법(15분)
Mypy 제네릭 - TypeVar
를 사용하여 List[T]
와 같은 제네릭 유형을 작성하는 방법(30분)
Mypy 프로토콜 - Protocol
을 사용하여 Iterable
과 같은 인터페이스를 정의하는 방법(30분)
cookiecutter - Cookiecutter 템플릿을 사용하여 새로운 Python 패키지 또는 앱을 빠르게 스캐폴드합니다.
cruft - Python 패키지의 기본 Cookiecutter 스캐폴딩 업데이트
commitizen - 커밋 메시지가 기존 커밋을 충족하는지 확인하고 의미 체계 버전 관리를 자동화하고 변경 로그를 유지합니다.
시 - Python 프로젝트의 패키징 및 종속성을 관리합니다.
poe - Poe the Poet를 사용하여 시 프로젝트에서 작업을 정의하고 실행합니다.
poem-workspace-plugin - 이 Poetry 플러그인으로 Python 모노레포를 관리하세요.
검정색 - 자동으로 코드 형식을 지정합니다.
isort - 수입 명세서를 자동으로 정렬합니다.
pre-commit - 커밋 시 코드 품질 검사를 자동으로 실행합니다.
bandit - 일반적인 보안 문제 찾기
darglint - 독스트링이 함수 서명과 일치하는지 확인하세요
flake8 - 코드에 버그가 있는지, 코드 스타일이 PEP8을 준수하는지 확인하세요.
flake8 확장 - Flake8 확장의 멋진 목록
mypy - 코드의 유형 정확성을 확인하세요.
pre-commit Hooks - 파일 품질을 확인하는 사전 커밋 후크 모음
pydocstyle - 코드가 문서화되어 있는지 확인하세요
pygrep 후크 - 일반적인 Python 코드 냄새를 확인하는 사전 커밋 후크 모음
pytest-recording - pytest 테스트에서 HTTP 요청을 기록하고 재생합니다.
? pyupgrade - 최신 Python 언어 기능을 사용하여 코드가 작성되었는지 확인하세요.
? 안전 - 종속성에 알려진 보안 취약점이 없는지 확인하세요.
? shellcheck - 쉘 스크립트의 품질을 확인하십시오
? Coverage.py - 코드의 테스트 적용 범위를 확인하세요.
? 가설 - 코드를 손상시키는 극단적인 경우를 자동으로 찾는 테스트 작성
? hypothese-auto - 코드의 유형 주석을 기반으로 가설 테스트 생성을 자동화합니다.
? fastapi - 유형 주석을 기반으로 RESTful API 생성
? typer - 유형 주석을 기반으로 CLI 생성
? streamlit - 단일 Python 파일로 웹 앱 만들기
? ump2version - 패키지의 새 버전 출시
? Colouredlogs - 색상으로 로그의 가독성을 높입니다.
? hvplot - Pandas 데이터프레임에서 대화형 플롯 만들기
? mkdocs - 프로젝트에 대한 개발자 문서 만들기
? pdoc - 코드에 대한 API 문서 생성
? Birdseye - Python 코드를 그래픽적으로 디버깅합니다.
? scalene - 코드의 CPU 및 메모리 사용량을 라인별로 프로파일링합니다.
? viztracer - Flamegraph를 사용하여 코드 성능 시각화
? tqdm - 장기 실행 작업에 진행률 표시줄을 쉽게 추가
? 편향-분산 절충 - 모델의 총 오류가 편향과 분산의 합이 되는 방식(30분)
? 교차 검증의 두 가지 다른 용도 - 중첩된 교차 검증을 사용하여 교차 검증의 두 가지 다른 용도를 결합하는 방법(30분)
? 모드, 중앙값 및 평균: 통일된 관점 - 평균 절대 오차(MAE)를 최소화하는 것이 평균 제곱 오차(MSE)를 최소화하는 것보다 더 강력한 이유(30분)
? 역전파는 기울기를 계산하는 연쇄 규칙입니다 - 역전파가 목적 함수의 기울기를 계산하는 알고리즘인 이유(30분)
? 누적 일반화 - 모델 누적 방법(30분)
? t-SNE 및 UMAP에 대해 잘못된 초기화를 사용했습니다. - t-SNE 및 UMAP를 올바르게 초기화하는 방법(15분)
? 기존의 완전 연결된 네트워크에서 Transformers까지 - 신경망이 완전 연결된 네트워크에서 Transformers로 진화한 방법(30분)
? .632+ 규칙이란 무엇입니까? - 부트스트래핑으로 일반화 성능을 측정하는 방법(30분)
? 누출이 있거나 없는 스택 전략 - 모델 스택을 위한 다양한 전략(30분)
? 데이터 배포 이동 및 모니터링 - 다양한 유형의 데이터 이동을 감지하고 해결하는 방법(1시간)
? 역전파는 단순한 체인 규칙이 아닙니다. 역전파가 라그랑주 승수와 어떻게 관련되는지(30분)
? ML 알고리즘을 조정하기 어려운 이유 - 파레토 전면이 오목할 때 여러 목표 최적화(30분)
? 딥 러닝 모델 압축 - 양자화, 가지치기, 증류를 사용하여 모델을 압축하는 방법(30분)
? SHAP: SHApley 추가 설명 - Shapley 값으로 모델의 출력을 설명하는 방법(30분)
? Shapley 및 SHAP 소개 - Shapley 값을 SHAP로 근사화하는 방법(30분)
? UMAP: 균일 다양체 근사화 및 투영 - 시각화 및 모델링을 위해 차원을 줄이는 방법(30분)
? PyNNDescent - 대규모 데이터세트에서 가장 가까운 이웃을 찾는 방법(15분)
? 정밀도 및 재현율 - 정밀도와 재현율이 분류자의 성능을 측정하는 방법(30분)
? 확률 보정 - 모델의 출력 점수를 확률로 보정해야 하는 모델 유형과 방법(30분)
? 모두 이탈률을 잘못 계산하고 있습니다. 이탈이 무엇인지 올바르게 정의하세요(30분)
? 가우스 프로세스 - 처음부터 - 가우스 프로세스를 사용하여 확률적 회귀 모델을 구축하는 방법(1시간)
? Microsoft의 Document Image Transformer - PubLayNet에서 SotA 성능을 달성하고 다양한 다운스트림 작업에 사용할 수 있는 자체 감독 사전 학습 모델(30분)
? Awesome Sentence Embedding - 사전 학습된 문장 및 단어 임베딩 모델의 선별된 목록(15분)
? Prophet 모델 - Meta의 Prophet 모델이 시계열을 추세, 계절성 및 휴일 구성 요소로 분해하는 방법(30분)
? 다트 - Python으로 쉽게 만든 시계열 - darts
로 예측 모델을 구축하는 방법(1시간)
? Microsoft Recommenders - 추천 시스템 모델 비교(30분)
? 누군가가 나에게 Tensor 계산 라이브러리에 대해 말해줬으면 좋았을 내용 - JAX, PyTorch, TensorFlow 및 Theano의 차이점(30분)
? 모던 판다 시리즈(1~7부) - 관용적인 판다 쓰기(1시간)
? Awesome Pandas - Pandas 리소스의 멋진 목록(1시간)
? scikit-learn 파이프라인 및 FeatureUnions 사용 - Pipeline
라인을 사용하여 엔드투엔드 모델을 구축하는 방법(30분)
? 회귀 분석에서 목표 변환 - 보다 강력한 모델을 구축하기 위해 목표를 변환하는 방법(15분)
? 이종 데이터용 ColumnTransformer - ColumnTransformer
사용하여 sklearn Pipeline
에서 Pandas DataFrames를 처리하는 방법(30분)
? 맞춤 견적 도구 - 나만의 맞춤 Estimator
만들기(30분)
? 연속적인 반감기를 통한 초매개변수 최적화 - 가장 계산적으로 효율적인 방법으로 초매개변수를 최적화하는 방법(30분)
? Doccano - 텍스트 레이블 지정 도구(30분)
? CVAT: 컴퓨터 비전 주석 도구 - 이미지 레이블 지정 도구(30분)
? 멋진 데이터 라벨링 - 멋진 데이터 라벨링 도구 목록(30분)
? 호출 - 프로젝트에서 실행하는 일반적인 작업을 CLI로 구현하는 방법(30분)
? poe - 프로젝트에서 실행하는 일반적인 작업을 CLI로 구현하는 방법(30분)
? Poetry를 이용한 Python 패키징 및 종속성 관리 소개 - Python 패키지의 종속성 및 환경을 관리하는 방법(30분)
? 기계 학습을 위한 Pyenv 소개 - pyenv를 사용하여 Python 인터프리터를 관리하는 방법(30분)
? 최신 Python 환경 - 종속성 및 작업 영역 관리 - pyenv, venv + pip, venv + pip-tools, poem, Pipenv 및 conda 비교(30분)
? Conda: 오해와 오해 - Conda에 대한 일반적인 오해(15분)
? Docker 커리큘럼 - Docker 사용 방법(4시간)
? Docker 레이어 캐싱 - 레이어 캐싱의 이점을 활용하기 위해 Dockerfile을 작성하는 방법(30분)
? Dockerfile 모범 사례 - 좋은 Dockerfile을 작성하는 방법(1시간)
? Docker용 Gunicorn 구성 - Docker 이미지용 Gunicorn을 가장 잘 구성하는 방법(30분)
? BuildKit의 새로운 캐싱으로 Docker 속도 향상 - 빌드 캐시를 사용하여 Docker 빌드 속도를 높이는 방법(30분)
? 안전한 방법인 Docker 및 Compose에서 비밀 구축 - Docker 빌드에서 비밀을 사용하는 방법(15분)
? Python 및 Docker용 보안 스캐너 - Docker 이미지에서 코드 및 Docker 이미지의 보안 문제를 스캔하는 방법(30분)
? 늑대를 울린 보안 스캐너 - 오탐 없이 Docker 이미지에서 보안 문제를 스캔하는 방법(15분)
? Awesome Docker - Docker 리소스의 멋진 목록(30분)
? 위대한 기대 - 데이터 및 데이터 파이프라인을 테스트하고 문서화하는 방법(30분)
? Cron 모범 사례 - Cron을 사용하여 작업을 예약하는 가장 좋은 방법(30분)
? SSH 터널에 대한 시각적 가이드 - SSH를 사용하여 포트를 전달하고 터널을 만드는 방법(30분)
? Bash에서 작업을 수행하는 안전한 방법 - 안전하고 강력한 쉘 스크립트를 작성하는 방법(1시간)
? 터미널은 터미널이 아닙니다: 스트림 소개 - 터미널이 스트림을 조작하는 도구인 방법(30분)
? Bash Heredoc - heredoc를 사용하여 명령에 여러 줄 인수를 전달하는 방법(30분)
? 셸 스크립트 작성을 중지하세요 - CI/CD 또는 Docker 이미지용 셸 스크립트를 작성하면 안되는 이유(30분)
? Terraform 소개 - Terraform 사용 방법(1시간)
? Terraform 모범 사례 - Terraform 모범 사례(1시간)
? Terraform 사전 커밋 후크 컬렉션 - 사전 커밋을 통해 Terraform 코드 품질 검사를 자동화하는 방법(1시간)
? Awesome Terraform - Terraform 리소스의 멋진 목록(30분)
? Terraform 튜토리얼 - Terraform을 시작하는 방법(1시간)
? Python 애플리케이션에 Redis 인 메모리 스토리지 사용 - Redis를 Python 애플리케이션의 인 메모리 캐시로 사용하는 방법(30분)
? Python Kafka 소비자: 최소 한 번, 최대 한 번, 정확히 한 번 - Python에서 다양한 유형의 Kafka 소비자를 작성하는 방법(30분)
? Kafka Exactly-Once-Semantics - 메시지를 정확히 한 번 생성하고 소비하는 방법(1시간)
? RabbitMQ: 지속성을 갖춘 메시지 대기열 라이브러리 - RabbitMQ는 메시지 브로커가 있는 메시징 시스템입니다(4시간)
? ZeroMQ: 메시지 큐 프리미티브가 포함된 소켓 라이브러리 - ZeroMQ는 메시지 브로커가 없는 경량 메시징 시스템입니다(8시간).
Superlinear는 벨기에에 본사를 둔 기계 학습 회사입니다.
우리는 AI 기반 소프트웨어를 발명, 설계 및 개발합니다. 우리는 고객과 함께 조직 내 어떤 문제를 AI로 해결할 수 있는지 파악하고 각 문제에 대한 인공 지능의 가치를 입증합니다.
우리 팀은 지속적으로 새롭고 더 나은 성능의 솔루션을 찾고 있으며 고객과 회사를 위한 최고의 아이디어를 생각해 내기 위해 서로 도전합니다.
다음은 AI의 기반이 되는 기술인 머신러닝을 사용하여 수행하는 작업의 몇 가지 예입니다.
구직자가 자신의 기대에 맞는 훌륭한 일자리를 찾을 수 있도록 도와주세요. 벨기에 공공고용서비스 웹사이트에서는 이력서만을 토대로 채용 추천을 찾을 수 있습니다.
병원의 시간 절약을 도와주세요. 환자의 퇴원 편지에서 진단을 추출합니다.
모방 기사를 감지하여 게시자가 영향력을 추정할 수 있도록 도와주세요.
우리는 열심히 일하고 함께 즐거운 시간을 보냅니다. 우리는 각 팀원이 도전할 때 지지를 받고, 책임을 질 때 신뢰를 받는 협업 문화를 조성합니다.