코드 검토는 소프트웨어 개발에서 중요한 연결 고리이지만, 시간이 많이 걸리고 노동 집약적이라는 특성 때문에 항상 개발자를 괴롭혀 왔습니다. 인간 동료 검토 및 규칙 기반 정적 분석 도구와 같은 기존 코드 검토 방법은 비효율적이며 오탐이 발생하기 쉽습니다. CodeRabbit은 인공 지능 기술을 사용하여 코드 검토 프로세스를 크게 자동화하여 개발자의 시간을 많이 절약한다고 주장합니다. 그러나 AI 기반 코드 검토가 실제로 원하는 결과를 얻을 수 있는지 여부는 여전히 논란의 여지가 있습니다.
기술계에서는 코드 리뷰를 두고 열띤 토론이 벌어지고 있다. 일주일에 2~5시간씩 코드를 검토하는 시대는 이제 곧 과거의 일이 될 것이며, CodeRabbit은 이를 위해 노력하고 있습니다.
개발자들이 싫어하는 링크인 코드 검토는 항상 코드 품질을 향상시키는 중요한 수단이었습니다. 그러나 시간이 많이 걸리고 노동 집약적이기도 합니다. 통계에 따르면 기업의 절반이 이에 주당 2~5시간을 소비합니다. 더 나쁜 것은 인력이 부족하면 코드 검토가 개발자의 시간과 에너지를 소모하는 끝없는 구렁텅이가 될 수 있다는 것입니다.
사진 출처 참고: 사진은 AI에 의해 생성되었으며 사진은 서비스 제공업체 Midjourney의 승인을 받았습니다.
이때 CodeRabbit의 공동 창립자이자 CEO인 Harjot Gill이 일어서서 인공 지능을 사용하면 코드 검토 프로세스를 크게 자동화할 수 있다고 주장했습니다. Gill은 신인이 아닙니다. 그는 데이터 센터 소프트웨어 회사인 Nutanix에서 수석 기술 이사를 역임했으며 Nutanix가 인수한 스타트업 Netsil을 설립하기도 했습니다. 또 다른 창업자인 구르 싱(Gur Singh) 역시 의료 결제 플랫폼 알레게우스(Alegeus)에서 개발팀을 이끌었던 경험이 풍부한 베테랑이다.
Gill은 CodeRabbit 플랫폼이 고급 AI 추론을 사용하여 코드 이면의 의도를 이해하고 개발자에게 실행 가능한 인간과 유사한 피드백을 제공한다는 자신감을 표명했습니다. 정말 멋진데요? Gill은 또한 전통적인 방법을 비판했습니다. 전통적인 정적 분석 도구와 코드 검사기는 규칙 기반이며 종종 높은 오탐률을 생성하는 반면, 동료 검토는 시간이 많이 걸리고 주관적입니다. 반면 CodeRabbit은 AI 우선 플랫폼입니다.
하지만 이 대담한 발언에는 온갖 유행어가 난무해 진정성을 의심하게 만든다. 실제로 AI 기반 코드 검토는 사람이 참여하는 검토보다 신뢰성이 떨어질 수 있다는 증거가 있습니다.
Graphite의 Greg Foster는 블로그 게시물에서 코드 검토를 위해 OpenAI의 GPT-4를 사용한 내부 실험 결과를 공유했습니다. AI 모델은 작은 논리 오류나 오타 등 몇 가지 유용한 사항을 포착할 수 있지만, 많은 오탐(false positive)도 생성합니다. 모델을 미세 조정하려는 시도조차도 이러한 오탐지를 크게 줄이는 데 실패했다고 Foster는 말했습니다.
그렇다면 CodeRabbit은 실제로 이러한 문제를 해결할 수 있을까요? 아니면 이것은 AI를 과대광고하기 위한 또 다른 마케팅 수법일까요? 현재로서는 CodeRabbit의 구체적인 성능 데이터를 본 적이 없어 그 효과에 대해 정확한 판단을 내릴 수 없습니다.
그럼에도 불구하고 CodeRabbit의 시도는 기술 산업의 끊임없는 효율성 추구를 반영합니다. AI가 인간의 코드 검토를 완전히 대체할 수는 없지만 일부 측면에서는 개발자에게 귀중한 지원을 제공할 수 있습니다.
앞으로는 더 많은 AI 지원 코드 검토 도구가 등장할 수도 있습니다. 이러한 도구를 사용하면 개발자가 몇 가지 일반적인 오류를 신속하게 발견하여 인간의 지능이 필요한 복잡한 문제에 더 집중할 수 있습니다.
CodeRabbit의 AI 코드 검토 도구가 실제로 업계의 문제점을 해결할 수 있는지 여부는 아직 밝혀지지 않았습니다. 그러나 이러한 시도는 의심할 여지없이 코드 검토 기술의 발전을 촉진했으며, 이는 AI 기술이 앞으로 소프트웨어 개발에서 더 큰 역할을 할 것임을 나타냅니다.