2024년 8월 7일, OpenAI는 API에 획기적인 기능 구조 출력을 도입하여 API의 안정성과 애플리케이션 정확성을 크게 향상시켰다고 발표했습니다. 이 새로운 기능은 모델에서 생성된 출력이 개발자가 제공한 JSON 스키마와 완전히 일치하는지 확인하여 출력이 특정 스키마와 완전히 일치하는지 보장할 수 없었던 이전 JSON 스키마의 한계를 해결합니다. 또한, OpenAI는 입력 가격이 절반으로, 출력 가격이 1/3로 인하되는 등 새 모델의 가격도 인하되었다고 발표했는데, 이는 의심할 여지 없이 개발자에게 좋은 소식입니다. Downcodes의 편집자는 이러한 기술 혁신에 대해 자세히 설명할 것입니다.
2024년 8월 7일, OpenAI는 오늘 API에 획기적인 기능 구조 출력을 도입한다고 발표했습니다. 이 새로운 기능은 모델에서 생성된 출력이 개발자가 제공한 JSON 스키마를 완전히 준수하도록 보장하여 API의 신뢰성과 애플리케이션의 정확성을 크게 향상시킵니다. 이전 JSON 스키마와 달리 현재 구조화된 출력은 JSON의 스키마(즉, JSON 출력의 구조가 어떻게 보이는지)를 정의할 수 있을 뿐만 아니라 출력 JSON이 100% 올바른지 확인할 수도 있습니다. 동시에 OpenAI는 새 모델의 가격을 인하했다고 발표했습니다. 입력 가격은 원래 가격의 절반에 불과하고 출력도 1/3 저렴합니다.
작년에 OpenAI는 애플리케이션을 구축하는 개발자를 위한 강력한 도구로 JSON 스키마를 도입했습니다. 그러나 JSON 스키마는 유효한 JSON 출력을 생성할 가능성을 향상시키지만 출력이 특정 스키마를 준수한다고 보장하지는 않습니다. 구조화된 출력의 도입은 모델 출력을 미리 설정된 패턴과 일치하도록 제한하여 출력 데이터의 정확성과 일관성을 보장함으로써 이러한 제한을 정확하게 해결하는 것입니다.
OpenAI의 복잡한 JSON 패턴 추적 평가에서 새로운 모델 gpt-4o-2024-08-06은 구조화된 출력에서 100%라는 우수한 점수를 얻은 반면, 이전 모델 gpt-4-0613은 40% 미만의 점수를 받았습니다. 이러한 중요한 진전은 OpenAI의 기술적 도약을 보여줄 뿐만 아니라 개발자에게 더 높은 작업 효율성과 더 낮은 오류율을 제공합니다.
OpenAI의 API는 두 가지 형태의 구조화된 출력을 도입합니다.
1. 함수 호출 : 함수 정의에 설정하여 구조화된 출력을 사용할 수 있습니다. 이 기능은 모든 모델 이상을 포함하여 모든 도구 지원 모델에서 사용할 수 있습니다. 구조화된 출력이 활성화되면 모델 출력이 제공된 도구 정의와 일치합니다.
API 요청 설정
API 응답
2. response_format 매개변수의 새로운 옵션 : 개발자는 JSON 스키마 json_schema를 매개변수의 새로운 옵션으로 제공하여 구조화된 방식으로 사용자 요청에 응답할 수 있습니다.
보안은 항상 OpenAI의 최우선 과제입니다. 새로운 구조화된 출력 기능은 기존 보안 정책을 존중하므로 모델이 필요할 때 안전하지 않은 요청을 거부할 수 있습니다. 또한 OpenAI의 Python 및 Node SDK는 기본적으로 구조화된 출력을 지원하도록 업데이트되어 개발 프로세스를 단순화합니다.
구조화된 출력은 사용자 의도에 따라 사용자 인터페이스를 동적으로 생성하고, 추론 지원에서 최종 답변을 분리하고, 구조화되지 않은 데이터에서 구조화된 데이터를 추출하는 등 광범위한 애플리케이션에 사용될 수 있습니다. 이러한 사용 사례는 다양한 시나리오에서 구조화된 출력의 실용성과 유연성을 보여줍니다.
OpenAI는 제한된 디코딩 기술을 사용하여 모델 출력과 JSON 스키마 간의 100% 일치를 달성합니다. 이 접근 방식을 사용하면 각 단계에서 모델이 디코딩을 동적으로 제한하여 유효한 토큰만 선택할 수 있으므로 오류 가능성이 줄어듭니다.
OpenAI의 구조화된 출력 기능은 개발자에게 보다 안정적이고 정확한 도구를 제공할 뿐만 아니라 데이터 처리 및 애플리케이션 개발에서 인공지능 기술의 발전을 더욱 촉진합니다. 이 기능의 공식 출시로 더욱 혁신적인 애플리케이션이 출시될 수 있기를 기대합니다.
전체적으로 OpenAI의 구조화된 출력 기능은 AI 애플리케이션의 신뢰성과 효율성을 크게 향상시키고 개발자에게 보다 편리한 개발 경험을 제공하는 중요한 기술 발전입니다. Downcodes의 편집자는 이 기술이 미래에 AI 애플리케이션 개발에 점점 더 중요한 역할을 할 것이라고 믿습니다.