GPT 눈
나는 GPT-4 눈을 주었다. "眼观六路,耳听八方"
내가 한 일은 다음과 같습니다.
- 비전 모델에 일부 데이터를 추가했습니다.
- AI 카메라 액세스 권한을 부여했습니다.
- 현장에 대해 질문을 던졌다
- 그것은 물체를 식별했습니다
- 정보를 찾기 위해 웹을 검색했습니다.
- 해당 정보를 사용하여 정확하게 답변했습니다.
3가지 질문이 100% 정답인지 확인해보세요!
- 트위터 https://twitter.com/mckaywrigley/status/1651291367224807424?s=20
- 유튜브 https://www.youtube.com/watch?v=w-wxguIs-0I
이 패키지는 스폰서웨어입니까???
https://github.com/sponsors/Charmve?주파수=one-time&sponsor=Charmve
이 리포지토리는 후원자가 15명에 도달할 때까지 GitHub 후원자의 후원자에게만 제공되었습니다.
github.com/sponsorware/docs ?에서 Sponsorware 에 대해 자세히 알아보세요.
사용된 기술
- 프론트엔드: 반응
- 이미지 분석 API: TensorFlow 모델 - MobileNet
- 텍스트 생성 API: GPT API
설치
- 저장소 복제:
git clone https://github.com/Charmve/gpt-eyes.git
- 프로젝트 디렉터리로 이동합니다:
cd gpt-eyes
- 종속성 설치:
npm install
구성
- 계정을 만들고 TensorFlow 모델용 API 키(MobileNet 및 GPT API)를 받으세요.
- API 키로 구성 파일을 업데이트합니다.
- TensorFlow 모델 - MobileNet:
/path/to/config.js
- GPT API:
/path/to/config.js
용법
- 개발 서버 시작:
npm start
- 브라우저를 열고
http://localhost:3000
방문하세요.
작동 방식
- 장치 카메라가 이미지를 분석합니다.
- 이 애플리케이션은 TensorFlow Models - MobileNet API를 사용하여 이미지를 분석하고 객체 정보를 추출합니다.
- 애플리케이션은 분석된 객체 정보를 GPT API로 보냅니다.
- GPT API는 분석된 개체를 설명하는 텍스트를 생성합니다.
- 애플리케이션은 분석된 이미지와 생성된 텍스트를 표시합니다.