ChatGPT는 종종 이해하기 위해 사전이 필요할 수 있는 단어를 생성하거나 마술처럼 들리는 단어를 생성합니다. 이는 ChatGPT에만 해당되는 것이 아니며 Mistral과 같은 다른 오픈 소스 언어 모델도 마찬가지입니다. 콘텐츠 제작을 위해 AI의 도움을 구하는 것은 윤리적으로만 수행되는 한 나쁠 것이 없지만, 14~16세를 대상으로 한 과학 글쓰기 대회에서 심사위원은 에세이에서 '미궁의 미로'라는 문구를 보고 의심을 품었습니다. , 십대의 글을 쓰기에는 너무 발전된 것 같았습니다. 그래서 그는 그것을 확인하기 위해 AI 도구를 사용했습니다. 불행하게도 네 가지 도구 모두 동일한 결과를 얻었습니다. 거의 전체 에세이의 90~96%가 인간이 아닌 AI에 의해 작성된 것처럼 보였습니다. 그러나 우리 모두가 전문가는 아니며, 위의 문구를 본다면 우리의 제한된 인식으로 인해 건너뛰었을 수도 있습니다.
AI가 저작자인가를 판별하는 비판적 사고력이 필요하다
AI가 생성한 텍스트를 찾는 가장 쉬운 방법은 일반적으로 사용하지 않지만 ChatGPT에서는 일반적으로 사용되는 단어를 확인하는 것입니다. 2010년부터 현재까지 매일 업데이트되는 블로그, 기사, 뉴스 등의 190억 개 이상의 영어 단어로 구성된 대규모 자료를 생각해 보세요. 문자열 검색 알고리즘을 사용하여 **“delve” **라는 단어를 검색했는데 52,388번 나왔습니다. 나는 연간 패턴을 계획하고 ChatGPT가 11월 30일에 출시된 같은 해인 2022년부터 인터넷에 나타나는 비정상적인 동작을 식별했습니다.
**“복잡성” **또는 “변함 없음” 과 같은 다른 단어도 “탐색” 과 마찬가지로 유사한 증가를 보여줍니다. 최근에는 더 자주 사용되고 있습니다.
인간도 다양한 단어를 사용하기 때문에 이러한 어휘 선택은 반드시 AI가 독점적으로 사용하는 것은 아닙니다. 하지만 학문적 글쓰기에서는 "탐색" 대신 "탐색" 또는 " 자세히 논의" 와 같은 문구를 자주 사용합니다. 저는 ChatGPT에 "자세히 논의하세요..."라는 문구를 바꿔달라고 요청했습니다. ****제공되는 처음 5개 제안에는 일반적으로 이 문구가 포함됩니다.
또한, 2023년까지 200만 개 이상의 논문이 포함된 유명한 출판 논문 플랫폼인 arXiv 데이터베이스를 분석하려고 합니다. 논문 초록에서 ** "delve" **라는 단어를 감지하고 연간 패턴을 플롯하려고 합니다. 나는 이 단어가 2023 년 논문 초록에서 널리 사용되었다는 사실에 놀랐습니다. 이는 ChatGPT가 상위 5개 제안에서 제안한 것과 동일한 단어입니다.
이는 학술 작가가 콘텐츠를 수정하거나 생성하기 위해 ChatGPT를 사용할 수 있음을 나타냅니다. "탐색"이라는 단어가 있으면 학생이나 온라인 블로그에서 제출한 문서(해당 단락이나 텍스트의 해당 부분)가 ChatGPT를 사용하여 다시 표현되거나 향상되었다는 힌트 또는 의심의 역할을 합니다.
내 연구 전문 지식과 LLM에서 2년 동안 일한 경험을 바탕으로 텍스트에서 눈여겨볼 수 있는 매우 포괄적인 100개 단어 목록을 작성하여 텍스트가 생성되었는지 또는 다음을 사용하여 바꾸어 표현되었는지 파악하는 데 도움을 주었습니다. 일체 포함.
하지만 이러한 단어 수를 확인하는 것은 쉬운 일이 아니기 때문에 빠르게 달성하기 위해 텍스트를 빠르게 확인하는 웹 앱을 만들었습니다. 파일을 업로드하거나 텍스트를 붙여넣기만 하면 나머지는 알아서 처리됩니다. 쉬워요!