pushshift.io Reddit API는 Reddit 댓글 및 제출물 검색을 위한 향상된 기능과 검색 기능을 제공하기 위해 /r/datasets mod 팀에서 설계하고 제작했습니다. 프로젝트 리더인 /u/stuck_in_the_matrix는 https://files.pushshift.io에 있는 Reddit 댓글 및 제출 아카이브의 관리자입니다.
이 RESTful API는 Reddit 데이터 검색을 위한 전체 기능을 제공하며 강력한 데이터 집계 생성 기능도 포함합니다. 이 API를 사용하면 관심 있는 데이터를 빠르게 찾고 흥미로운 상관관계를 찾을 수 있습니다.
Reddit 댓글 및 제출 데이터베이스에 액세스하는 두 가지 주요 방법이 있습니다. 하나는 https://api.pushshift.io/를 통해 직접 API를 사용하는 것이고, 다른 하나는 https://elastic.pushshift.io/를 통해 백엔드 Elasticsearch 검색 엔진에 액세스하는 것입니다. 이 문서에서는 두 가지 접근 방식을 모두 설명하고 제공합니다. API를 효과적으로 사용하는 방법에 대한 예입니다. 또한 이 문서에서는 보다 집중된 검색을 활용하기 위해 API 매개변수를 사용하는 방법을 살펴봅니다.
Reddit에서 공개적으로 사용 가능한 모든 댓글과 제출물을 검색하는 데 사용되는 두 가지 주요 엔드포인트가 있습니다.
다음 섹션에서는 댓글 검색 엔드포인트를 사용하여 보다 효과적인 검색을 수행하는 방법을 살펴보겠습니다.
댓글을 검색하려면 https://api.pushshift.io/reddit/search/comment/ 엔드포인트를 사용하세요. 몇 가지 예부터 시작한 다음 이 엔드포인트를 사용할 때 사용할 수 있는 다양한 매개 변수를 살펴보겠습니다. 가장 간단한 검색 중 하나는 q 매개변수만 사용하는 것입니다. q 매개변수는 특정 단어나 구문을 검색하는 데 사용됩니다. 예는 다음과 같습니다.
'과학'이라는 단어가 언급된 최신 댓글을 검색하세요.
https://api.pushshift.io/reddit/search/comment/?q=science
그러면 댓글 본문에 "과학"이라는 용어가 포함된 가장 최근 댓글이 검색됩니다. 이 검색은 대소문자를 구분하지 않으므로 대문자 사용에 관계없이 "science"라는 용어가 검색됩니다. API는 기본적으로 최근에 작성된 댓글을 먼저 정렬합니다. 이 검색을 수행하면 25개의 결과가 반환됩니다. 이는 검색의 기본 크기이며 크기 매개변수를 사용하여 조정할 수 있습니다. 이에 대해서는 매개변수 섹션에서 자세히 설명합니다. 데이터는 JSON 형식으로 반환되며, 'data' 키에는 실제 검색결과가 포함됩니다. 발견된 총 결과 수, 검색 처리에 걸린 시간 등을 포함하여 검색에 대한 추가 정보를 제공하는 "메타데이터" 키도 있습니다. 집계가 요청되면 모든 집계 데이터가 aggs 키 아래에 반환됩니다.
댓글 검색을 수행할 때 사용할 수 있는 추가 매개변수가 많이 있습니다. 그것들을 살펴보고 각각에 대한 예를 들어보겠습니다.
매개변수 | 설명 | 기본 | 허용되는 값 |
---|---|---|---|
큐 | 검색어. | 해당 없음 | 문자열/구문용 인용 문자열 |
아이디 | ID를 통해 구체적인 댓글을 받아보세요. | 해당 없음 | 쉼표로 구분된 base36 ID |
크기 | 반환할 결과 수 | 25 | 정수 <= 500 |
전지 | 하나의 반환 특정 필드(쉼표로 구분) | 모든 필드가 반환됨 | 문자열 또는 쉼표로 구분된 문자열 |
종류 | 특정 순서로 결과 정렬 | "설명" | "오름차순", "내림차순" |
sort_type | 특정 속성으로 정렬 | "created_utc" | "점수", "num_comments", "created_utc" |
애그 | 반환 집계 요약 | 해당 없음 | ["작성자", "link_id", "created_utc", "subreddit"] |
작가 | 특정 작성자로 제한 | 해당 없음 | 끈 |
하위 레딧 | 특정 하위 레딧으로 제한 | 해당 없음 | 끈 |
~ 후에 | 이 날짜 이후의 결과 반환 | 해당 없음 | Epoch 값 또는 정수 + "s,m,h,d"(예: 30일 동안 30d) |
~ 전에 | 이 날짜 이전의 결과를 반환합니다. | 해당 없음 | Epoch 값 또는 정수 + "s,m,h,d"(예: 30일 동안 30d) |
빈도 | Created_utc로 설정된 경우 aggs 매개변수와 함께 사용됩니다. | 해당 없음 | "초", "분", "시", "일" |
메타데이터 | 쿼리에 대한 메타데이터 표시 | 거짓 | "참", "거짓" |
ids 매개변수를 사용하여 댓글을 직접 검색할 수 있습니다. ID별로 댓글 배치를 얻으려면 다음 예를 사용하십시오.
기본 36 ID 값을 사용하여 3개의 댓글을 검색합니다.
https://api.pushshift.io/reddit/comment/search?ids=dlrezc8,dlrawgw,dlrhbkq
검토해야 할 매개변수가 꽤 많으므로 먼저 위의 매개변수를 사용하는 방법과 좀 더 복잡한 예를 제공하겠습니다. 위의 이전 예를 계속해서 "과학" 키워드 검색을 확장해 보겠습니다. "과학"이라는 용어를 검색하고 싶지만 특정 하위 레딧으로 제한하고 싶다면 어떻게 해야 할까요? subreddit 매개변수를 사용하면 다음과 같이 할 수 있습니다.
하위 레딧 /r/askscience에서 "science"라는 단어를 언급한 가장 최근 댓글을 검색하세요.
https://api.pushshift.io/reddit/search/comment/?q=science&subreddit=askscience
이렇게 하면 "science"라는 용어가 포함된 25개의 댓글이 반환되지만 /r/askscience 하위 레딧에서만 가능합니다. 특정 정렬 방법을 요청하지 않았으므로 가장 최근 주석이 반환됩니다(정렬 매개 변수의 기본값은 "desc"입니다). "science"라는 단어를 언급한 /r/askscience에 대한 첫 번째 댓글을 원한다면 어떻게 될까요? 이를 처리하기 위해 정렬 및 크기 매개변수를 사용할 수 있습니다.
하위 레딧 /r/askscience에서 "science"라는 단어를 언급한 가장 최근 댓글을 검색하세요.
https://api.pushshift.io/reddit/search/comment/?q=science&subreddit=askscience&sort=asc&size=1
결과는 다음과 같습니다.
{
"data": [
{
"author": "MockDeath",
"author_flair_css_class": null,
"author_flair_text": null,
"body": "Knowing more would definitely help. I guess all you can do is find out if they know the basics like you said then take it from there. That COu00b2 has the carbon turned to the isotope carbon14 in the upper atmosphere by cosmic radiation. This causes a specific percentage of carbon in the atmosphere to be carbon14.nnNow we are carbon based life forms and we have to get the carbon we are built out of from some where. We get it from eating plants, and the plants get it from absorbing COu00b2 from the air. So so long as we are alive, we uptake new carbon14. So this gives you a pretty good base line for dating.nnNow to fight arguments against carbon dating you could use the example of how we can see proton collisions in the LHC for sensitivity of our equipment. Nuclear decay is very accurate in how fast it happens, this is why atomic clocks work to a much higher degree of accuracy than other methods of time keeping. Also, you might want to make a general appeal for science. Science works, that is why we have TV's, robots, particle accelerators, satellites, computers, MRI and CAT scanners, nuclear power, etc etc. Scientists are not just willy nilly making shit up, or these kinds of things wouldn't work.",
"created_utc": 1270637661,
"id": "c0nn9iq",
"link_id": "t3_bne3u",
"parent_id": "t1_c0nn5ux",
"score": 2,
"subreddit": "askscience",
"subreddit_id": "t5_2qm4e"
}
],
"metadata": {
"execution_time_milliseconds": 30.52,
"results_returned": 1,
"shards": {
"failed": 0,
"successful": 36,
"total": 36
},
"size": 1,
"sort": "asc",
"sort_type": "created_utc",
"timed_out": false,
"total_results": 134785,
"version": "v3.0"
}
}
반환된 결과에서 "science"를 언급한 /r/askscience에 대한 첫 번째 댓글이 epoch 날짜 1270637661(2010년 4월 7일 수요일 오전 10:54:21(GMT))에 발생했음을 알 수 있습니다. 메타데이터 부분을 빠르게 살펴보겠습니다. 이 검색의 실행 시간은 약 30밀리초임을 알 수 있습니다. 총 36개의 샤드가 검색되었으며 모두 성공했습니다. 검색 시간이 초과되지 않았습니다(timed_out 매개변수). 이는 좋은 일입니다. 더 복잡한 일부 검색은 때때로 시간 초과가 발생할 수 있으므로 API를 프로그래밍 방식으로 사용하는 경우 확인할 수 있는 속성입니다. total_results 값은 134,785입니다. 이는 /r/askscience에 science라는 단어가 언급된 총 댓글 수를 알려줍니다. 이전 또는 이후 매개변수를 사용하지 않았기 때문에 이 숫자는 /r/askscience에 작성된 전체 댓글을 나타냅니다.
계속해서 추가 매개변수를 사용하여 검색 API의 기능을 강조해 보겠습니다. 이전 및 이후 매개변수를 사용하면 두 가지 모두에 대한 에포크 타임스탬프를 제공하여 검색 기간을 제한할 수 있습니다. 그러나 API는 이전 및 이후 매개변수에 대해 보다 인간과 유사한 값도 이해합니다. 숫자 뒤에 문자 s,m,h,d(초, 분, 시, 일을 나타냄)를 사용하여 기간을 제한할 수도 있습니다. 몇 가지 예를 살펴보겠습니다.
하위 레딧 /r/askhistorians에서 "Rome"을 검색하고 싶지만 지난 30일로만 제한하려면 값이 30d(30일)인 after 매개변수를 사용할 수 있습니다.
지난 30일 동안 로마를 언급한 댓글을 보려면 하위 레딧 /r/askhistorians를 검색하세요.
https://api.pushshift.io/reddit/search/comment/?q=rome&subreddit=askhistorians&after=30d
3일 전에 최근 뉴스 기사가 있었지만 검색 창을 4일 전과 2일 전 사이로 제한하고 싶다면 어떻게 해야 할까요? 그렇게 하려면 before와 after 매개변수를 모두 사용할 수 있습니다. 다음 예에서는 4~2일 전에 작성된 트럼프 언급 댓글을 검색하여 오름차순으로 정렬하겠습니다.
"Trump"라는 용어에 대한 모든 하위 레딧을 검색하고 2~4일 전에 작성된 댓글을 반환하세요.
https://api.pushshift.io/reddit/search/comment/?q=trump&after=4d&before=2d&sort=asc
지난 150개의 댓글을 검색하고 싶지만 각 댓글에 대해 반환된 작성자 및 본문 필드만 필요하다고 가정해 보겠습니다. fields 매개변수를 사용하면 어떤 정보를 필터링할지 API에 알릴 수 있습니다. 이는 요청을 많이 하고 특정 필드만 반환해야 하는 경우 주로 대역폭을 줄이는 데 도움이 됩니다.
다음은 fields 매개변수를 사용하여 "government"를 언급한 지난 150개의 댓글을 검색하고 작성자 및 본문 필드만 반환하는 예입니다.
"정부"라는 용어에 대한 모든 하위 레딧을 검색하고 본문 및 작성자 키만 포함하여 댓글을 반환합니다.
https://api.pushshift.io/reddit/search/comment/?q=government&size=150&fields=body,author
하위 레딧 /r/askscience에서 "science"라는 단어가 처음으로 검색된 위의 예 중 하나를 사용하여 댓글 작성자가 "MockDeath"라는 것을 확인했습니다. "MockDeath"가 Reddit에 남긴 처음 100개의 댓글을 받고 싶다면 어떻게 해야 할까요? 정렬 및 크기 매개변수와 함께 작성자 매개변수를 사용할 수 있습니다.
모든 하위 레딧을 검색하고 /u/MockDeath 사용자가 작성한 처음 100개의 댓글을 확인하세요.
https://api.pushshift.io/reddit/search/comment/?author=MockDeath&sort=asc&size=100
집계는 검색에 대한 요약 데이터를 제공하는 강력한 방법입니다. aggs 매개변수를 사용하면 특정 매개변수 주변에 패싯을 신속하게 생성하고 시간이 지남에 따라 데이터가 어떻게 변하는지 확인할 수 있습니다. 댓글 검색을 위한 aggs 매개변수는 작성자, 하위 레딧, reated_utc 및 link_id 값을 허용합니다. 이 매개변수를 사용하면 매우 멋진 작업을 많이 수행할 수 있으므로 몇 가지 예를 살펴보겠습니다.
시간이 지남에 따라 "Trump"라는 용어의 사용 빈도를 확인하고 싶다고 가정해 보겠습니다. 이번 기간 동안 지난 7일 동안 시간당 몇 개의 댓글이 게시되었는지 확인하고 싶습니다. 집계와 aggs 매개변수를 사용하면 해당 데이터를 빠르게 얻을 수 있습니다. 다음은 이 기준을 사용하는 예입니다.
트럼프라는 용어를 사용하여 시간 집계를 생성하여 지난 7일 동안 매시간 트럼프를 언급한 댓글 수를 표시합니다.
https://api.pushshift.io/reddit/search/comment/?q=trump&after=7d&aggs=created_utc&주파수=hour&size=0
우리는 지난 7일 동안 Trump를 언급한 총 댓글 수를 표시하기 위해 aggs 매개변수와 함께 빈도 매개변수를 사용하여 시간별 버킷을 만들었습니다. 주석 데이터가 아닌 집계 데이터 가져오기에만 관심이 있기 때문에 크기 매개변수는 0으로 설정되었습니다. 집계 데이터는 aggs ->created_utc 키 아래의 응답으로 반환됩니다. 다음은 반환의 첫 번째 부분에 대한 스니펫입니다.
{
"aggs": {
"created_utc": [
{
"doc_count": 685,
"key": 1502406000
},
{
"doc_count": 1238,
"key": 1502409600
},
{
"doc_count": 1100,
"key": 1502413200
},
doc_count 값은 "trump"라는 용어가 포함된 총 댓글 수입니다. 키 값은 해당 특정 버킷의 에포크 시간입니다. 이 예에서 첫 번째 버킷의 신기원 시간은 1502406000이며 이는 2017년 8월 10일 목요일 오후 11:00:00에 해당합니다. 이 키 값은 버킷의 시작 시간이므로 이 예에서는 2017년 8월 10일 목요일 오후 11:00:00부터 2017년 8월 10일 목요일 12:00 사이에 685개의 댓글에 "trump"라는 용어가 포함되어 있습니다. 오후 0시. 빈도 매개변수를 사용하면 초당, 분, 시간, 일, 주, 월, 연도별로 버킷을 생성할 수 있습니다. 이 집계를 사용하면 데이터를 사용하여 차트(예: Highcharts)를 만들고 특정 용어, 작성자, 하위 레딧 등에 대한 댓글 활동을 그래프로 표시할 수 있습니다. 이는 매우 강력한 데이터 분석 도구입니다.
시간이 지남에 따라 특정 댓글 용어의 빈도를 얻고 싶을 뿐만 아니라 해당 기간 동안 특정 용어에 대해 어떤 하위 레딧이 가장 인기가 있었는지 확인하고 싶다면 어떻게 해야 합니까? 다음은 aggs 매개변수를 사용하여 특정 용어에 대해 가장 많은 활동을 보인 하위 레딧을 표시하는 예입니다.
트럼프라는 용어를 사용하여 하위 레딧 집계를 생성하여 지난 7일 동안 트럼프를 언급한 상위 하위 레딧을 표시합니다.
https://api.pushshift.io/reddit/search/comment/?q=trump&after=7d&aggs=subreddit&size=0
다음은 결과의 일부입니다.
{
"aggs": {
"subreddit": [
{
"bg_count": 66,
"doc_count": 44,
"key": "lovetrumpshaters",
"score": 0.6666666666666666
},
{
"bg_count": 20,
"doc_count": 9,
"key": "Denmark_Uncensored",
"score": 0.45
},
{
"bg_count": 51,
"doc_count": 16,
"key": "WhoRedditHatesNow",
"score": 0.3137254901960784
},
하위 레딧 집계는 해당 하위 레딧에서 검색어를 언급하는 총 댓글 수(doc_count)와 해당 기간 동안 해당 하위 레딧에 작성된 총 댓글 수(bg_count)를 반환합니다. 이는 어느 하위 레딧에서 Trump를 가장 자주 언급했는지 보여줄 뿐만 아니라, 해당 하위 레딧 댓글 중 검색어가 포함된 댓글의 비율을 확인할 수 있도록 정규화된 결과도 제공합니다. 하위 레딧에서 "트럼프"라는 검색어를 가장 자주 언급한 하위 레딧의 순위를 매기면 결과는 일반적으로 가장 많은 활동을 포함하는 하위 레딧 쪽으로 편향될 것입니다. 이 접근 방식을 사용하면 원시 개수와 정규화된 데이터를 모두 볼 수 있습니다.
API는 또한 특정 검색어를 기반으로 어떤 제출물이 가장 인기가 있는지 확인하는 또 다른 매우 강력한 방법인 link_id에 대한 집계를 허용합니다. 위의 예를 계속해서 이것이 매우 도움이 될 수 있는 시나리오를 제시해 보겠습니다. 지난 24시간 동안 도널드 트럼프에 관한 수많은 큰 이야기가 쏟아졌습니다. API를 사용하여 제출물 내에서 Trump를 언급한 댓글 수를 기반으로 Trump와 관련된 제출물을 확인하고 싶습니다. 다시 aggs 매개변수를 사용하고 이를 link_id로 설정하여 이 정보를 빠르게 얻을 수 있습니다. 또 다른 예를 들어보겠습니다.
지난 24시간 동안 댓글에서 트럼프를 자주 언급한 제출물 표시
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=link_id&size=0
그러면 aggs -> link_id 키 아래에 제출 개체 배열이 반환됩니다. doc_count는 검색어("trump")를 언급한 각 제출물에 대한 총 댓글 수를 제공하고 bg_count는 해당 제출물에 대한 총 댓글 수를 제공합니다. 이는 특정 검색어나 구문을 기반으로 "인기 있는" 제출물을 빠르게 찾을 수 있는 좋은 방법입니다.
또한 API를 사용하면 작성자에 대한 집계를 생성할 수 있으므로 특정 검색어에 대해 어떤 작성자가 가장 많은 댓글을 달았는지 빠르게 확인할 수 있습니다. 다음은 작성자 집계를 사용하는 예입니다.
지난 24시간 동안 "Trump"라는 단어를 언급한 상위 작성자 표시
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=author&size=0
{
"aggs": {
"author": [
{
"doc_count": 605,
"key": "grrrrreat"
},
{
"doc_count": 329,
"key": "AutoModerator"
},
{
"doc_count": 168,
"key": "autotldr"
},
{
"doc_count": 73,
"key": "SnapshillBot"
},
작성자 집계는 특정 검색어가 포함된 댓글을 가장 많이 작성한 작성자를 보여줍니다. 위의 예에서 "트럼프"라는 용어를 언급하는 상위 작성자 중 다수는 실제로 봇입니다.
aggs 매개변수를 사용하면 여러 집계를 결합하고 특정 용어에 대한 많은 패싯 데이터를 얻을 수 있습니다. 위의 예를 사용하여 모든 통화를 하나의 통화로 결합하고 지난 24시간 동안 가장 많이 제출된 항목, Trump를 언급한 시간당 댓글 빈도, Trump에 대해 게시한 상위 작성자 및 댓글이 작성된 상위 하위 레딧을 표시할 수 있습니다. 트럼프를 언급함.
지난 24시간 동안 "Trump"라는 용어에 대한 작성자, 제출물, 하위 레딧 및 시간 빈도에 대한 집계 표시
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=author,link_id,subreddit,created_utc&주파수=시간&size=0
제출물을 검색하려면 https://api.pushshift.io/reddit/search/submission/ 엔드포인트를 사용하세요. 몇 가지 예부터 시작한 다음 이 엔드포인트를 사용할 때 사용할 수 있는 다양한 매개 변수를 살펴보겠습니다. 단순 검색의 경우 q 매개변수는 특정 단어나 구문을 검색하는 데 사용됩니다. 예는 다음과 같습니다.
"과학"이라는 단어가 언급된 최신 제출물을 검색하세요.
https://api.pushshift.io/reddit/search/submission/?q=science
그러면 제목이나 자체 텍스트에 과학이라는 단어가 포함된 가장 최근 제출물이 검색됩니다. 검색에서는 대소문자를 구분하지 않으므로 대문자 사용 여부에 관계없이 과학과 관련된 모든 항목을 찾습니다. API는 기본적으로 가장 최근에 제출된 항목을 먼저 정렬합니다. 이 검색을 실행하면 25개의 결과가 반환됩니다. 이는 검색의 기본 크기이며 크기 매개변수를 사용하여 변경할 수 있습니다. 이에 대해서는 매개변수 섹션에서 자세히 설명합니다. 데이터는 JSON 형식으로 반환되며 결과는 "data" 키에 포함됩니다.
제출물 검색을 수행할 때 사용할 수 있는 추가 매개변수가 많이 있습니다. 이제 각각을 살펴보고 각각에 대한 예를 들어보겠습니다.
매개변수 | 설명 | 기본 | 허용되는 값 |
---|---|---|---|
아이디 | ID를 통해 특정 제출물 받기 | 해당 없음 | 쉼표로 구분된 base36 ID |
큐 | 검색어. 가능한 모든 필드를 검색합니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
q:아니요 | 검색어를 제외합니다. 다음 용어는 제외됩니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
제목 | 제목 필드만 검색합니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
제목:아님 | 제목에서 검색어를 제외합니다. 다음 용어는 제외됩니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
자체 텍스트 | 자체 텍스트 필드만 검색합니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
자체 텍스트:아님 | 자체 텍스트에서 검색어를 제외합니다. 다음 용어는 제외됩니다. | 해당 없음 | 문자열/구문용 인용 문자열 |
크기 | 반환할 결과 수 | 25 | 정수 <= 500 |
전지 | 하나의 반환 특정 필드(쉼표로 구분) | 모든 분야 | 문자열 또는 쉼표로 구분된 문자열(여러 값 허용) |
종류 | 특정 순서로 결과 정렬 | "설명" | "오름차순", "내림차순" |
sort_type | 특정 속성으로 정렬 | "created_utc" | "점수", "num_comments", "created_utc" |
애그 | 반환 집계 요약 | 해당 없음 | ["작성자", "link_id", "created_utc", "subreddit"] |
작가 | 특정 작성자로 제한 | 해당 없음 | 문자열 또는 쉼표로 구분된 문자열(여러 값 허용) |
하위 레딧 | 특정 하위 레딧으로 제한 | 해당 없음 | 문자열 또는 쉼표로 구분된 문자열(여러 값 허용) |
~ 후에 | 이 날짜 이후의 결과 반환 | 해당 없음 | Epoch 값 또는 정수 + "s,m,h,d"(예: 30일 동안 30d) |
~ 전에 | 이 날짜 이전의 결과를 반환합니다. | 해당 없음 | Epoch 값 또는 정수 + "s,m,h,d"(예: 30일 동안 30d) |
점수 | 점수에 따라 결과 제한 | 해당 없음 | 정수 또는 > x 또는 < x(예: 점수=>100 또는 점수=<25) |
num_comments | 댓글 수에 따라 결과 제한 | 해당 없음 | 정수 또는 > x 또는 < x(예: num_comments=>100) |
18세 이상 | nsfw 또는 sfw 콘텐츠로 제한 | 둘 다 허용됨 | "참" 또는 "거짓" |
is_video | 비디오 콘텐츠로 제한 | 둘 다 허용됨 | "참" 또는 "거짓" |
잠긴 | 잠겼거나 잠금 해제된 스레드만 반환 | 둘 다 허용됨 | "참" 또는 "거짓" |
끈적끈적한 | 고정되거나 고정되지 않은 콘텐츠만 반환 | 둘 다 허용됨 | "참" 또는 "거짓" |
스포일러 | 스포일러만 제외 또는 포함 | 둘 다 허용됨 | "참" 또는 "거짓" |
콘테스트 모드 | 콘텐츠 모드 제출물 제외 또는 포함 | 둘 다 허용됨 | "참" 또는 "거짓" |
빈도 | Created_utc로 설정된 경우 aggs 매개변수와 함께 사용됩니다. | 해당 없음 | "초", "분", "시", "일" |
메타데이터 | 쿼리에 대한 메타데이터 표시 | 거짓 | ["참", "거짓"] |
이 호출은 Reddit의 API와 함께 사용할 때 매우 유용합니다. 수천 개의 댓글이 포함된 대규모 제출물이 있는 경우 제출물에 대한 모든 댓글 ID를 얻는 것이 어려운 경우가 많습니다. 이 호출은 제출 ID가 전달될 때 댓글 ID 배열을 반환합니다. 엔드포인트는 다음과 같습니다: https://api.pushshift.io/reddit/submission/comment_ids/{base36 submit id}
이 호출은 댓글 ID 배열이 포함된 데이터 키를 반환합니다. 그런 다음 이 API 또는 Reddit API에서 실제 댓글 정보를 검색할 수 있습니다. 제출물이 상당히 새로운 경우 Reddit API를 사용하여 댓글에 대한 최신 점수를 얻는 것이 좋습니다.
제출 객체에 대한 모든 댓글 ID 검색
https://api.pushshift.io/reddit/submission/comment_ids/6uey5x
엔드포인트 | 설명 | 상태 |
---|---|---|
/reddit/검색/댓글/ | Reddit 댓글 검색 | 활동적인 |
/reddit/검색/제출/ | Reddit 제출물 검색 | 활동적인 |
/reddit/submission/comment_ids/{base36-submission-id} | 제출 개체에 대한 댓글 ID 검색 | 활동적인 |
/reddit/analyze/user/{저자 이름} | Reddit 사용자의 활동 분석 | 개발 중 |
/reddit/term/빈도/{term} | 활동을 기반으로 용어 분석 | 개발 중 |
/레딧/검색/모두/ | 댓글과 제출물 모두 검색 | 개발 중 |
/reddit/트렌딩/사람들 | Reddit에서 누가 인기를 끌고 있는지 알아보세요 | 개발 중 |
/reddit/검색/링크 | Reddit에서 공유되는 관련 링크 찾기 | 개발 중 |