Die pushshift.io Reddit-API wurde vom /r/datasets-Mod-Team entworfen und erstellt, um erweiterte Funktionen und Suchfunktionen für die Suche nach Reddit-Kommentaren und -Einsendungen bereitzustellen. Der Projektleiter /u/stuck_in_the_matrix ist der Betreuer der Reddit-Kommentar- und Einreichungsarchive unter https://files.pushshift.io.
Diese RESTful-API bietet die volle Funktionalität für die Suche nach Reddit-Daten und umfasst auch die Möglichkeit, leistungsstarke Datenaggregationen zu erstellen. Mit dieser API finden Sie schnell die Daten, die Sie interessieren, und finden faszinierende Zusammenhänge.
Es gibt im Wesentlichen zwei Möglichkeiten, auf die Reddit-Kommentar- und Einreichungsdatenbank zuzugreifen. Zum einen durch die direkte Nutzung der API über https://api.pushshift.io/ und zum anderen durch den Zugriff auf die Back-End-Suchmaschine Elasticsearch über https://elastic.pushshift.io/. In diesem Dokument werden beide Ansätze erläutert und gegeben Beispiele für die effektive Nutzung der API. In diesem Dokument wird auch die Verwendung der API-Parameter untersucht, um gezieltere Suchvorgänge durchzuführen.
Es gibt zwei Hauptendpunkte, mit denen alle öffentlich verfügbaren Kommentare und Einsendungen auf Reddit durchsucht werden:
Im nächsten Abschnitt werden wir untersuchen, wie Sie mithilfe des Endpunkts für die Kommentarsuche effektivere Suchvorgänge durchführen können.
Um nach Kommentaren zu suchen, verwenden Sie den Endpunkt https://api.pushshift.io/reddit/search/comment/. Beginnen wir mit ein paar Beispielen und gehen wir dann die verschiedenen Parameter durch, die bei der Verwendung dieses Endpunkts verfügbar sind. Eine der einfachsten Suchvorgänge besteht darin, nur den q-Parameter zu verwenden. Der q-Parameter wird verwendet, um nach einem bestimmten Wort oder einer bestimmten Phrase zu suchen. Hier ist ein Beispiel:
Suchen Sie nach den neuesten Kommentaren, in denen das Wort „Wissenschaft“ erwähnt wird.
https://api.pushshift.io/reddit/search/comment/?q=science
Dadurch werden die neuesten Kommentare mit dem Begriff „Wissenschaft“ im Kommentartext durchsucht. Bei dieser Suche wird die Groß-/Kleinschreibung nicht beachtet, daher wird jedes Vorkommen des Begriffs „Wissenschaft“ unabhängig von der Groß-/Kleinschreibung gefunden. Die API sortiert standardmäßig zuerst nach kürzlich abgegebenen Kommentaren. Nach Durchführung dieser Suche werden 25 Ergebnisse zurückgegeben. Dies ist die Standardgröße für Suchvorgänge und kann mithilfe des Größenparameters angepasst werden. Dies wird im Abschnitt „Parameter“ ausführlicher besprochen. Die Daten werden im JSON-Format zurückgegeben und die tatsächlichen Suchergebnisse sind im Schlüssel „data“ enthalten. Es gibt auch einen „Metadaten“-Schlüssel, der zusätzliche Informationen über die Suche liefert, einschließlich der Gesamtzahl der gefundenen Ergebnisse, der Verarbeitungsdauer der Suche usw. Wenn Aggregationen angefordert werden, werden alle Aggregationsdaten unter dem aggs-Schlüssel zurückgegeben.
Es gibt zahlreiche zusätzliche Parameter, die bei der Kommentarsuche verwendet werden können. Lassen Sie uns sie durchgehen und jeweils Beispiele liefern.
Parameter | Beschreibung | Standard | Akzeptierte Werte |
---|---|---|---|
Q | Suchbegriff. | N / A | String/String in Anführungszeichen für Phrasen |
Ausweise | Erhalten Sie spezifische Kommentare über ihre IDs | N / A | Durch Kommas getrennte Base36-IDs |
Größe | Anzahl der zurückzugebenden Ergebnisse | 25 | Ganzzahl <= 500 |
Felder | Eine gibt bestimmte Felder zurück (durch Kommas getrennt) | Alle Felder zurückgegeben | Zeichenfolge oder durch Kommas getrennte Zeichenfolge |
Sortieren | Sortieren Sie die Ergebnisse in einer bestimmten Reihenfolge | „absteigend“ | „aufsteigend“, „absteigend“ |
sort_type | Sortieren Sie nach einem bestimmten Attribut | „created_utc“ | „score“, „num_comments“, „created_utc“ |
aggs | Zusammenfassung der Rückgabeaggregation | N / A | ["author", "link_id", "created_utc", "subreddit"] |
Autor | Auf einen bestimmten Autor beschränken | N / A | Zeichenfolge |
Subreddit | Auf einen bestimmten Subreddit beschränken | N / A | Zeichenfolge |
nach | Ergebnisse nach diesem Datum zurückgeben | N / A | Epochenwert oder Ganzzahl + „s,m,h,d“ (z. B. 30d für 30 Tage) |
vor | Geben Sie Ergebnisse vor diesem Datum zurück | N / A | Epochenwert oder Ganzzahl + „s,m,h,d“ (z. B. 30d für 30 Tage) |
Frequenz | Wird mit dem aggs-Parameter verwendet, wenn er auf „created_utc“ eingestellt ist | N / A | „Sekunde“, „Minute“, „Stunde“, „Tag“ |
Metadaten | Metadaten zur Abfrage anzeigen | FALSCH | „wahr“, „falsch“ |
Sie können Kommentare direkt mithilfe des Parameters ids abrufen. Um eine Reihe von Kommentaren anhand ihrer ID abzurufen, verwenden Sie das folgende Beispiel:
Rufen Sie drei Kommentare mit ihren Basis-36-ID-Werten ab
https://api.pushshift.io/reddit/comment/search?ids=dlrezc8,dlrawgw,dlrhbkq
Es gibt eine ganze Reihe von Parametern, die überprüft werden müssen. Beginnen wir also mit der Bereitstellung einiger komplexerer Beispiele und der Verwendung der oben genannten Parameter. Fahren wir mit dem vorherigen Beispiel oben fort und erweitern unsere Stichwortsuche „Wissenschaft“. Was wäre, wenn wir nach dem Begriff „Wissenschaft“ suchen, ihn aber auf einen bestimmten Subreddit beschränken wollten? Durch die Verwendung des Subreddit-Parameters können wir Folgendes tun:
Suchen Sie im Subreddit /r/askscience nach den neuesten Kommentaren, in denen das Wort „Wissenschaft“ erwähnt wird
https://api.pushshift.io/reddit/search/comment/?q=science&subreddit=askscience
Dadurch werden 25 Kommentare zurückgegeben, die den Begriff „Wissenschaft“ enthalten, jedoch nur aus dem Subreddit /r/askscience. Da wir nicht nach einer bestimmten Sortiermethode gefragt haben, werden die neuesten Kommentare zurückgegeben (der Sortierparameter ist standardmäßig „desc“). Was wäre, wenn wir den ersten Kommentar überhaupt an /r/askscience wünschen würden, in dem das Wort „Wissenschaft“ erwähnt wird? Wir könnten die Sortier- und Größenparameter verwenden, um damit umzugehen.
Suchen Sie im Subreddit /r/askscience nach den neuesten Kommentaren, in denen das Wort „Wissenschaft“ erwähnt wird
https://api.pushshift.io/reddit/search/comment/?q=science&subreddit=askscience&sort=asc&size=1
Das ist das Ergebnis:
{
"data": [
{
"author": "MockDeath",
"author_flair_css_class": null,
"author_flair_text": null,
"body": "Knowing more would definitely help. I guess all you can do is find out if they know the basics like you said then take it from there. That COu00b2 has the carbon turned to the isotope carbon14 in the upper atmosphere by cosmic radiation. This causes a specific percentage of carbon in the atmosphere to be carbon14.nnNow we are carbon based life forms and we have to get the carbon we are built out of from some where. We get it from eating plants, and the plants get it from absorbing COu00b2 from the air. So so long as we are alive, we uptake new carbon14. So this gives you a pretty good base line for dating.nnNow to fight arguments against carbon dating you could use the example of how we can see proton collisions in the LHC for sensitivity of our equipment. Nuclear decay is very accurate in how fast it happens, this is why atomic clocks work to a much higher degree of accuracy than other methods of time keeping. Also, you might want to make a general appeal for science. Science works, that is why we have TV's, robots, particle accelerators, satellites, computers, MRI and CAT scanners, nuclear power, etc etc. Scientists are not just willy nilly making shit up, or these kinds of things wouldn't work.",
"created_utc": 1270637661,
"id": "c0nn9iq",
"link_id": "t3_bne3u",
"parent_id": "t1_c0nn5ux",
"score": 2,
"subreddit": "askscience",
"subreddit_id": "t5_2qm4e"
}
],
"metadata": {
"execution_time_milliseconds": 30.52,
"results_returned": 1,
"shards": {
"failed": 0,
"successful": 36,
"total": 36
},
"size": 1,
"sort": "asc",
"sort_type": "created_utc",
"timed_out": false,
"total_results": 134785,
"version": "v3.0"
}
}
Aus dem zurückgegebenen Ergebnis können wir ersehen, dass der erste jemals an /r/askscience abgegebene Kommentar mit der Erwähnung von „Wissenschaft“ am Epochendatum 1270637661 erfolgte, was übersetzt Mittwoch, 7. April 2010, 10:54:21 Uhr (GMT) bedeutet. Lassen Sie uns kurz die Metadatenteile durchgehen. Wir können sehen, dass die Ausführungszeit für diese Suche etwa 30 Millisekunden betrug. Insgesamt wurden 36 Shards durchsucht und alle waren erfolgreich. Bei der Suche kam es nicht zu einer Zeitüberschreitung (timed_out-Parameter), was gut ist. Dies ist ein Attribut, das Sie möglicherweise überprüfen sollten, wenn Sie die API programmgesteuert verwenden, da es bei einigen komplizierteren Suchvorgängen manchmal zu Zeitüberschreitungen kommen kann. Der total_results-Wert beträgt 134.785. Dies gibt uns die Gesamtzahl der Kommentare in /r/askscience an, in denen das Wort Wissenschaft erwähnt wird. Da wir die Vorher- oder Nachher-Parameter nicht verwendet haben, stellt diese Zahl die Gesamtheit der an /r/askscience abgegebenen Kommentare dar.
Fahren wir fort, indem wir zusätzliche Parameter verwenden, um die Leistungsfähigkeit der Such-API hervorzuheben. Mit den Vorher- und Nachher-Parametern können Sie den Zeitrahmen für die Suche einschränken, indem Sie für beide einen Epochenzeitstempel angeben. Allerdings versteht die API auch eher menschenähnliche Werte für die Vorher- und Nachher-Parameter. Sie können auch eine Zahl gefolgt von den Zeichen s,m,h,d (die für Sekunde, Minute, Stunde und Tag stehen) verwenden, um den Zeitrahmen einzuschränken. Lassen Sie uns einige Beispiele durchgehen.
Wenn Sie im Subreddit /r/askhistorians nach „Rome“ suchen, diese aber nur auf die letzten 30 Tage beschränken möchten, können Sie den After-Parameter mit dem Wert 30d (30 Tage) verwenden.
Durchsuchen Sie den Subreddit /r/askhistorians nach Kommentaren, in denen Rom in den letzten 30 Tagen erwähnt wurde
https://api.pushshift.io/reddit/search/comment/?q=rome&subreddit=askhistorians&after=30d
Was wäre, wenn es vor drei Tagen eine aktuelle Nachricht gab, wir das Suchfenster jedoch auf den Zeitraum vor 4 Tagen und vor 2 Tagen beschränken wollten? Wir könnten dazu sowohl den Vorher- als auch den Nachher-Parameter verwenden. Im nächsten Beispiel suchen wir nach Kommentaren, in denen Trump erwähnt wird und die vor 4 bis 2 Tagen verfasst wurden, und sortieren sie nach aufsteigender Reihenfolge.
Durchsuchen Sie alle Subreddits nach dem Begriff „Trump“ und geben Sie Kommentare zurück, die vor 2 bis 4 Tagen abgegeben wurden
https://api.pushshift.io/reddit/search/comment/?q=trump&after=4d&before=2d&sort=asc
Angenommen, Sie möchten nach den letzten 150 Kommentaren suchen, benötigen aber für jeden Kommentar nur die Rückgabe der Felder „Autor“ und „Text“. Mit dem Parameter „Felder“ können Sie der API mitteilen, welche Informationen Sie filtern möchten. Dies dient in erster Linie dazu, die Bandbreite zu reduzieren, wenn Sie viele Anfragen stellen und nur bestimmte Felder zurückgeben müssen.
Hier ist ein Beispiel, bei dem der Parameter „Felder“ verwendet wird, um nach den letzten 150 Kommentaren zu suchen, in denen „Regierung“ erwähnt wird und nur die Felder „Autor“ und „Text“ zurückgegeben werden:
Durchsuchen Sie alle Subreddits nach dem Begriff „Regierung“ und geben Sie Kommentare nur mit den Schlüsseln „Text“ und „Autor“ zurück
https://api.pushshift.io/reddit/search/comment/?q=regierung&size=150&fields=body,autor
Anhand eines der obigen Beispiele, bei dem nach dem ersten Vorkommen des Wortes „Wissenschaft“ im Subreddit /r/askscience gesucht wurde, sahen wir, dass der Autor des Kommentars „MockDeath“ war. Was wäre, wenn wir die ersten 100 Kommentare von „MockDeath“ auf Reddit erhalten wollten? Wir können den Autor-Parameter zusammen mit den Sortier- und Größenparametern verwenden.
Durchsuchen Sie alle Subreddits und erhalten Sie die ersten 100 Kommentare, die jemals vom Benutzer /u/MockDeath abgegeben wurden
https://api.pushshift.io/reddit/search/comment/?author=MockDeath&sort=asc&size=100
Aggregationen sind eine leistungsstarke Methode, um zusammenfassende Daten für eine Suche bereitzustellen. Mithilfe des aggs-Parameters können wir schnell Facetten um bestimmte Parameter erstellen und sehen, wie sich Daten im Laufe der Zeit ändern. Der aggs-Parameter für Kommentarsuchen akzeptiert die folgenden Werte: author, subreddit, reated_utc und link_id. Mit diesem Parameter können wir viele sehr coole Dinge tun, also schauen wir uns einige Beispiele an.
Nehmen wir an, wir möchten die Häufigkeit der Verwendung des Begriffs „Trump“ im Laufe der Zeit sehen. Wir würden gerne sehen, wie viele Kommentare pro Stunde in den letzten 7 Tagen für diesen Begriff gepostet wurden. Mithilfe von Aggregationen und dem Parameter aggs können wir diese Daten schnell abrufen. Hier ist ein Beispiel mit diesen Kriterien:
Erstellen Sie eine Zeitaggregation mit dem Begriff Trump, um die Anzahl der Kommentare anzuzeigen, in denen Trump in den letzten sieben Tagen stündlich erwähnt wird
https://api.pushshift.io/reddit/search/comment/?q=trump&after=7d&aggs=created_utc&frequenz=hour&size=0
Wir haben den Frequency-Parameter zusammen mit dem Aggs-Parameter verwendet, um stündliche Buckets zu erstellen, um die Gesamtzahl der Kommentare zu Trump in den letzten 7 Tagen anzuzeigen. Der Größenparameter wurde auf 0 gesetzt, da wir nur daran interessiert sind, Aggregationsdaten und keine Kommentardaten zu erhalten. Die Aggregationsdaten werden in der Antwort unter dem Schlüssel aggs ->created_utc zurückgegeben. Hier ist ein Ausschnitt aus dem ersten Teil der Rücksendung:
{
"aggs": {
"created_utc": [
{
"doc_count": 685,
"key": 1502406000
},
{
"doc_count": 1238,
"key": 1502409600
},
{
"doc_count": 1100,
"key": 1502413200
},
Der doc_count-Wert ist die Gesamtzahl der Kommentare, die den Begriff „Trump“ enthalten. Der Schlüsselwert ist die Epochenzeit für diesen bestimmten Bucket. In diesem Beispiel hat der erste Bucket eine Epochenzeit von 1502406000, was Donnerstag, 10. August 2017, 23:00:00 Uhr entspricht. Dieser Schlüsselwert ist die Anfangszeit des Buckets. In diesem Beispiel enthalten also 685 Kommentare den Begriff „Trump“ zwischen Donnerstag, 10. August 2017, 23:00 Uhr und Donnerstag, 10. August 2017, 12:00 Uhr: 00 Uhr. Mit dem Frequenzparameter können Sie Buckets pro Sekunde, Minute, Stunde, Tag, Woche, Monat, Jahr erstellen. Mithilfe dieser Aggregation können Sie die Daten verwenden, um ein Diagramm (z. B. Highcharts) zu erstellen und die Aktivität von Kommentaren für bestimmte Begriffe, Autoren, Subreddits usw. grafisch darzustellen. Dies ist ein äußerst leistungsstarkes Datenanalysetool.
Was wäre, wenn Sie nicht nur die Häufigkeit bestimmter Kommentarbegriffe im Zeitverlauf ermitteln möchten, sondern auch sehen möchten, welche Subreddits für einen bestimmten Begriff in diesem Zeitraum am beliebtesten waren? Hier ist ein Beispiel für die Verwendung der aggs-Parameter, um zu zeigen, welche Subreddits für einen bestimmten Begriff die meiste Aktivität hatten.
Erstellen Sie eine Subreddit-Aggregation mit dem Begriff Trump, um die Top-Subreddits anzuzeigen, in denen Trump in den letzten 7 Tagen erwähnt wurde
https://api.pushshift.io/reddit/search/comment/?q=trump&after=7d&aggs=subreddit&size=0
Hier ist ein Ausschnitt des Ergebnisses:
{
"aggs": {
"subreddit": [
{
"bg_count": 66,
"doc_count": 44,
"key": "lovetrumpshaters",
"score": 0.6666666666666666
},
{
"bg_count": 20,
"doc_count": 9,
"key": "Denmark_Uncensored",
"score": 0.45
},
{
"bg_count": 51,
"doc_count": 16,
"key": "WhoRedditHatesNow",
"score": 0.3137254901960784
},
Die Subreddit-Aggregation gibt die Gesamtzahl der Kommentare in diesem Subreddit zurück, in denen der Suchbegriff erwähnt wird (doc_count), sowie die Gesamtzahl der Kommentare, die während dieses Zeitraums zu diesem Subreddit abgegeben wurden (bg_count). Dies zeigt Ihnen nicht nur, welche Subreddits Trump am häufigsten erwähnt haben, sondern liefert Ihnen auch normalisierte Ergebnisse, sodass Sie auch sehen können, wie viel Prozent der Kommentare dieses Subreddits den Suchbegriff enthielten. Würde man die Subreddits einfach danach ordnen, welche Subreddits den Suchbegriff „Trump“ am häufigsten erwähnten, würden die Ergebnisse auf die Subreddits verzerrt, die im Allgemeinen auch die meiste Aktivität aufweisen. Mit diesem Ansatz können Sie sowohl die Rohzahl als auch die normalisierten Daten sehen.
Die API ermöglicht auch Aggregationen auf link_id, was eine weitere sehr leistungsstarke Methode ist, um zu sehen, welche Einsendungen basierend auf einem bestimmten Suchbegriff am beliebtesten sind. Fahren wir mit den obigen Beispielen fort und geben wir ein Szenario an, in dem dies äußerst hilfreich wäre. In den letzten 24 Stunden sind zahlreiche große Geschichten über Donald Trump aufgetaucht. Sie möchten mithilfe der API anhand der Anzahl der Kommentare, in denen er in den Einsendungen erwähnt wird, sehen, welche Einsendungen einen Bezug zu Trump haben. Wir können erneut den Parameter aggs verwenden und ihn auf link_id setzen, um diese Informationen schnell zu erhalten. Fahren wir mit einem anderen Beispiel fort:
Zeigen Sie Beiträge der letzten 24 Stunden an, in denen Trump häufig in den Kommentaren erwähnt wird
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=link_id&size=0
Dadurch wird unter dem Schlüssel aggs -> link_id ein Array von Übermittlungsobjekten zurückgegeben. Der doc_count gibt die Gesamtzahl der Kommentare für jede Einreichung an, in denen der Suchbegriff („trump“) vorkommt, und der bg_count gibt die Gesamtzahl der Kommentare an, die zu dieser Einreichung abgegeben wurden. Dies ist eine großartige Möglichkeit, schnell Beiträge zu finden, die aufgrund eines bestimmten Suchbegriffs oder einer bestimmten Phrase „heiß“ sind.
Mit der API können Sie außerdem Aggregationen zu Autoren erstellen, sodass Sie schnell sehen können, welche Autoren die meisten Kommentare zu einem bestimmten Suchbegriff abgeben. Hier ist ein Beispiel für die Verwendung der Autorenaggregation:
Zeigt die Top-Autoren an, die in den letzten 24 Stunden den Begriff „Trump“ erwähnt haben
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=author&size=0
{
"aggs": {
"author": [
{
"doc_count": 605,
"key": "grrrrreat"
},
{
"doc_count": 329,
"key": "AutoModerator"
},
{
"doc_count": 168,
"key": "autotldr"
},
{
"doc_count": 73,
"key": "SnapshillBot"
},
Die Autorenaggregation zeigt Ihnen, welche Autoren die meisten Kommentare zu einem bestimmten Suchbegriff hinterlassen. Aus dem obigen Beispiel geht hervor, dass viele der Top-Autoren, die den Begriff „Trump“ erwähnen, tatsächlich Bots sind.
Mithilfe des aggs-Parameters können Sie mehrere Aggregationen kombinieren und viele Facettendaten für einen bestimmten Begriff abrufen. Anhand der obigen Beispiele können wir alle Anrufe in einem Anruf zusammenfassen und die Top-Einsendungen der letzten 24 Stunden, die Häufigkeit der Kommentare pro Stunde, in denen Trump erwähnt wird, die Top-Autoren, die über Trump posten, und die Top-Subreddits, zu denen Kommentare abgegeben wurden, anzeigen Erwähnung von Trump.
Zeigen Sie Aggregationen für Autoren, Einsendungen, Subreddits und Zeithäufigkeit für den Begriff „Trump“ in den letzten 24 Stunden an
https://api.pushshift.io/reddit/search/comment/?q=trump&after=24h&aggs=author,link_id,subreddit,created_utc&frequenz=hour&size=0
Um nach Einreichungen zu suchen, verwenden Sie den Endpunkt https://api.pushshift.io/reddit/search/submission/ Endpunkt. Beginnen wir mit ein paar Beispielen und gehen wir dann die verschiedenen Parameter durch, die bei der Verwendung dieses Endpunkts verfügbar sind. Bei einer einfachen Suche wird der q-Parameter verwendet, um nach einem bestimmten Wort oder einer bestimmten Phrase zu suchen. Hier ist ein Beispiel:
Suchen Sie nach den aktuellsten Beiträgen, in denen das Wort „Wissenschaft“ vorkommt.
https://api.pushshift.io/reddit/search/submission/?q=science
Dadurch wird nach den neuesten Beiträgen gesucht, deren Titel oder Selbsttext das Wort Wissenschaft enthält. Bei der Suche wird die Groß-/Kleinschreibung nicht beachtet, sodass jedes Vorkommen von „science“ unabhängig von der Groß-/Kleinschreibung gefunden wird. Die API sortiert standardmäßig zuerst nach den zuletzt erfolgten Übermittlungen. Nach Ausführung dieser Suche werden 25 Ergebnisse zurückgegeben. Dies ist die Standardgröße für Suchvorgänge und kann mithilfe des Größenparameters geändert werden. Dies wird im Abschnitt „Parameter“ ausführlicher besprochen. Die Daten werden im JSON-Format zurückgegeben und die Ergebnisse sind im Schlüssel „data“ enthalten.
Es gibt zahlreiche zusätzliche Parameter, die bei der Durchführung einer Einreichungssuche verwendet werden können. Lassen Sie uns nun jeden einzelnen durchgehen und Beispiele für jeden einzelnen bereitstellen.
Parameter | Beschreibung | Standard | Akzeptierte Werte |
---|---|---|---|
Ausweise | Erhalten Sie bestimmte Einsendungen über ihre IDs | N / A | Durch Kommas getrennte Base36-IDs |
Q | Suchbegriff. Durchsucht ALLE möglichen Felder | N / A | String/String in Anführungszeichen für Phrasen |
F: nicht | Suchbegriff ausschließen. Diese Bedingungen werden ausgeschlossen | N / A | String/String in Anführungszeichen für Phrasen |
Titel | Durchsucht nur das Titelfeld | N / A | String/String in Anführungszeichen für Phrasen |
Titel: nicht | Suchbegriff aus Titel ausschließen. Diese Bedingungen werden ausgeschlossen | N / A | String/String in Anführungszeichen für Phrasen |
Selbsttext | Durchsucht nur das Selbsttextfeld | N / A | String/String in Anführungszeichen für Phrasen |
Selbsttext: nicht | Suchbegriff aus Selbsttext ausschließen. Diese Bedingungen werden ausgeschlossen | N / A | String/String in Anführungszeichen für Phrasen |
Größe | Anzahl der zurückzugebenden Ergebnisse | 25 | Ganzzahl <= 500 |
Felder | Eine gibt bestimmte Felder zurück (durch Kommas getrennt) | Alle Felder | Zeichenfolge oder durch Kommas getrennte Zeichenfolge (Mehrere Werte zulässig) |
Sortieren | Sortieren Sie die Ergebnisse in einer bestimmten Reihenfolge | „absteigend“ | „aufsteigend“, „absteigend“ |
sort_type | Sortieren Sie nach einem bestimmten Attribut | „created_utc“ | „score“, „num_comments“, „created_utc“ |
aggs | Zusammenfassung der Rückgabeaggregation | N / A | ["author", "link_id", "created_utc", "subreddit"] |
Autor | Auf einen bestimmten Autor beschränken | N / A | Zeichenfolge oder durch Kommas getrennte Zeichenfolge (Mehrere Werte zulässig) |
Subreddit | Auf einen bestimmten Subreddit beschränken | N / A | Zeichenfolge oder durch Kommas getrennte Zeichenfolge (Mehrere Werte zulässig) |
nach | Ergebnisse nach diesem Datum zurückgeben | N / A | Epochenwert oder Ganzzahl + „s,m,h,d“ (z. B. 30 Tage für 30 Tage) |
vor | Geben Sie Ergebnisse vor diesem Datum zurück | N / A | Epochenwert oder Ganzzahl + „s,m,h,d“ (z. B. 30d für 30 Tage) |
Punktzahl | Beschränken Sie die Ergebnisse basierend auf der Punktzahl | N / A | Ganzzahl oder > x oder < x (z. B. Punktzahl=>100 oder Punktzahl=<25) |
Anzahl_Kommentare | Beschränken Sie die Ergebnisse basierend auf der Anzahl der Kommentare | N / A | Ganzzahl oder > x oder < x (z. B. num_comments=>100) |
über_18 | Auf NSFW- oder SFW-Inhalte beschränken | beides erlaubt | „wahr“ oder „falsch“ |
is_video | Auf Videoinhalte beschränken | beides erlaubt | „wahr“ oder „falsch“ |
gesperrt | Geben Sie nur gesperrte oder entsperrte Threads zurück | beides erlaubt | „wahr“ oder „falsch“ |
verklebt | Geben Sie nur fixierte oder nicht fixierte Inhalte zurück | beides erlaubt | „wahr“ oder „falsch“ |
Spoiler | Nur Spoiler ausschließen oder einschließen | beides erlaubt | „wahr“ oder „falsch“ |
Wettbewerbsmodus | Einsendungen im Inhaltsmodus ausschließen oder einschließen | beides erlaubt | „wahr“ oder „falsch“ |
Frequenz | Wird mit dem aggs-Parameter verwendet, wenn er auf „created_utc“ eingestellt ist | N / A | „Sekunde“, „Minute“, „Stunde“, „Tag“ |
Metadaten | Metadaten zur Abfrage anzeigen | FALSCH | [„wahr“, „falsch“] |
Dieser Aufruf ist sehr hilfreich, wenn er zusammen mit der Reddit-API verwendet wird. Bei großen Einsendungen mit Tausenden von Kommentaren ist es oft schwierig, alle Kommentar-IDs für eine Einsendung zu erhalten. Dieser Aufruf gibt ein Array von Kommentar-IDs zurück, wenn ihm eine Übermittlungs-ID übergeben wird. Der Endpunkt ist: https://api.pushshift.io/reddit/submission/comment_ids/{base36-Einreichungs-ID}
Dieser Aufruf gibt einen Datenschlüssel mit einem Array von Kommentar-IDs zurück. Anschließend können Sie die tatsächlichen Kommentarinformationen von dieser API oder der Reddit-API abrufen. Wenn die Einsendung relativ neu ist, ist es besser, die Reddit-API zu verwenden, um die aktuellste Bewertung für die Kommentare zu erhalten.
Rufen Sie alle Kommentar-IDs für ein Einreichungsobjekt ab
https://api.pushshift.io/reddit/submission/comment_ids/6uey5x
Endpunkt | Beschreibung | Status |
---|---|---|
/reddit/search/comment/ | Durchsuchen Sie Reddit-Kommentare | Aktiv |
/reddit/search/submission/ | Durchsuchen Sie Reddit-Einreichungen | Aktiv |
/reddit/submission/comment_ids/{base36-submission-id} | Kommentar-IDs für ein Einreichungsobjekt abrufen | Aktiv |
/reddit/analyze/user/{Autorenname} | Analysieren Sie die Aktivität eines Reddit-Benutzers | In Entwicklung |
/reddit/term/frequenz/{term} | Analysieren Sie einen Begriff anhand der Aktivität | In Entwicklung |
/reddit/search/all/ | Durchsuchen Sie sowohl Kommentare als auch Einsendungen | In Entwicklung |
/reddit/trending/people | Finden Sie heraus, wer auf Reddit im Trend liegt | In Entwicklung |
/reddit/search/links | Finden Sie relevante Links, die auf Reddit geteilt werden | In Entwicklung |