Das Forschungsteam der chinesischen Universität Hongkong (Shenzhen) und das Shenzhen Big Data Research Institute hat kürzlich ein medizinisches großes Sprachmodell (LLM) mit dem Namen Huatuogpt-O1 gestartet. Ein wichtiger Schritt. Das Modell wurde für komplexe Argumentation im medizinischen Bereich entwickelt und zielt darauf ab, die Genauigkeit und Zuverlässigkeit der medizinischen Diagnose und Entscheidungsfindung zu verbessern. Im Gegensatz zu der LLM, die sich in der Vergangenheit auf mathematische Denken konzentrierte, konzentriert sich Huatuogpt-O1 auf den besonderen Bereich der medizinischen Versorgung und hat einen neuen Weg für die Entwicklung der medizinischen KI eröffnet, indem er den strengen Denken der Ärzte in der tatsächlichen Arbeit simuliert.
Die größte Herausforderung für das Forschungsteam im Entwicklungsprozess besteht darin, dass der Argumentationsprozess im medizinischen Bereich häufig keine klaren Schritte fehlt und schwer zu überprüfen ist. Um dieses Problem zu lösen, wählten sie 40.000 schwierige Fragen mit einzigartigen und objektiven korrekten Antworten aus der Frage der medizinischen Prüfung aus und verwandelten sie in offene Fragen, um eine überprüfbare Reihe von medizinischen Fragen zu erstellen. Diese Fragen erfordern nicht nur, dass das Modell eingehendes Denken durchführt, sondern auch die Richtigkeit des Inferenzprozesses durch die richtigen oder falschen Antworten überprüfen und so eine zuverlässige Datenunterstützung für das Modelltraining bietet.
Um die Argumentationsfähigkeit des Modells zu verbessern, nahm das Forschungsteam eine zweistufige Trainingsmethode ein. In der ersten Phase verwenden sie das Validator-Feedback (korrekt oder falsch), um das Modell für politischbasierte Suchvorgänge zu leiten und komplexe Inferenz-Trajektorien zu generieren. Das Modell initialisiert zunächst eine Denkkette (COT). Diese erfolgreichen Argumentationsbahnen werden dann verwendet, um die LLM zu fannen, um ihm die komplexe Argumentationsfähigkeit der iterativen Reflexion zu verleihen. In der zweiten Phase verwendete das Forschungsteam die vom Validator bereitgestellten spärlichen Belohnungen, um die komplexen Argumentationsfunktionen des Modells durch RL -Algorithmen (Verstärkungslernen) weiter zu verbessern.
Die experimentellen Ergebnisse zeigen, dass diese zweistufige Trainingsmethode signifikante Ergebnisse erzielt hat. Unter Verwendung von nur 40.000 nachprüfbaren Fragen erreichte ein Modell mit 8 Milliarden Parametern einen Anstieg der medizinischen Benchmarks um 8,5 Punkte. Ein 70-Milliarden-Parametermodell übertrifft auch andere allgemeine und medizinisch-spezifische Open-Source-LLMs in mehreren medizinischen Benchmarks. Diese Ergebnisse bestätigen nicht nur die Wirksamkeit des komplexen Denkens bei der Lösung medizinischer Probleme, sondern zeigen auch die signifikante Rolle des Verstärkungslernens bei der Verbesserung der Modellleistung.
Huatuogpt-O1 ist insofern innovativ, als es zum ersten Mal überprüfbare medizinische Probleme und medizinische Validatoren verwendet, um die medizinischen Komplex-Argumentationsfunktionen von LLM zu verbessern. Mit diesem Ansatz kann das Modell tief wie ein Arzt denken und Selbstprüfungen und Korrekturen durchführen, bevor sie eine Antwort geben. Dies verbessert nicht nur das Anwendungspotential des Modells im medizinischen Bereich, sondern liefert auch Referenz für die Verbesserung der Argumentationsfähigkeit in anderen professionellen Bereichen.
Um die Zuverlässigkeit des Modells weiter zu überprüfen, verwendeten die Forscher GPT-4O als Validator, und die Ergebnisse zeigten, dass ihre Genauigkeitsrate in der ersten Phase 96,5% und in der zweiten Phase 94,5% erreichte. Gleichzeitig bestätigten sie auch, dass LLM-basierte Validatoren zuverlässiger sind als herkömmliche präzise Matching-Methoden. Darüber hinaus wendeten die Forscher die Methode auf das chinesische medizinische Bereich an und erzielten auch bemerkenswerte Ergebnisse, was die Anpassungsfähigkeit der Methode in verschiedenen Bereichen und Sprachumgebungen demonstrierte.
Insgesamt ist das Auftreten von Huatuogpt-O1 erhebliche Fortschritte bei der medizinischen KI im komplexen Denken. Es bietet nicht nur zuverlässigere Instrumente für die medizinische Diagnose und Entscheidungsfindung, sondern bietet auch neue Ideen für die zukünftige Anwendung von KI in anderen professionellen Bereichen. Obwohl sich das Modell noch in der Forschungsphase befindet und nicht direkt auf die klinische Praxis angewendet werden kann, hat sein großes Potenzial weit verbreitet und wird erwartet, dass sie in Zukunft eine größere Rolle im medizinischen Bereich spielen.
Papieradresse: https://arxiv.org/pdf/2412.18925