LLMの微調整および評価リポジトリへようこそ! ?ここでは、大規模な言語モデル(LLM)の微調整と評価のエキサイティングな世界を深く掘り下げ、 Flan-T5 、 Tinylama 、 Aguila7bなどのモデルを多様な自然言語処理(NLP)タスクに適応させる最先端の技術に焦点を当てています。 ?
LLMSが最新のAIアプリケーションの不可欠な部分になるにつれて、これらのモデルを効果的に微調整および評価する能力は、これまで以上に重要になりました。このリポジトリは、モデルのカスタマイズの複雑さをナビゲートするのに役立つように設計されており、モデルのパフォーマンス、正確性、倫理的責任を高めるための洞察と実用的なツールを提供します。
取り組んでいるかどうか:
このリポジトリは、プロジェクトを次のレベルに引き上げるためのリソースを提供します。
サイバーセキュリティと人工知能の専門家であるサンティアゴエルナンデスに心から感謝したいと思います。ウデミーで入手可能なディープラーニングとAI生成に関する彼の信じられないほどのコースは、このプロジェクトの開発を形作るのに役立ちました。
このプロジェクトに関する包括的な情報については、この中程度の記事をご覧ください。
開始するには、モデルの微調整と評価に関するステップバイステップガイドのノートブックをご覧ください。
Instruction_Fine_Tuning_LLM_T5.ipynb
:スペイン語の要約のための微調整flan-t5に関する詳細な指示。Evaluation_and_Analysis_T5_Familiy_LLMs.ipynb
:さまざまなT5モデルの評価と分析に関する洞察。 ?Parameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
:法的文書の作成などの特殊なタスクについては、Qloraで微調整することについて学びます。 ⚖⚖️TinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
:PPOとRLHFを使用してTinyllamaの微調整プロセスを探索して、有害または攻撃的な言語を避けます。 ?§Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
:Aguila7bおよびLatxaプロジェクトを含むIleniaフレームワークでの微調整モデルの評価。 この新しい研究では、主な目標は、近位政策最適化(PPO)手法を使用して、人間のフィードバック(RLHF)からの強化学習を組み合わせたTinyllamaを微調整することでした。目的は、意味のあるコンテンツ生成を維持しながら、有害、攻撃的、または有毒な言語の生成を避けるモデルの能力を改良することです。
研究のハイライト:
方法論と結果を包括的に理解するには、ノートブック: TinyLLAMA_PPO_RLHF_Avoiding_Offensive_Language.ipynb
を参照してください。
イレニアプロジェクトは、スペインの経済回復と変革のための戦略的プロジェクト(Perte)の一部であり、新しい言語経済(NEL)の多言語リソースの開発に焦点を当てています。このイニシアチブは、AI、翻訳、教育などの分野での経済成長と国際的な競争力を促進するためのスペイン語およびその他の公用語の使用をサポートしています。
この取り組みの一環として、テキストおよび音声処理タスク向けに設計されたAguila7BおよびLatxaプロジェクトのLLMSを評価します。これらの評価は、モデルのパフォーマンスに焦点を当てており、特に多言語と横断的な文脈において、社会的および技術的ニーズに合わせて保証します。
重要な側面:
詳細な分析については、ノートブック: Evaluation_of_Fine_Tuned_Large_Language_Models_for_ILENIA.ipynb
を参照してください。
自然言語処理の急速に進化する世界では、事前に訓練された言語モデルを活用することは、さまざまなタスクのパフォーマンスを改善するために重要になっています。 ?これらの中で、モデルのT5ファミリは、さまざまな言語タスクの処理における汎用性と有効性で際立っています。この研究では、事前に訓練されたT5モデルの評価と分析を掘り下げて、これらのモデルを微調整するために迅速なエンジニアリングと少ないショットの例をどのように使用できるかに焦点を当てています。 ?
T5ベース、T5-Large、Flan-T5などのモデルを含むT5ファミリーは、テキスト生成、質問回答、翻訳に印象的な能力を示しています。しかし、最適化の余地は常にあります。迅速なエンジニアリングを使用してこれらのモデルを微調整します - 入力プロンプトの設計と構造化は、少数のショット学習を使用して、広範な再訓練なしにパフォーマンスを向上させる強力な方法を提供します。
この作業では、さまざまなT5モデルを徹底的に評価し、さまざまな迅速なエンジニアリング技術と少数のショット学習セットアップがパフォーマンスにどのように影響するかを調査します。私たちの目標は、現実世界のアプリケーションで優れているために、事前に訓練されたモデルを微調整するためのベストプラクティスを明らかにすることです。さまざまな迅速な条件下で各モデルの強度と制限を分析することにより、この研究は、多様なNLPタスクのT5ベースのLLMを最適化するための貴重な洞察を提供することを目的としています。 ?
評価プロセスと調査結果の詳細なウォークスルーについては、Notebook: Evaluation_and_Analysis_T5_Family_LLMs.ipynb
を参照してください。
スペインの新聞記事を要約するためのFlan-T5-Small言語モデルの強化に関するこのプロジェクトへようこそ! ?このガイドでは、Flan-T5-Smallモデルを微調整する命令に焦点を当て、スペイン語でニュースコンテンツの簡潔で正確な要約を生成する能力を向上させます。
Notebook Instruction_Fine_Tuning_LLM_T5.ipynb
は、プロセス全体の詳細なウォークスルーを提供します。カバー:
ノートブックの指示に従うことで、この強力な事前訓練を受けたモデルをスペイン語のテキストの要約を効果的に処理し、ニュース記事の明確で一貫した要約を提供できるようにする方法を学びます。 ?§
包括的なガイドについては、ノートブックInstruction_Fine_Tuning_LLM_T5.ipynb
を参照してください。探索と微調整をお楽しみください! ?
このセクションでは、法的文脈で言語モデルを強化するためにQloraを使用して、パラメーター効率的な微調整(PEFT)の概念を紹介します。 Qlora (量子化された低ランク適応)は、パラメーターが少ない大規模な言語モデルを効率的に微調整して、計算要件とメモリ要件の両方を削減するように設計されています。
ノートブックParameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
の詳細:
このアプローチにより、言語モデルを法的文書の起草などの専門的なタスクに効率的に適応させることができ、リソースの使用を効果的に管理しながら高性能を確保できます。
Qlora微調整に関する包括的なガイドについては、ノートブックParameter_Efficient_Fine_Tuning_QLoRA_Legal_Assistance.ipynb
を参照してください。法的申請のための効率的な微調整技術の可能性を探りましょう! ?
LLMSのエキサイティングな分野に自由に探索し、実験し、貢献してください。あなたのフィードバックと貢献はいつでも大歓迎です! ??
幸せな微調整と評価!
サイバーセキュリティと人工知能の専門家であるサンティアゴエルナンデスに心から感謝したいと思います。 Udemyで入手可能な深い学習と生成AIに関する彼の信じられないほどのコースは、このプロジェクトの開発を形作るのに役立ちました。
このプロジェクトへの貢献は強くお勧めします!新機能の追加、バグの解決、プロジェクトの機能の強化に興味がある場合は、お気軽にプルリクエストを送信してください。
このプロジェクトは、SergioSánchezSánchez (Dream Software)によって開発および維持されています。オープンソースコミュニティと、このプロジェクトを可能にした貢献者に感謝します。ご質問、フィードバック、または提案がある場合は、[email protected]でお気軽にご連絡ください。
このプロジェクトは、開発者がソフトウェアを自由に使用、コピー、変更、および配布できるオープンソースソフトウェアライセンスであるMITライセンスの下でライセンスされています。これには、個人および商業プロジェクトの両方での使用が含まれ、唯一の要件は、元の著作権通知が保持されることです。 ?
次の制限に注意してください。
このライセンスの目標は、元のクリエイターの認識を維持しながら、開発者の自由を最大化することです。
MIT License
Copyright (c) 2024 Dream software - Sergio Sánchez
Permission is hereby granted, free of charge, to any person obtaining a copy
of this software and associated documentation files (the "Software"), to deal
in the Software without restriction, including without limitation the rights
to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
copies of the Software, and to permit persons to whom the Software is
furnished to do so, subject to the following conditions:
The above copyright notice and this permission notice shall be included in all
copies or substantial portions of the Software.
THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
SOFTWARE.