Téléchargement LORS - Téléchargement du code source LORS

LORS

Code Source AI

1.0.0

Télécharger

Système de raisonnement O1 local (LOR)

Abstrait

Le système de raisonnement O1 local (LOR) est un cadre de raisonnement distribué avancé qui met en œuvre une nouvelle approche pour une analyse rapide et une génération de réponse en utilisant des modèles locaux de grande langue (LLMS). Inspiré par l'architecture O1 d'OpenAI, LORS utilise un système multi-agents avec des capacités de mise à l'échelle dynamiques pour traiter les requêtes complexes à travers des pipelines de traitement parallèles de profondeurs de calcul variables.

Architecture du système

Composants de base

 LORS Architecture
├── Prompt Analysis Engine
│   ├── Complexity Analyzer
│   ├── Domain Classifier
│   └── Cognitive Load Estimator
├── Agent Management System
│   ├── Fast Reasoning Agents (llama3.2)
│   └── Deep Reasoning Agents (llama3.1)
├── Response Synthesis Pipeline
│   ├── Thought Aggregator
│   ├── Context Enhancer
│   └── Final Synthesizer
└── Response Management System
    ├── Intelligent Naming
    └── Structured Storage

Spécifications techniques

1. Moteur d'analyse rapide

Le système utilise un mécanisme d'analyse rapide sophistiqué qui évalue:

Métriques de complexité linguistique
- Profondeur de la structure des phrases (analyse de dépendance)
- Densité de terme technique
- Reconnaissance d'entité nommée
- Estimation de la charge cognitive

Analyse spécifique au domaine

 domain_complexity = {
    'technical' : [ algorithm , system , framework ],
    'scientific' : [ hypothesis , analysis , theory ],
    'mathematical' : [ equation , formula , calculation ],
    'business' : [ strategy , market , optimization ]
}

Algorithme de notation de la complexité

 C = Σ(wi * fi)
where:
C = total complexity score
wi = weight of feature i
fi = normalized value of feature i

2. Échelle d'agent dynamique

Le système implémente un mécanisme de mise à l'échelle adaptatif basé sur la complexité rapide:

Score de complexité	Agents rapides	Agents profonds	Cas d'utilisation
80-100	5	3	Analyse technique complexe
60-79	4	2	Complexité modérée
40-59	3	2	Analyse standard
0-39	2	1	Requêtes simples

3. Types d'agents et caractéristiques

Agents de raisonnement rapide (LLAMA3.2)

Optimisé pour l'analyse initiale rapide
Limite de jeton inférieure pour un traitement plus rapide
Concentrez-vous sur l'identification des concepts clés

Paramètres:

{
    'temperature' : 0.7 ,
    'max_tokens' : 150 ,
    'response_time_target' : '< 2s'
}

Agents de raisonnement profond (LLAMA3.1)

Conçu pour une analyse approfondie
Limite de jeton plus élevée pour les réponses complètes
Concentrez-vous sur les relations et les implications

Paramètres:

{
    'temperature' : 0.9 ,
    'max_tokens' : 500 ,
    'response_time_target' : '< 5s'
}

Détails de la mise en œuvre

1. Pipeline de traitement asynchrone

 async def process_prompt ( prompt ):
    complexity_analysis = analyze_prompt_complexity ( prompt )
    fast_thoughts = await process_fast_agents ( prompt )
    enhanced_context = synthesize_initial_thoughts ( fast_thoughts )
    deep_thoughts = await process_deep_agents ( enhanced_context )
    return synthesize_final_response ( fast_thoughts , deep_thoughts )

2. Implémentation de l'analyse de la complexité

Le système utilise une approche d'analyse des fonctionnalités pondérées:

 def calculate_complexity_score ( features ):
    weights = {
        'sentence_count' : 0.1 ,
        'avg_sentence_length' : 0.15 ,
        'subjectivity' : 0.1 ,
        'named_entities' : 0.15 ,
        'technical_term_count' : 0.2 ,
        'domain_complexity' : 0.1 ,
        'cognitive_complexity' : 0.1 ,
        'dependency_depth' : 0.1
    }
    return weighted_sum ( features , weights )

3. Synthèse de la réponse

Le système met en œuvre une approche de synthèse triphasée:

Agrégation d'analyse rapide
Amélioration du contexte
Intégration de l'analyse profonde

Caractéristiques de performance

Repères

Temps de réponse moyen: 2 à 8 secondes
Utilisation de la mémoire: 4-8 Go
Utilisation du GPU: 60-80%

Installation et utilisation

Condition préalable

pip install ollama asyncio rich textblob spacy nltk
python -m spacy download en_core_web_sm

Utilisation de base

python local-o1-reasoning.py -p " Your complex query here "

Stockage de réponse

Les réponses sont stockées au format JSON:

{
    "prompt" : " original_prompt " ,
    "timestamp" : " ISO-8601 timestamp " ,
    "complexity_analysis" : {
        "score" : 75.5 ,
        "features" : { ... }
    },
    "result" : {
        "fast_analysis" : [ ... ],
        "deep_analysis" : [ ... ],
        "final_synthesis" : " ... "
    }
}

Installation et utilisation

Condition préalable

Installer Olllama

 # For Linux
curl -L https://ollama.com/download/ollama-linux-amd64 -o ollama
chmod +x ollama
./ollama serve

# For Windows
# Download and install from https://ollama.com/download/windows

Installer les modèles requis

 # Install the fast reasoning model (3B Model - fast thought)
ollama pull llama3.2

# Install the deep reasoning model (8B Model - deep thought)
ollama pull llama3.1

# Verify installations
ollama list

Sortie attendue:

 NAME                    ID              SIZE      MODIFIED      
llama3.2:latest    6c2d00dcdb27    2.1 GB    4 seconds ago    
llama3.1:latest    3c46ab11d5ec    4.9 GB    6 days ago

Configurer un environnement Python

 # Create virtual environment
python -m venv lors-env

# Activate environment
# On Windows
lors-env S cripts a ctivate
# On Unix or MacOS
source lors-env/bin/activate

# Install requirements
pip install -r requirements.txt

# Install spaCy language model
python -m spacy download en_core_web_sm

Utilisation de base

 # Simple query
python local-o1-reasoning.py -p " Explain the concept of quantum entanglement "

# Complex analysis
python local-o1-reasoning.py -p " Analyze the implications of quantum computing on modern cryptography systems and propose potential mitigation strategies "

Dépannage

Problèmes de chargement du modèle

 # Verify model status
ollama list

# Restart Ollama service if needed
ollama stop
ollama serve

Problèmes de mémoire GPU
- Assurez-vous qu'aucune autre application à forte intensité de GPU ne s'exécute
- Surveiller l'utilisation du GPU:
```
nvidia-smi -l 1
```
Solutions d'erreur courantes
- Si les modèles ne parviennent pas à charger: ollama pull [model_name] --force
- Si la mémoire de Cuda: réduisez le nombre d'agents simultanés dans la configuration
- Si l'erreur du répertoire de réponse: cochez les autorisations d'écriture

Structure de répertoire

 LORS/
├── local-o1-reasoning.py
├── requirements.txt
├── responses/
│   └── [automated response files]
└── README.md

Licence

Licence MIT

Contributif

Nous accueillons les contributions! Veuillez consulter nos directives contributives pour plus d'informations.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-02-11
taille 7.56KB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout