Download git filter repo - Download do código -fonte git filter repo

git filter repo

Outro código-fonte

v2.45.0

Baixar

O GIT Filter-Repo é uma ferramenta versátil para reescrever o histórico, que inclui recursos que não encontrei em nenhum outro lugar. Ele se enquadra aproximadamente no mesmo espaço de ferramenta que o Git Filtro Chranch, mas sem o mau desempenho indutor de capitulação, com muito mais recursos e com um design que escala em termos de usabilidade além dos casos de reescrita trivial. O filtro Git-Repo agora é recomendado pelo projeto Git, em vez de git filtro rale.

Embora a maioria dos usuários provavelmente use apenas o filtro-repo como uma ferramenta simples de linha de comando (e provavelmente use apenas alguns de seus sinalizadores), em seu principal filtro-repo contém uma biblioteca para criar ferramentas de reescrita de histórico. Como tal, os usuários com necessidades especializadas podem aproveitá -lo para criar rapidamente ferramentas de reescrita de histórico totalmente novas.

Índice

Pré -requisitos
Como faço para instalá -lo?
Como eu uso isso?
Por que filtrar-se-repo em vez de outras alternativas?
- Filtro de filtro
- Limpador de repositório BFG
Exemplo simples, com comparações
- Resolvendo isso com Filtro-Repo
- Resolvendo isso com o limpador de repositório BFG
- Resolvendo isso com ramo de filtro
- Resolvendo isso com exportação rápida/rápido
Projeto Racionalidade por trás do Filtro-Repo
Como faço para contribuir?
Existe um código de conduta?
Melhorias a montante

Pré -requisitos

Filter-repo requer:

git> = 2.22.0 no mínimo; Alguns recursos requerem git> = 2,24.0 ou posterior
python3> = 3.6

Como faço para instalá -lo?

git-filter-repo é um script python de arquivo único, que foi feito para fazer a instalação para uso básico em muitos sistemas triviais: basta colocar esse arquivo no seu $ PATH.

Consulte Install.md para coisas além do uso básico ou de casos especiais. As instruções mais envolvidas são necessárias apenas se um dos seguintes se aplicar:

Você não encontra o comentário acima sobre a instalação trivial intuitivamente óbvia
Você está trabalhando com um executável do Python3 chamado algo diferente de "Python3"
Você deseja instalar a documentação (além dos documentos embutidos mostrados com -h)
você quer executar alguns dos exemplos contribuintes
Você deseja criar seus próprios scripts de filtragem Python usando filtro-repo como módulo/biblioteca

Como eu uso isso?

Para documentação abrangente:

Veja o manual do usuário
A formação alternativa do manual do usuário está disponível em vários sites externos (exemplo), para aqueles que não gostam do layout htmlpreview.github.io, embora só possa estar atualizado na versão mais recente

Se você preferir aprender com exemplos:

Há uma folha de dicas para converter comandos de filtro, que cobre todos os exemplos do manual do ramo de filtro
Há uma folha de dicas para converter comandos de limpeza do BFG Repo, que abrange todos os exemplos do site do BFG
O exemplo simples abaixo pode ser de interesse
O manual do usuário tem uma extensa seção de exemplos

Por que filtrar-se-repo em vez de outras alternativas?

Isso foi abordado com mais detalhes em um artigo do Git Rev News sobre Filter-Repo, mas alguns destaques para os principais concorrentes:

Filtro de filtro

O Filtro-Branch é extremamente indiscutivelmente lento (múltiplas ordens de magnitude mais lentamente do que deveria) para repositórios não triviais.
O Filter-Cranch está repleto de gotas que podem corromper silenciosamente sua reescrita ou pelo menos frustrar seus esforços de "limpeza", dando a você algo mais problemático e confuso do que o que você começou.
O filtro é muito oneroso de usar para qualquer reescrita que seja um pouco não trivial.
O projeto Git afirmou que os problemas acima com o ramo de filtro não podem ser fixos compatíveis com compactação; Eles recomendam que você pare de usar o ramo de filtro
Os fãs obstinados do Filtro-Branch podem estar interessados em filtrar-lamely (também conhecida como ramo de filtro), uma reimplementação de ramo de filtro baseada em filtro-repO, que é mais executiva (embora não tão rápido ou seguro quanto o filtro- repo).
Uma folha de dicas está disponível mostrando como converter comandos de exemplo do manual do filtro-ramo em comandos filtro-repo.

Limpador de repositório BFG

Ótima ferramenta para o seu tempo, mas, embora simplifique algumas coisas, é limitada a alguns tipos de reescritas.
Sua arquitetura não é passível de lidar com mais tipos de reescritas.
Sua arquitetura apresenta algumas deficiências e insetos, mesmo para a base de US $ pretendida.
Os fãs do BFG podem estar interessados no BFG-ISH, uma reimplementação de BFG com base no Filtro-Repo, que inclui vários novos recursos e bugs em relação ao BFG.
Uma folha de dicas está disponível mostrando como converter comandos de exemplo do manual do limpador de repositório BFG em comandos filtro-repo.

Exemplo simples, com comparações

Digamos que queremos extrair um pedaço de repositório, com a intenção de fundir exatamente essa peça em outro repositório maior. Para extração, queremos:

Extraia a história de um único diretório, src/. Isso significa que apenas os caminhos sob SRC/ permanecem no repositório, e quaisquer começos que apenas tocaram os caminhos fora deste diretório serão removidos.
Renomeie todos os arquivos para ter um novo diretório líder, My-Module/(por exemplo, para que Src/Foo.c se torne My-Module/src/foo.c)
Renomeie quaisquer tags no repositório extraído para ter um prefixo 'My-Module-' (para evitar conflitos quando mais tarde mesclamos esse repositório em outra coisa)

Resolvendo isso com Filtro-Repo

Fazer isso com o filtro-repo é tão simples quanto o seguinte comando:

  git filter-repo --path src/ --to-subdirectory-filter my-module --tag-rename ' ' : ' my-module- '

(As citações únicas são desnecessárias, mas tornam mais claro para um humano que estamos substituindo a corda vazia como um prefixo por my-module- )

Resolvendo isso com o limpador de repositório BFG

O limpador de repositório do BFG não é capaz desse tipo de reescrita; De fato, todos os três tipos de alterações desejadas estão fora de suas capacidades.

Resolvendo isso com ramo de filtro

O Filtro-Branch vem com uma pilha de advertências (mais sobre isso abaixo), mesmo depois de descobrir as invocação (s) necessária (s):

  git filter-branch 
      --tree-filter ' mkdir -p my-module && 
                     git ls-files 
                         | grep -v ^src/ 
                         | xargs git rm -f -q && 
                     ls -d * 
                         | grep -v my-module 
                         | xargs -I files mv files my-module/ ' 
          --tag-name-filter ' echo "my-module-$(cat)" ' 
	  --prune-empty -- --all
  git clone file:// $( pwd ) newcopy
  cd newcopy
  git for-each-ref --format= " delete %(refname) " refs/tags/ 
      | grep -v refs/tags/my-module- 
      | git update-ref --stdin
  git gc --prune=now

Alguns podem perceber que a invocação de ramo de filtro acima será realmente lenta devido ao uso de filtro de árvore; Como alternativa

  git filter-branch 
      --index-filter ' git ls-files 
                          | grep -v ^src/ 
                          | xargs git rm -q --cached;
                      git ls-files -s 
                          | sed "s%$(printf \t)%&my-module/%" 
                          | git update-index --index-info;
                      git ls-files 
                          | grep -v ^my-module/ 
                          | xargs git rm -q --cached ' 
      --tag-name-filter ' echo "my-module-$(cat)" ' 
      --prune-empty -- --all
  git clone file:// $( pwd ) newcopy
  cd newcopy
  git for-each-ref --format= " delete %(refname) " refs/tags/ 
      | grep -v refs/tags/my-module- 
      | git update-ref --stdin
  git gc --prune=now

No entanto, para qualquer comando de filtro, há uma pilha de advertências. Primeiro, alguns podem estar se perguntando por que listo cinco comandos aqui para o filtro rale. Apesar do uso do filtro de filtro de names e-e do ramo de filtro, alegando que um clone é suficiente para se livrar de objetos antigos, as etapas extras para excluir as outras tags e fazer outro GC ainda são necessárias para Limpe os objetos antigos e evite misturar a história nova e antiga antes de empurrar em algum lugar. Outras advertências:

Mensagens de compromisso não são reescritas; Portanto, se algumas de suas mensagens de confirmação se referirem a começos anteriores por (abreviado) sha1, depois que a reescrever essas mensagens agora se referirão a compromissos que não fazem mais parte da história. Seria melhor reescrever as referências (abreviadas) SHA1 para referir -se aos novos IDs de confirmação.
A bandeira-Prine-Enchty às vezes erra cometidos que devem ser podados, e também podará os compromissos que começaram a ser vazios, em vez de acabarem vazios devido à filtragem. Para repositórios que usam intencionalmente comprometimentos vazios para fins relacionados à versão e publicação, isso pode ser prejudicial.
Os comandos acima são específicos do OS. GNU vs. BSD Questões para sed, xargs e outros comandos frequentemente tropeçam em usuários; Eu acho que não consegui fazer com que a maioria das pessoas use--filtro Index, pois o único exemplo na mangueira do ramo de filtro que a usa e mostra como mover tudo para um subdiretório é específico do Linux, e não é óbvio para o leitor que ele tem um problema de portabilidade, pois silenciosamente se comporta mal, em vez de falhar em voz alta.
A versão-Index-filtro do comando filtro-ramo pode ser duas a três vezes mais rápida que a versão-Tree-Filter, mas ambos os comandos de filtro de filtro serão vários pedidos de magnitude mais lenta que o filtro-repo.
Ambos os comandos assumem que todos os nomes de arquivos são compostos inteiramente de caracteres ASCII (até caracteres ASCII especiais, como guias ou cotações duplas, causarão estragos e provavelmente resultarão em arquivos ausentes ou arquivos mal nomeados)

Resolvendo isso com exportação rápida/rápido

Pode -se meio que hackear isso junto com algo como:

  git fast-export --no-data --reencode=yes --mark-tags --fake-missing-tagger 
      --signed-tags=strip --tag-of-filtered-object=rewrite --all 
      | grep -vP ' ^M [0-9]+ [0-9a-f]+ (?!src/) ' 
      | grep -vP ' ^D (?!src/) ' 
      | perl -pe ' s%^(M [0-9]+ [0-9a-f]+ )(.*)$%1my-module/2% ' 
      | perl -pe ' s%^(D )(.*)$%1my-module/2% ' 
      | perl -pe s%refs/tags/%refs/tags/my-module-% 
      | git -c core.ignorecase=false fast-import --date-format=raw-permissive 
            --force --quiet
  git for-each-ref --format= " delete %(refname) " refs/tags/ 
      | grep -v refs/tags/my-module- 
      | git update-ref --stdin
  git reset --hard
  git reflog expire --expire=now --all
  git gc --prune=now

Mas isso vem com algumas advertências e limitações desagradáveis:

As várias substituições de Greps e Regex operam em todo o fluxo de exportação rápida e, portanto, podem corromper acidentalmente partes não intencionais, como mensagens de confirmação. Se você precisava editar o conteúdo do arquivo e, assim, soltar o sinalizador--não-dados, ele também poderia acabar com o conteúdo do arquivo de corrupção.
Este comando assume que todos os nomes de arquivos no repositório são compostos inteiramente de caracteres ASCII e também excluem caracteres especiais, como guias ou cotações duplas. Se um nome de arquivo especial existir dentro do antigo SRC/ diretório, ele será podado, mesmo que se pretendesse ser mantido. (Em reescritas de repositório ligeiramente diferentes, esse tipo de edição também corre o risco de corromper os nomes de arquivos com caracteres especiais, adicionando cotações duplas extras perto do final do nome do arquivo e em algum nome de diretório líder.)
Este comando deixará para trás um grande número de compromissos vazios inúteis e não terá uma maneira realista de podá -los. (E se você tentou combinar essa técnica com outra ferramenta para podar os compromissos vazios, agora não terá como distinguir entre confirmações que foram vazias pela filtragem que deseja remover e cometidos que estavam vazios antes do processo de filtragem e que você pode querer manter.)
Comprometer mensagens que referenciam outros começos por hash agora referenciarão compromissos antigos que não existem mais. Tentar editar as mensagens de confirmação para atualizá -las é extraordinariamente difícil de adicionar a esse tipo de reescrita direta.

Projeto Racionalidade por trás do Filtro-Repo

Nenhuma das ferramentas de filtragem de repositório existente fez o que eu queria; Todos eles surgiram para minhas necessidades. Nenhuma ferramenta forneceu nenhuma das oito primeiras características abaixo que eu queria, e nenhuma ferramenta forneceu mais de duas das últimas quatro características:

[Relatório inicial] Forneça ao usuário uma análise de seu repositório para ajudá -los a começar o que podar ou renomear, em vez de esperar que eles adivinhem ou encontrem outras ferramentas para descobrir isso. (Acionado, por exemplo, executando a primeira vez com uma bandeira especial, como -Analyze.)
[Mantenha vs. Remover] Em vez de apenas fornecer uma maneira de os usuários removerem facilmente os caminhos selecionados, também fornecem sinalizadores para os usuários manterem apenas determinados caminhos. Certamente, os usuários podem alternar isso especificando para remover todos os caminhos que não desejam manter, mas a necessidade de especificar todos os caminhos que já existiram em qualquer versão do repositório às vezes poderia ser bastante dolorosa. Para o ramo de filtro, usando pipelines como git ls-files | grep -v ... | xargs -r git rm pode ser uma solução razoável, mas pode ficar pesada e não é tão direta para os usuários; Além disso, esses comandos costumam ser específicos do sistema operacional (você pode identificar o gNuísmo no trecho que eu forneci?).
[Renomeação] Deve ser fácil renomear caminhos. Por exemplo, além de permitir que alguém trate algum subdiretório como a raiz do repositório, também fornece opções para os usuários tornarem a raiz do repositório apenas se tornar um subdiretório. E geralmente permitem que arquivos e diretórios sejam facilmente renomeados. Forneça verificações de sanidade se a renomeação faz com que vários arquivos existam no mesmo caminho. (E adicione um manuseio especial para que, se um commit apenas copiar o nome da velha-> newName sem modificação, filtrando o nome do Oldname-> Nome não aciona a verificação da sanidade e morre com esse compromisso.)
[Segurança mais inteligente] Escrever cópias dos árbitros originais para um espaço de nome especial no repositório não fornece um mecanismo de recuperação amigável. Muitos lutariam para se recuperar usando isso. Quase todo mundo que eu já vi fazer uma operação de filtragem de repositório o fez com um clone novo, porque limpar o clone em caso de erro é um mecanismo de recuperação muito mais fácil. Incentive fortemente esse fluxo de trabalho detectando e resgatando se não estivermos em um clone novo, a menos que o usuário substitua -force.
[Encolhimento automático] remova automaticamente o cruzamento antigo e reembale o repositório para o usuário após a filtragem (a menos que substitua); Isso simplifica as coisas para o usuário, ajuda a evitar a mistura de histórico antigo e novo e evita problemas em que o processo de várias etapas para diminuir o repositório documentado na Manpage não funciona em alguns casos. (Estou olhando para você, ramo de filtro.)
[Separação limpa] Evite confundir usuários (e impedir a renovação acidental de coisas antigas) devido à mistura de repositórios antigos e reescrito. (Isso é particularmente um problema com o Filtro Chranch ao usar a opção de filtro de tag-name e, às vezes, também um problema ao filtrar apenas um subconjunto de ramificações.)
[Versatility] fornece ao usuário a capacidade de estender a ferramenta ou até escrever novas ferramentas que aproveitam os recursos existentes e fornecem essa extensibilidade de uma maneira que (a) evita a necessidade de destacar processos separados (que destruiriam o desempenho), (b) evita fazer com que o usuário especifique os comandos do shell dependente de OS (o que impediria os usuários de compartilhar comandos um com o outro), (c) aproveita as estruturas de dados ricas (porque hashes, ditos, listas e matrizes são proibitivamente difíceis no shell) e ( d) Fornece recursos razoáveis de manipulação de cordas (que não têm muito tempo).
[Referências antigas de compromisso] Forneça uma maneira de os usuários usarem IDs de comprometimento antigos com o novo repositório (em particular através do mapeamento de antigos para novos hashes com referências/ referências/ referências).
[Confirme consistência da mensagem] Se as mensagens de confirmação se referirem a outras confirmações por ID (por exemplo, "Isso reverte com compromisso 01234567890ABCDEF", "No Commit 0013DeadBeef9a ..."), essas mensagens de comprometimento devem ser reescritas para se referir aos novos IDs de confirmação.
[A poda de tornar-se vazia] Cometidos que ficam vazios devido à filtragem devem ser podados. Se o pai de uma confirmação for podado, o primeiro ancestral não contratado precisa se tornar o novo pai. Se não existe ancestral não corrigido e o compromisso não era uma mesclagem, ele se torna um novo commit raiz. Se não existir ancestral não cortado e o compromisso era uma mesclagem, a mesclagem terá menos um pai (e, assim, tornará provável que se torne um compromisso não mérito que seria podado se não tivesse mudanças próprias de arquivo) . Uma coisa especial a ser observada aqui é que podamos cometidos que ficam vazios, não cometidos que começam vazios. Alguns projetos criam intencionalmente comprometimentos vazios para versões ou publicações, e estes não devem ser removidos. (Como um caso especial, começos que começaram vazios, mas cujos pais foram removidos também serão considerados como "ficaram vazios".)
[Tornar-se degenerar a poda] A poda de commits que ficam vazios pode potencialmente causar mudanças de topologia, e há muitos casos especiais. Normalmente, os compromissos de Merge não são removidos, pois são necessários para preservar a topologia de gráficos, mas a poda dos pais e outros ancestrais pode resultar na perda de um ou mais pais. Um caso simples já foi observado acima: se uma confirmação de mesclagem perde pais suficientes para se tornar uma confirmação não mércia e não possui alterações de arquivo, também pode ser podado. Os compromissos de Merge também podem ter uma topologia que se torna degenerada: ela pode acabar com a Merge_base servindo como ambos os pais (se todos os que intervieram com o repo original fossem podados), ou poderia acabar com um pai que é um ancestral de seu outro pai. Nesses casos, se a mesclagem não tiver alterações próprias de arquivo, o comprometimento da mesclagem também poderá ser podado. No entanto, por mais que façamos com a poda vazia, não podamos os compromissos de mescla eles próprios.
[Speed] A filtragem deve ser razoavelmente rápida

Como faço para contribuir?

Veja as diretrizes contribuintes.

Existe um código de conduta?

Espera-se que os participantes da comunidade filtro-repO sigam os mesmos padrões do projeto Git, para que o código de conduta Git se aplique.

Melhorias a montante

O trabalho em filtro-repo e seu antecessor também impulsionou inúmeras melhorias no Exportação Fast e Fast-Import (e, ocasionalmente, outros comandos) no Git Core, com base nas coisas que o filtro-repo precisa fazer seu trabalho:

Git-2.28.0
- FAST-IMPORT: Adicionar formato-Data-formato = Raw-Permissive
Git-2.24.0
- Exportação rápida: manuseio tags aninhadas
- T9350: Adicione testes para tags de coisas que não sejam uma confirmação
- Exportação rápida: permita que o usuário solicite tags marcado com-mark-tags
- Exportação rápida: adicione suporte para --import-marks-if-exists
- Fast-Import: Adicione suporte para o novo comando 'Alias'
- Fast-Import: permita que as tags sejam identificadas por etiquetas de marca
- Fast-Import: Fix Maniplel of Exclemed Tags
- Exploratório rápido: conserte a exportação de uma etiqueta e nada mais
- git-fast-import.txt: esclarecer que os compromissos de fusão múltipla são permitidos
Git-2.23.0
- T9350: Corrija o teste de codificação para realmente testar a reencodificação
- Fast-Import: Support 'Encoding' Commit Cabeçalho
- Exportação rápida: evite remover o cabeçalho da codificação se não pudermos reencodificar
- Exploratório rápido: diferencie entre explicitamente UTF-8 e implicitamente UTF-8
- Exploratório rápido: faça a reencodificação automática de mensagens de confirmação somente se solicitado
Git-2.22.0
- Log, Diff-Tree: Adicionar-opção de path-all-all
- T9300: Demonstre bug com a marca e cometidos órfãos vazios
- git-fast-import.txt: corrija a redação sobre onde o comando ls pode aparecer
- Fast-Import: Verifique a maioria dos comandos proeminentes primeiro
- Fast-Import: Somente permite solicitações de Blob Cat, onde faz sentido
- Fast-Import: Corrija o manuseio errôneo de Get-Mark com cometidos órfãos vazios
- Honor Core.precomposeunicode em mais lugares
Git-2.21.0
- Exportação rápida: converta SHA1 para OID
- git-fast-import.txt: corrija a documentação para-a opção
- Git-Fast-Export.txt: Esclareça documentação enganosa sobre o Rev-List Args
- Exportação rápida: use o valor da enumeração correta
- Exploratório rápido: Evite morrer quando a filtragem por caminhos e tags antigas existem
- Fast-Export: Move Commit Rewriting Logic em uma função para reutilização
- Fast-Export: ao usar caminhos, evite fluxo corrupto com marca inexistente
- Exportação rápida: verifique se exportamos referências solicitadas
- Fast-Export: Add-Reference-Excluded Parents Option
- Importação rápida: Remova a documentação duplicada sem manutenção
- Fast-Export: Adicione uma opção--Show-original-IDS para mostrar nomes originais
- git-show-ref.txt: fixar a ordem das bandeiras
Git-2.20.0
- Update-ref: Fix Type of Update_flags Variável para corresponder ao seu uso
- Update-ref: permitir--não-deref com--stdin
Git-1.7.3
- Exportação rápida: corrija a queda de arquivos com --import-marks e limite de caminho
- Exportação rápida: adicione uma opção --full-Tree
- Exportação rápida: corrige a ordem de saída de alterações d/f
- Fast-Import: Melhore a robustez quando as alterações d-> F fornecidas em ordem errada
Git-1.6.4:
- Fast-Export: Definir Revs.topo_order antes de ligar para Setup_revisões
- Exportação rápida: omitis tags que marcam árvores
- Fast-Export: certifique-se de mostrar nomes de ref em vez de "(nulo)"
- Exportação rápida: a reescrita dos pais para evitar soltar começos relevantes
- Exportação rápida: adicione uma opção--marca-de-objeto filtrado para tags recém-penduradas
- Adicione novas cases de teste rápido de exportação
- Exploratório rápido: documente o fato de que os argumentos da lista Git-Rev são aceitos
Git-1.6.3:
- Git-filter-ramo: Evite colisões com variáveis em comandos avaliados
- Personagens corretos de SP ausentes no Gramática Comentário no topo de Fast-Import.c
- Exportação rápida: evite soltar arquivos de compromissos
Git-1.6.1.4:
- Exportação rápida: verifique se nós atravessamos os compromissos em ordem topológica

Expandir

Informações adicionais

Versão v2.45.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-01
tamanho 227.66KB
Vindo de Github

Aplicativos Relacionados

NeverSink Filter

2024-11-11
GitHub sgrebnov/cordova plugin background download

2024-11-05
git remote s3

2024-11-03
repo info

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Filtro Urlscan da Microsoft

2009-07-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos