A Microsoft lançou recentemente um novo método de compactação de modelos de linguagem grande chamado SliceGPT. Essa tecnologia pode reduzir significativamente o tamanho dos parâmetros de modelos de linguagem grandes, mantendo seu desempenho. Ao substituir habilmente a matriz de pesos, o SliceGPT atinge uma taxa de compressão de parâmetros de até 25% sem afetar a eficiência computacional. Esta mudança é de grande importância para a implantação de grandes modelos de linguagem em dispositivos com recursos limitados e marca um grande avanço na melhoria da eficiência da tecnologia de inteligência artificial. Isso expandirá enormemente o escopo de aplicação de grandes modelos de linguagem e proporcionará conveniência a mais desenvolvedores e usuários.
A Microsoft lança o SliceGPT, um novo método de compactação de modelos de linguagem grande. Ao substituir a matriz de pesos e manter a invariância computacional, o SLICE GPT pode reduzir grandes parâmetros do modelo de linguagem em até 25%, mantendo o desempenho. Este método é adequado para vários modelos de redes conversoras e tem amplas perspectivas de aplicação em dispositivos com recursos limitados.
O surgimento do SliceGPT fornece uma maneira eficaz de resolver o problema de implantação de modelos de linguagem em larga escala. No futuro, podemos esperar o surgimento de mais tecnologias semelhantes para promover ainda mais a popularização e o desenvolvimento da tecnologia de inteligência artificial, permitindo que a tecnologia de IA beneficie uma gama mais ampla de campos e pessoas. Isto trará uma nova vitalidade ao campo da inteligência artificial, e vale a pena aguardar com expectativa as aplicações e desenvolvimentos subsequentes.