Clara Mendonça
outubro 2, 2024

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

Neste guia prático, vamos explorar o processo de ajuste fino de um modelo de linguagem grande (LLM) e executá-lo localmente em sua máquina usando o Ollama. Aprenderemos como usar dados específicos para treinar um LLM menor e obter um desempenho superior em tarefas específicas, comparado a modelos maiores. Abordaremos também como configurar o ambiente necessário, preparar os dados e utilizar as ferramentas certas para um processo de treinamento eficiente.

Encontrando o Conjunto de Dados Ideal

A escolha do conjunto de dados é crucial para o sucesso do ajuste fino de um LLM. Um conjunto de dados relevante para a tarefa em questão permite treinar um modelo menor que pode superar o desempenho de modelos maiores em tarefas específicas.

Neste exemplo, vamos criar um LLM rápido e pequeno que gera código SQL a partir de dados de tabelas. Para isso, utilizaremos o conjunto de dados "Synthetic Text to SQL", que contém mais de 105.000 registros, divididos em colunas de prompt, SQL, complexidade do conteúdo, entre outros.

É importante ressaltar que este projeto não exige hardware complexo e pode ser executado em máquinas com menos recursos. Utilizaremos o Google Colab para treinar o modelo na nuvem caso você não possua uma GPU.

Ferramentas Essenciais: Unsloth e Llama

Para este projeto, utilizaremos duas ferramentas poderosas: Unsloth e Llama.

Unsloth: O Unsloth permite o ajuste fino eficiente de vários modelos de código aberto com uma redução de até 80% no uso de memória.
Llama: Um LLM desenvolvido para fins comerciais e de pesquisa, especialmente em inglês, com alto desempenho.

Configurando o Ambiente

Antes de começar, certifique-se de ter o Anaconda e as bibliotecas CUDA instaladas em sua máquina. Recomenda-se usar CUDA 12.1 e Python 3.10.

Em seguida, instale as dependências do Unsloth, que incluem:

PIE
Torch
Bibliotecas CUDA
A versão mais recente do Unsloth

Crie um novo ambiente para o projeto e instale o Jupyter Notebook. Após a instalação, execute o Jupyter Notebook para começar a codificar.

Revolucione a sua prática jurídica

Ebook: IA Generativa no Direito 4.0: Guia Prático e Ético para Advogados Modernos

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

R$ 59,90

Revolucione seu ensino com IA

Ebook: Inteligência Artificial na Educação e suas Ferramentas

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

R$ 4,70

Ajustando o Modelo

No Jupyter Notebook, importe o modelo de linguagem rápida usando o Unsloth, especificando o modelo Llama 3/8 bits, um comprimento máximo de sequência de 2048 tokens e carregando-o em 4 bits para reduzir o uso de memória.

Em seguida, carregue o modelo PEFT (Parameter-Efficient Fine-Tuning), que utiliza adaptadores LoRA para atualizar apenas 1 a 10% dos parâmetros do modelo, economizando tempo e recursos.

A próxima etapa é formatar os dados para o modelo Llama 3, que utiliza prompts no estilo Alpaca. Adapte o código para incluir apenas as informações relevantes do conjunto de dados, como SQL, prompts e explicações.

Utilize o treinador de ajuste fino supervisionado do Hugging Face para treinar o modelo, definindo parâmetros como etapas máximas, semente e etapas de aquecimento.

Após o treinamento, converta o modelo para o tipo de arquivo correto para execução local com Ollama usando um comando do Unsloth.

Executando o Modelo com Ollama

No terminal, navegue até o caminho onde o arquivo do modelo está salvo e crie um arquivo chamado "modelfile". Abra o arquivo em um editor de código e adicione um prompt, como "Você é um gerador de SQL que recebe a consulta de um usuário e fornece SQL útil para usar."

Com o Ollama em execução, execute o comando para ler os itens no arquivo "modelfile" e iniciar o modelo usando o llama.cpp, permitindo a execução local do seu LLM ajustado.

Parabéns! Agora você tem um LLM ajustado fino em execução localmente, pronto para ser integrado em suas aplicações.

Gostou do conteúdo? Compartilhe

Referência

https://www.youtube.com/watch?v=pxhkDaKzBaY

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

A_Ascenso_de_um_Cavaleiro_Tudo_o_que_Sabemos_Sobre_o_Novo_Spinoff_de_Game_of_Thrones_da_HBO-6

10 de outubro de 2025, 20:49

Belkin_Stage_PowerGrip_Redefinindo_a_Fotografia_com_Smartphone-6

10 de outubro de 2025, 20:39

Armazenamento_do_Nintendo_Switch_2_A_Inevitvel_Busca_por_Mais_Espao_e_a_Queda_nos_Preos_dos_Cartes_microSD_Express-6

10 de outubro de 2025, 20:19

A_Invaso_Inesperada_Como_os_Anncios_Gigantes_Esto_Desfigurando_o_Amazon_Echo_Show-6

10 de outubro de 2025, 20:09

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

Encontrando o Conjunto de Dados Ideal

Ferramentas Essenciais: Unsloth e Llama

Configurando o Ambiente

Revolucione a sua prática jurídica

Ebook: IA Generativa no Direito 4.0: Guia Prático e Ético para Advogados Modernos

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

Revolucione seu ensino com IA

Ebook: Inteligência Artificial na Educação e suas Ferramentas

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

Ajustando o Modelo

Executando o Modelo com Ollama

Gostou do conteúdo? Compartilhe

Referência

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

2025 CBVR Tecnologia Computacional LTDA

CNPJ 42.004.155/0001-46

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

Encontrando o Conjunto de Dados Ideal

Ferramentas Essenciais: Unsloth e Llama

Configurando o Ambiente

Revolucione a sua prática jurídica

Ebook: IA Generativa no Direito 4.0: Guia Prático e Ético para Advogados Modernos

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

Revolucione seu ensino com IA

Ebook: Inteligência Artificial na Educação e suas Ferramentas

Um Ebook de Eng. Cris Rocco e Eng. Lucas Hashimoto, especialistas em IA

Ajustando o Modelo

Executando o Modelo com Ollama

Gostou do conteúdo? Compartilhe

Referência

Ajuste Fino de um Modelo de Linguagem Grande Localmente com Ollama

2025 CBVR Tecnologia Computacional LTDA

CNPJ 42.004.155/0001-46

Este site utiliza cookies. Ao continuar a navegar neste site, você aceita o uso de cookies e nossa política de privacidade.