Como Instalar e Usar Ollama Localmente

10 de janeiro de 2024 • Geanderson Lemonte

O Ollama é uma ferramenta poderosa que permite executar modelos de linguagem grandes (LLMs) localmente em sua máquina, sem depender de APIs externas ou conexão com a internet. Neste tutorial, você aprenderá como instalar e configurar o Ollama para começar a usar modelos de IA localmente.

O que é Ollama?

Ollama é uma plataforma que simplifica a execução de modelos de linguagem localmente. Ele gerencia o download, configuração e execução de modelos LLM, permitindo que você trabalhe com inteligência artificial diretamente em seu computador, garantindo privacidade e controle total sobre os dados processados.

Instalação do Ollama

O processo de instalação do Ollama é simples e varia dependendo do seu sistema operacional. Acesse o site oficial do Ollama em ollama.com para baixar a versão adequada para seu sistema.

Instalação no macOS

No macOS, você pode instalar o Ollama de duas formas:

Download direto: Acesse ollama.com/download e baixe o instalador para macOS. Execute o arquivo .dmg e arraste o Ollama para a pasta Applications.
Via Homebrew: Se você usa Homebrew, execute o comando:
```
brew install ollama
```

Instalação no Linux

No Linux, você pode instalar usando o script de instalação oficial:

curl -fsSL https://ollama.com/install.sh | sh

Ou baixe o binário diretamente do site oficial do Ollama.

Instalação no Windows

No Windows, baixe o instalador .exe do site oficial e execute-o. O instalador configurará tudo automaticamente.

Executando Modelos LLM Localmente

Após a instalação, você pode começar a usar modelos de linguagem. O Ollama oferece uma variedade de modelos pré-configurados que você pode baixar e executar facilmente.

Comandos Básicos do Ollama

Após instalar, abra o terminal e use os seguintes comandos:

Listar modelos disponíveis

Para ver uma lista de modelos populares, visite o site do Ollama ou use:

ollama list

Baixar um modelo

Para baixar um modelo específico, use o comando ollama pull seguido do nome do modelo:

ollama pull llama2

Alguns modelos populares incluem:

llama2 - Modelo da Meta
mistral - Modelo Mistral AI
codellama - Especializado em código
phi - Modelo compacto e eficiente

Executar um modelo

Para conversar com um modelo, use:

ollama run llama2

Isso iniciará uma sessão interativa onde você pode fazer perguntas e receber respostas do modelo.

Executar com prompt específico

Você também pode executar um modelo com um prompt específico diretamente:

ollama run llama2 "Explique o que é inteligência artificial"

Modelos Disponíveis

O Ollama suporta uma ampla variedade de modelos. Para ver a lista completa e atualizada, visite ollama.com/library. Lá você encontrará modelos para diferentes necessidades:

Modelos gerais de conversação
Modelos especializados em código
Modelos multilíngues
Modelos compactos para dispositivos com menos recursos

Integração com Outras Ferramentas

O Ollama pode ser integrado com diversas ferramentas e aplicações. Ele expõe uma API REST local que permite que outras aplicações se conectem e utilizem os modelos LLM.

Por padrão, a API do Ollama está disponível em http://localhost:11434. Você pode usar esta API para integrar o Ollama com ferramentas como Anything LLM, LangChain, e outras aplicações que suportam modelos LLM locais.

Para mais informações sobre como usar o Ollama com outras ferramentas, confira nosso artigo sobre Como Criar Seu Próprio Agente Inteligente com Anything LLM.

Conclusão

O Ollama é uma ferramenta essencial para quem deseja trabalhar com modelos de linguagem localmente, oferecendo privacidade, controle e a capacidade de trabalhar offline. Com este guia, você está pronto para começar a explorar o mundo dos LLMs locais.

Experimente diferentes modelos e descubra qual funciona melhor para suas necessidades. Lembre-se de verificar os requisitos de sistema de cada modelo, pois alguns podem exigir mais recursos computacionais do que outros.

Voltar para o blog