Ir para o conteúdo principal

Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece vantagens importantes:

  • Seguro por natureza - Seus dados permanecem no seu computador e nunca são enviados para servidores externos
  • Sem custos adicionais - Modelos locais não têm custos de API por uso
  • Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite rodar modelos de IA localmente de forma simples. Ele é instalado em cada computador separadamente, o que não impõe limites no número de usuários - sem servidor compartilhado necessário.

Instalar Ollama

  1. Acesse a página de download do Ollama
  2. Faça o download da versão para o seu sistema operacional (Windows, macOS ou Linux)
  3. Instale o Ollama seguindo o instalador
  4. Após a instalação, o Ollama será executado automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama você precisa baixar pelo menos um modelo de linguagem:

  1. Abra a interface Ollama (via o ícone da barra de sistema ou terminal)
  2. Faça o download do modelo de linguagem de sua escolha

Modelo recomendado

É preferível escolher um modelo que tenha capacidades de ferramenta (tool) e visão (vision):

  • Ferramentas (Tool capabilities) - o modelo pode usar todas as ferramentas disponíveis no aplicativo, como pesquisar na internet e gerar imagens
  • Visão (Vision capabilities) - o modelo pode analisar e descrever imagens
Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de ferramenta/visão. Instale este modelo através do terminal:

ollama pull qwen3-vl:4b

Escolher o modelo com base no hardware

O desempenho de um modelo depende fortemente do hardware do seu computador:

HardwareRecomendação
Limitado (8GB RAM, sem GPU)Opte por modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderna)Modelos maiores são viáveis (13B+)
Velocidade vs. qualidade

Um modelo menor geralmente oferece melhor velocidade, mas pode apresentar respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação desktop detecta isso automaticamente. Você pode então selecionar o modelo local na conversa como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a tool/vision

Veja a lista completa em ollama.com/library. Filtre por modelos com:

  • a tag Tools para capacidades de ferramenta
  • a tag Vision para reconhecimento de imagens

Opções populares:

  • qwen3-vl:4b - Compacto, rápido, ferramenta + visão
  • llama3.2-vision - Capacidades de visão
  • mistral - Tarefas gerais rápidas