Conversar com modelos de IA locais

Por que modelos de IA locais?

Trabalhar localmente com modelos de IA oferece vantagens importantes:

Seguro por natureza - Seus dados permanecem no seu computador e nunca são enviados para servidores externos
Sem custos adicionais - Modelos locais não têm custos de API por uso
Privacidade garantida - Ideal para documentos e informações sensíveis

Por que Ollama?

Ollama é uma ferramenta que permite rodar modelos de IA localmente de forma simples. Ele é instalado em cada computador separadamente, o que não impõe limites no número de usuários - sem servidor compartilhado necessário.

Instalar Ollama

Acesse a página de download do Ollama
Faça o download da versão para o seu sistema operacional (Windows, macOS ou Linux)
Instale o Ollama seguindo o instalador
Após a instalação, o Ollama será executado automaticamente em segundo plano

Instalar um modelo de linguagem

Após instalar o Ollama você precisa baixar pelo menos um modelo de linguagem:

Abra a interface Ollama (via o ícone da barra de sistema ou terminal)
Faça o download do modelo de linguagem de sua escolha

Modelo recomendado

É preferível escolher um modelo que tenha capacidades de ferramenta (tool) e visão (vision):

Ferramentas (Tool capabilities) - o modelo pode usar todas as ferramentas disponíveis no aplicativo, como pesquisar na internet e gerar imagens
Visão (Vision capabilities) - o modelo pode analisar e descrever imagens

Modelo recomendado

qwen3-vl:4b oferece um bom equilíbrio entre velocidade e capacidades de ferramenta/visão. Instale este modelo através do terminal:

ollama pull qwen3-vl:4b

Escolher o modelo com base no hardware

O desempenho de um modelo depende fortemente do hardware do seu computador:

Hardware	Recomendação
Limitado (8GB RAM, sem GPU)	Opte por modelos menores (1-4B parâmetros)
Médio (16GB RAM, GPU básica)	Modelos até 7B parâmetros
Potente (32GB+ RAM, GPU moderna)	Modelos maiores são viáveis (13B+)

Velocidade vs. qualidade

Um modelo menor geralmente oferece melhor velocidade, mas pode apresentar respostas menos precisas. Experimente para encontrar o melhor equilíbrio para a sua situação.

Configuração na aplicação desktop

Assim que o Ollama estiver rodando com um modelo instalado, a aplicação desktop detecta isso automaticamente. Você pode então selecionar o modelo local na conversa como alternativa aos modelos em nuvem.

Modelos disponíveis com suporte a tool/vision

Veja a lista completa em ollama.com/library. Filtre por modelos com:

a tag Tools para capacidades de ferramenta
a tag Vision para reconhecimento de imagens

Opções populares:

qwen3-vl:4b - Compacto, rápido, ferramenta + visão
llama3.2-vision - Capacidades de visão
mistral - Tarefas gerais rápidas

Por que modelos de IA locais?​

Por que Ollama?​

Instalar Ollama​

Instalar um modelo de linguagem​

Modelo recomendado​

Escolher o modelo com base no hardware​

Configuração na aplicação desktop​

Modelos disponíveis com suporte a tool/vision​

Por que modelos de IA locais?

Por que Ollama?

Instalar Ollama

Instalar um modelo de linguagem

Modelo recomendado

Escolher o modelo com base no hardware

Configuração na aplicação desktop

Modelos disponíveis com suporte a tool/vision