Por muito tempo, a integração de IAs com sistemas legados dependia da existência de APIs estruturadas ou de robôs de RPA (Robotic Process Automation) propensos a falhas de interface. A tecnologia Computer Use, introduzida originalmente pela Anthropic nos modelos Claude 3.5, rompe essa barreira.
O modelo pode “enxergar” a tela através de capturas de tela e acionar ponteiros de mouse e entradas de teclado de forma dinâmica. O resultado é o nascimento dos primeiros agentes autônomos que operam sistemas exatamente como operadores humanos.
Arquitetura de Execução Segura (Sandbox)
Permitir que uma IA interaja diretamente com o sistema operacional e a internet acarreta altos riscos de segurança corporativa. A execução de agentes autônomos deve ocorrer obrigatoriamente dentro de ambientes efêmeros e isolados (Sandboxes), usando serviços como AWS Fargate e políticas de rede restritas.
graph TD
UserRequest[Requisição do Usuário] --> Orchestrator[AWS ECS Orchestrator]
Orchestrator -->|Provisiona Fargate Task| Sandbox[Isolated Sandbox Container]
Sandbox -->|Envia Captura de Tela| Bedrock[Amazon Bedrock API]
Bedrock -->|Retorna Ação: Clicar / Digitar| Sandbox
Sandbox -->|Sem acesso à VPC Corporativa| Internet[Internet Controlada / Legado]
O Protocolo de Ferramenta (Tool Protocol) do Computer Use
O modelo interage enviando comandos que especificam coordenadas e ações de teclado. O container executa essas ações e retorna uma nova captura de tela ao modelo para o próximo ciclo de decisão.
{
"name": "computer",
"input": {
"action": "mouse_down",
"coordinate": [450, 620]
}
}
Estratégias de Auditoria e Conformidade
Em conformidade com regras regulatórias como ISO 27001 e LGPD, ações de agentes baseados em tela devem ser auditadas sistematicamente.
- Gravação de Sessão Completa: Gravar o vídeo das interações virtuais de tela de cada sessão efêmera e enviar os arquivos ao Amazon S3 para fins de compliance.
- Firewall de Aplicação Local (WAF): Limitar o acesso a endereços de IP específicos para evitar que agentes inteligentes acessem links maliciosos.
- Assinatura Criptográfica: Garantir que todas as chamadas geradas pelo agente incluam credenciais temporárias do AWS IAM com tempo de expiração curto (Session Tokens de até 15 minutos).
O design correto desses ambientes isolados protege o core dos dados da empresa e simultaneamente destrava a produtividade de processos baseados em sistemas legados sem APIs disponíveis.