LLM para coisas pequenas
Usando modelos LLM em um Raspberry Pi 5 com apenas 4GB de RAM
13 de julho de 2024

Usando modelos LLM em um Raspberry Pi 5 com apenas 4GB de RAM
Responsavél direto pela elaboração de uma arquitetura escalavél, performática e minimalista, usando Node.js como framework base.
Implementando serviços web e soluções para análise e processamento de imagens e vídeos
Elaboração dos padrões de qualidade e infraestrutura utilizando AWS e Docker como base.
Realização de estudos para otimização de recursos
Implementação de solução de mensageria e arquitetura distribuida usando RabbitMQ
Atuei como engenheiro responsavél por criar uma solução de orquestração e distribuição de RPA’s e Automações multiplataforma, com suporte á Java, Python e Nodejs.
Implementei melhorias e fluxos de processo de automação no sistema nacional de processos eletrônicos (EPROC) por meio de módulos em PHP
Contribui para otimização server side e integração de LLM’s na solução ApoIA, para uso de AI/LLM no entendimento, exploração e resumo de processos judiciários.
Otimização de tokens processados em solução de AI por meio de NLP (Natural Language Proccess), tendo como resultado uma economia média de 20% por envio de requisição a LLM’s por meio de API REST.
Estudos diversos sobre self-hosted para soluções de LLM usando Ollama como base.
Desenvolvedor de meio período para o core da SDR Virtual, ferramenta de funil de vendas
Melhoria de qualidade de código e otimização de uso de recursos envolvendo melhoria e aperfeiçoamento de código Python para backend
Implementação de dashboards e ferramentas de análise de dados otimizadas para consultas em larga escala.
Realização de patchs de segurança e otimização em dependências de terceiros com o intuito de viabilizar a ferramenta para o mercado LATAM/Europa
Integração com soluções da Meta para Whatsapp Business